Notícias
03 de fevereiro de 2012
Pesquisadores decodificam palavras com base na atividade do córtex
Interpretação pode proporcionar um meio de comunicação para pessoas com deficiência
 
Skip the Budgie, courtesy Flickr
Um espião no córtex auditivo! Isso, de certa forma, é exatamente o que fez um grupo de pesquisadores que trabalham em Berkeley e em São Francisco. Medições de sinais elétricos na região cerebral responsável por processar os sons captados permitiram ao grupo decodificar as palavras que uma pessoa estava ouvindo – essencialmente, uma forma de espionagem neural.

O objetivo, porém, é muito mais nobre do que descobrir o que seu chefe pensa sobre você ou o que está se passando na baia ao lado. A pesquisa lança luz sobre como o cérebro gerencia os sons e os transforma em linguagem. "A esperança é que esse conhecimento possa ser utilizado para ajudar pessoas com deficiências graves a recuperar sua capacidade de comunicação", diz Brian Pasley, um pesquisador com pós-doutorado pela Universidade da Califórnia, em Berkeley, e principal autor do estudo. As pesquisas poderão complementar outras iniciativas que visam reconstruir a fala usando movimentos musculares do trato vocal, dos lábios e da língua. Os pesquisadores – também da Universidade de Maryland, do Park College, da Universidade Johns Hopkins e da Universidade da Califórnia, em São Francisco –, publicaram o trabalho essa semana na PLoS Biology.

Durante o experimento, os voluntários ouviam palavras emitidas por um alto-falante ou com fones de ouvido: às vezes, apenas vocábulos isolados como "jazz" ou "propriedade", pseudopalavras como "poneca" e "juveiro" e, em alguns casos, frases completas. Depois, a equipe de pesquisadores estudou um registro dessa atividade conforme ela apareceu no córtex auditivo cerebral, permitindo a compreensão da linguagem, associada a outros sons. As pessoas que participaram do experimento, 15 voluntários com domínio normal das habilidades de linguagem, estavam também se submetendo a tratamentos neurocirúrgicos devido a epilepsia ou tumores cerebrais. Como a atividade cerebral desses pacientes já estava sendo monitorada na superfície do córtex para sensoriamento de convulsões, os pesquisadores puderam examinar essas mensurações corticais diretas.

Pasley e seus colegas elaboraram um algoritmo – modelo computacional – para mapear a correspondência do som que um voluntário escutava com as medições dos eletrodos. O modelo pôde, então, "aprender" como associar o som aos sinais elétricos do cérebro. Em seguida, os pesquisadores testaram seu modelo invertendo o processo: partiram da atividade do cérebro de um ouvinte e usaram o modelo para reconstruir as palavras que o participante havia escutado. Especificamente, o modelo reconstruía um som semelhante a um vocábulo, mas não imediatamente reconhecível como tal. Para completar o ciclo, os pesquisadores faziam uma busca em um conjunto de 47 palavras para encontrar a que mais correspondia ao som no modelo.

Os pesquisadores não apenas conseguiram "interceptar" as palavras por meio da atividade cortical, como também criaram duas versões de seu modelo para dar conta de diferentes características dos sons. Uma das versões fez uso de uma representação linear dos sons, denominada espectrograma, ou seja, um gráfico representativo de frequências ao longo do tempo. A outra versão empregou uma representação não linear do som denominada modelo de modulação. Pasley explica que na versão linear os ritmos sonoros são codificados pelas oscilações do cérebro, ao passo que na versão não linear os ritmos são transmitidas pelo nível geral da atividade cerebral. Em um ritmo de fala lenta, os dois modelos funcionam bem, mas em ritmos mais rápidos as representação de sons não lineares criam um modelo mais acurado. Essa técnica poderá aperfeiçoar a tecnologia de reconhecimento da fala. Embora os smartphones apresentem um desempenho razoável, qualquer pessoa que já tenha recebido uma transcrição de voz ininteligível processada pelo Google sabe que o reconhecimento da fala ainda é imperfeito.

Esse estudo é paralelo a uma pesquisa publicada no segundo semestre do ano passado pela Universidade da Califórnia em Berkeley em outro terreno sensorial, um modelo computacional que reconstruía as imagens que voluntários assistiam em trailers de filmes cinematográficos. Uma pergunta óbvia imediatamente se coloca, em vista das pesquisas de Pasley e seus colegas: Será que isso tornará possível ler palavras que silenciosamente vocalizamos para nós mesmos, por exemplo: "Ah não, esse cara outra vez”? Pasley explica que a pesquisa se aplica ao som efetivamente escutado. Não está claro se as mesmas regiões do cérebro são ativadas nos casos de palavras que subvocalizamos. O experimento demonstra, porém, que não é preciso ser capaz de ler a mente para “grampear” o sutil processamento do cérebro.
Veja aqui todas as notícias publicadas neste site!