Sciam


Clique e assine Sciam
Notícias

Computadores reconhecem imagens

Novo software de inteligência artificial consegue ler imagens de segurança

Maen Zayyad/shutterstock
CAPTURANDO CAPTCHAS: A abordagem de solução de CAPTCHAs da Vicarious permite que softwares de IA aprendam coisas novas a partir de alguns exemplos, de maneira semelhante ao modo como uma criança humana compreende o mundo aprendendo a reconhecer o que vê e descobrindo como as imagens se conectam. 

 
Por Susan Kuchinskas

 Luis von Ahn já ouviu tudo isso antes. Como coinventor dos CAPTCHAS, aquelas desagradáveis imagens compostas de letras e números tortos que websites usam para garantir que você é humano e não uma máquina, von Ahn já recebeu mais de 50 alegações na última década sobre maneiras de derrotar seu programa.

E agora são 51.

A start-up Vicarious, com sede em Union City, na Califórnia, alega ter desenvolvido um software de inteligência artificial (IA) que lê imagens quase tão bem quanto humanos e que pode resolver CAPTCHAs em 90% das vezes. Se as alegações forem verdadeiras, isso poderia significar um avanço na criação de IA indistinguíveil da cognição humana – pelo menos em se tratando de ajudar computadores a identificar e entender imagens.

De acordo com a Vicarious, a arquitetura de seu sistema de IA é baseado em uma “rede cortical recursiva”, o que significa que ela é modelada como o neocórtex humano – a massa cinzenta do cérebro, que processa informações. Essa abordagem permite que softwares de IA aprendam coisas novas a partir de alguns exemplos, semelhante à maneira como uma criança humana começa a entender o mundo aprendendo a reconhecer o que vê e percebendo como as imagens estão conectadas.  

De acordo com a Vicarious, sua abordagem é diferente de métodos de IA como a “aprendizagem profunda” [deep learning], em que um software treina uma rede neural artificial fornecendo milhares de imagens de treinamento para ela conectar. “O cérebro humano é composto de um circuito simples, replicado – um único elemento que ocorre repetidamente no neocórtex”, explica o cofundador da Vicarious, D. Scott Phoenix, adicionando que o software de sua empresa é construído de maneira semelhante a partir de elementos únicos, repetidos.

Resolver um CAPTCHA (que significa, em inglês, Teste Público de Turing Completamente Automatizado para diferenciar Computadores de Humanos) elimina a limitação que o matemático Alan Turing propôs em 1950 para determinar se uma máquina poderia possuir inteligência semelhante à humana, ainda que de maneira limitada. Com o passar dos anos, outros cientistas da computação e hackers encontraram maneiras de programar computadores para passar o teste dos CAPTCHAs, forçando desenvolvedores da Web a desenvolver CAPTCHAs cada vez mais complicados que são difíceis de decifrar em seus esforços para repelir táticas de spam cada vez mais sofisticadas.

A demonstração de resolução de CAPTCHAs da Vicarious é um exemplo de “inteligência artificial restrita” [narrow artificial intelligence], uma tecnologia que pode alcançar, ou até exceder, o desempenho humano em uma tarefa bem definida. O computador enxadrista Deep Blue, da IBM, é outro exemplo. Mas a Vicarious insiste que seu software de percepção é a base de uma IA que aprenderá como fazem os humanos – ao experimentar o mundo ao seu redor, principalmente por meio da visão, e depois por padrões de identificação. “Se um algoritmo resolve o problema da visão em geral, então não temos uma IA restrita, mas um sistema de IA geral”, declara Dileep George, também cofundador da Vicarious. “Nós estamos trabalhando em um algoritmo geral para solucionar o problema da visão, e os CAPTCHAs são uma maneira de fazer isso”.

Uma razão para cientistas da computação estarem céticos em relação às alegações da Vicarious é que a empresa mantém sua tecnologia escondida. Ela demonstrou o software em vídeos, que mostraram a tecnologia resolvendo CAPTCHAs de grandes websites, em vez de publicar suas descobertas em periódicos científicos. Nils Nilsson, professor emérito da Stanford University e autor de The Quest for Artificial Intelligence: A History of Ideas and Achievements (A Busca pela Inteligência Artificial: Uma história de ideias e conquistas, em tradução literal), declara que a alegação da Vicarious é importante, mas que ele tem reservas. A Vicarious, de acordo com ele, usa “os CAPTCHAs apenas como um caso-teste para mostrar como sua tecnologia funciona bem. Eu diria que tudo bem, esse provavelmente é um avanço muito bom, mas eu precisaria saber mais”.

George, ex-aluno de doutorado de Nilsson, observa que a Vicarious optou por não publicar seus resultados porque a publicação de artigos pode ser “muito limitante”. “Você trabalha no artigo seguinte e pensa em um intervalo de tempo de um ano, enquanto nós estamos preparados para pensar em um intervalo de tempo muito maior – e isso permite que façamos apostas ou procuremos em direções que outras pessoas podem não estar procurando”. Além disso, adiciona Phoenix, eles não querem dar novas ideias aos spammers.

Em 2012, a Vicarious recebeu US$15 milhões em financiamento de empresas de capital do Vale do Silício lideradas pela Good Ventures, a firma de investimento do cofundador do Facebook, Dustin Moskovitz. A Vicarious é uma “empresa de propósitos flexíveis”, um tipo de corporação californiana com fins lucrativos que busca beneficiar a sociedade, mesmo à custa de seus lucros. Isso permite que a empresa veja muito longe – de acordo com Phoenix, a Vicarious não espera demonstrar uma IA completa antes de 2028.

Mas pesquisadores apontam que ficar nas sombras não é necessário para desenvolver uma boa tecnologia de IA. “Se você quiser resultados impressionantes de visão computadorizada, inspirados de maneira neutra, existem muitos resultados por aí”, aponta Yann LeCun, diretor Centro de Dados Científicos da New York University. “Pessoas publicam resultados e usam referências para que você possa compará-los com outros métodos”.

Von Ahn, o inventor dos CAPTCHAs, professor associado de ciência da computação na Carnegie Mellon University, não parece muito preocupado. De acordo com ele, é difícil determinar com exatidão o quanto a tecnologia da Vicarious é melhor que outros trabalhos na área. A abordagem da Vicarious, que se baseia na percepção visual, segue a linha de raciocínio atual sobre IA, observa von Ahn. “Muitos pesquisadores da inteligência artificial passar a maior parte de seu tempo lidando com a percepção”, declara ele. “Acredita-se que nossa própria inteligência derive de nosso córtex visual”.

Mesmo que isso seja um beco sem saída tecnológico, “a única coisa boa sobre a abordagem de usar visão computadorizada é que, no mínimo, ela tem aplicações”, aponta von Ahn. Por exemplo, uma tecnologia baseada no sistema da Vicarious pode um dia dar a carros que se dirigem sozinhos a capacidade de identificar pedestres cruzando a pista.

sciam29out2013