Martin Schrimpf. Crédito:Kris Brewer
Quando abrimos nossos olhos pela manhã e observamos aquela primeira cena do dia, não pensamos muito no fato de que nosso cérebro está processando os objetos dentro de nosso campo de visão com grande eficiência e que está compensando a falta de informação sobre o que nos rodeia - tudo para permitir que façamos nosso cotidiano funções. O copo d'água que você deixou na mesinha de cabeceira ao se preparar para dormir agora está parcialmente bloqueado de sua linha de visão pelo despertador, no entanto, você sabe que é um copo.
Essa capacidade aparentemente simples para humanos de reconhecer objetos parcialmente ocluídos - definida nesta situação como o efeito de um objeto em um espaço 3-D bloqueando a visão de outro objeto - tem sido um problema complicado para a comunidade da visão computacional. Martin Schrimpf, um estudante de pós-graduação no laboratório DiCarlo no Departamento de Ciências do Cérebro e Cognitivas do MIT, explica que as máquinas se tornaram cada vez mais hábeis em reconhecer itens inteiros com rapidez e confiança, mas quando algo cobre parte desse item da vista, esta tarefa torna-se cada vez mais difícil para os modelos reconhecerem com precisão o artigo.
"Para modelos de visão computacional para funcionar na vida cotidiana, eles precisam ser capazes de digerir objetos obstruídos tão bem quanto objetos inteiros - afinal, quando você olha em volta, a maioria dos objetos está parcialmente escondida atrás de outro objeto, "diz Schrimpf, co-autor de artigo sobre o assunto recentemente publicado no Proceedings of the National Academy of Sciences ( PNAS )
No novo estudo, ele diz, "investigamos os cálculos subjacentes no cérebro e, em seguida, usamos nossas descobertas para construir modelos computacionais. Recapitulando o processamento visual no cérebro humano, esperamos, portanto, melhorar também os modelos de visão computacional. "
Como nós, como humanos, somos capazes de fazer repetidamente esta tarefa diária sem colocar muito pensamento e energia nesta ação, identificar cenas inteiras com rapidez e precisão depois de ver apenas peças? Os pesquisadores do estudo começaram com o córtex visual humano como um modelo de como melhorar o desempenho das máquinas neste ambiente, diz Gabriel Kreiman, uma afiliada do MIT Center for Brains, Minds, e máquinas. Kreinman é professor de oftalmologia no Boston Children's Hospital e na Harvard Medical School e foi o principal investigador do estudo.
Em seu jornal, "Cálculos recorrentes para conclusão de padrão visual, "a equipe mostrou como desenvolveram um modelo computacional, inspirado por restrições fisiológicas e anatômicas, que foi capaz de capturar as observações comportamentais e neurofisiológicas durante a conclusão do padrão. No fim, o modelo forneceu insights úteis para a compreensão de como fazer inferências a partir de informações mínimas.
Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.