Os pesquisadores usam a visão computacional para entender melhor as ilusões de ótica
p Crédito CC0:domínio público
p Ilusões de ótica, imagens que enganam o olho humano, são um tópico de pesquisa fascinante, já que estudá-los pode fornecer informações valiosas sobre a cognição e a percepção humanas. Pesquisadores da Flinders University, na Austrália, realizaram recentemente um estudo muito interessante usando um modelo de visão computacional para prever a existência de ilusões de ótica e o grau de seu efeito. p Na última década, os pesquisadores alcançaram uma compreensão biológica cada vez mais detalhada de como o cérebro humano processa os estímulos visuais. Muitos modelos de visão computacional existentes se inspiram em nossa compreensão atual do processamento visual. Apesar disso, alguns aspectos do processamento visual ainda são mal compreendidos e altamente debatidos.
p "O processamento visual começa com as sensações dos campos receptivos da retina (RFs) pela luz que entra nos olhos, "os pesquisadores explicaram em seu artigo, que foi pré-publicado no arXiv. "As células ganglionares da retina (RGCs) são os neurônios de saída da retina que convertem a entrada sináptica da camada plexiforme interna (IPL) e transportam o sinal visual para o cérebro. A diversidade de tipos de RGC e a dependência do tamanho de cada tipo específico para a excentricidade ( distância da fóvea) são evidências fisiológicas da codificação multiescala da cena visual na retina. modelos computacionais de baixo nível de visão da retina foram propostos com base na amostragem simultânea da cena visual em múltiplas escalas. "
p Pesquisas anteriores introduziram um modelo para detectar inclinações ilusórias na ilusão da Parede do Café, que surgem do contraste de fundo e sinais de inclinação. Em seu estudo, os pesquisadores da Flinders University generalizaram essa abordagem, a fim de cobrir uma gama mais ampla de ilusões geométricas, bem como ilusões de azulejos mais complexas.
p "Exploramos a resposta de um modelo simples e bio-plausível de visão de baixo nível em ilusões geométricas / azulejos, reproduzindo a percepção equivocada de sua geometria, que relatamos para o Café Wall e algumas ilusões de azulejos, "os pesquisadores escreveram em seu artigo." O modelo até agora não foi verificado para generalizar a essas outras ilusões, e é isso que mostramos neste artigo. "
p Em seu estudo, os pesquisadores avaliaram um modelo de filtragem computacional projetado para modelar a inibição lateral das células ganglionares da retina e suas respostas a diferentes ilusões geométricas. Adotando essa abordagem, os pesquisadores esperavam alcançar uma melhor compreensão dessas ilusões, prever o grau de seu efeito.
p "Embora a percepção equivocada de orientação em ilusões de inclinação em geral possa sugerir explicações fisiológicas envolvendo células seletivas de orientação no córtex, nosso trabalho fornece evidências para uma teoria de que o surgimento da inclinação nesses padrões é iniciado antes de atingir as células seletivas de orientação, como resultado do conhecido mecanismo de codificação de células retinais / corticais simples, "explicaram os pesquisadores.
p Geral, os resultados coletados neste estudo sugerem que as diferenças de Gaussiana (DoG), um filtro que detecta bordas em imagens, em várias escalas pode ajudar a explicar a inclinação induzida em ilusões de azulejos e também pode ajudar a descobrir algumas das pistas ilusórias percebidas ao olhar para ilusões geométricas. Além disso, os pesquisadores foram capazes de vincular os processos de baixo para cima à percepção e cognição de nível superior, de uma forma que é consistente com a teoria de visão e detecção de bordas de David Marr.
p Os modelos atuais de visão computacional para analisar ilusões geométricas são bastante complexos, portanto, podem ser mais difíceis de aplicar em pesquisas. De acordo com os pesquisadores, estudos futuros devem tentar desenvolver métodos menos sofisticados e mais biologicamente plausíveis para detectar pistas visuais.
p "Acreditamos que uma maior exploração do papel de modelos simples semelhantes a gaussianos no processamento de retina de baixo nível, e kernels gaussianos em DNNs de estágio inicial, e sua previsão de perda de ilusão perceptual levará a técnicas e modelos de visão computacional mais precisos e pode potencialmente direcionar a visão computacional para perto ou para longe dos recursos que os humanos detectam, "escreveram os pesquisadores." Esses efeitos podem, por sua vez, deverá contribuir para modelos de alto nível de processamento de profundidade e movimento e generalizados para a compreensão computacional de imagens naturais. " p © 2019 Science X Network