Gasto pelo tempo, coberto de neve ou coberto de vegetação:na vida real, os sinais de trânsito nem sempre se parecem com os de um livro didático. Crédito:Roberto Schirdewahn
A fim de gerar imagens realistas de sinais de trânsito, pesquisadores confrontam dois algoritmos.
Para garantir que os carros um dia dirijam com autonomia e segurança pelas ruas, eles devem ser capazes de reconhecer os sinais de trânsito. Mesmo à noite, na chuva, na neve, ou se os sinais estiverem cobertos de musgo, sujo ou parcialmente coberto de vegetação. Para aprender como fazer isso, eles exigem uma infinidade de exemplos de todos os sinais de trânsito de diferentes estações, horas do dia e condições meteorológicas. "Tirar fotos de todos aqueles sinais em algum lugar seria extremamente demorado, "explica o professor Sebastian Houben do RUB Neural Computation Institute." Especialmente porque alguns dos sinais são bastante raros. "
Junto com Dominic Spata e Daniela Horn, ele, portanto, desenvolveu um método para gerar sinais de trânsito automaticamente que os computadores podem usar para praticar a visão.
Processos baseados em máquinas são melhores no reconhecimento de sinais do que humanos
Na sua infância, o projeto usou fotos de sinais de trânsito reais:em 2011, a equipe gravou vídeos de 43 sinais de trânsito padronizados na Alemanha - os pesquisadores os chamam de classes. Com base nos vídeos, eles geraram aproximadamente 50, 000 imagens individuais dos sinais de diferentes perspectivas. Os processos baseados em máquina são, em geral, melhores em reconhecer os sinais nessas imagens do que os humanos:o último identificou 98,8 por cento corretamente, enquanto um software de reconhecimento de imagem está correto em até 99,7 por cento dos casos.
Mas esse não é mais o problema principal. “Queremos chegar a um ponto em que um algoritmo aprenda a gerar imagens de sinais de trânsito que outros programas possam usar para praticar seus recursos de reconhecimento, "descreve Sebastian Houben.
Os carros que dirigem sozinhos devem ser capazes de reconhecer os sinais, mesmo que tenham sido colados ou pintados. Crédito:Roberto Schirdewahn
A equipa de investigação utiliza dois algoritmos para este efeito:um recebe pictogramas iconográficos simples de sinais de trânsito oficiais e recebe a tarefa de os transferir para imagens que se parecem com fotos; mais, o algoritmo também deve ser capaz de transferir o sinal obtido de volta para esses pictogramas em um ponto posterior. "É assim que evitamos que o algoritmo distorça a imagem do sinal a tal ponto que ele não se pareça mais com o sinal de trânsito, "explica Daniela Horn.
O segundo algoritmo deve decidir se a imagem gerada é uma foto real ou não. O objetivo é garantir que o segundo algoritmo não possa mais dizer o que é. "Além disso, o segundo algoritmo indica ao primeiro de que forma o processo de seleção pode ser ainda mais difícil, "diz Sebastian Houben." Conseqüentemente, esses dois são parceiros de sparring, Do tipo."
Inicialmente, o processo de treinamento não funciona muito bem. É um sucesso se a imagem de uma placa de sinalização prioritária tiver a cor certa e for mais ou menos quadrada. Mas está melhorando rapidamente. "Depois de dois ou três dias, verificamos como são as imagens dos sinais de trânsito, "explica Daniela Horn." Se as imagens não parecerem boas ao nosso olho humano, modificamos o algoritmo. "
Não está muito claro quando o processo será concluído, porque não existe uma medida definitiva da qualidade da imagem. Os participantes humanos são enganados por apenas dez por cento das imagens, em média, que foram criadas usando processos de geração de imagens de alta qualidade. Na maioria dos casos, os humanos reconhecem quais imagens são fotos reais e quais não são. "As razões podem ser bastante simples, "diz Daniela Horn." Houve um caso, por exemplo, onde o algoritmo sempre omitiria o mastro no qual um sinal é montado. "
Não se trata de enganar os humanos
Para humanos, este é um critério óbvio, para um sistema de computador não é nem um pouco importante. "Não se trata de enganar os humanos, "pontua o neuroinformático. Em termos de softwares de reconhecimento de imagem, os dois algoritmos obtiveram resultados melhores do que os humanos, também:após o treinamento com um número comparável de imagens artificiais, um sistema de computador visual teve um desempenho apenas dez pontos percentuais pior do que após o treinamento com imagens reais.
Além disso, a equipe de pesquisa está usando truques para otimizar o algoritmo de geração de imagens. "Tinha, por exemplo, a tendência de criar fundos de floresta - presumivelmente porque o algoritmo de reconhecimento de imagem é facilmente enganado por eles, "elabora o pesquisador. A equipe abordou esse problema alterando a cor de fundo dos pictogramas originais." Podemos influenciar o processo apenas por meio da entrada inicial e modificando o algoritmo, "diz Sebastian Houben. As decisões subsequentes feitas pelos algoritmos estão fora do controle dos pesquisadores - uma característica da inteligência artificial.