A IA servirá para desenvolver um sistema de controle de rede que não apenas detecta e reage aos problemas, mas também pode prever e evitá-los. Crédito CC0:domínio público
Andrey Savchenko, Professor da Escola Superior de Economia (HSE University), desenvolveu um método que pode ajudar a melhorar a identificação da imagem em vídeos. Em seu projeto, uma rede foi ensinada por um novo algoritmo e agora pode tomar decisões sobre reconhecimento e classificação de imagens em uma taxa 10 vezes mais rápida do que antes. Esta pesquisa foi apresentada no artigo "Decisões sequenciais de três vias no reconhecimento de imagens multicategorias com recursos profundos com base no fator de distância" publicado em Ciências da Informação .
As redes neurais aprenderam a identificar humanos e animais em vídeos há muito tempo. Os neurônios artificiais podem aprender lembrando-se da aparência de um determinado objeto em uma imagem. Usualmente, pesquisadores tiram um banco de dados aberto de fotos (por exemplo, ImageNet, Locais, etc.) e usá-lo para ensinar uma rede neural. Para acelerar o processo de tomada de decisão, nosso algoritmo está configurado para escolher apenas algumas das imagens de amostra, ou focar em um número limitado de características. Podem surgir complicações quando objetos de classes diferentes estão na mesma foto, e há apenas um pequeno número de exemplos de treinamento para cada categoria.
O novo algoritmo agora pode reconhecer imagens sem degradação significativa da precisão por meio da aplicação de um método de tomada de decisão sequencial de três vias. Ao empregar essa abordagem, uma rede neural pode analisar imagens simples de uma maneira para objetos claramente reconhecíveis, enquanto objetos que são difíceis de identificar podem ser submetidos a um exame mais detalhado.
"Cada foto pode ser descrita por literalmente milhares de recursos. Então, não faria muito sentido comparar todos os recursos de uma determinada imagem de entrada com os de um exemplo de treinamento básico, uma vez que a maioria das amostras não seria semelhante à imagem analisada. Então, inicialmente comparamos apenas alguns dos recursos importantes, e deixar de lado as instâncias de treinamento, que obviamente não podem ser tratadas como soluções finais. Como resultado, a amostra de treinamento fica menor e apenas alguns exemplos são deixados. Na próxima fase, aumentaríamos o número de recursos para as imagens restantes, e, em seguida, repita esse processo até que apenas uma classe reste, "Prof. Savchenko observou.
Essa abordagem reduziu o tempo de reconhecimento de 1,5 a 10 vezes, em comparação com classificadores regulares e decisões de três vias sequenciais multicategorias conhecidas. Como resultado, esta tecnologia pode ser usada no futuro em dispositivos móveis e outros dispositivos básicos.