• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • A interseção de visão e linguagem

    Os pesquisadores por trás do Prêmio CVPR de Melhor Trabalho de Aluno de 2019 são reconhecidos por seu trabalho. Crédito:Matthew Turk

    Nove mil e duzentos pesquisadores de inteligência artificial. Cinco mil cento e sessenta e cinco artigos de pesquisa submetidos, dos quais apenas 1, 300 foram aceitos. Um Melhor Trabalho do Aluno.

    E o prêmio foi para:o estudante de doutorado em ciência da computação da UC Santa Barbara, Xin Wang. Seu trabalho de estudante, "Reforçada Cross-Modal Matching e Auto-Supervised Imitation Learning for Vision-Language Navigation, "emergiu no. 1 em sua categoria na 31ª Conferência IEEE / CVF sobre Visão Computacional e Reconhecimento de Padrões (CVPR), uma das conferências mais importantes no campo da ciência da computação hoje. O evento de premiação aconteceu em Long Beach, na terça-feira, 18 de junho.

    "Xin começou a trabalhar comigo em 2017 como aluno de Ph.D. em tópicos relacionados à linguagem e à pesquisa da visão, "disse William Wang, professor assistente do Departamento de Ciência da Computação da Faculdade de Engenharia da UCSB. "Desde março de 2018, estudamos o problema de navegação em linguagem de visão:como você usa instruções verbais para ensinar robôs a destinos específicos, sem acesso a um mapa? "

    Um robô que pode navegar com base na visão e realizar tarefas sob instruções em linguagem comum parece ficção científica, mas está mais perto da realidade do que você imagina.

    "Eu tenho trabalhado na interseção de visão e linguagem por um tempo, "Xin Wang disse, "e acredito que um dos grandes movimentos da IA ​​é fazer com que os robôs interajam com o mundo visual e físico, especialmente por meio de linguagem natural.

    "A navegação em linguagem de visão pode permitir muitas aplicações práticas, por exemplo, robôs domésticos, "ele continuou." Todo mundo, especialmente os deficientes, pode pedir ao robô para realizar algumas tarefas, por exemplo, 'Vá até a cozinha e traga um copo d'água para mim'. A navegação em linguagem de visão serve como uma tarefa básica para entender as cenas visuais e as instruções em linguagem natural, bem como realizar ações físicas para cumprir trabalhos de alto nível. "

    Mas o que vem tão naturalmente para as pessoas - navegar por uma cena e executar tarefas usando dicas ambientais em tempo real e conceitos humanos - requer um estrutura ainda elegante na qual os robôs podem aprender a conectar os dados que coletam ao significado das instruções que recebem. É um processo iterativo, exigindo reforço, feedback e adaptação. O trabalho de Xin Wang, de acordo com seu conselheiro, "apresenta várias idéias inovadoras para melhorar a generalização do algoritmo de navegação em linguagem de visão."

    "Este avanço na pesquisa de linguagem e visão permitirá que os robôs auxiliem melhor os humanos em muitas rotinas diárias e especiais, incluindo limpeza e manutenção doméstica, localização e recuperação de itens, controle remoto, auxiliando cegos, alívio de desastres, et cetera, "William Wang disse." Tem o potencial de influenciar milhões de pessoas e melhorar a qualidade de vida dos humanos, incluindo libertar humanos de tarefas domésticas tediosas, para que possamos arranjar tempo para atividades criativas. "

    A pesquisa para o Melhor Artigo de Aluno do CVPR 2019, que se baseia em colaborações anteriores na UCSB na aprendizagem por reforço baseada em modelo e livre de modelo com Ph.D. estudante Wenhan Xiong, foi conduzido no verão de 2018 durante um estágio na Microsoft Research (MSR), sob os mentores Qiuyuan Huang, Asli Celikyilmaz, Jianfeng Gao e Lei Zhang.

    De acordo com o comitê de Best Paper CVPR, "A navegação visual é uma área importante da visão computacional - este artigo faz avanços na navegação em linguagem visual. Com base em trabalhos anteriores nesta área, este artigo demonstra resultados empolgantes com base na aprendizagem de autoimitação em um ambiente multi-modal. "

    "Gostaríamos de parabenizar Xin Wang e William Wang por este reconhecimento extremamente prestigioso por seu trabalho em uma área que está na vanguarda da ciência da computação, "disse o decano da faculdade de engenharia Rod Alferness." Estamos muito satisfeitos por eles fazerem parte da comunidade UCSB. "

    "Estou muito honrado em receber este prêmio, "Xin Wang disse." Gostaria de agradecer sinceramente aos meus conselheiros William e Yuan-Fang, e aos colaboradores do MSR por seu forte apoio e valiosa orientação. Quanto ao futuro, Espero que mais e mais pesquisadores possam trabalhar nesta direção de pesquisa estimulante e necessária, em direção a robôs mais práticos e interativos que unem visão e linguagem para humanos. Certamente irei me dedicar a fazer isso acontecer. "


    © Ciência https://pt.scienceaq.com