p Pesquisadores do MIT e do Qatar Computing Research Institute (QCRI) estão colocando os sistemas de aprendizado de máquina conhecidos como redes neurais sob o microscópio. Crédito:MIT News
p Pesquisadores do MIT e do Qatar Computing Research Institute (QCRI) estão colocando os sistemas de aprendizado de máquina conhecidos como redes neurais sob o microscópio. p Em um estudo que lança luz sobre como esses sistemas conseguem traduzir texto de um idioma para outro, os pesquisadores desenvolveram um método que identifica nós individuais, ou "neurônios, "nas redes que captam características linguísticas específicas.
p As redes neurais aprendem a realizar tarefas computacionais processando enormes conjuntos de dados de treinamento. Na tradução automática, uma rede analisa dados de linguagem anotados por humanos, e presumivelmente "aprende" características linguísticas, como a morfologia da palavra, estrutura de sentença, e o significado da palavra. Dado o novo texto, essas redes combinam esses recursos aprendidos de um idioma para outro, e produzir uma tradução.
p Mas, em treinamento, essas redes basicamente ajustam configurações e valores internos de maneiras que os criadores não conseguem interpretar. Para tradução automática, isso significa que os criadores não sabem necessariamente quais recursos linguísticos a rede captura.
p Em um artigo apresentado na conferência Association for the Advancement of Artificial Intelligence, os pesquisadores descrevem um método que identifica quais neurônios são mais ativos ao classificar características linguísticas específicas. Eles também desenvolveram um kit de ferramentas para os usuários analisarem e manipularem como suas redes traduzem texto para vários fins, como compensar quaisquer vieses de classificação nos dados de treinamento.
p Em seu jornal, os pesquisadores identificam neurônios que são usados para classificar, por exemplo, palavras de gênero, tempos passados e presentes, números no início ou meio das frases, e palavras no plural e no singular. Eles também mostram como algumas dessas tarefas requerem muitos neurônios, enquanto outros requerem apenas um ou dois.
p "Nossa pesquisa tem como objetivo olhar dentro das redes neurais em busca de linguagem e ver quais informações elas aprendem, "diz o co-autor Yonatan Belinkov, Pós-doutorado no Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL). "Este trabalho visa obter uma compreensão mais detalhada das redes neurais e ter um melhor controle de como esses modelos se comportam."
p Os co-autores do artigo são:o cientista pesquisador sênior James Glass e o estudante de graduação Anthony Bau, de CSAIL; e Hassan Sajjad, Nadir Durrani, e Fahim Dalvi, de QCRI.
p Colocando um microscópio nos neurônios
p As redes neurais são estruturadas em camadas, onde cada camada consiste em muitos nós de processamento, cada um conectado a nós nas camadas acima e abaixo. Os dados são processados primeiro na camada mais baixa, que passa uma saída para a camada acima, e assim por diante. Cada saída tem um "peso" diferente para determinar quanto ela figura no cálculo da próxima camada. Durante o treinamento, esses pesos são reajustados constantemente.
p Redes neurais usadas para tradução automática treinam em dados de linguagem anotados. Em treinamento, cada camada aprende diferentes "embeddings de palavras" para uma palavra. Embeddings de palavras são essencialmente tabelas com várias centenas de números combinados de uma forma que corresponde a uma palavra e à função dessa palavra em uma frase. Cada número na incorporação é calculado por um único neurônio.
p Em seus trabalhos anteriores, os pesquisadores treinaram um modelo para analisar as saídas ponderadas de cada camada para determinar como as camadas classificaram qualquer incorporação. Eles descobriram que as camadas inferiores classificavam recursos linguísticos relativamente mais simples, como a estrutura de uma palavra específica, e os níveis superiores ajudavam a classificar recursos mais complexos, por exemplo, como as palavras se combinam para formar um significado.
p Em seu novo trabalho, os pesquisadores usam essa abordagem para determinar como os encaixes de palavras aprendidas fazem uma classificação linguística. Mas eles também implementaram uma nova técnica, chamada de "análise de correlação linguística, "que treina um modelo para localizar os neurônios individuais em cada incorporação de palavras que foram mais importantes na classificação.
p A nova técnica combina todos os embeddings capturados de diferentes camadas - cada um contendo informações sobre a classificação final da palavra - em um único embedding. À medida que a rede classifica uma determinada palavra, o modelo aprende pesos para cada neurônio que foi ativado durante cada processo de classificação. Isso fornece um peso para cada neurônio em cada incorporação de palavra que disparou para uma parte específica da classificação.
p "A ideia é, se este neurônio é importante, deve haver um alto peso que é aprendido, "Belinkov diz." Os neurônios com pesos elevados são os mais importantes para prever certas propriedades linguísticas. Você pode pensar nos neurônios como muitos botões que você precisa girar para obter a combinação correta de números na incorporação. Alguns botões são mais importantes do que outros, portanto, a técnica é uma forma de atribuir importância a esses botões. "
p Ablação de neurônios, manipulação de modelo
p Porque cada neurônio é pesado, ele pode ser classificado em ordem de importância. Para esse fim, os pesquisadores desenvolveram um kit de ferramentas, chamado NeuroX, que classifica automaticamente todos os neurônios de uma rede neural de acordo com sua importância e os visualiza em uma interface web.
p Os usuários fazem upload de uma rede que já treinaram, bem como novo texto. O aplicativo exibe o texto e, próximo a, uma lista de neurônios específicos, cada um com um número de identificação. Quando um usuário clica em um neurônio, o texto será destacado dependendo de quais palavras e frases o neurônio ativa. De lá, os usuários podem nocautear completamente - ou "remover" - os neurônios, ou modificar a extensão de sua ativação, para controlar como a rede é traduzida.
p A tarefa de ablação foi usada para determinar se o método dos pesquisadores localizou com precisão os neurônios de alto escalão corretos. Em seu jornal, os pesquisadores usaram a ferramenta para mostrar que, ablando neurônios de alto escalão em uma rede, seu desempenho na classificação de características linguísticas correlatas caiu significativamente. Alternativamente, quando eles realizaram a ablação de neurônios de baixo escalão, desempenho sofrido, mas não tão dramaticamente.
p "Depois de obter todas essas classificações, você quer ver o que acontece quando você mata esses neurônios e ver o quanto isso afeta o desempenho, "Belinkov diz." Esse é um resultado importante que prova que os neurônios que encontramos são, na verdade, importante para o processo de classificação. "
p Um aplicativo interessante para o kit de ferramentas é ajudar a limitar os preconceitos nos dados de idioma. Modelos de tradução automática, como o Google Translate, pode treinar em dados com preconceito de gênero, o que pode ser problemático para idiomas com palavras com gênero. Certas profissões, por exemplo, pode ser mais frequentemente referido como masculino, e outros como mulheres. Quando uma rede traduz um novo texto, pode apenas produzir o gênero aprendido para essas palavras. Em muitas traduções online de inglês para espanhol, por exemplo, "médico" muitas vezes se traduz em sua versão masculina, enquanto "enfermeira" se traduz em sua versão feminina.
p "Mas descobrimos que podemos rastrear neurônios individuais responsáveis por propriedades linguísticas como gênero, "Belinkov diz." Se você for capaz de rastreá-los, talvez você possa intervir de alguma forma e influenciar a tradução para traduzir essas palavras mais para o gênero oposto ... para remover ou mitigar o preconceito. "
p Em experimentos preliminares, os pesquisadores modificaram neurônios em uma rede para alterar o texto traduzido do passado para o presente com uma precisão de 67%. Eles conseguiram mudar o gênero das palavras com 21 por cento de precisão. "Ainda é um trabalho em andamento, "Belinkov diz. Uma próxima etapa, ele adiciona, está ajustando o aplicativo da web para obter ablação e manipulação mais precisas. p
Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.