• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Pesquisador desenvolve chatbot com expertise em nanomateriais
    Kevin Yager. Crédito:Jospeh Rubino/Laboratório Nacional Brookhaven

    Um pesquisador acaba de escrever um artigo científico. Ela sabe que seu trabalho pode se beneficiar de outra perspectiva. Ela esqueceu alguma coisa? Ou talvez haja uma aplicação de sua pesquisa na qual ela não tinha pensado. Um segundo par de olhos seria ótimo, mas mesmo o mais amigável dos colaboradores pode não conseguir perder tempo para ler todas as publicações de referência necessárias para se atualizar.



    Kevin Yager - líder do grupo de nanomateriais eletrônicos do Centro de Nanomateriais Funcionais (CFN), uma instalação de usuário do Escritório de Ciência do Departamento de Energia dos EUA (DOE) no Laboratório Nacional Brookhaven do DOE - imaginou como os avanços recentes em inteligência artificial (IA) e o aprendizado de máquina (ML) pode ajudar no brainstorming e na idealização científica. Para conseguir isso, ele desenvolveu um chatbot com conhecimento nos tipos de ciência em que está envolvido.

    Os rápidos avanços em IA e ML deram lugar a programas que podem gerar textos criativos e códigos de software úteis. Esses chatbots de uso geral capturaram recentemente a imaginação do público. Os chatbots existentes – baseados em modelos de linguagem grandes e diversos – carecem de conhecimento detalhado dos subdomínios científicos.

    Ao aproveitar um método de recuperação de documentos, o bot de Yager tem conhecimento em áreas da ciência de nanomateriais que outros bots não têm. Os detalhes deste projeto e como outros cientistas podem aproveitar este colega de IA para o seu próprio trabalho foram publicados recentemente na Digital Discovery .

    Ascensão dos robôs


    "Há muito tempo que o CFN busca novas maneiras de aproveitar a IA/ML para acelerar a descoberta de nanomateriais. Atualmente, ele está nos ajudando a identificar, catalogar e escolher amostras rapidamente, automatizar experimentos, controlar equipamentos e descobrir novos materiais. Esther Tsai, um cientista do grupo de nanomateriais eletrônicos do CFN, está desenvolvendo um companheiro de IA para ajudar a acelerar experimentos de pesquisa de materiais na Fonte Nacional de Luz Síncrotron II (NSLS-II)." NSLS-II é outra instalação de usuário do DOE Office of Science no Brookhaven Lab.

    No CFN, tem havido muito trabalho em IA/ML que pode ajudar a conduzir experimentos por meio do uso de automação, controles, robótica e análise, mas ter um programa adequado a textos científicos era algo que os pesquisadores não haviam explorado tão profundamente. Ser capaz de documentar, compreender e transmitir rapidamente informações sobre um experimento pode ajudar de várias maneiras – desde quebrar barreiras linguísticas até economizar tempo resumindo trabalhos maiores.
    Uma demonstração do chatbot de Yager respondendo a uma pergunta relacionada à pesquisa do CFN. Crédito:Laboratório Nacional de Brookhaven

    Observando seu idioma

    Para construir um chatbot especializado, o programa exigia texto específico do domínio – linguagem retirada das áreas nas quais o bot se destina a se concentrar. Neste caso, o texto são publicações científicas. O texto específico do domínio ajuda o modelo de IA a compreender novas terminologias e definições e apresenta conceitos científicos de ponta. Mais importante ainda, este conjunto de documentos selecionados permite que o modelo de IA baseie seu raciocínio usando fatos confiáveis.

    Para emular a linguagem humana natural, os modelos de IA são treinados em textos existentes, permitindo-lhes aprender a estrutura da linguagem, memorizar vários factos e desenvolver um tipo primitivo de raciocínio. Em vez de reciclar laboriosamente o modelo de IA em textos de nanociência, Yager deu-lhe a capacidade de procurar informações relevantes em um conjunto selecionado de publicações. Fornecer-lhe uma biblioteca de dados relevantes foi apenas metade da batalha. Para usar este texto com precisão e eficácia, o bot precisaria de uma maneira de decifrar o contexto correto.

    "Um desafio comum com os modelos de linguagem é que às vezes eles 'alucinam' coisas que parecem plausíveis, mas falsas", explicou Yager. "Esta tem sido uma questão central a ser resolvida para um chatbot usado em pesquisa, em oposição a alguém que faz algo como escrever poesia. Não queremos que ele fabrique fatos ou citações. Isso precisava ser resolvido. A solução para isso era algo que nós chamo de 'incorporação', uma forma de categorizar e vincular informações rapidamente nos bastidores."

    Incorporação é um processo que transforma palavras e frases em valores numéricos. O "vetor de incorporação" resultante quantifica o significado do texto. Quando um usuário faz uma pergunta ao chatbot, ela também é enviada ao modelo de incorporação de ML para calcular seu valor vetorial. Este vetor é usado para pesquisar em um banco de dados pré-computado de trechos de texto de artigos científicos que foram incorporados de forma semelhante. O bot então usa trechos de texto que considera semanticamente relacionados à pergunta para obter uma compreensão mais completa do contexto.

    A consulta do usuário e os trechos de texto são combinados em um “prompt” que é enviado para um grande modelo de linguagem, um programa expansivo que cria texto modelado na linguagem humana natural, que gera a resposta final. A incorporação garante que o texto extraído seja relevante no contexto da pergunta do usuário. Ao fornecer trechos de texto do corpo de documentos confiáveis, o chatbot gera respostas factuais e originais.

    “O programa precisa ser como um bibliotecário de referência”, disse Yager. "Ele precisa confiar fortemente nos documentos para fornecer respostas originais. Precisa ser capaz de interpretar com precisão o que as pessoas estão perguntando e ser capaz de reunir efetivamente o contexto dessas perguntas para recuperar as informações mais relevantes. Embora as respostas possam não ser ainda ser perfeito, já é capaz de responder questões desafiadoras e desencadear alguns pensamentos interessantes enquanto planeja novos projetos e pesquisas."
    Crédito:Laboratório Nacional de Brookhaven

    Bots capacitando humanos

    A CFN está desenvolvendo sistemas de IA/ML como ferramentas que podem liberar pesquisadores humanos para trabalhar em problemas mais desafiadores e interessantes e para aproveitar melhor seu tempo limitado enquanto os computadores automatizam tarefas repetitivas em segundo plano. Ainda há muitas incógnitas sobre esta nova forma de trabalhar, mas estas questões são o início de discussões importantes que os cientistas estão tendo neste momento para garantir que o uso de IA/ML seja seguro e ético.

    "Há uma série de tarefas que um chatbot de domínio específico como este poderia eliminar da carga de trabalho de um cientista. Classificar e organizar documentos, resumir publicações, apontar informações relevantes e atualizar-se em uma nova área temática são apenas alguns exemplos potenciais aplicações", observou Yager. "No entanto, estou animado para ver onde tudo isso irá. Nunca poderíamos ter imaginado onde estamos agora, três anos atrás, e estou ansioso para saber onde estaremos daqui a três anos."

    Para pesquisadores interessados ​​em experimentar este software por conta própria, o código-fonte do chatbot do CFN e ferramentas associadas podem ser encontrados neste repositório GitHub.

    Mais informações: Kevin G. Yager, Chatbots específicos de domínio para ciência usando embeddings, Digital Discovery (2023). DOI:10.1039/D3DD00112A
    Fornecido pelo Laboratório Nacional de Brookhaven



    © Ciência https://pt.scienceaq.com