• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • IA mais inteligente - aprendizado de máquina sem dados negativos

    Esquema mostrando dados positivos (maçãs) e uma falta de dados negativos (bananas), com uma ilustração da confiança dos dados da apple. Crédito:RIKEN

    Uma equipe de pesquisa do RIKEN Center for Advanced Intelligence Project (AIP) desenvolveu com sucesso um novo método para aprendizado de máquina que permite que uma IA faça classificações sem o que é conhecido como "dados negativos, "uma descoberta que poderia levar a uma aplicação mais ampla a uma variedade de tarefas de classificação.

    Classificar as coisas é fundamental para nossas vidas diárias. Por exemplo, temos que detectar e-mails de spam, notícias políticas falsas, bem como coisas mais mundanas, como objetos ou rostos. Ao usar IA, tais tarefas são baseadas na "tecnologia de classificação" no aprendizado de máquina - fazer com que o computador aprenda usando a fronteira que separa dados positivos e negativos. Por exemplo, dados "positivos" seriam fotos, incluindo um rosto feliz, e fotos de dados "negativos" que incluem um rosto triste. Uma vez que um limite de classificação é aprendido, o computador pode determinar se certos dados são positivos ou negativos. A dificuldade com esta tecnologia é que ela requer dados positivos e negativos para o processo de aprendizagem, e dados negativos não estão disponíveis em muitos casos (por exemplo, é difícil encontrar fotos com a etiqueta, "esta foto inclui um rosto triste, "já que a maioria das pessoas sorri na frente de uma câmera.)

    Em termos de programas da vida real, quando um varejista está tentando prever quem fará uma compra, pode encontrar facilmente dados sobre os clientes que compraram deles (dados positivos), mas é basicamente impossível obter dados sobre os clientes que não compraram deles (dados negativos), uma vez que eles não têm acesso aos dados de seus concorrentes. Outro exemplo é uma tarefa comum para desenvolvedores de aplicativos:eles precisam prever quais usuários continuarão usando o aplicativo (positivo) ou pararão (negativo). Contudo, quando um usuário cancela a assinatura, os desenvolvedores perdem os dados do usuário porque têm que deletar completamente os dados relativos a esse usuário de acordo com a política de privacidade para proteger as informações pessoais.

    De acordo com o autor principal Takashi Ishida de RIKEN AIP, "Os métodos de classificação anteriores não conseguiam lidar com a situação em que os dados negativos não estavam disponíveis, mas tornamos possível que os computadores aprendam apenas com dados positivos, contanto que tenhamos uma pontuação de confiança para nossos dados positivos, construído a partir de informações como intenção de compra ou taxa ativa de usuários do aplicativo. Usando nosso novo método, podemos permitir que os computadores aprendam um classificador apenas a partir de dados positivos equipados com confiança. "

    Ishida propôs, junto com o pesquisador Gang Niu de seu grupo e o líder da equipe Masashi Sugiyama, que eles permitem que os computadores aprendam bem, adicionando a pontuação de confiança, que corresponde matematicamente à probabilidade de os dados pertencerem a uma classe positiva ou não. Eles tiveram sucesso no desenvolvimento de um método que pode permitir que os computadores aprendam um limite de classificação apenas a partir de dados positivos e informações sobre sua confiança (confiabilidade positiva) contra problemas de classificação de aprendizado de máquina que dividem dados positiva e negativamente.

    Para ver como o sistema funcionou bem, eles o usaram em um conjunto de fotos que contém várias etiquetas de itens de moda. Por exemplo, eles escolheram "T-shirt, "como a classe positiva e um outro item, por exemplo., "sandália", como a classe negativa. Em seguida, eles anexaram um índice de confiança às fotos da "camiseta". Eles descobriram que, sem acessar os dados negativos (por exemplo, fotos de "sandália"), em alguns casos, seu método era tão bom quanto um método que envolve o uso de dados positivos e negativos.

    De acordo com Ishida, "Essa descoberta pode expandir a gama de aplicativos em que a tecnologia de classificação pode ser usada. Mesmo em campos onde o aprendizado de máquina tem sido usado ativamente, nossa tecnologia de classificação pode ser usada em novas situações em que apenas dados positivos podem ser coletados devido à regulamentação de dados ou restrições de negócios. No futuro próximo, esperamos colocar nossa tecnologia em uso em vários campos de pesquisa, como processamento de linguagem natural, visão de computador, robótica, e bioinformática. "


    © Ciência https://pt.scienceaq.com