Uma rede neural para extrair fragmentos e documentos com conhecimento

Estrutura do modelo proposto. Crédito:Zhou et al.

Todos os dias, milhões de artigos são publicados nas redes sociais e outras plataformas, receber uma grande quantidade de cliques e compartilhamentos de usuários que navegam na web. Muitos desses artigos contêm informações úteis que, se extraído, pode ser usado para compilar bancos de dados de conhecimento ou para fornecer recuperação de conhecimento e serviços de resposta a perguntas.

Pesquisadores da Academia Chinesa de Ciências (CAS) desenvolveram um modelo baseado em rede neural convolucional (CNN) para extrair fragmentos com conhecimento e fazer anotações em documentos. Seu método, delineado em um artigo pré-publicado no arXiv, foi considerado um desempenho melhor do que as ferramentas existentes, apesar de ter sido treinado por períodos mais curtos de tempo.

Em seu jornal, os pesquisadores definem o termo "documento conhecedor" como "um documento contendo vários fragmentos conhecedores, que descrevem conceitos, propriedades de entidades, ou as relações entre entidades. "Até agora, a maioria das bases de conhecimento, como YAGO ou DBpedia, extrair conhecimento baseado na Wikipedia, WordNet, GeoNames, e outros recursos online. Contudo, em comparação com as plataformas de mídia social, esses recursos geralmente contêm informações limitadas e inflexíveis.

"Outra base de conhecimento recente, Probase, com 2,7 milhões de conceitos, foi automaticamente aproveitado do maior corpus até agora, consistindo em 326 milhões de sentenças instruídas extraídas de 1,68 bilhão de páginas da web, "escreveram os pesquisadores em seu artigo." No entanto, essas sentenças são extraídas apenas pelos padrões de Hearst. Para extrair trechos mais informados para construir bases de conhecimento mais abrangentes, métodos baseados em semântica são necessários para complementar os anteriores baseados em padrões. "

Exemplo de documento com conhecimento. As frases em azul e vermelho são trechos com e sem conhecimento, respectivamente. O documento apresenta as 25 dicas para aquisição de imóveis. Crédito:Zhou et al.

Trechos e artigos com conhecimento também podem ser usados para desenvolver serviços de recuperação de conhecimento e resposta a perguntas. Esses serviços seriam, por exemplo, responder a perguntas levantadas por usuários que procuram ajuda para um problema específico. Com esses aplicativos em mente, os pesquisadores do CAS decidiram desenvolver um modelo baseado em CNN que pode analisar a semântica de um documento, determinar se é conhecedor ou não, e extrair fragmentos de informações com conhecimento dele.

"Especificamente, propomos SSNN, um modelo baseado em CNN conjunto, para entender o conceito abstrato de documentos em diferentes domínios de forma colaborativa e julgar se um documento é conhecido ou não, "os pesquisadores explicam em seu artigo." Em mais detalhes, a estrutura de rede do SSNN é 'Compartilhamento de baixo nível, divisão de alto nível, "em que as camadas de baixo nível são compartilhadas por diferentes domínios, enquanto as camadas de alto nível além da CNN são treinadas separadamente para perceber as diferenças de diferentes domínios."

O modelo idealizado pelos pesquisadores oferece uma solução ponta a ponta para anotar documentos que não envolve uma engenharia de recursos extensa e demorada. Eles também desenvolveram recursos manuais e treinaram um modelo de classificador SVM para concluir a tarefa.

Exemplo de documento com conhecimento. As frases em azul e vermelho são trechos com e sem conhecimento, respectivamente. O documento apresenta as habilidades de giro da direção. Crédito:Zhou et al.

Os pesquisadores avaliaram a eficácia de seu modelo em um conjunto de dados de documentos reais de três domínios de conteúdo no WeChat, uma mensagem chinesa, mídia social e plataforma de pagamento móvel desenvolvida pela Tencent. Suas descobertas foram muito promissoras, com o SSNN tendo um desempenho consistentemente melhor do que outros modelos CNN, enquanto economiza tempo e consumo de memória graças a processos de treinamento mais curtos e eficientes.

"Em comparação com a construção de vários CNNs específicos de domínio, este modelo conjunto não só economiza tempo de treinamento de forma crítica, mas também melhora a precisão da previsão visivelmente, "os pesquisadores escreveram em seu artigo." A superioridade do modelo proposto é demonstrada em um conjunto de dados real das plataformas públicas Wechat. "

No futuro, o modelo SSNN proposto neste estudo poderia ser usado para construir bancos de dados de conhecimento mais abrangentes. Também pode auxiliar no desenvolvimento de serviços inovadores que respondem às dúvidas dos usuários de forma rápida e exaustiva em tempo real.

Uber faz parceria com empresa de táxi do Japão na tentativa de abrir um mercado difícil

MakerLab se tornando um centro de implantes de concha impressos em 3D para animais de estimação feridos

Eletrônicos