• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Outros
    Como a IA poderia ajudar a traduzir a linguagem escrita de civilizações antigas
    p A OI iniciou expedições arqueológicas à antiga cidade de Persépolis na década de 1930, onde eles descobriram dezenas de milhares de tabuletas de argila contendo cuneiformes. Uma colaboração entre a OI e o Departamento de Ciência da Computação usando um programa de aprendizado de máquina poderia permitir uma tradução mais rápida desses tablets. Crédito:o OI

    p Vinte e cinco séculos atrás, a "papelada" do Império Aquemênida da Pérsia foi registrada em tabuletas de argila - dezenas de milhares das quais foram descobertas em 1933 no atual Irã por arqueólogos do Instituto Oriental da Universidade de Chicago. Por décadas, pesquisadores estudaram meticulosamente e traduziram esses documentos antigos à mão, mas este processo de decifração manual é muito difícil, lento e sujeito a erros. p Desde a década de 1990, cientistas recrutaram computadores para ajudar - com sucesso limitado, devido à natureza tridimensional das tabuinhas e à complexidade dos caracteres cuneiformes. Mas um avanço tecnológico na Universidade de Chicago pode finalmente fazer a transcrição automática desses comprimidos - que revelam informações valiosas sobre a história dos aquemênidas, sociedade e linguagem - possível, liberando arqueólogos para análises de alto nível.

    p Essa é a motivação por trás do DeepScribe, uma colaboração entre pesquisadores da OI e do Departamento de Ciência da Computação da UChicago. Com um conjunto de treinamento de mais de 6, 000 imagens anotadas do Arquivo da Fortificação de Persépolis, o projeto financiado pelo Centro de Dados e Computação construirá um modelo que pode "ler" tablets ainda não analisados ​​na coleção, e potencialmente uma ferramenta que os arqueólogos podem adaptar a outros estudos da escrita antiga.

    p "Se pudéssemos criar uma ferramenta flexível e extensível, que pode se espalhar para diferentes scripts e períodos de tempo, isso seria realmente uma mudança de campo, "disse Susanne Paulus, professor associado de Assiriologia.

    p "É um bom problema de aprendizado de máquina"

    p A colaboração começou quando Paulus, Sandra Schloen e Miller Prosser da OI encontraram Asst. Prof. Sanjay Krishnan do Departamento de Ciência da Computação em um evento do Neubauer Collegium sobre humanidades digitais. Schloen e Prosser supervisionam OCHER, uma plataforma de gerenciamento de banco de dados apoiada pela OI para capturar e organizar dados de escavações arqueológicas e outras formas de pesquisa. Krishnan aplica aprendizado profundo e técnicas de IA para análise de dados, incluindo vídeo e outros tipos de dados complexos. A sobreposição foi imediatamente aparente para ambos os lados.

    p "Da perspectiva da visão computacional, é muito interessante porque esses são os mesmos desafios que enfrentamos. A visão computacional nos últimos cinco anos melhorou significativamente; dez anos atrás, isso teria sido ondulado à mão, não teríamos chegado tão longe, "Krishnan disse." É um bom problema de aprendizado de máquina, porque a precisão é objetiva aqui, temos um conjunto de treinamento rotulado e entendemos o script muito bem e isso nos ajuda. Não é um problema completamente desconhecido. "

    p Na foto, há pontos de acesso delineando sinais cuneiformes em uma placa de elamita do Arquivo de Fortificação de Persépolis. Crédito:o OI

    p Esse conjunto de treinamento é graças a mais de 80 anos de estudo minucioso por pesquisadores da OI e da UChicago e um esforço recente para digitalizar imagens de alta resolução da coleção de tablets - atualmente com mais de 60 terabytes e ainda crescendo - antes de seu retorno ao Irã. Usando esta coleção, pesquisadores criaram um dicionário da língua elamita inscrito nos tablets, e os alunos aprendendo a decifrar cuneiformes construíram um banco de dados de mais de 100, 000 "pontos de acesso, "ou sinais individuais identificados.

    p Com recursos do UChicago Research Computing Center, Krishnan usou este conjunto de dados anotado para treinar um modelo de aprendizado de máquina, semelhantes aos usados ​​em outros projetos de visão computacional. Quando testado em tablets não incluídos no conjunto de treinamento, o modelo conseguiu decifrar sinais cuneiformes com cerca de 80% de precisão. A pesquisa em andamento tentará elevar esse número enquanto examina o que representa os 20% restantes.

    p Muito trabalho digital pesado

    p Mas mesmo a precisão de 80% pode fornecer ajuda imediata para os esforços de transcrição. Muitos dos tablets descrevem transações comerciais básicas, semelhante a "uma caixa de recibos do Walmart, "Paulus disse. E um sistema que não consegue se decidir ainda pode ser útil.

    p "Se o computador pudesse apenas traduzir ou identificar as partes altamente repetitivas e deixar para um especialista preencher os nomes de lugares difíceis ou verbos ou coisas que precisam de alguma interpretação, que faz muito trabalho, "disse Paulus, o curador da coleção de tablets da OI. "E se o computador não puder tomar uma decisão definitiva, se pudesse nos devolver as probabilidades ou as quatro primeiras classificações, então, um especialista tem um ponto de partida. Isso seria incrível. "

    p Ainda mais ambicioso, a equipe imagina o DeepScribe como uma ferramenta de decifração de uso geral que eles podem compartilhar com outros arqueólogos. Talvez o modelo possa ser retreinado para outras línguas cuneiformes além do elamita, ou pode fazer sugestões fundamentadas sobre o texto escrito em pedaços que faltam de tablets incompletos. Um modelo de aprendizado de máquina também pode ajudar a determinar a origem de tablets e outros artefatos de proveniência desconhecida, uma tarefa atualmente abordada por testes químicos.

    p Projetos semelhantes financiados pelo CDAC estão usando abordagens de visão computacional para aplicações, como estudar a biodiversidade em bivalves marinhos e separar o estilo do conteúdo do trabalho artístico. A colaboração também espera inspirar futuras parcerias entre a OI e o Departamento de Ciência da Computação, à medida que a arqueologia digital se cruza cada vez mais com abordagens computacionais avançadas.

    p "Acho que ajudou algo que teria terminado em uma conversa de jantar a se tornar uma colaboração real, "Krishnan disse." Isso nos levou a fazer mais do que apenas conversar.


    © Ciência https://pt.scienceaq.com