p A OI iniciou expedições arqueológicas à antiga cidade de Persépolis na década de 1930, onde eles descobriram dezenas de milhares de tabuletas de argila contendo cuneiformes. Uma colaboração entre a OI e o Departamento de Ciência da Computação usando um programa de aprendizado de máquina poderia permitir uma tradução mais rápida desses tablets. Crédito:o OI
p Vinte e cinco séculos atrás, a "papelada" do Império Aquemênida da Pérsia foi registrada em tabuletas de argila - dezenas de milhares das quais foram descobertas em 1933 no atual Irã por arqueólogos do Instituto Oriental da Universidade de Chicago. Por décadas, pesquisadores estudaram meticulosamente e traduziram esses documentos antigos à mão, mas este processo de decifração manual é muito difícil, lento e sujeito a erros. p Desde a década de 1990, cientistas recrutaram computadores para ajudar - com sucesso limitado, devido à natureza tridimensional das tabuinhas e à complexidade dos caracteres cuneiformes. Mas um avanço tecnológico na Universidade de Chicago pode finalmente fazer a transcrição automática desses comprimidos - que revelam informações valiosas sobre a história dos aquemênidas, sociedade e linguagem - possível, liberando arqueólogos para análises de alto nível.
p Essa é a motivação por trás do DeepScribe, uma colaboração entre pesquisadores da OI e do Departamento de Ciência da Computação da UChicago. Com um conjunto de treinamento de mais de 6, 000 imagens anotadas do Arquivo da Fortificação de Persépolis, o projeto financiado pelo Centro de Dados e Computação construirá um modelo que pode "ler" tablets ainda não analisados na coleção, e potencialmente uma ferramenta que os arqueólogos podem adaptar a outros estudos da escrita antiga.
p "Se pudéssemos criar uma ferramenta flexível e extensível, que pode se espalhar para diferentes scripts e períodos de tempo, isso seria realmente uma mudança de campo, "disse Susanne Paulus, professor associado de Assiriologia.
p
"É um bom problema de aprendizado de máquina"
p A colaboração começou quando Paulus, Sandra Schloen e Miller Prosser da OI encontraram Asst. Prof. Sanjay Krishnan do Departamento de Ciência da Computação em um evento do Neubauer Collegium sobre humanidades digitais. Schloen e Prosser supervisionam OCHER, uma plataforma de gerenciamento de banco de dados apoiada pela OI para capturar e organizar dados de escavações arqueológicas e outras formas de pesquisa. Krishnan aplica aprendizado profundo e técnicas de IA para análise de dados, incluindo vídeo e outros tipos de dados complexos. A sobreposição foi imediatamente aparente para ambos os lados.
p "Da perspectiva da visão computacional, é muito interessante porque esses são os mesmos desafios que enfrentamos. A visão computacional nos últimos cinco anos melhorou significativamente; dez anos atrás, isso teria sido ondulado à mão, não teríamos chegado tão longe, "Krishnan disse." É um bom problema de aprendizado de máquina, porque a precisão é objetiva aqui, temos um conjunto de treinamento rotulado e entendemos o script muito bem e isso nos ajuda. Não é um problema completamente desconhecido. "
p Na foto, há pontos de acesso delineando sinais cuneiformes em uma placa de elamita do Arquivo de Fortificação de Persépolis. Crédito:o OI
p Esse conjunto de treinamento é graças a mais de 80 anos de estudo minucioso por pesquisadores da OI e da UChicago e um esforço recente para digitalizar imagens de alta resolução da coleção de tablets - atualmente com mais de 60 terabytes e ainda crescendo - antes de seu retorno ao Irã. Usando esta coleção, pesquisadores criaram um dicionário da língua elamita inscrito nos tablets, e os alunos aprendendo a decifrar cuneiformes construíram um banco de dados de mais de 100, 000 "pontos de acesso, "ou sinais individuais identificados.
p Com recursos do UChicago Research Computing Center, Krishnan usou este conjunto de dados anotado para treinar um modelo de aprendizado de máquina, semelhantes aos usados em outros projetos de visão computacional. Quando testado em tablets não incluídos no conjunto de treinamento, o modelo conseguiu decifrar sinais cuneiformes com cerca de 80% de precisão. A pesquisa em andamento tentará elevar esse número enquanto examina o que representa os 20% restantes.
p
Muito trabalho digital pesado
p Mas mesmo a precisão de 80% pode fornecer ajuda imediata para os esforços de transcrição. Muitos dos tablets descrevem transações comerciais básicas, semelhante a "uma caixa de recibos do Walmart, "Paulus disse. E um sistema que não consegue se decidir ainda pode ser útil.
p "Se o computador pudesse apenas traduzir ou identificar as partes altamente repetitivas e deixar para um especialista preencher os nomes de lugares difíceis ou verbos ou coisas que precisam de alguma interpretação, que faz muito trabalho, "disse Paulus, o curador da coleção de tablets da OI. "E se o computador não puder tomar uma decisão definitiva, se pudesse nos devolver as probabilidades ou as quatro primeiras classificações, então, um especialista tem um ponto de partida. Isso seria incrível. "
p Ainda mais ambicioso, a equipe imagina o DeepScribe como uma ferramenta de decifração de uso geral que eles podem compartilhar com outros arqueólogos. Talvez o modelo possa ser retreinado para outras línguas cuneiformes além do elamita, ou pode fazer sugestões fundamentadas sobre o texto escrito em pedaços que faltam de tablets incompletos. Um modelo de aprendizado de máquina também pode ajudar a determinar a origem de tablets e outros artefatos de proveniência desconhecida, uma tarefa atualmente abordada por testes químicos.
p Projetos semelhantes financiados pelo CDAC estão usando abordagens de visão computacional para aplicações, como estudar a biodiversidade em bivalves marinhos e separar o estilo do conteúdo do trabalho artístico. A colaboração também espera inspirar futuras parcerias entre a OI e o Departamento de Ciência da Computação, à medida que a arqueologia digital se cruza cada vez mais com abordagens computacionais avançadas.
p "Acho que ajudou algo que teria terminado em uma conversa de jantar a se tornar uma colaboração real, "Krishnan disse." Isso nos levou a fazer mais do que apenas conversar.