Há boas chances de você ter enviado ou recebido uma mensagem que foi truncada graças à correção automática ou preenchimento automático. Existem centenas de memes em que esses erros causam falhas de comunicação, frequentemente com resultados hilários. Como este. Ou este. Ou este.
Mas não é tão engraçado quando acontece com o seu artigo científico. Trabalhos acadêmicos frequentemente incluem arquivos suplementares com dados, tabelas e gráficos que apóiam a conclusão do artigo. Muitos desses arquivos são planilhas.
Desde 2004, cientistas notaram que o Microsoft Excel, o popular programa de planilhas tem o mau hábito de transformar alguns nomes de genes em outros tipos de dados. Por exemplo, geneticistas usam MARCH1 como uma abreviação para dedo tipo CH anel associado à membrana 1. Mas o Excel interpreta MARCH1 como uma data, convertendo-o automaticamente para 1-março ou outra designação para primeiro de março.
O Excel identifica erroneamente alguns outros nomes de genes como coordenadas ou pontos flutuantes. Você pode descobrir que 1 de março é, na verdade, 1 de março, mas que tal 2.31E + 13? É assim que o Excel converte o identificador RIKEN 2310009E13. RIKEN é um grande instituto de pesquisa no Japão que, entre outras coisas, conduz projetos de genoma. (Para o registro, tentamos conectar o identificador RIKEN em uma planilha do Excel e o convertemos automaticamente para 2,31E + 19, ainda está errado e ainda não é o que se pretende nesses trabalhos acadêmicos.)
Apesar do fato de que os pesquisadores identificaram esse problema pela primeira vez há mais de uma década, persiste hoje. Pesquisadores Mark Ziemann, Yotam Eren e Assam El-Osta exibiram mais de 35, 000 arquivos suplementares para ver até que ponto o problema estava realmente disseminado. Eles desenvolveram um software automatizado que buscava quaisquer dados que parecessem ser uma lista de nomes de genes. Eles identificaram 7, 467 listas de genes que representam os dados suplementares para 3, 597 artigos publicados em 18 periódicos diferentes. Descobriu-se que 704 desses artigos publicados incluíam arquivos com erros de formato do Excel. Isso é uma taxa de falha de 19,6 por cento. Em outras palavras, quase um em cada cinco artigos publicados inclui arquivos suplementares com erros de formatação do Excel.
Isso não é apenas um inconveniente. Os pesquisadores contam com trabalhos publicados para orientar seus próprios projetos. Se os arquivos incluírem erros, pode ser difícil e demorado resolver o problema e encontrar os dados relevantes.
Por que não apenas desativar os recursos de formatação automática? De acordo com a equipe de pesquisa, não há como desabilitar permanentemente os recursos do Excel. Você pode ser capaz de alterar manualmente cada opção sempre que criar um novo arquivo, mas isso é ineficiente. Eles apontaram, Contudo, que o Planilhas Google não segue a mesma abordagem de formatação. O que mais, se você primeiro colocar todos os seus dados no Planilhas Google e, em seguida, copiá-los para um programa de planilha diferente, a formatação permanece intacta.
É um pouco cômico que um recurso destinado a ajudar as pessoas a usar planilhas esteja causando tanta dor de cabeça nos círculos acadêmicos. Talvez as versões futuras do Excel incluam uma opção para desativar os recursos de formatação automática indefinidamente. Até então, os geneticistas devem verificar seu trabalho ou considerar a mudança para o Planilhas Google.