Crédito CC0:domínio público
A estilometria - o uso de técnicas estatísticas para determinar a autoria - é mais conhecida por identificar o Unabomber como Theodor Kaczynski e revelar que Shakespeare colaborou com Christopher Marlowe no ciclo de peças de Henrique IV. Na análise textual, não é a escolha incomum de palavras que trai a voz oculta, mas o habitual - os padrões recorrentes de palavras comuns, como preposições, que marcam a provável identidade de uma única pessoa.
Foi uma paixão mútua dos Beatles - descoberta em uma conferência na Ilha do Príncipe Edward - que levou Mark Glickman, conferencista sênior em estatística em Harvard, e Jason Brown, professor de matemática na Dalhousie University, imaginar se uma abordagem estilométrica poderia responder à pergunta candente:Lennon ou McCartney?
Como Glickman explica, para a maioria das canções de Lennon-McCartney, é bem conhecido e bem documentado qual dos dois escreveu a canção. Contudo, um número surpreendentemente grande de canções (ou partes de canções) tem autoria disputada. Como um exemplo, ninguém sabe quem escreveu a música para "In My Life, "uma faixa do álbum Rubber Soul de 1965, que está classificado em 23º na revista Rolling Stone, As 500 Maiores Canções de Todos os Tempos. Lennon e McCartney se lembravam de maneira diferente. "Então, nos perguntamos se você poderia usar técnicas de análise de dados para tentar descobrir o que estava acontecendo na música para distinguir se era por um ou outro, "diz Glickman.
Com a ajuda do ex-estudante de estatística de Harvard Ryan Song, Glickman e Brown "decompuseram" cada música dos Beatles de 1962 a 1966 em cinco representações. Cada representação consistia na frequência de ocorrência de um conjunto de traços musicais dentro de cada canção. "A ideia básica por trás de nossa abordagem, "diz Glickman, "é converter uma música, cujo conteúdo musical é difícil de quantificar de forma direta, em um conjunto de estruturas de dados diferentes que são passíveis de estabelecer a assinatura de uma música usando uma abordagem quantitativa. "Glickman continua, "Pense em decompor uma cor em seus componentes constituintes de vermelho, verde e azul com pesos diferentes anexados. Estamos fazendo a mesma coisa com as músicas dos Beatles, embora com mais de três componentes. No total, nosso método divide as músicas em um total de 149 componentes constituintes. "
"A primeira representação consiste simplesmente nas frequências de diferentes acordes comumente tocados, junto com agregações de acordes incomuns, "diz Glickman." Fomos capazes de formar 11 categorias de acordes. "Então, eles caracterizaram notas melódicas - notas cantadas pelo vocalista. Terceiro, eles gravaram as frequências de ocorrência de transições de acordes, isso é, um acorde seguido por outro acorde. Novamente, certas transições de acordes incomuns foram agregadas em categorias únicas. Quarto, eles gravaram as frequências de pares consecutivos de notas melódicas.
E então, finalmente, eles decomporam as canções em "contornos" de quatro notas melódicas. Um contorno, diz Glickman, é uma sequência melódica de quatro notas categorizada em uma série de "ups, "" diminui "e" permanece o mesmo ". Em outras palavras, se uma passagem melódica de quatro notas envolve quatro notas aumentando em tom, então o contorno seria ("para cima, "" para cima "" para cima ") porque cada par consecutivo de notas envolve um aumento no tom. Examinando contornos de quatro notas, diz Glickman, adiciona detalhes extras que podem ajudar a distinguir estilos de composição melódica.
A razão pela qual essas cinco representações podem servir como assinaturas de diferentes estilos de composição musical é porque, como Glickman aponta, há algo bem conhecido sobre os estilos de composição dos Beatles:Lennon normalmente escrevia versos melódicos que não variavam muito.
"Considere a música de Lennon, 'Socorro!' ", Diz Glickman." Basicamente, 'Quando eu era mais jovem, muito mais jovem do que hoje, 'onde o tom não muda muito. Ele permanece na mesma nota repetidamente, e apenas mudanças em etapas curtas. Enquanto com Paul McCartney, você pega uma música como 'Michelle, 'e vai, 'Michelle, MA Belle. Sont les mots qui vont très bien ensemble. Em termos de pitch, está em todo o lugar. "
Sua abordagem para inferir autoria desconhecida ou disputada de características musicais pode ser entendida em três etapas. Primeiro, seu modelo postula que cada uma das frequências das 149 características musicais de uma canção depende do autor da canção. Por exemplo, a "tônica" (o acorde fundamental de uma música) ocorre com uma frequência nas músicas de Lennon, mas uma frequência possivelmente diferente nas canções de McCartney. Segundo, eles usam uma ferramenta comum em probabilidade chamada "regra de Bayes" para reverter a probabilidade. Em outras palavras, começando com a frequência de 149 recursos musicais conhecendo o autor de uma música, eles determinam um modelo para a probabilidade de Lennon ou McCartney escreverem uma canção dada a frequência dos 149 recursos musicais. Este modelo foi então treinado usando 70 canções de Lennon-McCartney ou partes de canções em que a autoria era verdadeiramente conhecida. Finalmente, como uma terceira etapa, os resultados deste modelo foram aplicados a canções de Lennon-McCartney e partes de canções em que a autoria foi contestada, o que resultou em previsões de probabilidade para as canções de autoria desconhecida.
"Então, a probabilidade de que "In My Life" tenha sido escrito por McCartney é 0,018, "diz Glickman, "o que basicamente significa que é uma música de Lennon bastante convincente." McCartney lembra-se mal. Mas "A Palavra, "que Glickman pensou que seria uma música de Lennon acabou, de acordo com seu modelo, quase certamente por McCartney.
Existe mais neste exercício do que um divertido filme policial musical? "Sim, "diz Glickman." Esta tecnologia pode ser estendida. Podemos olhar para a história pop e mapear o fluxo de influência estilística. "