Figura 1:Diagrama que ilustra a construção de amostras mistas para treinar um classificador CWoLa fracamente supervisionado na caça ao bump. Na pesquisa ATLAS, o recurso ressonante (mres) é a massa do dijet e os outros recursos (y) são as massas dos dois jatos. Crédito:ATLAS Collaboration / CERN
A ATLAS Collaboration no CERN está explorando novas maneiras de pesquisar novos fenômenos. Juntamente com um extenso programa de pesquisa frequentemente inspirado por modelos teóricos específicos - variando de buracos negros quânticos à supersimetria - os físicos estão aplicando novos métodos independentes de modelo para ampliar suas pesquisas. ATLAS acaba de lançar a primeira busca independente de modelo por novas partículas usando uma nova técnica chamada "supervisão fraca".
As pesquisas por novas partículas geralmente começam com um modelo teórico específico. Dados a fenomenologia e os parâmetros do modelo, os físicos vão simular como novas partículas seriam produzidas e decaiam no detector ATLAS. Em seguida, eles simulam os processos de segundo plano do Modelo Padrão para desenvolver classificadores (com ou sem aprendizado de máquina) que separam os sinais do segundo plano. Esses classificadores determinam a melhor região do espaço de fase dos dados a serem estudados, onde se espera que um sinal hipotético seja enriquecido. Finalmente, os físicos irão comparar os dados e a previsão de fundo em busca de anomalias.
A nova pesquisa do ATLAS utiliza classificadores de aprendizado de máquina (redes neurais) desenvolvidos diretamente nos dados para reduzir a dependência de um modelo específico. Este é um afastamento significativo dos métodos padrão porque os dados não estão rotulados:não se sabe se um evento particular de colisão próton-próton é de fundo ou sinal. Este método - conhecido como "supervisão fraca" - explora estruturas nos dados sem a necessidade de rótulos por evento.
Juntamente com este método, a nova busca ATLAS usa uma das estratégias de detecção de anomalias independentes de simulação mais tradicionais:a "caça aos bump". O objetivo de uma caça aos solavancos é procurar um "relevo" localizado no topo de um fundo liso. Essas saliências são uma característica genérica de muitos modelos de novas partículas, onde a colisão acontece na massa da nova partícula. A nova pesquisa baseia-se nessa base sólida para aumentar a sensibilidade a uma ampla variedade de partículas hipotéticas sem especificar suas propriedades com antecedência.
A combinação de bump hunt e supervisão fraca resulta em uma análise que é principalmente livre de dependência de modelo de sinal e modelo de plano de fundo.
Figura 2:A saída da rede neural em um compartimento de massa dijet. Como uma função bidimensional, a saída pode ser facilmente visualizada como uma imagem, onde a intensidade corresponde à eficiência da saída da rede no compartimento de massa do dijet. O gráfico da esquerda não tem nenhum sinal injetado e o gráfico da direita mostra a saída quando uma partícula hipotética a 3 TeV que decai em duas outras partículas a 200 GeV é adicionada aos dados. Crédito:ATLAS Collaboration / CERN
Detectando anomalias com supervisão fraca
Os físicos do ATLAS treinaram redes neurais em dados usando uma técnica chamada "Classificação sem rótulos" (CWoLa, pronunciado "Koala"). Nesta abordagem, os físicos constroem dois conjuntos de dados mistos compostos de fundo e potencialmente também sinal. Eles são idênticos, exceto pelas proporções relativas do sinal potencial. Embora os rótulos de sinal versus fundo sejam desconhecidos para cada evento, as redes neurais podem ser treinadas para diferenciar entre os dois conjuntos de dados. Com dados suficientes e um classificador poderoso o suficiente, isso é realmente ideal para distinguir o sinal do fundo.
O método CWoLa é combinado com um bump hunt ao criar os conjuntos de dados mistos acima, como mostrado na Figura 1. Os eventos de sinal seriam caracterizados por uma região de ressonância localizada e uma região de banda lateral. Essas regiões teriam outros recursos (y) que também podem ser usados para treinar as redes neurais. Se não houver sinal, uma rede neural não aprenderia nada e se houver um sinal, ele pode aprender a identificá-lo sobre o fundo.
A nova pesquisa ATLAS é a primeira aplicação de detecção de anomalias totalmente orientada a dados e aprimorada por aprendizado de máquina. A pesquisa examinou eventos com estados finais hadrônicos, usando a massa invariante de pares de "jatos" de partículas como o recurso ressonante e as massas dos jatos individuais como os recursos para treinar o classificador CWoLa. Usando este conjunto restrito de recursos, os físicos estabeleceram o procedimento com sucesso e descobriram que ele já é sensível a uma ampla gama de novas partículas.
Os físicos foram capazes de treinar as redes neurais, evitando um fator de teste estatístico que reduziria a sensibilidade da pesquisa de treinamento e teste nos mesmos dados. A rede neural (Figura 2) é mapeada para uma eficiência. Por exemplo, 10% significa que 90% dos eventos têm uma saída de rede inferior a este valor. Na ausência do sinal, a rede não deve aprender nada (já que os dois conjuntos de dados mistos devem ser iguais), mas deve haver uma região de baixa eficiência por projeto. O gráfico à direita da Figura 2 mostra que a rede é capaz de identificar o sinal injetado, mesmo que não tenha sido dito para onde olhar com antecedência!
Figura 3:Sinais específicos são simulados e, em seguida, adicionados aos dados para definir limites. Os modelos escolhidos aqui representam uma partícula pesada A (com uma massa de 3 TeV) decaindo para duas outras novas partículas B e C com massas escritas no eixo horizontal. O eixo vertical é o limite - números mais baixos indicam limites mais fortes. A nova pesquisa é comparada com dois resultados existentes do ATLAS:a pesquisa dijet inclusiva (triângulos vermelhos) e uma pesquisa dedicada para jatos produzidos a partir de bósons W e Z (cruz cinza). Crédito:ATLAS Collaboration / CERN
Fornecendo nova precisão
A nova busca não resultou em evidências significativas de novas partículas e quantificar o que não foi encontrado foi seu próprio desafio. Usualmente, os físicos podem simplesmente perguntar quanto sinal teria que ser adicionado para registrar um excesso significativo, e então essa quantidade de sinal é declarada excluída, pois nenhum excesso foi observado. A obtenção de exclusões semelhantes para esta análise exigiu que todas as redes neurais fossem treinadas novamente para cada tipo de sinal modelado e quantidade de sinal.
Os limites resultantes são apresentados na Figura 3. A produção deste gráfico exigiu um treinamento de cerca de 20, 000 redes neurais! Alguns sinais eram mais difíceis de serem encontrados pelas redes neurais do que outros, com aqueles em regiões com muitos antecedentes provando ser particularmente desafiadores. Para outros sinais, os novos limites são mais fortes do que os limites anteriores e melhoram as pesquisas anteriores em um espaço de fase semelhante.
Olhando para o futuro
Esta nova abordagem adotada pela ATLAS tem muitas possibilidades de extensões. O bump hunt fracamente supervisionado pode ser aplicado a topologias de eventos adicionais e mais recursos podem ser adicionados para ampliar a sensibilidade a novas partículas. Redes neurais mais complexas podem ser necessárias para acomodar espaços de recursos de dimensões superiores e isso exigirá recursos computacionais exigentes. Os físicos do ATLAS também estão considerando uma variedade de técnicas alternativas de detecção de anomalias, que pode ser capaz de complementar a pesquisa baseada em CWoLa. É provável que nenhum método cubra tudo - serão necessárias várias abordagens para garantir robusto, e forte sensibilidade a novas partículas.