A Intel colabora com a Novartis no uso de redes neurais profundas (DNN) para acelerar a triagem de alto conteúdo - um elemento-chave para a descoberta inicial de medicamentos. A equipe de colaboração reduziu o tempo para treinar modelos de análise de imagem de 11 horas para 31 minutos - uma melhoria de mais de 20 vezes.
A triagem de alto conteúdo de fenótipos celulares é uma ferramenta fundamental de apoio à descoberta precoce de medicamentos. O termo "alto conteúdo" significa o rico conjunto de milhares de recursos predefinidos (como tamanho, forma, textura) que são extraídos de imagens usando técnicas clássicas de processamento de imagem. A triagem de alto conteúdo permite a análise de imagens microscópicas para estudar os efeitos de milhares de tratamentos genéticos ou químicos em diferentes culturas de células.
A promessa do aprendizado profundo é que os recursos de imagem relevantes que podem distinguir um tratamento de outro são aprendidos "automaticamente" a partir dos dados. Ao aplicar aceleração de rede neural profunda, biólogos e cientistas de dados da Intel e Novartis esperam acelerar a análise de telas de imagens de alto conteúdo. Neste trabalho conjunto, a equipe está se concentrando em imagens microscópicas inteiras em vez de usar um processo separado para identificar cada célula em uma imagem primeiro. Imagens inteiras de microscopia podem ser muito maiores do que aquelas normalmente encontradas em conjuntos de dados de aprendizado profundo. Por exemplo, as imagens usadas nesta avaliação são mais de 26 vezes maiores do que as imagens normalmente usadas no conhecido conjunto de dados ImageNet de animais, objetos e cenas.
Modelos de redes neurais convolucionais profundas, para analisar imagens de microscopia, normalmente funcionam em milhões de pixels por imagem, milhões de parâmetros no modelo e possivelmente milhares de imagens de treinamento por vez. Isso constitui uma alta carga computacional. Mesmo com recursos computacionais avançados na infraestrutura de computação existente, uma exploração mais profunda de modelos DNN pode ser proibitiva em termos de tempo.
Para resolver esses desafios, a colaboração está aplicando técnicas profundas de aceleração de rede neural para processar várias imagens em muito menos tempo, ao mesmo tempo em que extrai maior percepção dos recursos de imagem que o modelo aprende.
A equipe de colaboração com representantes da Novartis e da Intel mostrou uma melhoria de mais de 20 vezes1 no tempo de processamento de um conjunto de dados de 10 mil imagens para treinamento. Usando o conjunto de dados Broad Bioimage Benchmark Collection 021 (BBBC-021), a equipe atingiu um tempo total de processamento de 31 minutos com mais de 99 por cento de precisão.
Para este resultado, a equipe usou oito servidores baseados em CPU, uma interconexão de malha de alta velocidade, e TensorFlow1 otimizado. Ao explorar o princípio fundamental do paralelismo de dados no treinamento de aprendizado profundo e a capacidade de utilizar plenamente os benefícios do suporte de grande memória na plataforma do servidor, a equipe conseguiu dimensionar para mais de 120 imagens de 3,9 megapixels por segundo com 32 trabalhadores do TensorFlow.
Embora os métodos de aprendizagem profunda supervisionados sejam essenciais para acelerar a classificação de imagens e acelerar o tempo de percepção, os métodos de aprendizado profundo dependem de grandes conjuntos de dados rotulados por especialistas para treinar os modelos. O tempo e o esforço manual necessários para criar esses conjuntos de dados costumam ser proibitivos. Métodos de aprendizado profundo não supervisionados - que podem ser aplicados a imagens de microscopia sem rótulo - prometem revelar novos insights para a biologia celular e, em última instância, a descoberta de medicamentos. Este será o foco de esforços contínuos no futuro.