A técnica de aprendizado de máquina reconstrói imagens que passam por uma fibra multimodo

Crédito CC0:domínio público

Por meio do uso inovador de uma rede neural que imita o processamento de imagens pelo cérebro humano, uma equipe de pesquisa relata reconstruções precisas de imagens transmitidas por fibras ópticas para distâncias de até um quilômetro.

No jornal da Optical Society para pesquisas de alto impacto, Optica , os pesquisadores relatam ensinar um tipo de algoritmo de aprendizado de máquina conhecido como rede neural profunda para reconhecer imagens de números a partir do padrão de manchas que eles criam quando transmitidos para a extremidade de uma fibra. O trabalho pode melhorar a imagem endoscópica para diagnóstico médico, aumentar a quantidade de informações transportadas por redes de telecomunicações de fibra óptica, ou aumentar a potência óptica fornecida pelas fibras.

"Usamos arquiteturas modernas de rede neural profunda para recuperar as imagens de entrada da saída codificada da fibra, "disse Demetri Psaltis, Instituto Federal Suíço de Tecnologia, Lausanne, que liderou a pesquisa em colaboração com o colega Christophe Moser. “Demonstramos que isso é possível para fibras de até 1 quilômetro de comprimento”, acrescentou. chamando o trabalho de "um marco importante".

Decifrando o borrão

As fibras ópticas transmitem informações com a luz. As fibras multimodo têm uma capacidade de transporte de informações muito maior do que as fibras monomodo. Seus muitos canais - conhecidos como modos espaciais porque têm diferentes formatos espaciais - podem transmitir diferentes fluxos de informação simultaneamente.

Embora as fibras multimodo sejam adequadas para transportar sinais baseados em luz, transmitir imagens é problemático. A luz da imagem viaja por todos os canais e o que sai do outro lado é um padrão de manchas que o olho humano não consegue decodificar.

Para resolver este problema, Psaltis e sua equipe se voltaram para uma rede neural profunda, um tipo de algoritmo de aprendizado de máquina que funciona da mesma forma que o cérebro. Redes neurais profundas podem dar aos computadores a capacidade de identificar objetos em fotografias e ajudar a melhorar os sistemas de reconhecimento de voz. A entrada é processada através de várias camadas de neurônios artificiais, cada um deles realiza um pequeno cálculo e passa o resultado para a próxima camada. A máquina aprende a identificar a entrada, reconhecendo os padrões de saída associados a ela.

“Se pensarmos sobre a origem das redes neurais, que é o nosso próprio cérebro, o processo é simples, "explica Eirini Kakkava, um aluno de doutorado trabalhando no projeto. "Quando uma pessoa encara um objeto, neurônios no cérebro são ativados, indicando o reconhecimento de um objeto familiar. Nosso cérebro pode fazer isso porque é treinado ao longo de nossa vida com imagens ou sinais da mesma categoria de objetos, que muda a força das conexões entre os neurônios. "Para treinar uma rede neural artificial, pesquisadores seguem essencialmente o mesmo processo, ensinar a rede a reconhecer certas imagens (neste caso, dígitos manuscritos) até que seja capaz de reconhecer imagens na mesma categoria das imagens de treinamento que não tenha visto antes.

Aprendendo pelos números

Para treinar seu sistema, os pesquisadores recorreram a um banco de dados contendo 20, 000 amostras de números escritos à mão, 0 a 9. Eles selecionaram 16, 000 para serem usados como dados de treinamento, e deixou de lado 2, 000 para validar o treinamento e mais 2, 000 para testar o sistema validado. Eles usaram um laser para iluminar cada dígito e enviaram o feixe de luz através de uma fibra óptica, que tinha aproximadamente 4, 500 canais, para uma câmera na extremidade oposta. Um computador mediu como a intensidade da luz de saída variava na imagem capturada, e eles coletaram uma série de exemplos para cada dígito.

Embora os padrões de manchas coletados para cada dígito parecessem iguais ao olho humano, a rede neural foi capaz de discernir diferenças e reconhecer padrões de intensidade associados a cada dígito. O teste com as imagens retiradas mostrou que o algoritmo alcançou 97,6 por cento de precisão para imagens transmitidas através de uma fibra de 0,1 metro de comprimento e 90 por cento de precisão com um comprimento de fibra de 1 quilômetro.

Um método mais simples

Navid Borhani, um membro da equipe de pesquisa, diz que essa abordagem de aprendizado de máquina é muito mais simples do que outros métodos para reconstruir imagens passadas por fibras ópticas, que requerem fazer uma medição holográfica da saída. A rede neural também foi capaz de lidar com distorções causadas por distúrbios ambientais na fibra, como flutuações de temperatura ou movimentos causados por correntes de ar que podem adicionar ruído à imagem - uma situação que piora com o comprimento da fibra.

"Espera-se que a notável capacidade das redes neurais profundas de recuperar informações transmitidas por meio de fibras multimodo beneficie procedimentos médicos, como endoscopia e aplicativos de comunicação, "Disse Psaltis. Os sinais de telecomunicações muitas vezes têm que viajar por muitos quilômetros de fibra e podem sofrer distorções, que este método pode corrigir. Os médicos poderiam usar sondas de fibra ultrafina para coletar imagens dos tratos e artérias dentro do corpo humano sem a necessidade de gravadores holográficos complexos ou de se preocupar com o movimento. "Movimentos leves devido à respiração ou circulação podem distorcer as imagens transmitidas por meio de uma fibra multimodo, "Disse Psaltis. As redes neurais profundas são uma solução promissora para lidar com esse ruído.

Psaltis e sua equipe planejam experimentar a técnica com amostras biológicas, para ver se isso funciona tão bem quanto ler números escritos à mão. Eles esperam realizar uma série de estudos usando diferentes categorias de imagens para explorar as possibilidades e limites de sua técnica.

Fenômeno doméstico observado por Leonardo da Vinci finalmente explicado

As renovações levam a grandes melhorias no laboratório de Astrofísica Nuclear

Física