Crédito:Universidade de Glasgow
Um novo método radical de imagem que aproveita a inteligência artificial para transformar o tempo em visões do espaço 3-D pode ajudar os carros, dispositivos móveis e monitores de integridade desenvolvem consciência de 360 graus.
Fotos e vídeos geralmente são produzidos pela captura de fótons - os blocos de construção da luz - com sensores digitais. Por exemplo, As câmeras digitais consistem em milhões de pixels que formam imagens ao detectar a intensidade e a cor da luz em cada ponto do espaço. As imagens 3-D podem então ser geradas posicionando duas ou mais câmeras ao redor do assunto para fotografá-lo de vários ângulos, ou usando fluxos de fótons para escanear a cena e reconstruí-la em três dimensões. De qualquer jeito, uma imagem só é construída pela coleta de informações espaciais da cena.
Em um novo artigo publicado hoje na revista Optica , pesquisadores baseados no Reino Unido, A Itália e a Holanda descrevem uma maneira inteiramente nova de fazer imagens 3-D animadas:capturando informações temporais sobre os fótons em vez de suas coordenadas espaciais.
Seu processo começa com um simples, detector de ponto único barato ajustado para funcionar como uma espécie de cronômetro para fótons. Ao contrário das câmeras, medindo a distribuição espacial de cor e intensidade, o detector apenas registra quanto tempo leva para os fótons produzidos por uma fração de segundo de pulso de luz laser ricochetearem em cada objeto em qualquer cena e alcançarem o sensor. Quanto mais longe um objeto está, mais tempo cada fóton refletido levará para chegar ao sensor.
As informações sobre os tempos de cada fóton refletido na cena - o que os pesquisadores chamam de dados temporais - são coletadas em um gráfico muito simples.
Esses gráficos são então transformados em uma imagem 3-D com a ajuda de um algoritmo de rede neural sofisticado. Os pesquisadores treinaram o algoritmo mostrando a ele milhares de fotos convencionais da equipe movendo e carregando objetos pelo laboratório, ao lado de dados temporais capturados pelo detector de ponto único ao mesmo tempo.
Eventualmente, a rede havia aprendido o suficiente sobre como os dados temporais correspondiam às fotos para ser capaz de criar imagens altamente precisas apenas com os dados temporais. Nos experimentos de prova de princípio, a equipe conseguiu construir imagens em movimento em cerca de 10 quadros por segundo a partir dos dados temporais, embora o hardware e o algoritmo usados tenham o potencial de produzir milhares de imagens por segundo.
Dr. Alex Turpin, Lord Kelvin Adam Smith Fellow em Ciência de Dados na Escola de Ciência da Computação da Universidade de Glasgow, liderou a equipe de pesquisa da Universidade juntamente com o Prof. Daniele Faccio, com o apoio de colegas da Universidade Politécnica de Milão e da Universidade de Tecnologia de Delft.
O Dr. Turpin disse:"As câmeras em nossos telefones celulares formam uma imagem usando milhões de pixels. Criar imagens com um único pixel sozinho é impossível se considerarmos apenas as informações espaciais, já que um detector de ponto único não tem nenhum. Contudo, esse detector ainda pode fornecer informações valiosas sobre o tempo. O que conseguimos fazer é encontrar uma nova maneira de transformar dados unidimensionais - uma simples medição de tempo - em uma imagem em movimento que representa as três dimensões do espaço em qualquer cena. A maneira mais importante que difere da criação de imagens convencionais é que nossa abordagem é capaz de separar totalmente a luz do processo. Embora grande parte do artigo discuta como usamos luz laser pulsada para coletar os dados temporais de nossas cenas, também demonstra como conseguimos usar ondas de radar para o mesmo propósito. Temos certeza de que o método pode ser adaptado a qualquer sistema capaz de sondar uma cena com pulsos curtos e medir com precisão o eco de retorno. Este é realmente apenas o começo de uma maneira totalmente nova de visualizar o mundo usando o tempo em vez da luz. "
Atualmente, a capacidade da rede neural de criar imagens é limitada ao que foi treinada para captar dos dados temporais de cenas criadas pelos pesquisadores. Contudo, com mais treinamento e até mesmo usando algoritmos mais avançados, poderia aprender a visualizar uma gama variada de cenas, ampliando suas aplicações potenciais em situações do mundo real.
O Dr. Turpin acrescentou:"Os detectores de ponto único que coletam os dados temporais são pequenos, leve e barato, o que significa que eles podem ser facilmente adicionados aos sistemas existentes, como as câmeras em veículos autônomos, para aumentar a precisão e a velocidade do pathfinding. Alternativamente, eles poderiam aumentar os sensores existentes em dispositivos móveis como o Google Pixel 4, que já possui um sistema simples de reconhecimento de gestos baseado em tecnologia de radar. As gerações futuras de nossa tecnologia podem até ser usadas para monitorar a ascensão e queda do tórax de um paciente no hospital para alertar a equipe sobre mudanças em sua respiração, ou para manter o controle de seus movimentos para garantir sua segurança de uma forma compatível com os dados. Estamos muito entusiasmados com o potencial do sistema que desenvolvemos, e estamos ansiosos para continuar a explorar seu potencial. Nossa próxima etapa é trabalhar em um sistema autônomo, sistema portátil em uma caixa e estamos ansiosos para começar a examinar nossas opções para continuar nossa pesquisa com a contribuição de parceiros comerciais. "
O papel da equipe, intitulado "Imagens espaciais de dados temporais, "é publicado em Optica .