Aplicações de caulim. Crédito:Murthy Jatavallabhula et al.
Como a maioria dos ambientes do mundo real são tridimensionais, modelos de aprendizado profundo projetados para analisar vídeos ou completar tarefas em ambientes do mundo real devem ser treinados em dados 3D. Ferramentas tecnológicas, como robôs, veículos autônomos, smartphones, e outros dispositivos estão atualmente gerando uma quantidade crescente de dados 3-D que podem eventualmente ser processados por algoritmos de aprendizado profundo.
Até agora, Contudo, treinar algoritmos de aprendizagem profunda nesta vasta quantidade de dados 3-D tem sido relativamente difícil, já que as ferramentas e plataformas necessárias são acessíveis apenas a alguns pesquisadores de inteligência artificial (IA). Para resolver essa falta de ferramentas prontamente disponíveis, uma equipe de pesquisadores da NVIDIA criou recentemente o Kaolin, uma biblioteca de código aberto PyTorch destinada a promover e facilitar a pesquisa de aprendizado profundo em 3-D.
"Atualmente, não há uma única biblioteca de software de código aberto que suporte várias representações de dados 3-D, múltiplas tarefas, e critérios de avaliação, "Krishna Murthy Jatavallabhula, um dos pesquisadores que realizou o estudo, disse TechXplore. "Decidimos preencher essa lacuna na literatura criando Kaolin, a primeira biblioteca abrangente de aprendizado profundo em 3-D. "
Caulino, a biblioteca PyTorch apresentada por Jatavallabhula e seus colegas, contém uma variedade de ferramentas para a construção de arquiteturas de aprendizagem profunda que podem analisar dados 3-D, que são eficientes e fáceis de usar. Também permite que os pesquisadores carreguem, pré-processamento, e manipular dados 3D antes de serem usados para treinar algoritmos de aprendizado profundo.
Kaolin inclui vários módulos gráficos para editar imagens 3-D, com funções como renderização, iluminação, sombreamento e distorção de vista. Além disso, ele suporta uma ampla gama de funções de perda e métricas de avaliação, permitindo que os pesquisadores avaliem facilmente seus algoritmos de aprendizagem profunda.
Crédito:Murthy Jatavallabhula et al.
"Tipicamente, Pesquisadores de aprendizado profundo em 3-D precisam escrever muitos códigos padronizados para seus projetos de pesquisa, "Jatavallabhula explicou." Com Caulim, Contudo, pesquisadores só precisam implementar as novas partes de seu projeto, como Kaolin empacota um conjunto abrangente de utilitários para carregamento de dados, conversão e avaliação. "
O caulim é uma ferramenta valiosa tanto para desenvolvedores com experiência no desenvolvimento de modelos de aprendizado profundo quanto para aqueles que estão apenas começando. Na biblioteca, na verdade, os desenvolvedores também podem encontrar várias arquiteturas de última geração que podem usar como ponto de partida ou como fonte de inspiração para seus próprios modelos.
"Embora os pesquisadores de aprendizagem profunda em 3-D vejam o caulim como um meio de acelerar suas pesquisas, recém-chegados neste campo estão recorrendo ao Kaolin para uma ideia de por onde começar, "Jatavallabhula disse.
No futuro, a biblioteca de código aberto apresentada por esses pesquisadores da NVIDIA pode ajudar a acelerar a pesquisa de aprendizado profundo em 3-D, auxiliando os desenvolvedores na criação de novas arquiteturas de IA, bem como em treiná-los e avaliá-los. Enquanto isso, Jatavallabhula e seus colegas estão planejando trabalhar para estender o caulim e aprimorar ainda mais suas capacidades.
"Nosso plano é adicionar mais modelos de aprendizagem profunda ao nosso zoológico de modelos (coleção de modelos de IA) e expandir nossa cobertura para um conjunto mais amplo de aplicações, como carros autônomos e agentes incorporados que precisam de aprendizagem 3-D, "Jatavallabhula disse." Em suma, planejamos fazer do Kaolin uma plataforma completa para pesquisa de aprendizado profundo em 3-D. "
© 2019 Science X Network