Esta captura de tela mostra um quadro de um vídeo no Scoop, A ferramenta da Voxel 51 para organizar vídeos por seu conteúdo. Os veículos são reconhecidos por tipo, fazer e colorir. A plataforma do Voxel51 realiza processamento de vídeo AI que identifica objetos e ações em vídeo. Crédito:Voxel51
Voxel51, uma startup da Universidade de Michigan, lançou hoje seu principal produto, uma plataforma de software projetada para torná-lo mais fácil, mais rápido e acessível para acessar o potencial inexplorado dos dados de vídeo.
O software é voltado para empresas que trabalham com vídeo, mas lutam para extrair as informações de que precisam. Embora o vídeo seja uma forma rica de dados, é difícil de analisar e pesquisar devido à sua complexidade, tamanhos de arquivo grandes e falta de unidades definidas como palavras.
A Voxel51 se propôs a superar esses obstáculos com sua plataforma de análise de vídeo e bibliotecas de software de código aberto que, juntos, habilite o reconhecimento de vídeo de última geração. Ele identifica e segue objetos e ações em cada clipe. Como diz o cofundador Brian Moore, “Transformamos o vídeo em valor”.
Seu foco inicial, que é particularmente relevante para carros sem motorista, está em imagens de vídeo de cenas de estradas e para segurança pública. Em ambos os aplicativos, câmeras são os principais sensores, mas é demorado para os humanos processar os dados para que um computador possa analisá-los. Mais rápido, o processamento automatizado deve acelerar o desenvolvimento de uma melhor visão computacional.
"Esta é a primeira e única plataforma publicamente disponível para compreensão da cena rodoviária, "disse o cofundador Jason Corso, professor de engenharia elétrica e da computação. "As montadoras estão construindo-os, mas em silos proprietários. O nosso estará disponível para qualquer pessoa usar e experimentar.
"Ao democratizar o processamento de vídeo e o acesso a grandes, bibliotecas anotadas, permitimos que as startups mais jovens concorram com as equipes bem-dotadas de recursos que trabalham em carros sem motorista e outros aplicativos de visão computacional em grandes empresas. "
Em veículos sem motorista hoje, algoritmos de percepção são produzidos com técnicas de aprendizado de máquina, o que significa que eles precisam ser treinados em clipes de vídeo que são anotados com identificação e rastreamento de objetos, por exemplo, pedestres, veículos, postes de lâmpada, sinais e semáforos.
Esta captura de tela mostra um quadro de um vídeo no Scoop, A ferramenta da Voxel 51 para organizar vídeos por seu conteúdo. Veículos, sinais e pedestres são identificados e rastreados no clipe. A plataforma do Voxel51 realiza processamento de vídeo AI que identifica objetos e ações em vídeo. Crédito:Voxel51
Antes que os sistemas sejam treinados, o vídeo deve ser anotado - geralmente por um humano. É por isso que é demorado e caro criar dados de treinamento para algoritmos de aprendizado de máquina.
Com Voxel51, os usuários podem contar com o software de IA da plataforma para acelerar grande parte desse processo. Então, é possível pesquisar conteúdo de vídeo muito específico, por exemplo, um passeador de cães. E com a biblioteca de código aberto, alguns usuários têm acesso a conjuntos de dados muito maiores do que poderiam adquirir.
"Há uma necessidade clara do tipo de tecnologia de IA de ponta que foi desenvolvida pela Voxel51 no espaço de veículos automatizados, e estamos entusiasmados com o progresso que já está sendo feito, "disse Bryce Pilz, diretor de licenciamento da U-M Tech Transfer.
"Agora mesmo, A tecnologia Voxel51 está ajudando os veículos autônomos em Mcity a entender o que estão vendo na estrada para que possam tomar melhores decisões, e não temos dúvidas de que eventualmente veremos essas inovações chegando aos veículos de produção, tornando-os mais seguros, mais eficiente e confiável. "
Além de colocar uma poderosa análise de vídeo de IA nas mãos dos desenvolvedores, O principal diferencial subjacente do Voxel51 é que seu processamento opera no volume do espaço-tempo entre os quadros, onde eles podem capturar mudanças de movimento e aparência ao longo do tempo. Em outras palavras, eles estão olhando não para pixels, mas para voxels.
A empresa levantou US $ 2 milhões em capital de risco. Ele está localizado em Ann Arbor, emprega 15 pessoas e está contratando muito mais, Diz Corso.
"Desde o início da computação moderna, os humanos têm se adaptado aos computadores. Acho que é hora de os computadores começarem a se adaptar a nós, e isso envolve uma compreensão mais profunda do mundo visual, "Disse Corso." A nova plataforma do Voxel51 é um passo importante nessa direção. Queremos permitir que novas empresas adicionem recursos de percepção visual com facilidade e poder onde, de outra forma, não seriam capazes. "