• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Usando inteligência artificial para enriquecer mapas digitais

    Um modelo de IA desenvolvido no MIT e no Qatar Computing Research Institute que usa apenas imagens de satélite para marcar automaticamente as características das estradas em mapas digitais pode melhorar a navegação GPS, especialmente em países com dados de mapa limitados. Crédito:Google Maps / MIT News

    Um modelo inventado por pesquisadores do MIT e do Qatar Computing Research Institute (QCRI) que usa imagens de satélite para marcar características de estradas em mapas digitais pode ajudar a melhorar a navegação GPS.

    Mostrar aos motoristas mais detalhes sobre seus trajetos pode frequentemente ajudá-los a navegar em locais desconhecidos. Contagens de pistas, por exemplo, pode habilitar um sistema GPS para alertar os motoristas sobre pistas divergentes ou mescladas. Incorporar informações sobre as vagas de estacionamento pode ajudar os motoristas a planejarem com antecedência, enquanto o mapeamento de ciclovias pode ajudar os ciclistas a contornar as ruas movimentadas da cidade. Fornecer informações atualizadas sobre as condições das estradas também pode melhorar o planejamento de ajuda humanitária em desastres.

    Mas criar mapas detalhados é caro, processo demorado feito principalmente por grandes empresas, como o Google, que envia veículos com câmeras presas ao capô para capturar vídeo e imagens das estradas de uma área. Combinar isso com outros dados pode criar dados precisos, mapas atualizados. Como esse processo é caro, Contudo, algumas partes do mundo são ignoradas.

    Uma solução é liberar modelos de aprendizado de máquina em imagens de satélite - que são mais fáceis de obter e atualizar com bastante regularidade - para marcar automaticamente os recursos da estrada. Mas as estradas podem ser fechadas por, dizer, árvores e edifícios, tornando-se uma tarefa desafiadora. Em um artigo apresentado na conferência Association for the Advancement of Artificial Intelligence, os pesquisadores do MIT e QCRI descrevem "RoadTagger, "que usa uma combinação de arquiteturas de rede neural para prever automaticamente o número de faixas e tipos de estradas (residenciais ou rodoviárias) por trás de obstruções.

    Ao testar o RoadTagger em estradas obstruídas a partir de mapas digitais de 20 cidades dos EUA, o modelo contou os números das faixas com 77 por cento de precisão e inferiu tipos de estradas com 93 por cento de precisão. Os pesquisadores também estão planejando permitir que o RoadTagger preveja outros recursos, como vagas de estacionamento e ciclovias.

    "Os mapas digitais mais atualizados vêm de lugares com os quais as grandes empresas mais se importam. Se você estiver em lugares com os quais elas não se importam muito, você está em desvantagem com relação à qualidade do mapa, "diz o co-autor Sam Madden, professora do Departamento de Engenharia Elétrica e Ciência da Computação (EECS) e pesquisadora do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL). “Nosso objetivo é automatizar o processo de geração de mapas digitais de alta qualidade, para que estejam disponíveis em qualquer país. "

    Os co-autores do artigo são alunos de pós-graduação do CSAIL Songtao He, Favyen Bastani, e Edward Park; O estudante de graduação da EECS, Satvat Jagwani; Os professores do CSAIL, Mohammad Alizadeh e Hari Balakrishnan; e os pesquisadores da QCRI, Sanjay Chawla, Sofiane Abbar, e Mohammad Amin Sadeghi.

    Combinando CNN e GNN

    Quatar, onde QCRI é baseado, "não é uma prioridade para as grandes empresas que constroem mapas digitais, "Madden diz. Ainda, está constantemente construindo novas estradas e melhorando as antigas, especialmente na preparação para sediar a Copa do Mundo FIFA de 2022.

    "Ao visitar o Qatar, tivemos experiências em que nosso motorista do Uber não consegue descobrir como chegar aonde está indo, porque o mapa está tão errado, "Madden diz." Se os aplicativos de navegação não tiverem as informações certas, para coisas como fusão de pistas, isso pode ser frustrante ou pior. "

    RoadTagger conta com uma nova combinação de uma rede neural convolucional (CNN) - comumente usada para tarefas de processamento de imagens - e uma rede neural de gráfico (GNN). GNNs modelam relacionamentos entre nós conectados em um gráfico e se tornaram populares para analisar coisas como redes sociais e dinâmica molecular. O modelo é "ponta a ponta, "o que significa que é alimentado apenas com dados brutos e produz saída automaticamente, sem intervenção humana.

    A CNN toma como entrada imagens de satélite brutas de estradas alvo. O GNN divide a estrada em segmentos de aproximadamente 20 metros, ou "tiles". Cada bloco é um nó de gráfico separado, conectado por linhas ao longo da estrada. Para cada nó, a CNN extrai características das estradas e compartilha essas informações com seus vizinhos imediatos. As informações da estrada se propagam ao longo de todo o gráfico, com cada nó recebendo algumas informações sobre os atributos da estrada em todos os outros nós. Se um certo bloco estiver ocluído em uma imagem, RoadTagger usa informações de todos os blocos ao longo da estrada para prever o que está por trás da oclusão.

    Esta arquitetura combinada representa uma intuição mais humana, dizem os pesquisadores. Digamos que parte de uma estrada de quatro pistas esteja obstruída por árvores, portanto, alguns blocos mostram apenas duas pistas. Os humanos podem facilmente supor que algumas pistas estão escondidas atrás das árvores. Modelos tradicionais de aprendizado de máquina - digamos, apenas uma CNN - extraia recursos apenas de blocos individuais e muito provavelmente preveja que o bloco ocluído é uma estrada de duas pistas.

    "Os humanos podem usar informações de blocos adjacentes para adivinhar o número de pistas nos blocos obstruídos, mas as redes não podem fazer isso, "Ele diz." Nossa abordagem tenta imitar o comportamento natural dos humanos, onde capturamos informações locais da CNN e informações globais da GNN para fazer melhores previsões. "

    Pesos de aprendizagem

    Para treinar e testar o RoadTagger, os pesquisadores usaram um conjunto de dados de mapa do mundo real, chamado OpenStreetMap, que permite aos usuários editar e organizar mapas digitais em todo o mundo. A partir desse conjunto de dados, eles coletaram atributos de estradas confirmados de 688 quilômetros quadrados de mapas de 20 cidades dos EUA, incluindo Boston, Chicago, Washington, e Seattle. Então, eles reuniram as imagens de satélite correspondentes de um conjunto de dados do Google Maps.

    Em treinamento, RoadTagger aprende pesos - que atribuem vários graus de importância a recursos e conexões de nó - da CNN e GNN. O CNN extrai recursos de padrões de pixel de ladrilhos e o GNN propaga os recursos aprendidos ao longo do gráfico. A partir de subgráficos da estrada selecionados aleatoriamente, o sistema aprende a prever as características da estrada em cada ladrilho. Ao fazer isso, ele aprende automaticamente quais recursos da imagem são úteis e como propagá-los ao longo do gráfico. Por exemplo, se um bloco de destino tiver marcações de pista pouco claras, mas o bloco vizinho tem quatro pistas com marcações claras e compartilha a mesma largura da estrada, então, é provável que o ladrilho de destino também tenha quatro pistas. Nesse caso, o modelo aprende automaticamente que a largura da estrada é um recurso de imagem útil, então, se dois blocos adjacentes compartilham a mesma largura de estrada, é provável que tenham a mesma contagem de pistas.

    Dada uma estrada não vista no treinamento do OpenStreetMap, o modelo divide a estrada em blocos e usa seus pesos aprendidos para fazer previsões. Com a tarefa de prever várias pistas em um bloco ocluso, o modelo observa que os ladrilhos vizinhos têm padrões de pixel correspondentes e, Portanto, uma alta probabilidade de compartilhar informações. Então, se esses blocos tiverem quatro pistas, o ladrilho ocluído também deve ter quatro.

    Em outro resultado, O RoadTagger previu com precisão os números das pistas em um conjunto de dados sintetizado, perturbações rodoviárias altamente desafiadoras. Por exemplo, um viaduto com duas faixas cobria alguns ladrilhos de uma estrada alvo com quatro faixas. O modelo detectou padrões de pixel incompatíveis do viaduto, então ele ignorou as duas pistas sobre os ladrilhos cobertos, prevendo com precisão quatro faixas abaixo.

    Os pesquisadores esperam usar o RoadTagger para ajudar os humanos a validar e aprovar rapidamente modificações contínuas na infraestrutura em conjuntos de dados como o OpenStreetMap, onde muitos mapas não contêm contagens de pistas ou outros detalhes. Uma área de interesse específica é a Tailândia, Bastani diz, onde as estradas estão mudando constantemente, mas há poucas ou nenhuma atualização no conjunto de dados.

    "Estradas que já foram rotuladas como estradas de terra foram pavimentadas, então é melhor dirigir, e alguns cruzamentos foram totalmente reconstruídos. Há mudanças todos os anos, mas os mapas digitais estão desatualizados, " he says. "We want to constantly update such road attributes based on the most recent imagery."

    Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.




    © Ciência https://pt.scienceaq.com