Novo modelo de base melhora a precisão da interpretação de imagens de sensoriamento remoto
Crédito:Unsplash/CC0 Public Domain
Um novo modelo de fundação apelidado de RingMo foi desenvolvido para melhorar a precisão da interpretação de imagens de sensoriamento remoto, de acordo com o Instituto de Pesquisa de Informação Aeroespacial (AIR), Academia Chinesa de Ciências (CAS).
O estudo intitulado "RingMo:A Remote Sensing Foundation Model with Masked Image Modeling" foi publicado em
IEEE Transactions on Geoscience and Remote Sensing .
As imagens de sensoriamento remoto são aplicadas em campos como classificação e detecção de alterações, e as abordagens de aprendizado profundo contribuíram para o rápido desenvolvimento da interpretação de imagens de sensoriamento remoto. O paradigma de treinamento mais utilizado é o uso de modelos pré-treinados ImageNet para processar dados de sensoriamento remoto para tarefas específicas.
No entanto, existem problemas, como uma lacuna de domínio entre as cenas de sensoriamento natural e remoto e a baixa capacidade de generalização dos modelos de sensoriamento remoto. Assim, é necessário desenvolver um modelo de fundação com representação geral de características de sensoriamento remoto. Como uma grande quantidade de dados não rotulados está disponível, o método autossupervisionado é melhor do que o método totalmente supervisionado em sensoriamento remoto.
O estudo tem como objetivo propor um framework de modelo de base de sensoriamento remoto, que possa alavancar os benefícios do aprendizado autossupervisionado generativo para imagens de sensoriamento remoto. O RingMo apresenta um conjunto de dados em larga escala construído pela coleta de 2 milhões de imagens de sensoriamento remoto de plataformas aéreas e de satélite, cobrindo várias cenas e objetos em todo o mundo. Além disso, o método de treinamento de modelo de base de sensoriamento remoto é projetado para objetos densos e pequenos em cenas complicadas de sensoriamento remoto.
RingMo é o primeiro modelo de base generativa para dados de sensoriamento remoto multimodal. No futuro, o modelo pode ser aplicado à reconstrução 3D, construção residencial, transporte, conservação da água, proteção ambiental e outros campos.
+ Explorar mais Rede de iniciação de atenção mútua desenvolvida para resposta a perguntas visuais de sensoriamento remoto