• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • A abordagem de criação de rosto da Nvidias é genuinamente GAN-tastic

    Conjunto não curado de imagens produzido pelo gerador baseado em estilo (config F) com o conjunto de dados FFHQ. Crédito:arXiv:1812.04948 [cs.NE]

    Um novo tipo de abordagem de Rede Adversarial Generativa faz os observadores de tecnologia coçarem suas cabeças:como as imagens podem ser falsas e ainda assim parecer tão reais?

    "Criamos um novo gerador que aprende automaticamente a separar diferentes aspectos das imagens sem qualquer supervisão humana, "disseram os pesquisadores em um vídeo. Eles afirmaram em seu artigo, "A nova arquitetura leva a um aprendizado automático, separação não supervisionada de atributos de alto nível. "

    Fazer com que fotos falsas pareçam reais é um esforço artístico que não é novo, mas esses três pesquisadores elevaram o esforço ao próximo nível.

    Eles explicaram sua técnica em seu trabalho, "Uma Arquitetura Geradora Baseada em Estilo para Redes Adversariais Generativas." O artigo está no arXiv e tem chamado muita atenção.

    Stephen Johnson em Big Think disse que os resultados foram "bastante surpreendentes". Will Knight em MIT Technology Review disse que o que estamos olhando constitui "impressionante, realismo quase assustador. "

    Os pesquisadores, Tero Karras, Samuli Laine, e Timo Aila, são da Nvidia. Sua abordagem se concentra na construção de uma rede adversária geradora, órgão, onde a aprendizagem ocorre para gerar imagens inteiramente novas que mímico o aparecimento de fotos reais.

    Os autores disseram que todas as imagens neste vídeo foram produzidas por seu gerador. "Não são fotos de pessoas reais."

    Seu papel, "disse o Cavaleiro, mostrou como a abordagem pode ser usada para brincar, e remixar elementos como raça, Gênero sexual, ou mesmo sardas.

    O molho mágico é seu gerador baseado em estilo. Big Think explicou isso como uma versão modificada da tecnologia convencional que é usada para gerar imagens automaticamente.

    A tecnologia deles está bagunçando sua cabeça e dando a última risada (ou palavra, no entanto, você olha para ele).

    Você, como humano, pensa em "imagens". O gerador, Contudo, pensa em "coleção de estilo".

    Visualizar o efeito dos estilos no gerador fazendo com que os estilos produzidos por um código latente (fonte) substituam um subconjunto dos estilos de outro (destino). Crédito:arXiv:1812.04948 [cs.NE]

    Cada estilo controla os efeitos em uma escala específica. Existem estilos grosseiros, estilos médios, estilos finos. (Estilos grosseiros referem-se a pose, cabelo, formato do rosto; os estilos intermediários referem-se às características faciais; olhos. Estilos finos referem-se ao esquema de cores.)

    Will Knight, Enquanto isso, fez algumas observações sobre os GANs:"Os GANs empregam duas redes neurais em duelo para treinar um computador a aprender a natureza de um conjunto de dados bem o suficiente para gerar falsificações convincentes. Quando aplicado a imagens, isso fornece uma maneira de gerar falsificações altamente realistas. "

    Johnson forneceu um histórico do conceito de GAN:

    "Em 2014, um pesquisador chamado Ian Goodfellow e seus colegas escreveram um artigo descrevendo um novo conceito de aprendizado de máquina chamado redes adversárias geradoras. A ideia, em termos simplificados, envolve colocar duas redes neurais uma contra a outra. Um atua como um gerador que olha, dizer, fotos de cães e, em seguida, faz o possível para criar uma imagem de como ele pensa que é um cão. A outra rede atua como um discriminador que tenta diferenciar as imagens falsas das reais.

    "Inicialmente, o gerador pode produzir algumas imagens que não parecem cachorros, então o discriminador os abate. Mas o gerador agora sabe um pouco sobre onde deu errado, então a próxima imagem que ele cria é um pouco melhor. Este processo continua até, em teoria, o gerador cria uma boa imagem de um cachorro. "

    A equipe da Nvidia adicionou princípios de transferência de estilo ao mix de GAN.

    Devin Coldewey em TechCrunch :"Carros, gatos, paisagens - tudo isso mais ou menos se encaixa no mesmo paradigma de pequenas, feições de médio e grande porte que podem ser isoladas e reproduzidas individualmente. "

    Do ponto de vista técnico, seu trabalho tem sido elogiado por resultados impressionantes em imagens de pessoas que parecem reais. De uma visão popular, aguçado por falar de notícias falsas, o avanço é visto como perigoso. "A capacidade de gerar imagens artificiais realistas, muitas vezes chamados de deepfakes quando as imagens devem parecer pessoas reconhecíveis, tem gerado preocupação nos últimos anos, "disse Johnson.

    As páginas do site de observação de tecnologia estavam cheias de comentários sobre como isso era "assustador", e alguns comentários eram simplesmente perguntas:"Por que estamos fazendo isso?" "Quem está pagando por isso?" “Se não criarmos limites regulatórios, Acho que a próxima grande batalha da história humana será travada (e possivelmente perdida) contra a IA que criamos, "disse uma resposta.

    Apesar disso, nem todos os comentários refletiram desconforto. Este é um avanço da tecnologia e alguns comentários apontaram que os aplicativos podem ser úteis em determinados setores. Designers, criadores de agências de publicidade, e até mesmo os criadores de videogames poderiam usar esse avanço tecnológico.

    "Esses rostos gerados por IA prometem inaugurar uma nova geração de pessoas fotorrealistas em videogames e filmes sem a necessidade de atores humanos ou extras, " disse HotHardware .

    © 2018 Science X Network




    © Ciência https://pt.scienceaq.com