Arquitetura do modelo de duas etapas:A primeira etapa realiza a detecção de palavras com base no Faster R-CNN. A segunda etapa realiza o reconhecimento de palavras usando um modelo totalmente convolucional com perda CTC. Os dois modelos são treinados de forma independente. Crédito:Facebook
Quando um meme está além de tolo e cruza a linha para a ofensiva total, alguém está cuidando da loja?
Diga olá para Rosetta, que é um sistema de aprendizado de máquina que foi projetado para dizer uau. O Facebook construiu e implantou este sistema de aprendizado de máquina. "Ele extrai texto de mais de um bilhão de imagens públicas do Facebook e Instagram e quadros de vídeo (em uma ampla variedade de idiomas), diariamente e em tempo real, e o insere em um modelo de reconhecimento de texto que foi treinado em classificadores para entender o contexto do texto e da imagem juntos. "
O reconhecimento de discursos de ódio por meio de tecnologia automática nunca é fácil e fica mais difícil com o tempo. Rosetta pode aliviar a carga de tentar garantir que ele não escorregue sem ser detectado. Rosetta é um sistema que pode determinar o contexto do texto e da imagem juntos .
O que isso significa? Compreendendo as palavras, entender imagens ... mas agora vamos entender o texto no imagens?
Postando no site "Facebook Code", Viswanath Sivakumar, Albert Gordo, e Manohar Paluri, descreva os desafios que acenaram para uma solução como a Rosetta. Afinal, os criativos vão além dos artigos tradicionais centrados em texto.
Eles disseram que "um número significativo de fotos compartilhadas no Facebook e Instagram contém texto em várias formas. Pode ser sobreposto a uma imagem em um meme, ou embutidos em uma foto de uma loja, sinal de rua, ou menu do restaurante. Levando em consideração o grande volume de fotos compartilhadas a cada dia no Facebook e Instagram, o número de idiomas suportados em nossa plataforma global, e as variações do texto, o problema de compreensão de texto em imagens é bastante diferente daqueles resolvidos por sistemas tradicionais de reconhecimento óptico de caracteres (OCR), que reconhecem os personagens, mas não entendem o contexto da imagem associada. "
OK, AI, podemos falar sobre memes? Nossas conversas têm vários condimentos. Com o Facebook, imagens com texto são postadas todos os dias - incluindo memes. O Rosetta foi projetado (1) para dar aos leitores de tela uma maneira de ler o que está escrito neles (2) para garantir que não contenham incitação ao ódio ou violem a política de conteúdo do site,
Fast Company apontou que o sistema foi aplicado principalmente a imagens estáticas, mas Rosetta está apenas começando; isso vai se aprofundar mais. "O Facebook planeja empregar cada vez mais o Rosetta para extrair o significado do texto do vídeo em todos os seus aplicativos, "mesmo que a tecnologia ainda não esteja pronta para lidar com todos os vídeos.
Interessantemente, Fast Company Daniel Terdiman viu isso como uma arma contra os memes, já que há uma necessidade de ferramentas eficazes nas quais os serviços possam confiar, para erradicar memes que podem ser prejudiciais, em conteúdo que, de outra forma, poderia passar despercebido. "Todos nós amamos memes, e a maioria de nós provavelmente ajudou a divulgá-los - passando aquela foto fofa com o texto irônico para nossos muitos amigos no Facebook, Twitter, e em outros lugares. Mas às vezes os memes podem ser prejudiciais, espalhar falsidades sobre pessoas ou organizações. "
Claro e simples, o sistema Rosetta pode fazer um trabalho melhor do que era possível anteriormente "na compreensão de textos prejudiciais ou falsos usados em memes que se espalham pelo Facebook e Instagram".
Mariella Moon em Engadget discutiu como funciona, e "começa detectando regiões retangulares em imagens que potencialmente contêm texto. Em seguida, usa uma rede neural convolucional para reconhecer e transcrever o que está escrito nessa região, até palavras não inglesas ou alfabetos não latinos, "Disse Moon. Para treinar o sistema, ela adicionou, O Facebook usou "uma mistura de imagens públicas anotadas por humanos e máquinas".
Qual é o status da Rosetta agora? Jacob Kastrenakes, The Verge :"Dizem que Rosetta está ao vivo agora, extração de texto de 1 bilhão de imagens e quadros de vídeo por dia no Facebook e no Instagram. "
Qual é o próximo? Rosetta não é perfeita; O Facebook quer chegar mais perto da perfeição, embora e tenha uma lista de tarefas pendentes. Moon disse que a empresa planeja continuar a aumentar o número de idiomas que pode entender e "torná-la melhor na extração de texto de quadros de vídeo".
Alguém sente que pode haver alguém que enviará olhares feios para Rosetta à medida que ela se torna mais conhecida? Pode ser. Cohen Coberly em TechSpot escreveu, "Rosetta certamente será uma ferramenta controversa para certos membros do público amante de memes, mas espero que a tecnologia se mostre inteligente o suficiente para distinguir entre conteúdo bobo, mas inofensivo, e imagens verdadeiramente ofensivas. "
Kastrenakes, The Verge :"Dados os conhecidos problemas de moderação da empresa, um sistema que funcione bem e que possa sinalizar automaticamente imagens potencialmente problemáticas pode ser de grande ajuda. "
© 2018 Tech Xplore