DeepDream - DeepDream

"Mona Lisa" com efeito DeepDream usando rede VGG16 treinada em ImageNet

DeepDream é uma visão por computador programa criado pelo Google engenheiro Alexander Mordvintsev que utiliza uma rede neural convolutional para encontrar e melhorar os padrões em imagens via algorítmica pareidolia , criando assim um sonho -como psicodélico aparência nas imagens deliberadamente sobre-processados.

O programa do Google popularizou o termo (profundo) "sonhar" para se referir à geração de imagens que produzem as ativações desejadas em uma rede profunda treinada , e o termo agora se refere a uma coleção de abordagens relacionadas.

História

O software DeepDream, originado em uma rede convolucional profunda com o codinome "Inception" após o filme de mesmo nome , foi desenvolvido para o ImageNet Large-Scale Visual Recognition Challenge (ILSVRC) em 2014 e lançado em julho de 2015.

A ideia e o nome dos sonhos se tornaram populares na internet em 2015 graças ao programa DeepDream do Google. A ideia data do início da história das redes neurais, e métodos semelhantes foram usados ​​para sintetizar texturas visuais. Idéias de visualização relacionadas foram desenvolvidas (antes do trabalho do Google) por vários grupos de pesquisa.

Depois que o Google publicou suas técnicas e tornou seu código -fonte aberto , várias ferramentas na forma de serviços da web, aplicativos móveis e software de desktop apareceram no mercado para permitir aos usuários transformar suas próprias fotos.

Processar

Uma imagem de água-viva em um fundo azul
Uma imagem de água-viva processada com DeepDream após dez iterações
Uma imagem de água-viva processada com DeepDream após cinquenta iterações
A imagem original (topo) após a aplicação de dez (meio) e cinquenta (baixo) iterações do DeepDream, a rede tendo sido treinada para perceber cães

O software foi desenvolvido para detectar rostos e outros padrões em imagens, com o objetivo de classificá-las automaticamente. No entanto, uma vez treinada, a rede também pode ser executada ao contrário, sendo solicitado que ajuste ligeiramente a imagem original para que um determinado neurônio de saída (por exemplo, aquele para rostos ou certos animais) produza uma pontuação de confiança mais alta. Isso pode ser usado para visualizações para entender melhor a estrutura emergente da rede neural e é a base para o conceito DeepDream. Esse procedimento de reversão nunca é perfeitamente claro e inequívoco porque utiliza um processo de mapeamento um-para-muitos . No entanto, após reiterações suficientes, mesmo as imagens inicialmente desprovidas das características procuradas serão ajustadas o suficiente para que resulte uma forma de pareidolia , pela qual imagens psicodélicas e surreais são geradas algoritmicamente. A otimização se assemelha à retropropagação , no entanto, em vez de ajustar os pesos da rede, os pesos são mantidos fixos e a entrada é ajustada.

Por exemplo, uma imagem existente pode ser alterada para que fique "mais parecida com um gato" e a imagem aprimorada resultante pode ser novamente inserida no procedimento. Esse uso se assemelha à atividade de procurar animais ou outros padrões nas nuvens.

Aplicar gradiente descendente de forma independente a cada pixel da entrada produz imagens nas quais os pixels adjacentes têm pouca relação e, portanto, a imagem tem muitas informações de alta frequência. As imagens geradas podem ser bastante aprimoradas incluindo um anterior ou regularizador que prefere entradas que tenham estatísticas de imagem naturais (sem preferência por nenhuma imagem em particular) ou são simplesmente suaves. Por exemplo, Mahendran et al. usou o regularizador de variação total que prefere imagens que são constantes por partes. Vários regularizadores são discutidos mais adiante. Uma exploração visual detalhada das técnicas de visualização e regularização de recursos foi publicada mais recentemente.

A citada semelhança das imagens com LSD - e alucinações induzidas por psilocibina é sugestiva de uma semelhança funcional entre redes neurais artificiais e camadas particulares do córtex visual.

Computerphile, um programa de ciência da computação , descreve em detalhes os processos de aprendizado de máquina usados ​​pelo Google Dream.

Uso

Uma fotografia altamente processada pelo DeepDream de três homens em uma piscina

A ideia do sonho pode ser aplicada a neurônios ocultos (internos) diferentes daqueles na saída, o que permite a exploração dos papéis e representações de várias partes da rede. Também é possível otimizar a entrada para satisfazer um único neurônio (esse uso às vezes é chamado de Maximização de Atividade) ou uma camada inteira de neurônios.

Embora sonhar seja mais frequentemente usado para visualizar redes ou produzir arte computacional, recentemente foi proposto que adicionar entradas "sonhadas" ao conjunto de treinamento pode melhorar os tempos de treinamento para abstrações em Ciência da Computação.

O modelo DeepDream também demonstrou ter aplicação no campo da história da arte .

DeepDream foi usado para o videoclipe de Foster the People para a canção "Doing It for the Money".

Em 2017, um grupo de pesquisa da Universidade de Sussex criou uma máquina de alucinação , aplicando o algoritmo DeepDream a um vídeo panorâmico pré-gravado, permitindo aos usuários explorar ambientes de realidade virtual para imitar a experiência de substâncias psicoativas e / ou condições psicopatológicas. Eles foram capazes de demonstrar que as experiências subjetivas induzidas pela Máquina de Alucinação diferiam significativamente dos vídeos de controle (não 'alucinógenos'), embora apresentassem semelhanças fenomenológicas com o estado psicodélico (após a administração de psilocibina).

Veja também

Referências

links externos