Como criar rostos melhores com difusão estável

2023/01/26

Stable Diffusion permite criar praticamente qualquer imagem baseada em texto. Por exemplo, seu projeto pode exigir que você melhore uma face de IA, mas você está tendo problemas para melhorar o original. Nesse caso, você pode usar algumas de nossas dicas para melhorar o processo de criação de faces Stable Diffusion. Leia para saber mais.

Como você cria rostos melhores com difusão estável?

Para criar rostos melhores com Stable Diffusion, você precisa configurar um Google Colab chamado Deforum Stable Diffusion v0.5. Veja como você pode fazer isso:

Abra seu navegador e acesse este site .
Pressione o botão “Conectar” e clique em “NVIDIA GPU”. Como esta é a GPU do servidor do Google, não se preocupe – você não precisa de uma placa de vídeo NVIDIA.
Conceda permissões de sistema para que o site use seu computador.
Pressione na seção abaixo da placa GPU (“Model and Output Paths”).
Conecte seu Google Colab com seu Google Drive e aguarde até que a marca de seleção apareça ao lado de “Modelo e caminhos de saída”.
Selecione “Ambiente de configuração” e deixe o sistema conectar sua conta. Faça o mesmo para “Definições do Python”.
Vá para “Selecionar e carregar modelo”. Esta seção requer que você tenha o modelo que deseja carregar em seu Google Drive. Para isso, baixe o. ckpt deste site pressionando “sd-v1.4.ckpt” na seção “Baixar os pesos”. Carregue este arquivo para sua pasta Google Drive AI contendo os modelos que você deseja melhorar.
Aperte o botão “Play” ao lado da seção “Select and Load Model”. Aguarde a marca de seleção verde e seu Google Colab estará funcionando.

Agora que seu Google Colab está configurado, você pode melhorar suas faces de IA com Stable Diffusion. Esse processo também é conhecido como melhoria de renderizações antigas e se resume a alterar a resolução de suas imagens:

Recorte o rosto que deseja melhorar e salve-o como uma imagem separada.
Carregue o rosto arrastando-o para a unidade temporária do Google Colab (o painel esquerdo).
Clique com o botão direito do mouse na imagem e clique no botão “Copiar caminho”.
Cole a imagem no campo “init_image” no menu à direita.
Navegue até a janela “Prompts” e digite os prompts que deseja para o seu rosto. Certifique-se de digitar
os prompts entre aspas para obter os melhores resultados.
Vá para a seção “Executar” e encontre o menu “Configurações de imagem”.
Altere a resolução de pixels para aumentar a clareza do rosto. Por exemplo, 800×800 funciona bem na maioria dos casos.
Pressione o botão vermelho “Play” na janela “Run” para renderizar a imagem.
Sua imagem agora será renderizada com uma resolução diferente. Brinque com o procedimento até obter o efeito desejado.
Baixe a imagem de sua unidade e sobreponha-a ao original.

Como você usa variações com difusão estável para criar rostos melhores?

Além de melhorar os rostos diretamente alterando a resolução, você também pode introduzir variações para produzir imagens mais nítidas. O primeiro passo é definir suas preferências de “Animação” como “nenhuma”. Aqui está o que você precisa fazer:

Conecte seu Google Drive ao Google Deforum Stable Diffusion 0.5 Colab com as etapas acima.
Carregue a imagem do rosto no painel esquerdo do Colab.
Vá para o menu “Animation” e altere a configuração “animation_mode” para “none”.
Clique no botão “Play” ao lado da seção “Animation” para salvar suas alterações.

Depois de alterar as configurações de “Animação”, você pode ignorar a maioria das outras configurações, pois não deseja criar uma animação. No entanto, você precisará fazer alguns ajustes na seção “Prompts”. Siga esses passos:

Use o prompt original como ponto de partida.
Faça as variações necessárias alterando a linha, dependendo se você deseja adicionar ou remover os recursos de sua face AI. Trabalhe na seção “Prompts” em vez da janela “Animation Prompts”.
Coloque aspas no início e no final de seus prompts.
Coloque uma vírgula no final do prompt (após as aspas).
Clique no botão “Play” no canto superior esquerdo da janela “Prompts” para renderizar sua imagem e salvar seu progresso.

O próximo menu que você deseja ajustar é o menu “Executar”. Mais especificamente, você precisa ir para a janela “Configurações de imagem” e fazer as seguintes alterações:

Navegue até “Sampling Settings” e defina a configuração “Seed” para “-1”.
Brinque com a configuração “Sampler” até obter o efeito desejado.
Defina quantas “etapas” quiser. O valor de “Escala” também depende de você.
Se você usou a renderização “ddim” na janela “Sampler”, defina “ddim_eta” como “1”.
Role para baixo até encontrar “Configurações de lote” e vá para a linha “n_batch”. Digite o número de variações que deseja ter na caixa de texto.
Vá para “Init Settings” e pressione a caixa ao lado da opção “use_init”. Agora deve haver uma marca de seleção ao lado da configuração.
Digite “0,5” no campo “força” se quiser reutilizar 50% da imagem original. Você pode inserir valores mais altos ou mais baixos, dependendo de quanto deseja reutilizar o material de origem.
Clique no ícone “Arquivo” no painel esquerdo. Vá até a pasta que contém a imagem do rosto que deseja otimizar e arraste-a para a seção à esquerda. Aguarde até que o sistema carregue sua imagem, clique com o botão direito do mouse e pressione o botão “copiar caminho”.
Cole o caminho no campo “init_image” e clique no botão vermelho “Play” no canto superior esquerdo do menu “Image Settings”.
Deixe o programa renderizar sua imagem e adicionar variações. Agora você deve ver o novo rosto na parte inferior da tela com suas variações.

Como melhorar a geração de imagens com difusão estável

Ao melhorar rostos com difusão estável, a maior parte do trabalho se resume a escrever prompts apropriados. O sistema conta com esse recurso para gerar uma imagem usando a tecnologia “txt2img”. Ele usa o prompt de texto e outros parâmetros para produzir uma imagem com base em sua entrada.

Conforme discutido anteriormente, você precisa inserir o valor “semente” em um ponto para criar os resultados desejados. Você também pode alterar o número de “etapas” ao incorporar variações.

No entanto, esses recursos podem não fazer muito em termos de melhoria das faces resultantes. Em vez disso, você precisará intensificar seu jogo de “prompts” para garantir a geração de imagens de alta qualidade. Aqui estão algumas dicas que irão ajudá-lo a fazê-lo.

Seja específico – Seus prompts de texto devem ser muito detalhados, especialmente no início, já que o início de sua frase tem mais influência do que o final. Se você deixar de fora informações importantes, poderá não obter a aparência desejada.
Atenha-se ao inglês – Os desenvolvedores do Stable Diffusion usaram mais de dois bilhões de pares de texto e imagem em inglês. Os outros 100 idiomas representaram menos pares, o que significa que a participação de idiomas individuais é muito menor do que a do inglês. Como resultado, escrever prompts em outro idioma pode não fornecer o resultado correto.
Inclua o gênero e o tipo de arte – o Stable Diffusion pode gerar todos os tipos de imagens, incluindo acrílico e pinturas a óleo, fotos de moda, desenhos animados e impressões. Portanto, especificar a forma de imagem que você deseja torna o algoritmo mais preciso.
Esteja na moda – Se estiver procurando por imagens artísticas, você pode adicionar “tendências no ArtStation” ou outros nomes para ajudar o Stable Diffusion a ficar o mais próximo possível da imagem desejada.
Brinque com palavras diferentes – Ao escrever seus prompts, você nunca pode exagerar em suas descrições. Portanto, brinque com diferentes propriedades técnicas, como “foco nítido” e “iluminação dramática” ou adjetivos, como “incrível”, “lindo” e “deslumbrante”.
Adicione o nome de um artista – Stable Diffusion permite produzir imagens no estilo de artistas famosos. Para obter esse efeito, adicione o nome de seus artistas ao prompt, como Andry Warhol, Caspar David Friedrich ou Auguste Renoir.
Use negativos – Algumas versões de sua interface reagem a prompts negativos. Eles permitem que você indique o que seu sistema deve evitar ao produzir imagens.

Deixe sua imaginação e criatividade correrem soltas na difusão estável

Dominar a difusão estável pode demorar um pouco, especialmente quando você deseja aprimorar seus rostos de IA e outras imagens. Uma ou duas linhas erradas podem facilmente degradar seu projeto, então você precisa ter muito cuidado ao escrever seus prompts e inserir parâmetros de geração. Com alguns ajustes, você poderá embelezar rostos e outras partes de suas fotos com facilidade.

Com que frequência você usa Difusão Estável? Você já adicionou variações em suas imagens? Se sim, que efeitos produziram? Compartilhe suas experiências na seção de comentários abaixo.

Como você cria rostos melhores com difusão estável?

Como você usa variações com difusão estável para criar rostos melhores?

Como melhorar a geração de imagens com difusão estável

Deixe sua imaginação e criatividade correrem soltas na difusão estável

Deixe um comentário Cancelar resposta