Midjourney V5 chegou e é muito bom
- Leonardo Pachelle
- 29 de mar. de 2023
- 2 min de leitura
Este foi um mês agitado para a IA. Depois do chatGPT4, foi a vez do Midjourney lançar uma nova versão de seu algoritmo.
Atualmente, o novo algoritmo da versão 5 está em seu estado alfa. E será ajustado e modificado para seu lançamento final. Mas melhorias significativas em relação às versões anteriores já podem ser vistas.

O que mudou?
Aqui está uma lista de mudanças que veremos nesse artigo:
· Resolução melhorada
· Rostos e mãos melhoradas
· Tamanho padrão 1024×1024
Resolução melhorada
Com a versão 5, não precisamos mais esperar para melhorar as imagens. Todas as imagens na grade 4x4 já estão em sua máxima resolução e qualidade. E pressionar o botão de upscale oferece instantaneamente a opção que você escolher.
Aqui está um exemplo da grade 4x4 da v5:

Nas versões anteriores, as gerações iniciais ofereciam visualizações de qualidade inferior. E o upscaling pode potencialmente alterar a imagem.
Agora você pode ver instantaneamente como ficará a versão final.
Rostos e mãos melhoradas
Gerar mãos decentes tem sido uma luta para a IA, pelo menos até agora. Com o MidJourney5, você verá muito menos mãos instáveis que não se parecem em nada com as reais.
E os rostos também melhoraram significativamente. Parecendo muito mais realistas do que com as versões anteriores.
Vamos comparar a versão 5 com a versão 4. Para começar, vamos olhar para os rostos. O mesmo prompt exato foi usado para ambas as gerações (v4 a esquerda e v5 a direita):

Embora a geração v4 não seja ruim a v5 definitivamente leva a vitória. Há toda uma nova dimensão de realismo. Basta olhar como a pele fica bonita.
Você poderia sem dúvida obter um resultado melhor da v4, mas este foi apenas um exemplo rápido para provar o ponto.
Agora vamos olhar para as mãos.


Não é difícil identificar o vencedor aqui. A imagem gerada pelo algoritmo da versão 4 (acima) parece mais um pesadelo do que mãos.
A V5 não acerta as mãos sempre. Mas é muito melhor e mais consistente na tarefa. E não cria mãos de “combustível de pesadelo” com metade da frequência de v4 ao tentar gerar imagens de corpo inteiro de humanos ou personagens diferentes.
Tamanho padrão do MidJourney5 é 1024×1024
O tamanho padrão das imagens no MidJourney5 aumentou e agora é de 1024×1024. O processamento ficou um pouco mais lento (não muito), mas em compensação, como já dissemos, o upscale é imediato.

Outra novidade é a capacidade de repetir padrões com o comando --tile para criar texturas e fundos. Também já existia na versão anterior mas agora ficou bem melhor.
Resumindo
O MidJourney5 novo tem uma coerência maior em comparação aos anteriores. Isso significa que a qualidade e força da conexão entre o prompt e o resultado são melhores. Tanto a capacidade de interpretar e compreender o comando quanto as imagens geradas foram aprimoradas. Contudo, o que realmente destaca o MidJourney5 dos seus antecessores é o nível de precisão e detalhamento que ele oferece para imagens fotográficas.
Comentarios