iniciou o teste alfa da versão 4 (“v4”) de seu modelo de síntese de texto para imagem, que está disponível para assinantes em seu Servidor de discórdia. O novo modelo fornece mais detalhes do que anteriormente disponível no serviço, inspirando alguns artistas de IA a comentar que a v4 quase o torna “muito fácil” para obter resultados de alta qualidade a partir de instruções simples.
“V4 é uma base de código totalmente nova e uma arquitetura de IA totalmente nova”, escreveu o fundador da Midjourney, David Holz, em um anúncio do Discord. “É o nosso primeiro modelo treinado em um novo superaglomerado Midjourney AI e está em andamento há mais de 9 meses.”
Saída de comparação entre Midjourney v3 (esquerda) e v4 (direita) com o prompt “um bárbaro musculoso com armas ao lado de um aparelho de televisão CRT, cinematográfico, 8K, iluminação de estúdio.”
– Suporta –chaos arg (defina de 0 a 10 0) para controlar a variedade de grades de imagem
A reação ao Midjourney v4 foi positiva no Discord do serviço e nos fãs de outras sínteses de imagens modelos – que lutam regularmente com instruções complexas para obter bons resultados – estão tomando nota.
Midjourney diz que a v4 ainda está em alfa, então continuará corrigindo as peculiaridades do novo modelo ao longo do tempo. A empresa planeja aumentar a resolução e a qualidade das imagens aprimoradas da v4, adicionando proporções personalizadas (como a v3), aumentando a nitidez da imagem e reduzindo os artefatos de texto. taxa de inscrição
que varia entre US$ 10 e US$ 50 por mês.
Considerando o progresso Midjourney fez ao longo de oito meses de trabalho, nos perguntamos o que trará o progresso do próximo ano na síntese de imagens.