Tech 17 dez 2024

Whisk: Google desafia Midjourney com IA que entende imagens

Novo gerador de imagens dispensa os longos prompts em texto e deixa você "remixar" fotos existentes para criar novas obras

Whisk: Google desafia Midjourney com IA que entende imagens
whisk-google-ia

Novo gerador de imagens do Google, chamado Whisky, dispensa os longos prompts em texto e deixa você "remixar" fotos existentes para criar novas obras

Por que importa: A ferramenta Whisk representa uma mudança interessante na forma como interagimos com IAs geradoras de imagens, tornando o processo mais intuitivo e visual.

Como funciona:

  • Basta arrastar e soltar fotos na ferramenta
  • A IA "entende" o assunto, a cena e o estilo das imagens de referência
  • Você pode usar múltiplas imagens como inspiração
  • Textos são opcionais para refinar o resultado

🎲 Sem referências? Não tem problema. A ferramenta oferece um botão "dado" que gera imagens aleatórias para usar como base.

Nos bastidores, o Whisk usa duas IAs poderosas da Google:

  • Gemini: converte automaticamente as imagens em prompts detalhados
  • Imagen 3: gera as novas imagens a partir desses prompts

A empresa faz questão de avisar que a ferramenta foi feita para "exploração visual rápida, não edições perfeitas em nível de pixel" - ou seja, é mais para brincar e experimentar do que para trabalhos profissionais precisos.

↳ Se o resultado não agradar, você pode editar manualmente os prompts gerados pela IA

📱 Disponibilidade: Por enquanto apenas nos EUA, sem previsão de lançamento global

Por que é diferente: Enquanto outras IAs como DALL-E e Midjourney dependem fortemente de descrições textuais complexas, o Whisk busca simplificar o processo tornando-o mais visual e intuitivo.

Carlos Merigo

Carlos Merigo

Ver todos os artigos →