Mix diário

O que é ‘Nano-Banana’, nova IA ‘misteriosa’ que surpreendeu ao gerar imagens

Até o saturado universo de modelos de inteligência artificial (IA) encontrou um jeito de impressionar. Nesta semana, o modelo “Nano-Banana” surgiu de forma misteriosa na plataforma LMArena.ai e surpreendeu na geração e edição de imagens. Nesta terça-feira, 26, o Google assumiu a responsabilidade pela tecnologia e divulgou o nome oficial: Gemini 2.5 Flash Image.

Antes da confirmação pela gigante, o modelo chamou entre a atenção entre especialistas e curiosos quando editou imagens com precisão, ajustou a iluminação em fotos e gerou feições realistas.

Inicialmente, os usuários acessaram a nova ferramenta por meio do site Battle Mode, que coloca duas IAs lado a lado para gerar imagens a partir do mesmo comando. Depois, o público vota no melhor resultado sem saber qual modelo fez qual imagem. O modelo fez sucesso entre os usuários e se espalhou pelas redes.

Depois de ser confirmado pelo Google, o modelo já ficou disponível para todos que quiserem usá-lo – o Gemini 2.5 Flash Image tem a versão gratuita e paga. A companhia anunciou que essa IA também vai aparecer em versões para desenvolvedores e empresas. Ainda nesta semana, a gigante deve lançar a IA na API do Gemini, no Google AI Studio e no Vertex AI.

E por que os usuários ficaram em choque com o Nano-Bana? Seu diferencial está na consistência na criação e edição de personagens, o que na prática evita alucinações visuais.

A versatilidade em editar fotos com precisão ou gerar imagens do zero também impressiona. Tudo isso com uma velocidade inédita na indústria.

Para treinar o modelo, o Google usou imagens do cotidiano, como a visualização de projetos de decoração ou jardinagem, e possui um “conhecimento de ambiente” melhorado, segundo Nicole Brichtova, gestora de produto na Google DeepMind, divisão de IA da companhia.

Em fóruns online, a novidade foi comparada ao MidJourney e ao DALL.E, porém os usuários acreditam que mesmo sem a “vibe” artística do MidJourney, o Nano-Banana entrega resultados mais sofisticados para uso profissional, como peças de publicidade ou edição de produtos.

O lançamento não acontece no vácuo. O mercado de imagens geradas por IA se tornou uma das maiores apostas das gigantes do ramo. Quando a OpenAI lançou uma ferramenta similar nativo do GPT-4o, a quantidade de usuários do ChatGPT disparou, mesmo que a maior parte só fizesse memes com as imagens nada reais.

A Meta, empresa dona do Facebook, Instagram e WhatsApp, também anunciou que vai licenciar modelos de imagem da startup MidJourney.

Onde acessar o Nano-Banana?

O modelo já está disponível em contas pagas ou não do Gemini. E como ele é incluído no modelo base do Gemini 2.5 Flash, é só carregar uma foto e escrever o comando para a IA editá-la.

Usuários do Adobe Express e do Firefly também podem acessar o modelo.

Estadão Conteudo

About Author

Deixar um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

Você também pode se interessar

Mix diário

Brasil defende reforma da OMC e apoia sistema multilateral justo e eficaz, diz Alckmin

O Brasil voltou a defender a reforma da Organização Mundial do Comércio (OMC) em um fórum internacional. Desta vez, o
Mix diário

Inflação global continua a cair, mas ainda precisa atingir meta, diz diretora-gerente do FMI

A diretora-gerente do Fundo Monetário Internacional (FMI), Kristalina Georgieva disse que a inflação global continua a cair, mas que deve