Até o saturado universo de modelos de inteligência artificial (IA) encontrou um jeito de impressionar. Nesta semana, o modelo “Nano-Banana” surgiu de forma misteriosa na plataforma LMArena.ai e surpreendeu na geração e edição de imagens. Nesta terça-feira, 26, o Google assumiu a responsabilidade pela tecnologia e divulgou o nome oficial: Gemini 2.5 Flash Image.
Antes da confirmação pela gigante, o modelo chamou entre a atenção entre especialistas e curiosos quando editou imagens com precisão, ajustou a iluminação em fotos e gerou feições realistas.
Inicialmente, os usuários acessaram a nova ferramenta por meio do site Battle Mode, que coloca duas IAs lado a lado para gerar imagens a partir do mesmo comando. Depois, o público vota no melhor resultado sem saber qual modelo fez qual imagem. O modelo fez sucesso entre os usuários e se espalhou pelas redes.
Depois de ser confirmado pelo Google, o modelo já ficou disponível para todos que quiserem usá-lo – o Gemini 2.5 Flash Image tem a versão gratuita e paga. A companhia anunciou que essa IA também vai aparecer em versões para desenvolvedores e empresas. Ainda nesta semana, a gigante deve lançar a IA na API do Gemini, no Google AI Studio e no Vertex AI.
E por que os usuários ficaram em choque com o Nano-Bana? Seu diferencial está na consistência na criação e edição de personagens, o que na prática evita alucinações visuais.
A versatilidade em editar fotos com precisão ou gerar imagens do zero também impressiona. Tudo isso com uma velocidade inédita na indústria.
Para treinar o modelo, o Google usou imagens do cotidiano, como a visualização de projetos de decoração ou jardinagem, e possui um “conhecimento de ambiente” melhorado, segundo Nicole Brichtova, gestora de produto na Google DeepMind, divisão de IA da companhia.
Em fóruns online, a novidade foi comparada ao MidJourney e ao DALL.E, porém os usuários acreditam que mesmo sem a “vibe” artística do MidJourney, o Nano-Banana entrega resultados mais sofisticados para uso profissional, como peças de publicidade ou edição de produtos.
O lançamento não acontece no vácuo. O mercado de imagens geradas por IA se tornou uma das maiores apostas das gigantes do ramo. Quando a OpenAI lançou uma ferramenta similar nativo do GPT-4o, a quantidade de usuários do ChatGPT disparou, mesmo que a maior parte só fizesse memes com as imagens nada reais.
A Meta, empresa dona do Facebook, Instagram e WhatsApp, também anunciou que vai licenciar modelos de imagem da startup MidJourney.
Onde acessar o Nano-Banana?
O modelo já está disponível em contas pagas ou não do Gemini. E como ele é incluído no modelo base do Gemini 2.5 Flash, é só carregar uma foto e escrever o comando para a IA editá-la.
Usuários do Adobe Express e do Firefly também podem acessar o modelo.