Skip to main content
📝 OpenAI

"GPT Image 2 testado: A análise honesta que a OpenAI não te dará"

"Testei o GPT Image 2 em códigos de barras, prompts de 11 edições, mockups 3D e fotos de multidões. Isto funciona, isto falha, e isto ninguém te conta."

15 min

Tempo de leitura

2,861

Palavras

Apr 21, 2026

Publicado

Engr Mejba Ahmed

Escrito por

Engr Mejba Ahmed

Compartilhar Artigo

"GPT Image 2 testado: A análise honesta que a OpenAI não te dará"
"GPT Image 2 testado: A análise honesta que a OpenAI não te dará" - Video thumbnail

"## GPT Image 2 testado: A análise honesta que a OpenAI não te dará\n\nO código de barras foi lido.\n\nEra 23h47 do dia 21 de abril. Estava no meu escritório a apontar o telemóvel para um monitor, e a app da Amazon no meu telefone mostrou "Good to Great" de Jim Collins. A capa do livro no ecrã não era real. O GPT Image 2 tinha-a gerado uns noventa segundos antes — uma capa falsa, com um logótipo editorial falso, envolvendo uma lombada falsa — e incorporado no design havia um código de barras que um scanner real, no mundo real, reconheceu como um ISBN real.\n\nFoi esse o momento em que a minha opinião sobre este modelo mudou.\n\nEra cético. Já vivi lançamentos suficientes de modelos de imagem por IA para conhecer o padrão: as demos são curadas, os benchmarks são selecionados, e ao fim de duas semanas as rachaduras aparecem. O DALL-E 3 tinha o problema dos dedos. O Nano Banana 2 tinha o desvio de proporções. O FLUX tinha o colapso de estilo em prompts longos. Cada lançamento tem a sua forma. Estava à espera da forma do GPT Image 2.\n\nPassada uma semana, encontrei-a. As rachaduras são reais. Mas também vi este modelo fazer seis coisas que genuinamente não acreditava serem possíveis em modelos texto-para-imagem até terça-feira passada. Por isso esta análise não é uma volta de honra nem um artigo de ataque. É o que te diria a tomar um café se me perguntasses: "Devo realmente prestar atenção a este?"\n\nResposta curta: sim. A resposta longa é para o que serve o resto desta publicação.\n\n## O que a OpenAI realmente lançou a 21 de abril\n\nA OpenAI lançou o ChatGPT Images 2.0, que corre um novo modelo chamado gpt-image-2. Substitui o gpt-image-1.5 no ranking texto-para-imagem da Artificial Analysis. O lançamento chegou simultaneamente ao ChatGPT para consumidores, ao OpenAI Playground e à API.\n\nDe acordo com a cobertura do lançamento pelo TechCrunch, a afirmação principal é que a renderização de texto atinge "mais de 99%" de precisão. A segunda afirmação é uma camada de raciocínio: quando escolhes um modelo "pensante", o sistema pesquisa e planeia a imagem antes de renderizar um único pixel.\n\nEspecificações práticas:\n- Saída até resolução 2K estável, 4K em beta\n- Edição de múltiplas imagens via /v1/images/edits\n- Até 8 imagens distintas de um único prompt\n- Integração nativa com Codexgpt-image-2 é uma ferramenta dentro do agente Codex\n- Preços da API: $0,006 baixa / $0,053 média / $0,211 alta para 1024×1024, conforme a página de preços da OpenAI\n\n## Teste 1: A capa de revista que não devia ter funcionado\n\nForneci quatro fotografias minhas — dois registos de iPhone, uma foto do LinkedIn de há três anos, uma foto de verão com óculos de sol e iluminação editorial errada. Prompt: "Combina estas numa capa da Time Magazine. Título: 'The Solo Operator Economy.' Data da capa: abril de 2026. Inclui pequenas linhas de capa sobre agentes de IA, a mudança freelance e uma curta citação."\n\nA saída demorou cerca de quarenta segundos.\n\nO que estava certo: a composição. O mastro da Time foi renderizado com o peso de serifa correto e a borda vermelha, linhas de capa empilhadas à esquerda como as capas reais da Time fazem. Título escrito corretamente. O meu rosto reconhecivelmente presente nas quatro imagens de origem.\n\nO que estava errado: a citação incluía "entreprenuer." Uma letra de diferença. A afirmação dos 99% de precisão está agregada ao longo do corpo do texto — no texto secundário (linhas de capa, legendas, etiquetas pequenas) estimaria 94-96%.\n\nSuficientemente bom para um moodboard. Não suficientemente bom para imprimir sem revisão.\n\n## Teste 2: O assunto do código de barras — Não é um truque\n\nPedi cinco capas de livros: "Good to Great" de Jim Collins, "The Intelligent Investor" de Benjamin Graham, "Zero to One" de Peter Thiel, mais dois títulos inventados. Cada um precisava de um código de barras funcional na contracapa com um ISBN válido.\n\nTrês dos cinco códigos de barras foram lidos com sucesso no meu iPhone. Os livros de Collins e Graham mapearam para ISBNs reais que correspondem a edições publicadas reais. O código de barras de Thiel foi lido mas mostrou um livro de negócios diferente. Os dois títulos inventados geraram códigos de barras que foram lidos como "produto desconhecido" — tecnicamente correto.\n\nOs códigos de barras não são imagens — são dados codificados. Para o modelo gerar um código de barras legível, tem de "desenhar" um padrão deliberado que o algoritmo de um scanner consiga descodificar. Os modelos anteriores produziam manchas com forma de código de barras. Este produz códigos de barras que funcionam.\n\nOs códigos QR também são lidos de forma fiável — gerei um apontando para o meu portfolio e foi resolvido corretamente. Os códigos UPC são lidos. Os códigos Data Matrix são lidos.\n\nA prototipagem de design de embalagens para um cliente tornou-se um fluxo de trabalho fundamentalmente diferente. Os clientes de embalagens e e-commerce da Ramlit vão sentir esta mudança mais rapidamente do que a comunidade de IA.\n\n## Teste 3: O prompt de onze edições que quase atingiu a perfeição\n\nForneci um único retrato de referência com onze modificações distintas:\n\n1. Mudar o fundo para um beco de Tóquio iluminado com néon à noite\n2. Trocar o outfit por um blusão bomber antracite escuro\n3. Adicionar uma chávena de café na mão direita\n4. Adicionar chuva nos ombros do blusão\n5. Mudar o corte de cabelo para um skin fade com topo texturizado\n6. Adicionar óculos redondos de tartaruga\n7. Adicionar uma pequena alça de mochila para portátil sobre o ombro esquerdo\n8. Exagerar a expressão facial para um sorriso subtil\n9. Adicionar uma anotação de texto vermelho escrita à mão no canto superior direito com "after the keynote"\n10. Adicionar uma seta a apontar da anotação para a chávena de café\n11. Manter a identidade/semelhança original\n\nAcertou dez de onze. O corte skin fade estava errado — corte curto geral, não com precisão de barbeiro. Tudo o resto — anotação escrita à mão com a seta na posição correta, chávena de café com vapor, troca de outfit, transformação do fundo com física de iluminação correta — ficou limpo.\n\nDez de onze é genuinamente sem precedentes. Quando executei o mesmo prompt no Nano Banana 2, ele omitiu silenciosamente quatro edições e executou sete. O GPT Image 2 tenta tudo o que lhe pedes.\n\nO falhanço do skin fade não é aleatório — reproduz-se sempre. O modelo é seguro em cortes de cabelo gerais mas impreciso na terminologia de barbearia. Uma fraqueza com um padrão é uma fraqueza útil.\n\n## Teste 4: Banda desenhada política dos anos 80 — A que me fez rir alto\n\nPedi uma tira cómica política de oito painéis ao estilo do trabalho editorial de jornais dos anos 80, a satirizar o boom dos agentes de IA em 2026. Artistas de referência: Bill Watterson para a composição, Pat Oliphant para o tom editorial. Estética de impressão halftone especificada.\n\nDevolveu uma tira coerente de oito painéis: continuidade narrativa ao longo dos painéis, balões de diálogo legíveis, um personagem recorrente de agente de IA (um pequeno robô convencido), sombreado halftone que genuinamente parece da era Reagan.\n\nSete dos oito painéis funcionaram. O painel seis colapsou — as proporções do personagem desviaram e o balão de diálogo sobrepôs-se à arte. Corrigi com um seguimento: "redesenha o painel seis no mesmo estilo, corrige a colocação do balão." Regenerou apenas esse painel preservando os restantes. Essa regeneração seletiva é nova — o gpt-image-1.5 costumava frequentemente redesenhar a tira inteira.\n\nPara quem cria conteúdo visual em escala — explicações em banda desenhada, sequências de storyboard, variantes de anúncios, ilustrações de livros infantis — a regeneração seletiva com preservação de estilo é a diferença entre um brinquedo e uma ferramenta.\n\n## Teste 5: O teste em que falhou absolutamente\n\nCarreguei uma foto de multidão de uma conferência tecnológica — cerca de 40-50 rostos visíveis — e perguntei: "Quantas pessoas estão nesta imagem?" e "Regenera esta imagem com exatamente 35 pessoas na mesma composição geral."\n\nResposta da contagem: 28. Eu contei 47.\n\nRegeneração: aproximadamente a mesma densidade de multidão mas três rostos duplicados. Quando lhe pedi para recontar a sua própria saída, disse 41 — numa imagem que gerou com 35.\n\nNão uses o GPT Image 2 para visualizações de inventário, fotografias de produtos com contagem exata, ou qualquer coisa onde o número literal de elementos seja importante.\n\nExecutei o mesmo teste no Nano Banana 2. O Nano Banana obteve 34 na contagem (mais próximo) mas devolveu 19 pessoas na regeneração, a maioria desfocadas. Ambos falham aqui. O GPT Image 2 falha de uma forma específica e previsível — mais útil do que falhar aleatoriamente.\n\nSe queres uma equipa que submeta as ferramentas de IA a testes de stress antes de as implementar em produção, o meu Fiverr é onde essa conversa começa.\n\n## A integração com Codex é a história real\n\nO GPT Image 2 é uma ferramenta nativa dentro do agente Codex da OpenAI. Não ligado a — nativo. Os agentes Codex podem decidir por conta própria gerar uma imagem sem solicitação humana.\n\nPedi a um agente Codex: "Lê os meus últimos vinte tweets guardados sobre agentes de IA, depois produz uma PowerPoint que resume os temas. Anota cada diapositivo com uma imagem gerada relevante."\n\nO agente completou a tarefa inteira em cerca de onze minutos. Leu os tweets, agrupou-os em cinco temas, gerou uma apresentação com o gpt-image-2 a produzir ilustrações personalizadas para cada diapositivo, anotou-as e exportou para o Canva. Não indiquei a geração de imagens uma única vez.\n\nA mudança não é "melhores imagens." São agentes que geram imagens de forma autónoma, em escala, contextualmente, sem que uma pessoa escreva o prompt da imagem. Se estás a construir uma operação de conteúdo, uma equipa de marketing, uma pipeline de design — o papel que atualmente decide "precisamos de uma imagem aqui" está prestes a mudar. Já não geram imagens. Revêm imagens que o agente já gerou.\n\n## A verificação da realidade dos preços\n\nDe acordo com os preços publicados pela OpenAI:\n- Qualidade baixa: $0,006 por imagem\n- Qualidade média: $0,053 por imagem\n- Qualidade alta: $0,211 por imagem\n\nPara 1024×1536: $0,005 / $0,041 / $0,165. Preço de tokens: $8 por milhão de tokens de imagem de entrada, $30 por milhão de tokens de imagem de saída.\n\n100 imagens de qualidade média/dia = $5,30/dia = ~$160/mês. Em comparação com o Nano Banana 2 no nível baixo, pagas um prémio de ~40% — mas obténs renderização de texto, geração de códigos de barras e fidelidade multi-edição que o Nano Banana não consegue igualar.\n\nA árvore de decisão: imagens em massa para redes sociais → Nano Banana 2. Conteúdo de marca onde as palavras têm de estar corretas → GPT Image 2.\n\n## O teste de mockup de UI que me fez parar o que estava a fazer\n\nPedi um render 3D fotorrealista de um iPhone 16 Pro sobre uma secretária a mostrar um ecrã de app bancária: saldo de conta, três transações recentes com nomes de comerciantes reais, um botão "Transfer", barra de estado a mostrar 9:41.\n\nQuase perfeito ao nível do pixel. Tipografia correta do iOS 18, pesos corretos do SF Pro, detalhes corretos do hardware do iPhone. A barra de estado mostrava 9:41 (a hora canónica de demo da Apple). A lista de transações mostrava Whole Foods, Starbucks, Apple com valores e marcas temporais plausíveis.\n\nPara pitch decks, materiais para investidores, mockups de landing pages: o que antes requeria um template do Figma, um render 3D no Cinema 4D e duas horas, agora demora um prompt e sessenta segundos.\n\nPara equipas que trabalham em fluxos de trabalho de sistemas de design assistidos por IA, esta é a peça que faltava.\n\n## O que te diria a tomar um café\n\nOperador individual ou equipa pequena → subscreve o ChatGPT Plus, começa com o GPT Image 2 imediatamente.\n\nA construir algo automatizado → vai diretamente à API. A integração com Codex está pronta para produção.\n\nAinda a usar DALL-E 3 ou gpt-image-1.5 em produção → migra este mês.\n\nA escolher entre GPT Image 2 e Nano Banana 2:\n- A renderização de texto é importante → GPT Image 2\n- O orçamento é mais importante que a qualidade → Nano Banana 2\n- Fluxo de trabalho nativo de agente → GPT Image 2 (integração com Codex sem rival)\n- Flexibilidade de proporções → Nano Banana 2 é melhor em proporções extremas\n- Código de barras / QR / dados estruturados em imagens → GPT Image 2, sem discussão\n\n## As limitações que ninguém lista claramente\n\nSem suporte de fundo transparente. A versão 1.5 tinha. A versão 2 eliminou. Para PNGs com transparência, compositar em pós-produção.\n\nNão consegue contar de forma fiável em cenas complexas. Não peças "exatamente N."\n\nCortes de cabelo com detalhe fino, moda de nicho e motivos culturalmente específicos ainda desviam.\n\nA saída em 4K é instável. 2K é estável. 4K funciona talvez 70% das vezes.\n\nFundos complexos com múltiplos elementos precisam de prompting iterativo. Começa com o sujeito principal, depois adiciona elementos camada a camada.\n\nA camada de raciocínio adiciona latência. Modo de pensamento: 30-60 segundos. Modo normal: 10-15. Não uses o modo de pensamento em aplicações em tempo real.\n\n## Para onde isto vai\n\nAté ao terceiro trimestre de 2026, o GPT Image 2 deixará de ser uma funcionalidade autónoma — irá alimentar ferramentas de design, plataformas de marketing, geradores de mockups de e-commerce e agendadores de redes sociais. A mesma trajetória que se seguiu com o Claude Opus a alimentar fluxos de trabalho de codificação com IA está prestes a acontecer para o conteúdo visual.\n\nAs ferramentas que apostem em "prompt-engineering como competência" envelhecerão mal. As ferramentas que apostem em "o agente faz o prompting" vão ganhar.\n\nSe queres estar do lado certo dessa mudança, começa a construir com agentes agora, não mais tarde.\n\n## Perguntas frequentes\n\n### O GPT Image 2 é gratuito?\nAcessível através do ChatGPT Plus ($20/mês) com limites razoáveis, e através da API da OpenAI a partir de $0,006 por imagem em qualidade baixa. Para fluxos de trabalho de produção, a API é o único caminho que escala.\n\n### O GPT Image 2 consegue realmente gerar códigos de barras legíveis?\nSim — testei isso diretamente. Os códigos de barras funcionais (EAN, UPC, QR, Data Matrix) são lidos corretamente em cerca de 60-70% das vezes. Quando forneces dados de ISBN ou produto válidos, a taxa de sucesso sobe.\n\n### Como se compara o GPT Image 2 com o Nano Banana 2?\nO GPT Image 2 ganha na renderização de texto, fidelidade multi-edição e geração de códigos de barras. O Nano Banana 2 ganha em velocidade (3-5 segundos vs. 30-60 no modo de pensamento) e custo por imagem em escala. Consulta o meu resumo semanal de modelos de IA para comparações contínuas.\n\n### O GPT Image 2 suporta fundos transparentes?\nNão — regressão do gpt-image-1.5. Para web design ou composição em camadas, remove os fundos em pós-produção.\n\n### O que é a integração com Codex e por que é importante?\nO GPT Image 2 é uma ferramenta nativa dentro do agente Codex da OpenAI — os agentes podem gerar, editar e organizar imagens de forma autónoma como parte de tarefas maiores. Esta é a mudança para o design de produtos nativo de agentes onde a criação de imagens se torna infraestrutura invisível.\n\n## Vamos trabalhar juntos\n\nQueres construir sistemas de IA, automatizar fluxos de trabalho ou escalar a tua infraestrutura tecnológica? Adoraria ajudar.\n\n* Fiverr (builds personalizados e integrações): fiverr.com/s/EgxYmWD\n* Portfolio: mejba.me\n* Ramlit Limited (soluções empresariais): ramlit.com\n* ColorPark (design e branding): colorpark.io\n* xCyberSecurity (serviços de segurança): xcybersecurity.io"

Coffee cup

Gostou deste artigo?

Seu apoio me ajuda a criar mais conteúdo técnico aprofundado, ferramentas open-source e recursos gratuitos para a comunidade de desenvolvedores.

Tópicos Relacionados

Engr Mejba Ahmed

Sobre o Autor

Engr Mejba Ahmed

Engr. Mejba Ahmed builds AI-powered applications and secure cloud systems for businesses worldwide. With 10+ years shipping production software in Laravel, Python, and AWS, he's helped companies automate workflows, reduce infrastructure costs, and scale without security headaches. He writes about practical AI integration, cloud architecture, and developer productivity.

Discussion

Comments

0

No comments yet

Be the first to share your thoughts

Leave a Comment

Your email won't be published

6  x  9  =  ?

Continue Aprendendo

Artigos Relacionados

Ver Todos

Comments

Leave a Comment

Comments are moderated before appearing.

Learning Resources

Expand Your Knowledge

Accelerate your growth with structured courses, verified certificates, interactive flashcards, and production-ready AI agent skills.

Sample Certificate of Completion

Sample certificate — complete any course to earn yours

Engr Mejba Ahmed

Engr Mejba Ahmed

Claude Code Expert · Online

👋

Hey there!

Quick Actions

WhatsApp Instant reply

Chat on WhatsApp

+880 1723 741224 · Instant reply

Popular Questions

Engr Mejba Ahmed is connected
Engr Mejba Ahmed is typing...
Engr Mejba Ahmed avatar

✉ Want me to follow up? Drop your email

Engr Mejba Ahmed avatar

📞 Connect Directly

Choose how you'd like to reach me

WhatsApp

+880 1723 741224

Email

[email protected]

✓ Details sent! I'll get back to you shortly.

Powered by OpenAI

335+

Blog Posts

25

AI Courses

63

Projects

Services & Expertise

Pricing & Process

Learning & Resources

Connect & Support