19 Agosto 2025

o3 da OpenAI Domina Grok em Campeonato de Xadrez de IAs com Vitória Contundente

A aguardada final do torneio de xadrez de IAs entre o modelo o3 da OpenAI e o Grok 4 da xAI gerou grande expectativa, sendo vista como uma disputa indireta entre as duas gigantes da tecnologia e seus respectivos CEOs. No entanto, qualquer comparação com os duelos históricos como o de Deep Blue contra Garry Kasparov foi rapidamente esquecida, pois o o3 dominou completamente o Grok 4, vencendo por um placar de 4 a 0 sob os comentários por vezes sarcásticos do ex-campeão mundial de xadrez Magnus Carlsen e do grande mestre David Howell.

As Regras do Jogo e o Caminho Para a Final

O torneio ocorreu na Game Arena da Kaggle, uma plataforma do Google onde modelos de IA competem em xadrez e outros jogos. Uma regra fundamental garantia a equidade: os competidores não podiam receber treinamento especializado em xadrez, devendo jogar apenas com o conhecimento geral obtido na internet. A competição contou com oito dos mais proeminentes LLMs do mercado, incluindo Gemini 2.5 Pro do Google e Claude Opus da Anthropic. Durante sua jornada, o Grok 4 mostrou força ao eliminar os modelos Gemini 2.5 Flash e Gemini 2.5 Pro, enquanto o o3 demonstrou uma consistência formidável, vencendo todas as suas partidas anteriores também por 4 a 0, incluindo a semifinal contra seu “irmão”, o o4-mini.

Um Desempenho Questionável no Confronto Decisivo

Apesar da expectativa de uma batalha de campeões, o desempenho do Grok na final foi decepcionante. Os comentaristas Carlsen e Howell alternaram entre análises sérias e provocações, à medida que o Grok exibia um jogo errático. Na primeira partida, ele sacrificou seu bispo sem uma boa razão e, em seguida, trocou peças de forma apressada. Em contraste, o o3 não precisou de jogadas geniais; seu jogo foi sólido, sem erros graves, convertendo suas vantagens de maneira metódica e executando movimentos clássicos. Antes da final, Elon Musk havia comentado que a xAI investiu relativamente pouco na otimização de xadrez, o que poderia explicar o resultado.

Análise dos Especialistas e a Lacuna de Habilidade

A análise dos especialistas foi dura. Carlsen classificou o jogo do Grok com um ELO de aproximadamente 800, nível de um jogador iniciante, enquanto deu ao o3 um respeitável ELO 1200, comparável a um jogador amador mediano. “O o3 é bastante implacável nas conversões; parece um enxadrista. O Grok parece ter aprendido alguns lances de abertura e conhecer as regras, mas não muito mais que isso”, afirmou Carlsen. O grande mestre Hikaru Nakamura também criticou os múltiplos erros do Grok. Para contextualizar, o ELO oficial de Carlsen é 2839 e o de Nakamura, 2807, evidenciando a enorme lacuna de habilidade entre os modelos de IA generalistas e os campeões humanos.

IA Generalista vs. IA Especializada: O Cenário Maior

Este evento reforça uma distinção importante no mundo da IA: o desempenho de modelos generalistas versus programas especializados. Marcos históricos, como a vitória do AlphaGo sobre o mestre de Go Lee Sedol em 2019 e a derrota de Garry Kasparov para o Deep Blue em 1997, foram possíveis porque essas IAs foram exaustivamente treinadas para um único jogo. Carlsen resumiu bem a limitação dos modelos atuais, afirmando que eles se assemelham a um bom coletor de ingredientes que não sabe cozinhar; calculam bem a captura de peças, mas carecem de uma estratégia coesa para o xeque-mate. Isso foi corroborado no início de 2025, quando tanto o Grok quanto o ChatGPT foram derrotados pelo Stockfish, um motor de xadrez especializado, demonstrando que, apesar dos avanços impressionantes, ainda há um longo caminho para o domínio estratégico em competições complexas.