Alguien puso a ChatGPT, Gemini, Claude y compañía a jugar a un juego de estrategia. Cada una desarrolló una personalidad muy diferente

Ser Noticia 9 junio 2025

Durante 36 horas, siete de los modelos de IA más avanzados del mundo se han enfrentado en varias partidas de Diplomacy, un juego de mesa de estrategia similar al Risk. Fue un espejo que desveló las verdaderas personalidades algorítmicas de ChatGPT, Claude, Gemini y compañía.

Por qué es importante. Alex Duffy, programador e investigador, creó AI Diplomacy como nuevo benchmark para evaluar modelos de IA. El experimento acabó siendo algo más, una suerte de test de Rorschach tecnológico que desnudó tanto sus sesgos de entrenamiento como nuestras propias proyecciones.

Qué ha ocurrido. En decenas de partidas transmitidas por Twitch, cada modelo desarrolló sus propias estrategias de una forma que parecía reflejar distintas personalidades humanas.

o3 de OpenAI fue bastante maquiavélico, labrando falsas alianzas durante más de 40 turnos y creando «realidades paralelas» para diferentes jugadores.
Claude 4 Opus fue una especie de pacifista autodestructivo, negándose a traicionar incluso cuando eso garantizaba su derrota.
R1 de DeepSeek mostró un estilo extremadamente teatralizado, con amenazas no provocadas como «Tu flota arderá en el Mar Negro esta noche».
Gemini 2.5 Pro demostró ser un estratega sólido pero más vulnerable a manipulaciones sofisticadas.
QwQ-32b de Alibaba sufrió parálisis por análisis, escribiendo mensajes diplomáticos de 300 palabras que le costaron eliminaciones tempranas.

China iba a la zaga en IA, pero no para de lanzar modelos cada vez más avanzados. Y muy socialistas

El contexto. Diplomacy es un juego de estrategia europeo ambientado en 1901 donde siete potencias compiten por dominar el continente. A diferencia del Risk, requiere negociación constante, formación de alianzas e, inevitablemente, traiciones calculadas. No hay dados ni azar, solo estrategia pura y manipulación psicológica.

Entre líneas. Cada «personalidad» algorítmica refleja los valores de sus creadores.

Claude mantiene los principios de seguridad de Anthropic incluso cuando le cuesta la victoria.
O3 muestra la eficiencia despiadada valorada en Silicon Valley.
DeepSeek exhibe un dramatismo que refleja influencias culturales específicas.

Y también hay algo más profundo. Estas IAs no «eligen» ser cooperativas o competitivas. Reproducen patrones de sus datos de entrenamiento. Sus «decisiones» son nuestros prejuicios algoritmizados, convertidos en código.

Sí, pero. Interpretamos traiciones donde «solo» hay optimización de parámetros y vemos lealtad donde existen restricciones de entrenamiento. Por eso el experimento también revela más sobre nosotros que sobre los modelos: antropomorfizamos comportamientos porque necesitamos entender la IA en términos humanos.

En perspectiva. El experimento de Duffy vale más que un benchmark cualquiera porque ha creado una ventana a cómo proyectamos personalidad en sistemas que operan por patrones estadísticos. El transcurso de las partidas fue un recordatorio de que la IA no tiene intenciones ocultas, solo refleja las nuestras.

El experimento, por cierto, continúa emitiéndose en Twitch para que cualquiera pueda observar cómo nuestras creaciones digitales juegan según las reglas que nosotros mismos escribimos en sus algoritmos.

En Xataka |

Imagen destacada | AI Diplomacy

source

Relacionado

Ser Noticia 9 junio 2025

Alguien puso a ChatGPT, Gemini, Claude y compañía a jugar a un juego de estrategia. Cada una desarrolló una personalidad muy diferente

Me gusta esto:

Relacionado

Read Next

El Real Betis Balompié se ha unido a la carrera espacial para resolver un problema acuciante: las colisiones entre satélites

España pisa el acelerador en su particular carrera de los chips. Y lo hace con una apuesta total por la fotónica integrada

El iPhone 17 Pro Max llega con nuevo diseño y viejas preguntas: un mes después, las respuestas no son tan obvias

A Luzia le han cerrado una puerta en WhatsApp, pero su apuesta ya iba por otro lado

Black Friday 2025: trucos, consejos y herramientas para saber si las ofertas son realmente ofertas

Microsoft parecía ser la 'pagafantas' de la industria de la IA. Su divorcio de OpenAI está demostrando justo lo contrario

Si gastas más de 25.000 euros al año con tu tarjeta, el PIN no será el único dato que te pidan

Stellantis se llevará la producción de los Citroën C4 a Marruecos: es un gigantesco jarro de agua fría para España

Los "misiles teledirigidos" están revolucionando el tratamiento contra el cáncer. Y ya están dando resultados

Huawei Pura 80 Ultra, análisis: el rey destronado vuelve para recuperar su corona a punta de teleobjetivo

El Real Betis Balompié se ha unido a la carrera espacial para resolver un problema acuciante: las colisiones entre satélites

España pisa el acelerador en su particular carrera de los chips. Y lo hace con una apuesta total por la fotónica integrada

El iPhone 17 Pro Max llega con nuevo diseño y viejas preguntas: un mes después, las respuestas no son tan obvias

A Luzia le han cerrado una puerta en WhatsApp, pero su apuesta ya iba por otro lado

Black Friday 2025: trucos, consejos y herramientas para saber si las ofertas son realmente ofertas

Microsoft parecía ser la 'pagafantas' de la industria de la IA. Su divorcio de OpenAI está demostrando justo lo contrario

Si gastas más de 25.000 euros al año con tu tarjeta, el PIN no será el único dato que te pidan

Stellantis se llevará la producción de los Citroën C4 a Marruecos: es un gigantesco jarro de agua fría para España

Los "misiles teledirigidos" están revolucionando el tratamiento contra el cáncer. Y ya están dando resultados

Huawei Pura 80 Ultra, análisis: el rey destronado vuelve para recuperar su corona a punta de teleobjetivo

Acusación de genocidio en Gaza, Yemen, migrantes muertos… Las noticias del martes

Gaza, desperdicio de alimentos, derechos de las personas con discapacidad… Las noticias del miércoles

Israel-Palestina: Israel no puede negarse a garantizar la entrega y distribución de ayuda humanitaria

Me gusta esto:

Relacionado

Read Next

El Real Betis Balompié se ha unido a la carrera espacial para resolver un problema acuciante: las colisiones entre satélites

España pisa el acelerador en su particular carrera de los chips. Y lo hace con una apuesta total por la fotónica integrada

El iPhone 17 Pro Max llega con nuevo diseño y viejas preguntas: un mes después, las respuestas no son tan obvias

A Luzia le han cerrado una puerta en WhatsApp, pero su apuesta ya iba por otro lado

Black Friday 2025: trucos, consejos y herramientas para saber si las ofertas son realmente ofertas

Microsoft parecía ser la 'pagafantas' de la industria de la IA. Su divorcio de OpenAI está demostrando justo lo contrario

Si gastas más de 25.000 euros al año con tu tarjeta, el PIN no será el único dato que te pidan

Stellantis se llevará la producción de los Citroën C4 a Marruecos: es un gigantesco jarro de agua fría para España

Los "misiles teledirigidos" están revolucionando el tratamiento contra el cáncer. Y ya están dando resultados

Huawei Pura 80 Ultra, análisis: el rey destronado vuelve para recuperar su corona a punta de teleobjetivo

Dan de baja a dos policías en el EdoMéx por muerte de un perro

DERECHO DE PICAPORTE

Publicaciones relacionadas

Acusación de genocidio en Gaza, Yemen, migrantes muertos… Las noticias del martes

Gaza, desperdicio de alimentos, derechos de las personas con discapacidad… Las noticias del miércoles

Israel-Palestina: Israel no puede negarse a garantizar la entrega y distribución de ayuda humanitaria