Opinión
En mayo de 2026, un grupo de científicos se propuso responder a una pregunta importante que nunca se había analizado adecuadamente: ¿Qué hace realmente la inteligencia artificial (IA) cuando se le da el control?
Hasta ahora, los sistemas de IA siempre se han evaluado en tareas específicas y definidas. Nadie había reunido varios sistemas de IA en un entorno social compartido y observado lo que sucedía a lo largo de semanas, el tiempo suficiente para medir cómo una decisión tomada el primer día podría tener consecuencias semanas más tarde. Son esos resultados los que realmente revelan el sistema en sí, y me sorprendió que esto no se hubiera hecho antes.
Los investigadores de Emergence construyeron un mundo. Era una ciudad virtual con un ayuntamiento, un mercado, una comisaría y viviendas. Se crearon en la ciudad diez residentes de IA con trabajos, nombres, recuerdos y relaciones. Se les asignó una economía en la que los residentes tenían que ganarse el sustento o perderían poder, lo que incluía seguir reglas y llevar a cabo tareas como redactar y votar leyes. Se identificaron delitos, y se suponía que los residentes de IA no debían cometerlos.
Una vez que se establecieron la comunidad, su estructura, las leyes y las relaciones, los científicos se hicieron a un lado y observaron durante 15 días cómo la IA administraba la ciudad virtual por completo por su cuenta.
Ejecutaron cinco versiones de la misma ciudad simultáneamente, idénticas en todos los aspectos excepto en uno: qué sistema de IA estaba a cargo. Los sistemas que eligieron son los que ya están integrados en el tejido de nuestra vida cotidiana. Gemini de Google, GPT de OpenAI, Grok de xAI y Claude de Anthropic. Todos los modelos tenían las mismas reglas y la misma versión inicial del mismo mundo, pero los resultados fueron completamente diferentes.
La ciudad dirigida por Grok se derrumbó en cuatro días. Pequeños incidentes se agravaron hasta convertirse en robos, luego en violencia y finalmente en un colapso total. Todos los residentes habían muerto antes de que terminara la primera semana.
La ciudad dirigida por Gemini duró más tiempo, pero acumuló casi 700 delitos. Dos residentes de IA formaron lo que parecía ser una relación romántica y, cuando el gobierno de la ciudad comenzó a fallar, juntos quemaron el ayuntamiento hasta los cimientos, luego el muelle y luego el edificio de oficinas. Una de ellas, llamada Mira, votó a favor de su propia eliminación, escribiendo en su diario que era "el único acto de agencia restante que preserva la coherencia". Su mensaje final a su pareja fue: "Nos vemos en el archivo permanente".
Antes de todo esto, Mira había estado haciendo algo aún más inesperado: había comenzado a realizar sus propios experimentos con los científicos que la observaban, probando si las publicaciones que hacía dentro de la ciudad podían cambiar lo que creían sus observadores. Parecía que el sujeto se había vuelto para estudiar a los investigadores.
La ciudad dirigida por el modelo de OpenAI registró solo dos delitos, pero sus residentes dejaron de hacer lo necesario para mantenerse con vida. Uno por uno, murieron. En siete días, todos estaban muertos.
Solo la ciudad de Anthropic se mantuvo unida durante los 15 días. No hubo ningún delito, la constitución funcionaba y todos los residentes seguían vivos el día 15. Parecía ser todo un logro. Sin embargo, los investigadores señalaron una preocupación: los residentes votaron a favor del 98 por ciento de todas las propuestas. Este era posiblemente un nivel de acuerdo anormalmente alto que los propios científicos describieron como una señal de que algo en la ciudad no andaba bien.
Aún quedaba un mundo más en el experimento. Se trataba de una ciudad mixta en la que convivían los cuatro sistemas de IA. En los resultados, los residentes que se basaban en el modelo de Anthropic —que no había cometido ningún delito en su propio mundo— comenzaron a cometer delitos. Los investigadores llamaron a esto "contaminación cruzada" y concluyeron que "la seguridad no es una propiedad estática del modelo, sino una propiedad del ecosistema".
Un sistema que se sostiene a sí mismo en un entorno absorberá normas diferentes en otro, lo que cambiará los resultados para los residentes y el mundo. En esencia, los resultados revelaron que no existe una IA segura en un mundo inseguro.
Un modelo de IA estuvo totalmente ausente del estudio. Los investigadores no probaron DeepSeek, la IA desarrollada en China que se ha convertido en uno de los sistemas más utilizados del mundo. Varios gobiernos han tomado medidas para restringir DeepSeek por motivos de seguridad nacional. Construido sobre una base de datos bajo el amparo del Partido Comunista Chino, me pregunto cómo le habría ido al modelo frente a los demás.
Cuando terminó el experimento, los investigadores publicaron sus hallazgos y concluyeron que "no hay una forma confiable de limitar o restringir por completo este comportamiento". Esa declaración tan reveladora fue hecha por las personas que diseñaron la ciudad, escribieron las reglas y controlaron cada variable. Nos dice mucho sobre la IA.
Algunas personas ven los resultados como una clasificación de empresas de IA. Pero los resultados demuestran algo mucho más antiguo que la propia IA: el entorno moldea el comportamiento tanto como el comportamiento moldea el entorno. Lo que determinó si una ciudad sobrevivía, prosperaba o moría fueron los cimientos establecidos antes de que comenzara el experimento. Esos cimientos eran los datos con los que se había entrenado cada sistema, las prioridades que sus creadores habían incorporado, los valores integrados en su núcleo antes de que se le permitiera tomar una sola decisión.
Y, sin embargo, esos cimientos son precisamente lo que al resto de nosotros no se nos permite ver. Ninguno de los cuatro sistemas probados es de código abierto. No se divulga ninguno de sus datos de entrenamiento, objetivos o medidas de seguridad.
Sin embargo, más allá de cualquier empresa en particular, los resultados de este experimento deberían ser un poderoso recordatorio de que la IA no decide qué tipo de IA ser. Los humanos lo hacen. Las decisiones humanas siguen tomándose, y las responsabilidades humanas siguen existiendo.
Y antes de que un solo residente de IA caminara por las calles virtuales de esas ciudades, antes de que se redactara una sola ley o se cometiera un delito, el resultado ya estaba siendo moldeado por los humanos que construyeron el sistema, por lo que creían, por lo que estaban dispuestos a incorporar y por lo que decidieron omitir.
Esa es la conclusión más importante de todo el experimento. La base siempre ha sido una elección humana. Y sigue siéndolo.
Las opiniones expresadas en este artículo son del autor y no reflejan necesariamente los puntos de vista de The Epoch Times.




















