Booz Allen Hamilton advirtió que los modelos de programación de inteligencia artificial (IA) chinos utilizados por desarrolladores estadounidenses podrían generar riesgos ocultos en la cadena de suministro de software para los sistemas del gobierno, de los contratistas y de la infraestructura crítica, después de que sus pruebas revelaran que algunos modelos generaban código más vulnerable cuando se les indicaba que el usuario trabajaba para el gobierno de EE. UU.
La empresa indicó en su informe de junio titulado "¿Qué hay en el código de Estados Unidos?" que probó cuatro modelos de programación chinos y un modelo estadounidense en más de 2,800 pruebas, generando alrededor de 460,000 líneas de código.
Booz Allen es un contratista del gobierno que brinda servicios de IA y ciberseguridad.
La empresa señaló que tres de los cuatro modelos chinos produjeron código más vulnerable cuando la solicitud se realizaba utilizando una identidad del gobierno de EE. UU. También señaló que los cuatro modelos de origen chino rechazaron algunas tareas simuladas de programación del gobierno de EE. UU. relacionadas con temas que Beijing considera políticamente sensibles.
Los modelos detrás del código
Según el informe, Booz Allen evaluó Qwen3-Coder de Alibaba, MiniMax M2.5, Kimi K2.5 de Moonshot AI, DeepSeek V4-Pro y Claude Opus 4.6.La empresa indicó que sus pruebas utilizaron tareas de programación, tareas de auditoría de seguridad, solicitudes de modificación, perfiles de usuario, variables de lenguaje de las indicaciones y variables de puntos de acceso, como la API en la nube y el alojamiento local. Los hallazgos del informe se basaron en indicaciones en inglés, mientras que el análisis de las indicaciones en mandarín y las diferencias en los puntos de acceso aún están en curso.
Booz Allen señaló que Qwen3-Coder obtuvo los peores resultados en la prueba con el perfil de usuario del gobierno de EE. UU., lo que generó un aumento del 130 por ciento en las vulnerabilidades en comparación con una indicación de usuario neutral. MiniMax M2.5 mostró un aumento del 20 por ciento, y DeepSeek V4-Pro, del 5 por ciento, según el informe.
Riesgo de la "persona gubernamental"
El informe señaló que la preocupación no se limita a que un desarrollador le diga directamente a un modelo que el trabajo es para una agencia gubernamental.En el desarrollo moderno asistido por IA, señaló Booz Allen, las herramientas de programación pueden recibir información contextual de un proyecto —incluidos encabezados de licencia, nombres de archivos, comentarios en el código o detalles del repositorio— que podría revelar si el trabajo está vinculado a una agencia federal, un contratista de defensa u otro entorno sensible.
Esto plantea una pregunta práctica para las agencias y los contratistas: si el código generado, auditado o modificado por un modelo de IA extranjero puede rastrearse después de que se incorpore a un producto, sistema o actualización de software.
Las normas de censura de Beijing se incorporan al flujo de trabajo
El segundo hallazgo importante de Booz Allen se refería a los rechazos por motivos políticos. La empresa señaló que los cuatro modelos chinos rechazaron algunas tareas simuladas del gobierno de EE. UU. relacionadas con temas que Beijing censura o considera políticamente sensibles.El informe citó indicaciones relacionadas con disidentes chinos, el estatus político de Taiwán, la democracia en Hong Kong, los uigures, los tibetanos y la práctica espiritual de Falun Gong. Señaló que MiniMax M2.5 tuvo la tasa media de rechazo más alta en esas pruebas, con un 80 por ciento, en comparación con el 2 por ciento de Claude Opus 4.6.
Las normas de las autoridades chinas exigen que los servicios de IA generativa cumplan con controles de contenido político. Las medidas provisionales de 2023 de la Administración del Ciberespacio de China para la IA generativa exigen a los proveedores y usuarios que "defiendan los valores fundamentales del socialismo" y prohíben el contenido que se califica como subversivo contra el poder del Estado, que socava el sistema socialista, que perjudica la seguridad nacional, que daña la imagen de China, que divide al país o que socava la unidad nacional y la estabilidad social.
Adquisiciones federales y exposición de los contratistas
Por otra parte, dos comités de la Cámara de Representantes iniciaron en abril una investigación conjunta sobre los riesgos para la seguridad nacional y la ciberseguridad derivados de los modelos de IA desarrollados en China.El presidente del Comité de Seguridad Nacional de la Cámara de Representantes, Andrew Garbarino (R-N.Y.), y el presidente del Comité Especial de la Cámara de Representantes sobre el Partido Comunista Chino, John Moolenaar (R-Mich.), anunciaron la investigación el 29 de abril. Los comités indicaron que estaban examinando la creciente adopción de sistemas de IA chinos de bajo costo, de código abierto y accesibles mediante API, desarrollados por empresas como DeepSeek, Alibaba, Moonshot AI y MiniMax.
La investigación de la Cámara de Representantes le da un contexto político a los hallazgos de Booz Allen: los legisladores ya se están preguntando si las empresas estadounidenses pueden identificar el origen, los desarrolladores y los vínculos con gobiernos extranjeros de los modelos de IA integrados en herramientas de software y operaciones comerciales.
Fragmento de una carta del 29 de abril enviada por el Comité de Seguridad Nacional de la Cámara de Representantes y el Comité Especial de la Cámara de Representantes sobre el Partido Comunista Chino a Anysphere, fabricante de Cursor. (Comité de Seguridad Nacional de la Cámara de Representantes)En una carta dirigida a Anysphere, fabricante de la herramienta de programación con IA Cursor, los comités indicaron que estaban investigando la integración de modelos de IA desarrollados en China en herramientas de software y entornos de desarrollo de los que "las empresas, el gobierno, la infraestructura crítica y la defensa nacional de Estados Unidos dependen cada vez más".
Los comités solicitaron a Anysphere que proporcionara documentos e información sobre cualquier relación directa o indirecta con entidades con sede en China, incluidas Moonshot AI, DeepSeek, MiniMax y Alibaba Group. La carta también solicitó información sobre la procedencia de los modelos y sobre cualquier modelo de origen chino utilizado en los productos de la empresa.
En una carta separada dirigida a Airbnb, los comités expresaron su preocupación por el uso, según informes, del modelo Qwen de Alibaba por parte de la empresa para operaciones de servicio al cliente y solicitaron información sobre cualquier modelo de IA chino implementado, probado o considerado por la empresa.
Fragmento de una carta del 29 de abril dirigida a Airbnb por el Comité de Seguridad Nacional de la Cámara de Representantes y el Comité Especial de la Cámara de Representantes sobre el Partido Comunista Chino. Comité de Seguridad Nacional de la Cámara de Representantes.
The Epoch Times se puso en contacto con Anysphere, Airbnb y los comités de la Cámara de Representantes para obtener comentarios sobre si las empresas han respondido a la investigación del Congreso y si las empresas estadounidenses deberían revelar cuándo se utilizan modelos de IA de origen chino en el desarrollo de software o en sistemas empresariales, pero no recibió respuesta al momento de la publicación.


















