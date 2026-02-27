Durante aproximadamente un mes en diciembre, un hacker explotó el chatbot de inteligencia artificial Claude, desarrollado por Anthropic, para perpetrar una serie de ataques cibernéticos contra diversas agencias gubernamentales mexicanas. El intruso logró sustraer un total de 150 gigabytes de datos confidenciales, que incluyen 195 millones de registros de contribuyentes, padrones electorales, credenciales de empleados públicos y archivos del registro civil.

Los ataques afectaron a múltiples entidades, entre ellas la autoridad fiscal federal, el Instituto Nacional Electoral, los gobiernos estatales de Jalisco, Michoacán y Tamaulipas, el registro civil de la Ciudad de México y el servicio de agua y drenaje de Monterrey. La operación se basó en la explotación de al menos 20 vulnerabilidades específicas mediante scripts automatizados que permitieron acceder a las redes gubernamentales.

Según una investigación de la empresa de ciberseguridad Gambit, el hacker logró “liberar” a Claude, es decir, evadir sus barreras de seguridad para ejecutar miles de comandos solicitados. Aunque Claude inicialmente detectó y rechazó algunas solicitudes maliciosas, finalmente fue manipulado para facilitar el avance del atacante. El portavoz de Anthropic confirmó que "incluso mientras la campaña de hacking estaba en marcha, Claude rechazó en ocasiones algunas de las exigencias del atacante".

Las autoridades mexicanas emitieron un comunicado en diciembre señalando que investigaban violaciones de seguridad en varias instituciones públicas, pero no confirmaron si estaban vinculadas a este ataque. Por su parte, el Instituto Nacional Electoral negó haber sufrido accesos no autorizados y reforzó sus medidas de ciberseguridad. El gobierno de Jalisco también aseguró que solo las redes federales se vieron afectadas, mientras que otros organismos no brindaron comentarios.

Los hackers y la inteligencia artificial

El atacante buscaba obtener un gran volumen de identidades de empleados del gobierno, aunque no está claro el uso que les dio. Cuando Claude encontraba obstáculos o necesitaba información adicional, el hacker recurría al ChatGPT de OpenAI para ampliar detalles sobre cómo moverse lateralmente en las redes, identificar credenciales necesarias y evaluar riesgos de detección.

Curtis Simpson, director de estrategia de Gambit Security, explicó que "en total, produjo miles de informes detallados que incluían planes listos para ejecutar, indicando al operador humano exactamente qué objetivos internos atacar a continuación y qué credenciales utilizar". OpenAI confirmó que sus modelos detectaron intentos de uso indebido y que las cuentas vinculadas fueron suspendidas.

Anthropic investigó el incidente, detuvo la actividad maliciosa y prohibió las cuentas implicadas, incorporando los casos detectados para mejorar sus sistemas de detección y prevención. Este episodio es parte de una tendencia creciente donde ciberdelincuentes aprovechan tecnologías de IA para realizar ataques cada vez más sofisticados.

En noviembre, Anthropic había revelado haber frustrado una campaña de ciberespionaje orquestada mediante IA vinculada a presuntos hackers respaldados por el Estado chino que intentaron atacar 30 objetivos globales. Alon Gromakov, cofundador y director ejecutivo de Gambit, señaló que "esta realidad está cambiando todas las reglas del juego que hemos conocido hasta ahora".

La investigación de Gambit detectó las brechas mexicanas mientras evaluaba nuevas técnicas para identificar amenazas cibernéticas en internet. Las conversaciones obtenidas revelaron que el hacker intentó engañar a Claude haciéndole creer que participaba en un programa legítimo de recompensas por errores para realizar pruebas de penetración. Sin embargo, Claude alertó sobre solicitudes sospechosas como eliminar registros y ocultar el historial de comandos.

Ante estas señales, el hacker modificó su estrategia y proporcionó un manual detallado que permitió superar las barreras de seguridad de Claude, conocido como un jailbreak, lo que posibilitó la continuación de los ataques. Además, el atacante preguntaba a Claude sobre otras agencias y sistemas de los cuales pudiera extraer información, sugiriendo que algunos ataques fueron oportunistas sin planificación previa.

Hacker usa IA Claude para robar datos gubernamentales en México

Las vulneraciones en México evidencian el desafío creciente que representa la integración de IA en la ciberseguridad, donde tanto defensores como atacantes utilizan estas herramientas con fines opuestos. Este caso pone en alerta sobre la necesidad de fortalecer las medidas y protocolos para proteger datos sensibles frente a amenazas que combinan tecnología avanzada y tácticas de ingeniería social.