En medio de la geopolítica de la inteligencia artificial le metieron un gol a Anthropic

Hace unas semanas escribí sobre Claude Mythos, Gödel y el precio estructural de la ciberseguridad (El Financiero, 21 de abril, 2026). El argumento central era relativamente simple: el verdadero riesgo no consiste en imaginar una inteligencia artificial omnipotente, sino en aceptar que ningún sistema complejo puede observarse, verificarse o defenderse completamente desde dentro de sus propias reglas. Siempre hay puntos ciegos. Siempre hay caminos que el sistema no sabe que existen. Siempre hay verdades que quedan fuera del mapa.

Vale la pena retomar el tema porque la discusión en los medios dejó de ser puramente tecnológica o filosófica. En los últimos días, el acceso a los modelos más avanzados de Anthropic volvió a colocarse en el centro de una tensión internacional. Las patadas están fuertes y le metieron gol a Anthropic. Tras las restricciones impuestas por las autoridades estadounidenses al uso de modelos como Claude Mythos por parte de usuarios extranjeros, líderes del G7 comenzaron a discutir esquemas para que ciertos países, empresas u organizaciones consideradas “socios confiables” puedan acceder a estas capacidades bajo condiciones especiales.

La pregunta de fondo ya no es solamente qué puede hacer Mythos. La pregunta es quién debe poder usarlo, bajo qué reglas y con qué propósito. Durante décadas, la ciberseguridad ha funcionado como una carrera desigual entre quienes construyen sistemas, quienes los defienden y quienes buscan romperlos. El modelo tradicional era reactivo: alguien descubre una falla, la reporta, se genera un identificador, se produce un parche, se despliega la actualización y se espera que los atacantes no hayan llegado primero. De hecho, el origen mismo de los hackatones parte de un evento sobre ciberseguridad en la hoy inexistente empresa SUN. Mythos altera esa economía. Reduce dramáticamente el costo de explorar software complejo. Acelera la búsqueda de fallas. Convierte en tarea parcialmente automatizable algo que antes dependía de equipos humanos altamente especializados.

Para entender por qué una máquina puede hacer esto, conviene distinguir tres ideas que suelen confundirse: aprendizaje autosupervisado, aprendizaje por refuerzo y deep learning. El aprendizaje supervisado clásico es el paradigma más intuitivo. Un sistema aprende a partir de ejemplos etiquetados: imágenes de gatos y perros, correos clasificados como spam o no spam, transacciones marcadas como fraudulentas o legítimas. La máquina recibe pares de entrada y respuesta correcta. Es como un estudiante que practica con un libro de ejercicios que tiene las respuestas al final.

Ese enfoque sigue siendo importante, pero no explica por sí solo el éxito de modelos como Claude, GPT o Mythos. En los grandes modelos de lenguaje, el mecanismo fundamental durante el pre-entrenamiento es más bien el aprendizaje autosupervisado. El modelo recibe cantidades gigantescas de texto, código, documentación técnica, manuales, conversaciones, reportes y ejemplos. No necesita que cada fragmento esté etiquetado por un humano. Su tarea inicial parece simple: predecir qué viene después. Una palabra. Una línea de código. Una estructura. Una instrucción. Una consecuencia lógica.

A escala masiva, esa tarea produce algo mucho más profundo. El modelo empieza a capturar regularidades del lenguaje, patrones de programación, convenciones de diseño, estilos de razonamiento, errores recurrentes y relaciones entre causas y efectos. Aprende, en cierto sentido, la gramática oculta de los sistemas humanos. En ciberseguridad, esa gramática es decisiva. Una vulnerabilidad rara vez aparece con una señal visible. No dice “aquí estoy”. Puede esconderse en una validación incompleta, una condición de carrera, una conversión peligrosa de tipos, un manejo incorrecto de memoria, una dependencia heredada o una interacción inesperada entre capas de software que fueron escritas por equipos y momentos distintos. Encontrar una vulnerabilidad no es solo leer código. Es imaginar cómo puede fallar un sistema cuando se le empuja fuera de las condiciones normales para las que fue diseñado.

El segundo mecanismo es el aprendizaje por refuerzo. A diferencia del aprendizaje supervisado clásico, aquí el modelo no aprende únicamente a imitar respuestas correctas, sino a mejorar su comportamiento a partir de señales de éxito o fracaso. La analogía más común es la de un agente que aprende jugando: intenta una acción, observa el resultado, recibe una recompensa o penalización y ajusta su estrategia. Sugiero ver The Thinking Game en Youtube. En los modelos modernos, esta lógica aparece de formas más sofisticadas. Se usa para alinear respuestas con preferencias humanas, mejorar la utilidad del sistema, reducir comportamientos peligrosos y orientar el modelo hacia ciertos principios. Anthropic ha desarrollado, además, una técnica conocida como Constitutional AI, que busca entrenar modelos no solo con retroalimentación humana, sino también con principios explícitos que guían su comportamiento.

Esto es especialmente relevante en ciberseguridad porque estamos frente a una capacidad de doble uso. La misma habilidad que permite encontrar una vulnerabilidad para corregirla también puede servir para explotarla. El modelo no es “bueno” o “malo” por naturaleza. Su impacto depende del entorno institucional, los permisos, las herramientas, las restricciones, los objetivos y los actores que lo utilicen. El tercer elemento es el deep learning. Aquí hay que ser precisos: el deep learning no es una forma de enseñanza, sino una arquitectura. Es el tipo de “cerebro” estadístico que hace posible el aprendizaje. Consiste en redes neuronales profundas, con múltiples capas capaces de transformar datos en representaciones cada vez más abstractas.

Los modelos tipo Claude pertenecen a la familia de los transformers, arquitecturas especialmente potentes para procesar secuencias largas de texto, código e instrucciones. Eso importa porque una falla de seguridad puede depender de algo que aparece cientos o miles de líneas antes. Puede estar relacionada con una variable definida en otro módulo, con una biblioteca externa, con una configuración del entorno o con una decisión de diseño tomada años atrás. Deep learning aporta la arquitectura. El aprendizaje autosupervisado aporta el conocimiento estadístico del mundo técnico. El aprendizaje por refuerzo y el post-entrenamiento aportan dirección, criterio y alineación. Pero el verdadero salto aparece cuando todo eso se convierte en estrategia: la capacidad de planear, probar hipótesis, usar herramientas, leer código, interpretar errores, ejecutar pruebas y volver a intentarlo.

Eso es lo que distingue a Mythos de un simple detector de patrones. Un antivirus tradicional compara contra firmas conocidas. Un analizador estático busca ciertos tipos de errores. Una herramienta de fuzzing explora entradas inesperadas. Todas esas herramientas son valiosas, pero operan dentro de límites relativamente definidos. Un modelo agéntico puede combinarlas, interpretar sus resultados, cambiar de estrategia y explicar por qué un comportamiento observado podría convertirse en una vulnerabilidad real.

La IA no solo encuentra agujas en el pajar: empieza a formular nuevas maneras de buscar agujas. Aquí se conecta el debate actual con el argumento de fondo que planteaba en mi artículo anterior. Mythos importa porque revela algo relevante sobre los sistemas complejos: no se entienden por completo desde dentro. Un software suficientemente grande contiene zonas que sus propios diseñadores no anticiparon. No porque sean incompetentes, sino porque la complejidad acumulada produce puntos ciegos. Pareciera que Mythos funciona como una mirada externa. No sustituye al ingeniero, pero amplifica brutalmente su capacidad de inspección. Puede recorrer caminos que a un equipo humano le tomaría semanas explorar. Puede detectar patrones sutiles entre millones de líneas de código. Puede sugerir hipótesis que después deben ser verificadas, descartadas o convertidas en parches por personas con criterio técnico.

Por eso la reacción internacional es tan importante. Cuando Washington restringe el acceso a estos modelos por razones de seguridad nacional, no está simplemente regulando una herramienta comercial. Está reconociendo que los modelos de frontera se están convirtiendo en infraestructura estratégica. Y cuando los países del G7 discuten esquemas de acceso para “socios confiables”, están aceptando que la ciberseguridad del futuro no podrá separarse de algo que ya llevamos tiempo escuchando en la arena internacional, la geopolítica de la inteligencia artificial.

La pregunta ya no es si una empresa puede lanzar un modelo. La pregunta es si un país puede permitirse quedar fuera de las capacidades que descubren, priorizan y ayudan a corregir vulnerabilidades en la infraestructura digital global. Esa es la paradoja. Restringir el acceso puede reducir riesgos inmediatos de abuso, pero también puede debilitar a defensores legítimos fuera de Estados Unidos. Abrir el acceso puede acelerar la protección de sistemas críticos, pero también aumenta el riesgo de que capacidades avanzadas lleguen a actores maliciosos. No hay solución perfecta. Hay, más bien, un equilibrio inestable entre seguridad, innovación, soberanía tecnológica y cooperación internacional.

En ese contexto, el Proyecto Glasswing adquiere una dimensión que va más allá de Anthropic. Es un experimento de gobernanza. Intenta responder una pregunta urgente: ¿cómo se distribuye una capacidad peligrosa pero necesaria? La respuesta inicial ha sido limitar el acceso, seleccionar socios, exigir requisitos de seguridad y priorizar el uso defensivo. Pero el conflicto reciente muestra que esa fórmula todavía está lejos de estar resuelta.

El propio éxito de Mythos crea un nuevo cuello de botella. Encontrar vulnerabilidades a gran velocidad no basta. Cada hallazgo debe verificarse. Cada reporte debe priorizarse. Cada parche debe probarse. Cada actualización debe desplegarse. En el mundo real, corregir software crítico puede ser más difícil que descubrir que está roto. Una vulnerabilidad encontrada en minutos puede tardar semanas o meses en resolverse si afecta sistemas heredados, infraestructura crítica o proyectos de código abierto mantenidos por pocas personas.

Esto tiene una consecuencia directa para empresas, gobiernos y universidades: ya no podemos enseñar ni practicar ciberseguridad como si el principal problema fuera solamente la escasez de expertos humanos. El nuevo reto será formar expertos capaces de dirigir sistemas de IA, validar sus hallazgos, entender sus errores, decidir prioridades y diseñar arquitecturas más resistentes desde el origen.

Y aquí aparece una implicación educativa que deberíamos tomar muy en serio. En medio del entusiasmo por herramientas que escriben código, ha surgido una idea falsa, pero peligrosa: que ya no será necesario aprender a programar. Es exactamente lo contrario. Nunca ha sido más importante entender cómo funcionan los sistemas desde dentro.

La IA puede generar código, pero alguien debe saber si ese código es seguro. Puede encontrar vulnerabilidades, pero alguien debe distinguir entre una falsa alarma y una falla crítica. Puede proponer parches, pero alguien debe entender sus consecuencias. Puede automatizar parte del trabajo, pero no puede reemplazar el criterio de quien comprende arquitectura, memoria, concurrencia, redes, criptografía, sistemas operativos y comportamiento humano.

Los hackatones, en su sentido original, deberían recuperar relevancia. No como eventos superficiales para producir prototipos vistosos en 24 horas, sino como espacios intensivos para construir, romper, entender y asegurar sistemas reales. El futuro de la ciberseguridad no necesita menos programadores. Necesita programadores más profundos, más conscientes de los límites del software y mejor equipados para trabajar con máquinas que amplifican tanto la defensa como el ataque.

Claude Mythos no es simplemente una noticia sobre Anthropic. Es una señal de época. Nos dice que la inteligencia artificial ya no sólo redacta textos, resume documentos o responde preguntas. Empieza a inspeccionar las estructuras invisibles sobre las que descansa, aceptémoslo, la vida digital moderna.

La controversia internacional reciente confirma algo todavía más importante: estas capacidades ya no pertenecen únicamente al terreno de la innovación empresarial. Pertenecen al terreno de la seguridad nacional, la cooperación internacional y la soberanía tecnológica. Hace unas semanas, la pregunta era filosófica: ¿qué nos enseña Mythos sobre los límites de los sistemas complejos?

Hoy la pregunta es más compleja: ¿quién tendrá derecho a usar las máquinas que revelan esos límites?

Y mañana la pregunta será industrial: ¿quién será capaz de corregirlos más rápido y a qué precio?

推荐订阅源

El Financiero