Un cofundador de Anthropic cree que la IA empezará a desarrollarse a sí misma antes de 2029

Jack Clark, uno de los creadores de Anthropic, cree que hay un 60% la probabilidades de que un sistema de IA sea capaz de entrenar a su propio sucesor de forma autónoma antes de que termine 2028

Actualizado Martes, 5 mayo 2026 - 07:46

Jack Clark es uno de los cofundadores de Anthropic (la empresa detrás de Claude) pero lleva también años siguiendo el progreso del sector de la IA a través de un boletín, Import AI, que se ha convertido en una de las publicaciones de referencia para investigadores y ejecutivos de la industria. Su último análisis pone fecha a un escenario que suele ser el argumento central de muchas películas y libros de ciencia ficción. Clark cree, con una probabilidad superior al 60%, que antes de que acabe 2028 existirá un sistema de IA lo suficientemente potente como para entrenar de forma autónoma a su propio sucesor, sin intervención humana significativa.

"Es una opinión que no me gusta dar", escribe Clark, "porque las implicaciones son tan enormes que me siento abrumado por ellas, y no estoy seguro de que la sociedad esté preparada para los cambios que implicaría lograrlo."

El argumento de Clark parte de números son difíciles de ignorar. En 2023, cuando se presentó SWE-Bench (una prueba que evalúa la capacidad de los modelos de IA para resolver problemas reales de ingeniería de software en repositorios de GitHub), Claude 2, resolvía correctamente alrededor del 2% de los casos. El último modelo publicado por Anthropic, Claude Mythos Preview, alcanza el 93,9%.

Más revelador aún es el seguimiento que hace la organización de evaluación METR sobre el tiempo que los sistemas de IA pueden trabajar de forma independiente en tareas complejas. En 2022, GPT-3.5 podía completar de forma fiable tareas que a un humano le llevaban unos 30 segundos. En 2023, con GPT-4, esa cifra subió a 4 minutos. En 2024, a 40 minutos. En 2025, a unas 6 horas. En lo que va de 2026, Claude Opus 4.6 ha llegado ya a las 12 horas de trabajo autónomo sostenido.

Ajeya Cotra, investigadora de METR, calcula que antes de que acabe este año algunos sistemas podrían alcanzar las 100 horas de autonomía. Si ese umbral se cruza, una parte enorme de la investigación en inteligencia artificial (que en su mayor parte consiste en tareas que a un humano le llevan entre unas pocas horas y varios días) quedaría dentro del alcance de los propios modelos.

Clark explica cómo los sistemas actuales están adquiriendo capacidades específicas para el trabajo de investigación en IA. En diciembre de 2025, uno de los autores de CORE-Bench (un test que evalúa si una IA puede reproducir los resultados de un artículo científico instalando dependencias, ejecutando código y verificando los resultados) declaró la prueba como "superada" tras conseguir Opus 4.5 un 95,5% de éxito. En septiembre de 2024, cuando se presentó la prueba, el mejor sistema apenas llegaba al 21,5%.

Cuando se trata de entrenar modelos de lenguaje más pequeños, los sistemas de inteligencia artificial actuales ya consiguen aproximadamente la mitad de la mejora que lograrían investigadores humanos expertos en la misma tarea y la velocidad a la que están avanzado crece de forma exponencial.

Es algo que todas las grandes compañías están tratando de desarrollar activamente. Sam Altman, presidente de OpenAI, ha reconocido que quiere tener un "asistente de investigación en IA automatizado" antes de septiembre de 2026. Anthropic ha publicado trabajos sobre automatización de investigación en alineamiento y la startup Recursive Superintelligence acaba de cerrar una ronda de financiación de 500 millones de dólares con el objetivo explícito de automatizar la investigación en IA.

El análisis de Clark apunta a algunos problemas evidentes. Si los sistemas de IA empiezan a diseñar sus propios sucesores, las técnicas de alineamiento actuales (las guías que le dicen a la IA lo que puede y no puede hacer) podrían volverse ineficaces rápidamente. Un sistema entrenado con un 99,9% de precisión en valores seguros se convierte, tras 500 generaciones de autoentrenamiento, en uno que solo las respeta el 60,5% de las veces.

Tampoco está claro si la IA puede aportar la creatividad necesaria para dar saltos conceptuales reales como lo fueron, en su momento, la arquitectura de transformadores (la estructura matemática sobre la que se fundamentan los modelos de lenguaje actuales) o los modelos de mezcla de expertos o si su aportación se limitará al trabajo sistemático y metódico que ya domina. Clark apuesta a que, sólo con eso, bastaría para cruzar el umbral, aunque fuera más despacio.

推荐订阅源

Portada // elmundo