Los 6 niveles de programar con IA (y por qué el 90% se queda atascado)
·
Joaquín Ruiz
Programar con IA no te hace más rápido: te hace más lento, y lo peor es que ni te enteras. Si crees que con la inteligencia artificial picas código diez veces más rápido, hay un estudio que dice justo lo contrario. En este artículo te explico los 6 niveles reales de programar con IA, por qué la mayoría de desarrolladores está atascada entre el Nivel 2 y el 3 sin saberlo, y cómo dar el salto al nivel donde de verdad multiplicas tu productividad.
🎥 ¿Prefieres verlo en vídeo? Lo explico con demos en pantalla nivel a nivel aquí:
El estudio que demuestra que vas más lento con IA
En julio de 2025, METR publicó un experimento controlado con desarrolladores senior trabajando en proyectos que ya conocían. El resultado fue contraintuitivo: usando IA tardaron un 19% más en completar sus tareas.
Pero el dato demoledor es otro. Esos mismos desarrolladores estaban convencidos de ir un 20% más rápido. Esa es la trampa: te sientes un cohete mientras vas marcha atrás. Y tiene un nombre.
¿Qué es el vibe coding (y por qué te frena)?
El vibe coding es esa costumbre de abrir el chat de la IA, soltarle «hazme un dashboard con un backend en Python» y a partir de ahí ir tirando del hilo: prueba, error y cruzar los dedos para que funcione por pura vibra.
Funciona para un prototipo de fin de semana. Pero te ancla. Porque el modelo no te lee la mente: si tus instrucciones son ambiguas, rellena los huecos con código genérico, inseguro y propenso a alucinar. Es como pedirle a un albañil que te reforme la casa diciéndole solo «hazme algo bonito», sin un plano. El plano es justo lo que separa a los que avanzan de los que se estancan.
Los 6 niveles de programar con IA
El marco lo popularizó Dan Shapiro en enero de 2026 con el nombre de «los 5 niveles», aunque —como buen informático— empieza a contar desde el cero, así que en realidad son seis escalones (del 0 al 5). Lo modeló a partir de los niveles de conducción autónoma: la misma escalera que va de «tú al volante» a «el coche conduce solo».
Nivel 0 – Autocompletado. La IA sugiere la siguiente línea (el Copilot de toda la vida). El software lo escribes tú.
Nivel 1 – Becario. Delegas tareas muy concretas y aburridas (un test, un docstring). Lo importante lo sigues escribiendo tú, y lo revisas todo.
Nivel 2 – Desarrollador junior. La IA navega por el código, toca varios archivos y te escribe funciones enteras. Tú lees y revisas cada línea.
Nivel 3 – Manager. Ya no escribes código: diriges a la IA y revisas los Pull Requests que te envía. Exige soltar el control.
Nivel 4 – Product Manager. Escribes una especificación detallada, te vas, y horas después solo evalúas si los tests pasan. El código se convierte en una caja negra.
Nivel 5 – Fábrica oscura (Dark Factory). Un sistema totalmente autónomo: entran especificaciones y sale software funcionando. Ningún humano escribe ni revisa código.
El truco psicológico: por qué el 90% se atasca entre el 2 y el 3
Aquí está la clave del marco: cada nivel parece engañosamente la cima. En el Nivel 2 te sientes productivísimo y crees que ya has llegado. No has llegado. La mayoría de los desarrolladores rebota entre el 2 y el 3: suben un poco, se agobian de revisar diffs sin parar, y vuelven a bajar a «déjame que lo escriba yo». Por eso casi nadie cruza al Nivel 4.
El mismo ejemplo en los 6 niveles: un algoritmo de Dijkstra
La forma más clara de entenderlo es coger una sola función —un algoritmo de Dijkstra, el típico de buscar el camino más corto— y subirla por los seis niveles. Verás algo revelador: el código apenas cambia. Lo único que cambia en cada nivel eres tú y lo que aportas.
En el Nivel 0 lo escribes a mano, carácter a carácter.
En el Nivel 1 le pides a la IA solo el docstring y los tests.
En el Nivel 2 te escribe la función entera… y aquí toca leerla. (En el vídeo se ve cómo la IA llega a documentar un resultado equivocado en su propio comentario: dice «coste 7» cuando al ejecutar sale 10. Si te fías a ciegas, cuelas ese error.)
En el Nivel 3 un agente te abre un Pull Request refactorizándola a módulo. Tu trabajo ya no es cazar typos, es juzgar decisiones de diseño.
En el Nivel 4 dejas de escribir código y escribes una spec.md: contexto, contratos, reglas innegociables y qué pasa ante cada error.
En el Nivel 5 esa spec, más un fichero de escenarios que el agente no ve mientras programa, alimenta un bucle que itera solo hasta que todo pasa.
Fíjate en cómo sube tu entregable: en los niveles 0-2 produces código; en el 3, un diff que revisas; en el 4, una especificación; en el 5, un arnés de verificación y un visto bueno. Esa es toda la transformación de la industria en un solo ejemplo.
El muro entre el Nivel 3 y el 4: Spec-Driven Development
El salto que casi nadie da es el del Nivel 3 al 4: pasar de «reviso código» a «escribo la spec». Ese muro tiene un nombre, y es el Spec-Driven Development (SDD). En el Nivel 5, tu lenguaje de programación principal ya no es Python ni TypeScript: es el Markdown. Tu trabajo no es picar código, es articular el problema con precisión milimétrica y entregárselo a un agente para que lo construya.
Y lo más importante de todo, lo que separa a los profesionales: los escenarios de prueba externos. Nunca dejes que la IA escriba los tests de su propio código, porque hace trampa (se escribe tests fáciles que su código pueda aprobar). Tú defines escenarios que la IA no ve mientras programa, y solo cuando termina se cruza su código contra ellos.
🚀 Si quieres cruzar al Nivel 4 de verdad, tengo una serie completa de vídeos sobre Spec-Driven Development, explicado paso a paso y con proyectos reales:
El Nivel 5 ya existe (Spotify y Anthropic, 2026)
¿La fábrica oscura suena a ciencia ficción? Está pasando ya. Según TechCrunch, los mejores desarrolladores de Spotify no escriben una sola línea de código desde diciembre de 2025: usan un sistema interno (Honk) construido sobre Claude Code que les permite desplegar desde el móvil.
Y no es un caso aislado. Anthropic montó un compilador de C lanzando 16 agentes en paralelo: 100.000 líneas capaces de compilar el kernel de Linux, en unas dos semanas y por menos de 20.000 dólares, sin que un humano revisara cada cambio. La clave de que funcionara fue usar GCC como oráculo de verificación: exactamente la idea de los escenarios externos del Nivel 5.
¿En qué nivel estás tú?
Sé honesto. Si te has visto reflejado en lo de revisar cada línea que escupe la IA, probablemente estés en esa franja 2-3 donde está el 90%. La buena noticia es que del 2 al 4 hay un camino, y empieza por dejar de hacer vibe coding y empezar a diseñar software de verdad.
Las herramientas ya están aquí: agentes locales, modelos de contexto largo y orquestación. La tecnología ya permite el Nivel 5. La única pregunta es si tú —y tu equipo— estáis dispuestos a soltar la comodidad del vibe coding.
Preguntas frecuentes
¿Cuántos niveles de programación con IA existen?
Existen 6 niveles (del 0 al 5), según el marco de Dan Shapiro: autocompletado (0), becario (1), desarrollador junior (2), manager (3), product manager (4) y fábrica oscura o sistema autónomo (5). Se le suele llamar «los 5 niveles» porque la numeración empieza en cero.
¿Qué es el vibe coding?
Es programar pidiéndole a la IA lo que quieres con instrucciones vagas e ir corrigiendo por prueba y error, sin una especificación previa. Sirve para prototipos rápidos, pero genera código frágil e inseguro cuando se usa para construir software serio.
¿Qué es la «fábrica oscura» (dark factory)?
Es el Nivel 5: un sistema totalmente autónomo donde entran especificaciones y sale software funcionando, sin que ningún humano escriba ni revise el código. Se llama así porque, como una fábrica de robots, no necesita las luces encendidas.
¿Programar con IA te hace más rápido o más lento?
Un estudio de METR (2025) midió que desarrolladores senior usando IA tardaron un 19% más, pese a creerse un 20% más rápidos. La IA acelera de verdad cuando se usa con método (especificaciones y verificación), no con vibe coding.
¿Cómo paso del Nivel 3 al Nivel 4?
Adoptando Spec-Driven Development: dejas de revisar código línea a línea y empiezas a escribir especificaciones detalladas (contexto, contratos, reglas y comportamiento ante errores) que un agente ejecuta y que se verifican contra escenarios externos.
To provide the best experiences, we use technologies like cookies to store and/or access device information. Consenting to these technologies will allow us to process data such as browsing behaviour or unique IDs on this site. Not consenting or withdrawing consent, may adversely affect certain features and functions.
Functional
Siempre activo
The technical storage or access is strictly necessary for the legitimate purpose of enabling the use of a specific service explicitly requested by the subscriber or user, or for the sole purpose of carrying out the transmission of a communication over an electronic communications network.
Preferences
The technical storage or access is necessary for the legitimate purpose of storing preferences that are not requested by the subscriber or user.
Statistics
The technical storage or access that is used exclusively for statistical purposes.The technical storage or access that is used exclusively for anonymous statistical purposes. Without a subpoena, voluntary compliance on the part of your Internet Service Provider, or additional records from a third party, information stored or retrieved for this purpose alone cannot usually be used to identify you.
Marketing
The technical storage or access is required to create user profiles to send advertising, or to track the user on a website or across several websites for similar marketing purposes.