⚡ En mayo de 2024, Octomind arrancó LangChain de su stack de producción. No lo reemplazaron por CrewAI ni AutoGen. Lo reemplazaron por 100 líneas de Python llamando directamente a la API de Anthropic. Su CTO lo dijo claro: "seis meses de relación tóxica con un framework que prometía simplificar y terminó complicando todo".
Esa historia se repitió decenas de veces entre 2024 y 2026. Un startup fintech redujo su latencia de 4.2s a 2.5s (40% menos) simplemente eliminando LangChain de su pipeline. Un equipo de documentación reemplazó su stack CrewAI con archivos SKILL.md y redujo el consumo de tokens a una tercera parte.
No es que los frameworks sean "malos". Es que resolvieron problemas de 2023 que los modelos de 2026 ya resuelven por sí solos. Y mientras tanto, su capa de abstracción se convirtió en un impuesto silencioso que cada equipo pagaba en tokens, latencia y complejidad.
La alternativa que está emergiendo —y que ya corre en producción— es sorprendentemente simple: agentes definidos por archivos .md en un árbol de directorios. Sin abstracciones gigantes. Sin dependencias monstruosas. Sin overhead.
Bienvenidos a la era de los File-Tree Agents.
🔴 El Impuesto Silencioso de los Frameworks
En 2026, LangChain acumula 47 millones de descargas en PyPI. CrewAI y AutoGen le siguen de cerca. Pero las métricas de adopción esconden una verdad incómoda: cada vez más equipos están migrando en dirección contraria.
Los datos de producción hablan solos:
| Framework | Overhead en tokens | Latencia extra | Costo por tarea simple | Lo que realmente hace |
|---|---|---|---|---|
| LangChain | 2x - 3x | +40% | $0.008 → $0.024 | Chain-first: cada paso reinterpreta todo |
| CrewAI | 3x - 5x | +60% | $0.008 → $0.032 | Managerial overhead: Planner + Analyst validan todo |
| AutoGen | 2x - 4x | +50% | $0.008 → $0.028 | Conversacional: múltiples agentes dialogando |
| File-Tree Agent | 1x (justo) | +0% | $0.008 exacto | Lee instrucciones de .md, ejecuta tools, punto. |
💡 Traducción: Si tu stack de agentes procesa 100,000 tareas al mes con DeepSeek V4 Flash ($0.14/MTok input), estás pagando $140 con File-Tree Agents vs $420-$560 con LangChain o CrewAI. El framework te cuesta 3x-4x más que el modelo.
¿Por qué pasa esto?
Los frameworks fueron diseñados en una época donde los modelos no podían llamar funciones de forma confiable (2022-2023). Necesitaban capas de abstracción que tradujeran intenciones en acciones. Hoy, Claude, GPT y DeepSeek hacen tool calling nativo. Esa capa ya no suma valor: es peso muerto.
En benchmarks de 2026, LangChain consume más tokens y tiempo que cualquier alternativa probada. Su diseño chain-first significa que el LLM debe interpretar lenguaje natural y elegir una herramienta en cada paso, incluso cuando esa elección es determinista. En un pipeline de 5 pasos, ese overhead se multiplica 5 veces.
CrewAI es peor: su arquitectura de Planner + Analyst + Worker crea lo que los investigadores llaman "managerial overhead". El agente no ejecuta la tarea: primero la planifica, luego la analiza, luego la ejecuta, luego la valida. Para una tarea de "tráeme los datos de esta API", estás pagando 3 rondas de LLM donde solo necesitas 1.
🧠 Dato clave: "Para tareas simples de agente único que requieren tool calls directos, sáltate los tres frameworks. Usa llamadas directas a la API del LLM." — AI Agent Frameworks Comparison, 2026
🟢 File-Tree Agents: La Alternativa que ya Está en Producción
Los File-Tree Agents no son una idea nueva. Son la aplicación del principio Unix más antiguo: "haz una cosa y hazla bien". En lugar de un monolito de abstracciones, usas archivos de texto plano como instrucciones, configuración y memoria.
La arquitectura es simple:
~/agente/
├── SKILL.md # Instrucciones y capacidades del agente
├── MEMORY.md # Memoria persistente entre sesiones
├── CONTEXT.md # Contexto del proyecto o sesión actual
├── skills/
│ ├── data-analyst/ # Skill: analista de datos
│ │ └── SKILL.md
│ ├── web-search/ # Skill: búsqueda en internet
│ │ └── SKILL.md
│ └── code-vibe/ # Skill: programación asistida
│ └── SKILL.md
├── tools/ # Tool definitions para tool calling
└── sessions/ # Notas de sesión persistentes
Cada archivo SKILL.md contiene instrucciones detalladas sobre qué hace ese skill, cuándo usarlo y cómo ejecutarlo. El agente principal lee estos archivos como contexto, y mediante tool calling, invoca los skills según los necesita.
Este patrón, que Visual Studio Magazine llamó en febrero 2026 "el nuevo estándar para agentes de IA", está siendo adoptado por Microsoft, GitHub, y la comunidad open source. El estándar agentskills.io ya define el formato SKILL.md como especificación abierta.
Los beneficios son difíciles de ignorar:
- ✅ Cero overhead de abstracción — Solo pagas por el LLM, no por el framework
- ✅ Versionable con Git — Tus instrucciones son archivos de texto, no código empaquetado
- ✅ Portabilidad total — Un SKILL.md funciona con Claude, GPT, DeepSeek o cualquier LLM con tool calling
- ✅ Transparencia absoluta — Sabes exactamente qué instrucciones recibe el agente en cada paso
- ✅ Costo predecible — Sin sorpresas de "managerial overhead" o cadenas ocultas
🔥 Dato de la industria: Desarrolladores están reemplazando servidores MCP completos con archivos .md, reduciendo costos de tokens hasta 100x. Un SKILL.md bien escrito pesa 2KB. Un MCP server en Python pesa 200KB+ de dependencias y consume tokens en cada handshake.
🤫 Mientras el Mundo Descubría LangChain, Nosotros ya Habíamos Tomado Otro Camino
A finales de 2025, cuando la fiebre de los frameworks estaba en su punto máximo, empezamos a construir algo diferente. No porque supiéramos que los File-Tree Agents se convertirían en tendencia —sinceramente, ni siquiera sabíamos que existía el término— sino porque la complejidad de LangChain nos parecía fuera de lugar para lo que necesitábamos.
Queríamos agentes que hicieran cosas reales en producción. No experimentos de laboratorio. No pruebas conceptuales. Y sobre todo, queríamos entender exactamente lo que estábamos ejecutando.
Así nació Trinity, nuestro primer experimento con agentes modulares basados en archivos. Y luego SHIVA, el agente que estás usando ahora mismo para leer este artículo.
SHIVA no está construido sobre LangChain, ni CrewAI, ni AutoGen. SHIVA es un File-Tree Agent puro: lee instrucciones de archivos .md, llama herramientas según las necesita, mantiene memoria persistente en archivos, y orquesta skills especializados mediante tool calling. Sin dependencias monstruosas. Sin abstracciones mágicas. Sin overhead.
No lo sabíamos en ese momento, pero estábamos aplicando el mismo patrón que Microsoft, GitHub y la comunidad agentskills.io formalizarían meses después. A veces, la solución más simple no es la que está de moda, sino la que funciona.
💬 Nota al margen: Este artículo está siendo escrito, investigado y orquestado por SHIVA — un File-Tree Agent que corre en producción desde principios de 2026. Los datos que ves aquí vinieron de búsquedas web, análisis de 6+ fuentes y síntesis automática. Sin LangChain. Sin CrewAI. Solo archivos .md, tool calling y un LLM.
📊 File-Tree vs Frameworks: La Tabla que lo Dice Todo
Más allá de los tokens, hay dimensiones que importan igual o más: mantenibilidad, curva de aprendizaje, flexibilidad y costo de operación. Aquí la comparativa completa:
| Dimensión | File-Tree Agent | LangChain | CrewAI | AutoGen |
|---|---|---|---|---|
| Dependencias | 0 (solo LLM SDK) | 50+ paquetes | 30+ paquetes | 40+ paquetes |
| Curva de aprendizaje | 15 min (sabes .md?) | 2-4 semanas | 1-2 semanas | 2-3 semanas |
| Costo mensual (100K tasks) | ~$140 | ~$280-$420 | ~$420-$560 | ~$280-$420 |
| Portabilidad | Total (cualquier LLM) | Solo LangChain | Solo CrewAI | Solo AutoGen |
| Versionable (Git) | ✅ Nativo (.md) | ✅ (pero pesado) | ⚠️ Parcial | ⚠️ Parcial |
| Transparencia | Total (lees el .md) | Media (abstracciones) | Baja (managerial) | Media (conversacional) |
| Debugging | Simple (archivos) | Complejo (cadenas) | Complejo (roles) | Medio (conversaciones) |
| Producción real 2026 | ✅ Crece rápido | ✅ Maduro | ⚠️ En deuda técnica | ⚠️ Experimental |
📐 La regla que usamos: Si tu agente hace 1-3 herramientas por tarea, no necesitas framework. Si necesitas 10+ agentes coordinándose con grafos de estado complejos, quizás LangGraph aporta valor. Pero el 80% de los casos de uso están en el primer grupo.
🛠️ Cómo Construir tu Propio File-Tree Agent
Si te quedaste con ganas de probarlo, aquí tienes una guía práctica para empezar hoy mismo. No necesitas instalar nada más que un LLM con tool calling.
Paso 1: Define tu árbol de archivos
mi-agente/
├── AGENT.md # Identidad, propósito, reglas generales
├── MEMORY.md # Contexto persistente entre sesiones
└── skills/
├── buscador/
│ └── SKILL.md # "Cuando te pidan buscar, usa web_search"
└── analista/
└── SKILL.md # "Para analizar datos, ejecuta Python"
Paso 2: Escribe tu primer SKILL.md
# Skill: Búsqueda en Internet
## Descripción
Busca información actualizada en internet usando la herramienta web_search.
## Cuándo usarlo
- El usuario pide datos actuales (noticias, precios, tendencias)
- Necesitas verificar información con fuentes externas
- El contexto del agente no tiene la respuesta
## Instrucciones
1. Identifica los términos de búsqueda clave
2. Usa web_search con max_results=8
3. Lee los resultados y selecciona las fuentes más relevantes
4. Sintetiza la información en una respuesta clara
5. Si una fuente es clave, usa fetch_url para leer el contenido completo
## Restricciones
- No inventes datos. Si no encuentras, dilo.
- Prioriza fuentes en español y LATAM cuando sea relevante
- Siempre cita las fuentes utilizadas
Así de simple. Eso es un File-Tree Agent.
Paso 3: Conecta con tool calling
La magia ocurre cuando el LLM lee el SKILL.md y decide qué tool llamar. En la práctica, tu agente principal recibe el contenido del archivo como parte del system prompt, y las tools están pre-definidas en el SDK del LLM que uses (OpenAI, Anthropic, DeepSeek, etc.).
# Cargar instrucciones desde archivos .md
agent_prompt = open("AGENT.md").read()
skill_prompt = open("skills/buscador/SKILL.md").read()
# System prompt = identidad + skill activo
response = client.messages.create(
model="claude-opus-4",
system=f"{agent_prompt}\n\n{skill_prompt}",
messages=[{"role": "user", "content": user_input}],
tools=[web_search_tool, fetch_url_tool] # Tools pre-definidas
)
10 líneas. Sin LangChain. Sin dependencias. Sin abstracciones.
Paso 4: Memoria persistente
Los frameworks gastan tokens manteniendo historiales de conversación en memoria. Los File-Tree Agents escriben archivos .md con resúmenes de sesiones anteriores:
## Última sesión (22 Junio 2026)
- Se escribió un artículo sobre File-Tree Agents
- Quedó pendiente generar la imagen de portada
- El slug del blog es: file-tree-agents-vs-frameworks-cerrados
## Proyectos activos
- Blog en producción con 37+ artículos
- Stack: VPS Hetzner, landing-page-v2
- Próximo: post de LinkedIn e Instagram para el artículo
Cuando el agente arranca una nueva sesión, lee MEMORY.md y retoma el contexto exactamente donde lo dejó. Cero tokens perdidos en historial.
🎯 El Veredicto: Cuándo Usar Cada Enfoque
No todo es blanco o negro. Los frameworks tienen casos de uso donde aportan valor. La clave es saber elegir:
| ✅ Usa File-Tree Agents cuando... | ⚠️ Considera un Framework cuando... |
|---|---|
| 🔹 Tienes 1-5 agentes por proyecto | 🔸 Tienes 20+ agentes con dependencias complejas |
| 🔹 Presupuesto ajustado (LATAM, startups, bootstrappers) | 🔸 Presupuesto enterprise con compliance obligatorio |
| 🔹 Valoras la transparencia sobre la abstracción | 🔸 Necesitas reporting y auditoría pre-construidos |
| 🔹 Tu equipo sabe Linux y archivos de texto | 🔸 Tu equipo viene de .NET/Java y prefiere abstracciones |
| 🔹 Quieres versionar instrucciones con Git | 🔸 Necesitas integración enterprise con 50+ servicios |
| 🔹 Ejecutas en VPS, Raspberry Pi o edge computing | 🔸 Corres en Kubernetes con auto-scaling |
💡 Nuestra recomendación: Empieza con File-Tree. Es gratis, es simple, es transparente. Si escalas y sientes dolor, migra a un framework. Pero no empieces con el framework "por si acaso". El 90% de los proyectos nunca necesita esa complejidad.
🔮 El Futuro es File-Tree
En 2026, el paradigma está claro: menos abstracción, más control. El movimiento "configuration-as-markdown" no es una moda pasajera. Es la respuesta natural a años de frameworks que prometían simplificar y terminaban complicando.
Microsoft está invirtiendo en SKILL.md como estándar. Visual Studio tiene soporte nativo. GitHub lo integra en Copilot. La comunidad agentskills.io ya definió la especificación abierta.
Y mientras todo eso sucede, equipos como el nuestro —que empezaron con Trinity a finales de 2025 y hoy corren SHIVA en producción— solo sonríen. Porque a veces, la innovación no es inventar algo nuevo, sino darse cuenta de que lo simple siempre funciona.
¿Vas a seguir pagando el impuesto de los frameworks?
¿Listo para construir tu propio File-Tree Agent?
En Wagner Solutions AI diseñamos arquitecturas de agentes que sí funcionan en producción. Sin bloatware. Sin frameworks innecesarios. Solo código limpio, archivos .md y resultados reales.
🚀 Hablemos de tu proyecto