TOON, MCP y Agentes: menos hype, más arquitectura real (y un 25% de ahorro que sí importa)
En mis pruebas reales con modelos de razonamiento (o1) y datos de negocio no cocinados, TOON no fue “mágico”, pero sí consistentemente útil: frente a JSON compacto, TOON-RAW redujo ~25% de tokens sin perder precisión ni aumentar la latencia. Ese ahorro aparece justo donde más duele —en los tool-results entre MCP y los agentes— y se multiplica en arquitecturas AI-native con decenas de llamadas por flujo. La conclusión no es cambiar tus APIs a TOON, sino usar JSON mini en el backend y reservar TOON para la frontera MCP ↔ LLM, donde optimizar tokens sin perder estructura sí importa.
Leer más







