El Test del Costo por Tarea: cómo saber si tu IA sobrevive a los precios reales
Segunda parte. Un método para encontrar el precio exacto al que tu proyecto de IA deja de devolver plata, antes de que el mercado te lo encuentre a ti.
El costo que te mostró la demo y el que vas a pagar no son el mismo número. La distancia entre los dos es tu zona de riesgo, y casi nadie la mide.
Todos vimos el piloto que funcionó. El agente respondió el reclamo, el informe salió solo, y la cuenta de fin de mes fue una fracción de lo que costaba hacerlo a mano. Sobre esa cuenta se aprobó el presupuesto y se prometió el retorno. El problema es que esa cuenta describe un laboratorio en condiciones perfectas, no tu operación corriendo a escala todos los días.
La semana pasada te dejé incómodo a propósito. El argumento fue simple: los IPOs de OpenAI y Anthropic no son la validación que celebró la prensa, sino el aviso de que la inteligencia que tu empresa consume todos los días viene subsidiada, y los subsidios tienen fecha de vencimiento. Prometí pasarte un método para saber si tu caso de negocio sigue en pie cuando ese subsidio se acabe. Acá está. No es teoría: lo corres esta semana, con tu equipo, sobre tu proyecto de IA más importante, y sales con una respuesta binaria. El proyecto es viable por sí solo, o estaba parado sobre una rebaja que no controlas.
Empecemos por la métrica equivocada, porque es la que te metió en este problema. Cuando evalúas un proyecto de IA, lo primero que te muestran es el precio por token o por consulta: fracciones de centavo que caen mes a mes. El AI Index de Stanford documentó que ese número cayó más de 280 veces en dos años. Es cierto. Y es la cifra más inútil que vas a mirar.
Inútil porque tu negocio no compra tokens. Compra tareas terminadas: un reclamo resuelto, un pedido procesado, un informe entregado. Entre “una consulta al modelo” y “una tarea terminada” hay un abismo, y ese abismo es justo lo que el precio por token no ve. Por eso el método entero se para sobre una sola unidad: el costo por tarea completada (CPT). Es la única cifra que conecta lo que gastas en IA con lo que produces, y la única que sigue significando algo cuando el proveedor cambie su lista de precios el próximo trimestre.
De ahí el nombre de lo que vamos a hacer: el Test del Costo por Tarea. Tres pasos para calcularlo bien, estresarlo y encontrar el número que deberías tener pegado al monitor: el precio al que tu caso de negocio deja de devolver plata. Tu punto de quiebre. No necesitas adivinar qué van a hacer los precios de la IA. Necesitas saber a qué precio tu caso se cae, y eso lo puedes calcular hoy, en una tarde.
Paso 1: calcula tu CPT real, no el de la demo
El error que mató más casos de negocio de IA que cualquier alza de precios es este: confundir una llamada al modelo con una tarea terminada. En la era del chat eran casi lo mismo. Hacías una pregunta, el modelo respondía, una llamada. Hoy no. Un agente que resuelve un reclamo de verdad clasifica el caso, busca en tu base de conocimiento, redacta la respuesta, la revisa contra tus políticas, consulta un par de sistemas internos y, cuando algo no calza, lo reintenta. Una tarea terminada no es una llamada: son decenas, a veces cientos.
Ese es el número que casi nadie calcula y el que de verdad decide si tu caso funciona. Lo llamo el factor de amplificación: cuántas llamadas al modelo se gastan para entregar un solo resultado de negocio. En un piloto controlado ese factor es bajo, porque el caso es limpio y el camino es corto. En producción se dispara, porque la realidad trae casos raros, contexto largo y reintentos. Goldman Sachs proyecta que el consumo de tokens podría multiplicarse 24 veces hacia 2030 justamente por esto: los agentes se vuelven más autónomos y cada uno consume más. EY se lo dice a sus clientes en una frase que deberías anotar: el costo por token baja, el costo por tarea sube.
La fórmula es simple y tu equipo la arma en una planilla:
Costo por tarea = (llamadas por tarea × tokens promedio por llamada × precio por token) + overhead
El overhead es todo lo que el precio por token no incluye y casi siempre se olvida: las búsquedas en tu base de conocimiento, las llamadas a herramientas, el almacenamiento de contexto, los reintentos fallidos que igual se pagan. Una regla para no inflarlo: cuenta solo lo que el proyecto de IA agregó. Si ya pagabas por algo antes y lo seguirías pagando sin el agente, no es costo de la IA, es parte del paisaje y se cancela solo.
Pero no lo modeles con supuestos. Mídelo. Toma 50 o 100 tareas reales ya completadas en producción y suma todo lo que de verdad costó servirlas con IA: el consumo de los modelos más el overhead que agregó el agente, las búsquedas, las herramientas, el almacenamiento. Divide por la cantidad de tareas y ese es tu CPT real. Ahora compáralo con el número que asumió tu caso de negocio cuando se aprobó. La razón entre los dos, cuánto más caro es el real que el de la planilla, es tu primera bandera roja. Si tu caso asumió que una tarea costaba lo que cuesta una consulta, ya estás operando sobre una cifra que nunca fue verdad, mucho antes de que el subsidio se mueva.
Paso 2: córrele el stress, CPT ×2 y ×3
Ya tienes tu CPT real. Ahora lo estresas. Toma el retorno de tu proyecto y recalcúlalo con el costo por tarea al doble y al triple. Son dos columnas nuevas en la misma planilla.
La pregunta obvia es por qué ×2 y ×3 y no un alza más modesta. Porque el ajuste no va a llegar como “subimos la lista de precios 5%”. Va a llegar disfrazado, y por varias puertas a la vez: un modelo premium más caro para las tareas que de verdad importan, límites de uso más agresivos en los planes actuales, el fin de los descuentos por volumen que hoy te regalan por capturar mercado, el contrato enterprise que se renegocia al alza en la renovación. Junta dos de esas y ya estás en ×2 sin que nadie haya tocado oficialmente el precio. La presión de tener accionistas públicos mirando el margen cada trimestre es lo que convierte esto de hipótesis en agenda.
No estás tratando de adivinar el alza exacta. No la controlas, así que predecirla es perder el tiempo. Lo que el test mide es tu resistencia: ×2 y ×3 son escenarios de estrés, no pronósticos. La pregunta no es “¿cuánto van a subir?”, es “¿hasta cuánto aguanto yo?”.
Y si operas en Latinoamérica, hay una columna más que tu par del norte no tiene que llenar. La IA se compra en dólares: la API, las licencias, el cómputo. Tus ingresos están en pesos, reales o soles. Una empresa americana que enfrenta un alza en su costo por tarea la absorbe en la misma moneda en que factura. Tú la absorbes dos veces: el alza del proveedor y el riesgo cambiario encima. En la práctica, tu escenario ×2 se comporta como algo peor. Un movimiento del tipo de cambio de 15 o 20%, de los que en la región no son noticia, convierte tu ×2 en un ×2,4 real. Modélalo así. El golpe que para una empresa de Estados Unidos es un dolor de cabeza, para ti puede ser el que cruza la línea.
Paso 3: encuentra tu punto de quiebre
Después de estresar el caso, sale el único número que de verdad importa: el punto de quiebre. Es el costo por tarea al que tu proyecto deja de devolver plata, el punto donde lo que te cuesta la tarea iguala lo que vale resolverla. Exprésalo como un múltiplo de tu CPT actual, porque así se vuelve accionable: “mi caso aguanta hasta 2,7 veces mi costo por tarea de hoy”. Esa frase deberías poder decirla de memoria sobre tu proyecto de IA más importante. Si no la puedes decir, no terminaste el test.
Con ese múltiplo en la mano, tu proyecto cae en una de tres zonas.
Si aguanta ×3 o más, duerme tranquilo. Tu caso está parado sobre el valor que genera, no sobre el precio que hoy pagas. Que el subsidio se acabe te va a doler en el margen, pero no te cambia la decisión.
Si muere entre ×1.5 y ×3, estás en la zona de riesgo. El proyecto es rentable hoy y deja de serlo con un alza perfectamente posible en los próximos trimestres. Tienes tiempo para actuar, pero no mucho. Esta es, por lejos, la zona más poblada, porque la mayoría de los casos se construyeron sobre el CPT de la demo y nunca se estresaron.
Si muere bajo ×1.5, la conversación es otra. Tu proyecto apenas es viable hoy y cualquier normalización de precios lo da vuelta. No estás operando un caso de negocio, estás operando un subsidio ajeno. Mejor saberlo ahora que en la próxima renovación de contrato.
El punto de todo esto no es asustarte. Es convertir una ansiedad difusa, “los precios de la IA podrían subir”, en un número concreto que puedes gestionar.
El test corrido de verdad: nuestro propio soporte
Te lo muestro con un caso real, el nuestro, porque es más honesto que un ejemplo de laboratorio.
En Yom tenemos un agente que gestiona el soporte a clientes. Ojo con la palabra: no resuelve el problema técnico, todavía, pero gestiona el ticket completo. Responde al cliente, le asigna prioridad, mueve los estados, persigue al que tiene que resolver y cierra. Es exactamente el trabajo que antes hacía una persona metida todo el día en la mesa de ayuda.
Corramos el test.
Paso 1, el CPT real. Entre enero y mayo de 2026 el agente gestionó 222 tickets, unos 44 al mes. La cuenta de API que lo alimenta es de alrededor de US$100 mensuales. Divides una cosa por la otra y tu costo por tarea real es de US$2,3 por ticket gestionado. La plataforma de tickets, que cuesta más que eso, no entra en la cuenta: la pagábamos igual cuando el trabajo lo hacía una persona, así que no es costo del agente. No es el número de una demo: es lo que salió en la factura, contando solo lo que la IA agregó.
Pasos 2 y 3, el valor y el punto de quiebre. La persona que hacía antes esta gestión costaba del orden de US$1.500 al mes cargada. Ese es el valor que el agente libera. Puesto por ticket, son unos US$34 de valor contra US$2,3 de costo. El punto de quiebre aparece cuando el costo iguala al valor, es decir cuando la cuenta de API llegue a US$1.500 mensuales. Eso es quince veces el costo de hoy.
Quince veces. El test no me pide adivinar si los proveedores van a subir los precios. Me dice que mi caso aguanta que los multipliquen por quince antes de dejar de devolver plata. Le puedo sumar la capa cambiaria, el fin de los descuentos y un modelo premium encima, y ni así me acerco al borde. Este proyecto duerme tranquilo.
Ahora dale vuelta los números, porque el caso espejo es el que mata proyectos. Imagina la tarea opuesta: una que vale cinco centavos y que corres dos millones de veces al mes. Mismo proveedor, misma curva de precios. Si tu CPT real es de tres centavos, tu punto de quiebre está en 1,7 veces, y cualquiera de los ajustes que enumeré te deja en rojo el mismo trimestre. La diferencia entre los dos casos no es la tecnología ni el proveedor. Es que uno se para sobre una tarea que vale mucho y se repite poco, y el otro sobre una que vale poco y se repite hasta el infinito. El primero sobrevive a los precios reales. El segundo vive del subsidio y todavía no lo sabe.
Paso 4: mide tu lock-in, no es una nota al pie
El test tiene una variable escondida que cambia tu resistencia real: cuánto te demoras en irte. De nada sirve un punto de quiebre cómodo si, cuando llegue el alza, estás amarrado a un solo proveedor y no te puedes mover. Si migrar tu carga de trabajo a otro modelo te toma más de un trimestre, no puedes esquivar el aumento, y eso significa que tu CPT efectivo ya es más alto que el de la planilla, porque le tienes que sumar el costo de no poder huir. Cuando los laboratorios necesiten mostrar margen, el primero que paga la cuenta es el comprador que no se puede ir.
Hazle a tu equipo una sola pregunta: si mañana el proveedor principal duplica el precio, ¿cuánto nos demoramos en mover esto a otro modelo? Si la respuesta pasa de un trimestre, ya tienes un hallazgo, no un detalle. La arquitectura multi-modelo dejó de ser sofisticación técnica. Es una cláusula de seguro, y como todo seguro, se contrata antes del incendio.
Paso 5: qué haces con el resultado
El test no sirve de nada si no cambia una decisión. Lo que hagas depende de la zona en que caíste.
Si duermes tranquilo, no sobre-actúes. Sigue midiendo tu CPT cada trimestre y dedica tu energía a otra cosa. Un caso robusto no necesita que lo rescates.
Si estás en la zona de riesgo, tienes tres palancas y tiempo para usarlas. Baja el factor de amplificación, que es donde más rápido se gana: menos llamadas por tarea, un modelo más barato para los sub-pasos que no necesitan al grande, cachear lo que se repite. Renegocia el contrato antes de la renovación, mientras todavía tienes con qué negociar. Y construye la opción multi-modelo antes de necesitarla.
Si tu caso muere bajo ×1.5, la decisión es más dura pero más clara. O rediseñas el proyecto para bajar el CPT de raíz, o lo apagas tú, de forma controlada, antes de que lo apague la próxima renovación de contrato. Matar un proyecto a tiempo es una decisión de negocios. Que te lo maten por sorpresa es un problema de caja.
Corre el test ahora, y vuelve a correrlo en cada cierre de trimestre y en cada renovación. El precio de la inteligencia es lo único que va a cambiar. Tu obligación de saber a qué precio te caes, no.
La ventaja que queda en tus manos
La semana pasada terminé diciendo que la incomodidad con tiempo para actuar se llama ventaja. Esto es lo que quería decir. La incomodidad ya la tenías: sabías, en alguna parte, que el precio que pagas hoy por la inteligencia no iba a ser el precio para siempre. Lo que no tenías era qué hacer con esa sensación.
Ahora lo tienes. Un número, tu punto de quiebre, que convierte una amenaza difusa en una cuenta que puedes mirar de frente. No te dice si los precios van a subir. Te dice si te importa. Y esa diferencia, entre el que va a reaccionar cuando el primer laboratorio reporte su primer trimestre como empresa pública y el que ya corrió el test y sabe dónde está parado, es toda la ventaja.
Corre el test esta semana. La próxima vez que alguien te muestre el costo de la demo, vas a saber qué preguntar.

