BrunoP.Blog

¿Cuánto cuesta un prompt? Calculé para 8 modelos de IA y muestro dónde está el dinero

La mayoría elige el modelo de IA por costumbre — y paga de más. Construí PromptTools: pegas el prompt, estima los tokens, compara el costo entre 8 modelos y proyecta el gasto por volumen. Todo en el navegador, sin API, sin registro.

El otro día me llevé un susto tonto: abrí la factura de una API de IA de un proyectito y el valor estaba bastante por encima de lo que imaginaba. Investigué y la causa era la más boba posible — elegía el modelo por costumbre. Usaba el "tope de línea" para todo, incluso para tareas simples que un modelo 100× más barato resolvería igual. Nunca me había detenido a comparar.

Cuando miré los números, la diferencia era absurda. El mismo prompt, en la misma tarea, costaba cerca de US$0,0007 en un modelo abierto y US$0,08 en el tope de línea — más de 100× la diferencia. Multiplicá eso por miles de llamadas al mes y el "me equivoqué de modelo" se vuelve dinero de verdad. Ahí construí PromptTools.

El problema: elegimos modelo por vibra, no por costo

Quien trabaja con APIs de LLM conoce la escena. Los huecos son siempre estos:

  • Modelo por costumbre. Usás el que conocés (o el más "listo") para todo — hasta para clasificar un texto corto, donde un modelo barato da el mismo resultado.
  • El token es invisible. No "ves" el tamaño del prompt. Un system prompt gordo, un contexto pegado entero, y el costo por llamada se infla sin que lo notes.
  • Input ≠ output. El precio de lo que entra es distinto de lo que sale, y el output suele ser el más caro. Ignorarlo arruina la cuenta.
  • La sorpresa solo aparece a escala. US$0,08 por llamada parece nada. Por 50 mil llamadas/mes se vuelve una cuenta que duele — y ya es tarde.

El problema central: la decisión de qué modelo usar casi nunca pasa por una comparación de costo lado a lado. Falta la regla.

La solución: PromptTools, con comparación lado a lado

PromptTools es la regla. Pegás el prompt y te muestra, al instante: cuántos tokens tiene, cuánto cuesta (input + output + multimodal) y — el truco — el costo del mismo prompt en todos los modelos, lado a lado, del más barato al más caro. Un vistazo y ves que podés cambiar el "tope de línea" por un modelo 20× más barato sin perder calidad en esa tarea.

Es gratis, sin login, y corre 100% en el navegador — tu prompt (muchas veces tu secreto) no sale de la máquina.

Lo que te da

  • Comparación de modelos. El mismo prompt en GPT-5, Claude Opus 4.8, Gemini 3, DeepSeek, Llama y cía., ordenado del más barato al más caro, con el "cuántas veces más caro" de cada uno.
  • Proyección de escala. Indicá cuántas requests por mes y mirá el costo mensual estimado — donde el error de modelo realmente aparece.
  • Contexto: chat vs API. Una barra muestra si tu prompt + respuesta entra en el límite seguro del chat o solo en la API (y avisa cuando se pasa, o cuando Gemini entra en la franja de precio doblado).
  • Densidad, templates y PDF. Un "termómetro" de densidad del prompt, templates guardados en el navegador y exportación de un informe de costo para mandar al cliente.

Comparar el costo de mi prompt

Los precios son estimaciones de referencia (USD) y fáciles de actualizar — siempre revisá la tabla oficial del proveedor antes de cerrar un presupuesto.

Preguntas frecuentes

¿Cómo estima los tokens? Por la regla práctica ≈ caracteres ÷ 3,5 (buena para presupuestar; lo exacto depende del tokenizer de cada modelo). Imagen y audio cuentan cuando los indicás.
¿Los precios están siempre correctos? Son estimaciones de referencia (USD) en un archivo fácil de actualizar — revisá la tabla oficial del proveedor, los precios cambian.
¿Mi prompt se envía a algún servidor? No — corre 100% en el navegador; los templates quedan en tu localStorage.
¿Para quién es? Devs y builders que usan APIs de LLM y quieren elegir el modelo correcto por costo, proyectar el gasto mensual y auditar contexto.