Como ele estima os tokens?

Pela regra prática de ≈ caracteres ÷ 3,5, que é boa o bastante para orçar. O número exato varia conforme o tokenizer de cada modelo, mas para decidir custo e comparar modelos a estimativa resolve. Imagens e áudio (multimodal) entram no cálculo quando você informa a quantidade.

Os preços estão sempre corretos?

São estimativas de referência em USD, guardadas num arquivo fácil de atualizar (models.json). Preços de API mudam e variam por região — então confira sempre a tabela oficial do provedor antes de fechar um orçamento. A ferramenta serve pra comparar e dimensionar, não pra ser a fatura final.

Meu prompt é enviado para algum servidor?

Não. Tudo roda no seu navegador (JavaScript), o prompt não é enviado a lugar nenhum e os templates que você salva ficam no localStorage da sua máquina.

Pra quem é o PromptTools?

Pra dev e builder que usa APIs de LLM e precisa de previsibilidade: escolher o modelo certo pelo custo antes de chamar a API, projetar o gasto mensal por volume e checar se o contexto cabe no limite do chat ou da API.

Desarrollo 17 de junio de 2026 6 min de lectura 462

¿Cuánto cuesta un prompt? Calculé para 8 modelos de IA y muestro dónde está el dinero

La mayoría elige el modelo de IA por costumbre — y paga de más. Construí PromptTools: pegas el prompt, estima los tokens, compara el costo entre 8 modelos y proyecta el gasto por volumen. Todo en el navegador, sin API, sin registro.

El otro día me llevé un susto tonto: abrí la factura de una API de IA de un proyectito y el valor estaba bastante por encima de lo que imaginaba. Investigué y la causa era la más boba posible — elegía el modelo por costumbre. Usaba el "tope de línea" para todo, incluso para tareas simples que un modelo 100× más barato resolvería igual. Nunca me había detenido a comparar.

Cuando miré los números, la diferencia era absurda. El mismo prompt, en la misma tarea, costaba cerca de US$0,0007 en un modelo abierto y US$0,08 en el tope de línea — más de 100× la diferencia. Multiplicá eso por miles de llamadas al mes y el "me equivoqué de modelo" se vuelve dinero de verdad. Ahí construí PromptTools.

El problema: elegimos modelo por vibra, no por costo

Quien trabaja con APIs de LLM conoce la escena. Los huecos son siempre estos:

Modelo por costumbre. Usás el que conocés (o el más "listo") para todo — hasta para clasificar un texto corto, donde un modelo barato da el mismo resultado.
El token es invisible. No "ves" el tamaño del prompt. Un system prompt gordo, un contexto pegado entero, y el costo por llamada se infla sin que lo notes.
Input ≠ output. El precio de lo que entra es distinto de lo que sale, y el output suele ser el más caro. Ignorarlo arruina la cuenta.
La sorpresa solo aparece a escala. US$0,08 por llamada parece nada. Por 50 mil llamadas/mes se vuelve una cuenta que duele — y ya es tarde.

El problema central: la decisión de qué modelo usar casi nunca pasa por una comparación de costo lado a lado. Falta la regla.

La solución: PromptTools, con comparación lado a lado

PromptTools es la regla. Pegás el prompt y te muestra, al instante: cuántos tokens tiene, cuánto cuesta (input + output + multimodal) y — el truco — el costo del mismo prompt en todos los modelos, lado a lado, del más barato al más caro. Un vistazo y ves que podés cambiar el "tope de línea" por un modelo 20× más barato sin perder calidad en esa tarea.

Es gratis, sin login, y corre 100% en el navegador — tu prompt (muchas veces tu secreto) no sale de la máquina.

Lo que te da

Comparación de modelos. El mismo prompt en GPT-5, Claude Opus 4.8, Gemini 3, DeepSeek, Llama y cía., ordenado del más barato al más caro, con el "cuántas veces más caro" de cada uno.
Proyección de escala. Indicá cuántas requests por mes y mirá el costo mensual estimado — donde el error de modelo realmente aparece.
Contexto: chat vs API. Una barra muestra si tu prompt + respuesta entra en el límite seguro del chat o solo en la API (y avisa cuando se pasa, o cuando Gemini entra en la franja de precio doblado).
Densidad, templates y PDF. Un "termómetro" de densidad del prompt, templates guardados en el navegador y exportación de un informe de costo para mandar al cliente.

Comparar el costo de mi prompt

Los precios son estimaciones de referencia (USD) y fáciles de actualizar — siempre revisá la tabla oficial del proveedor antes de cerrar un presupuesto.

Preguntas frecuentes

¿Cómo estima los tokens? Por la regla práctica ≈ caracteres ÷ 3,5 (buena para presupuestar; lo exacto depende del tokenizer de cada modelo). Imagen y audio cuentan cuando los indicás.
¿Los precios están siempre correctos? Son estimaciones de referencia (USD) en un archivo fácil de actualizar — revisá la tabla oficial del proveedor, los precios cambian.
¿Mi prompt se envía a algún servidor? No — corre 100% en el navegador; los templates quedan en tu localStorage.
¿Para quién es? Devs y builders que usan APIs de LLM y quieren elegir el modelo correcto por costo, proyectar el gasto mensual y auditar contexto.