Fórmula prática
- Custo por tarefa = tokens de entrada + tokens de saída + embeddings + busca vetorial + orquestração + logs + novas tentativas + revisão humana quando aplicável.
- Meça por fluxo de produto: resposta, usuário/mês, documento, ticket, recomendação, automação bem-sucedida ou transação.
- Compare custo junto com qualidade, latência e taxa de erro; custo isolado leva a modelos baratos que falham mais.