[ Insights · 15 de março de 2026 ]
Observabilidade de IA: o que logar (e o que não logar)
Logging de LLM mistura compliance, custo e debug. O esquema que funciona para auditar 6 meses depois.

Logar tudo é caro e arriscado. Não logar nada é debug impossível. O meio-termo importa.
Schema mínimo
{
"trace_id": "uuid",
"tenant_id": "string",
"user_id_hash": "sha256",
"model": "claude-opus-4-7",
"input_tokens": 1234,
"output_tokens": 567,
"latency_ms": 890,
"tool_calls": ["search", "create_order"],
"outcome": "success | refusal | error",
"cost_usd": 0.042
}
O que NÃO logar
- Prompt completo se houver PII
- Output bruto sem anonimização
- API key (óbvio mas acontece)
Onde mandar
- Métricas → Prometheus / Grafana
- Traces → OpenTelemetry / Honeycomb
- Conteúdo amostrado → S3 com retention curta (30-90d)
O melhor log é o que você precisa às 3am quando algo quebra. Pense no futuro você.