Dados

Benchmarks e custos dos LLMs

Performance, preço por token, custo total (equipes + GPUs + APIs) e o que dá pra fazer com cada faixa de orçamento — incluindo OpenCode (OpenCLAW) e Vibe Coding.

Performance

MMLU · HumanEval · GPQA · MATH

Pontuação % nos principais benchmarks. Maior é melhor.

ModeloEmpresaMMLUHumanEvalGPQAMATHContexto (K)Ano
GPT-5OpenAI92%96%75%94%400K2025
Claude 4.8 SonnetAnthropic93%95%76%92%500K2026
Claude 4.5 SonnetAnthropic91%93%72%90%200K2025
Gemini 2.5 ProGoogle90%89%70%92%2000K2025
GPT-4oOpenAI88%90%53%76%128K2024
Llama 3.1 405BMeta87%89%51%73%128K2024
DeepSeek R1DeepSeek89%91%71%95%128K2025
Grok 4xAI87%86%65%88%256K2025
Mistral Large 2Mistral84%84%48%71%128K2024
Calculadora

Quanto custa rodar uma IA?

Preço atual: $5/1M entrada · $15/1M saída
Estimativa mensal
$1.250
≈ R$ 6.500
Entrada$500
Saída$750
Custo por chamada$1,25
Custo Total (TCO)

Quanto custa montar um produto de IA por mês?

Equipe + infraestrutura + APIs + ferramentas. Cenários sintetizados a partir de faixas de mercado (Glassdoor, Levels.fyi, AWS/GCP, OpenAI/Anthropic).

Equipe tradicional (sem IA assistida)

1 PM + 2 devs full-stack + 1 designer + 1 QA. Stack convencional, sem copilots.

Equipe
$38.0k
Infra
$1.2k
APIs
$0.0k
Tools
$0.4k
$39,600/mês
$475,200/ano
Baseline

Equipe com Copilot + ChatGPT Team

Mesma equipe, mas com GitHub Copilot e ChatGPT Team em todos os assentos.

Equipe
$38.0k
Infra
$1.2k
APIs
$0.3k
Tools
$0.6k
$40,150/mês
$481,800/ano
+1% custo, ~30% ganho de velocidade

Equipe enxuta com Vibe Coding (Lovable / v0 / Bolt)

1 PM + 1 dev sênior + 1 designer. Geram interfaces e CRUDs por prompt.

Equipe
$19.0k
Infra
$0.4k
APIs
$0.2k
Tools
$0.3k
$19,950/mês
$239,400/ano
−50% custo vs. baseline

Solo founder com OpenCode (OpenCLAW) + Claude Skills

1 pessoa operando agente de código no terminal com skills customizadas.

Equipe
$8.0k
Infra
$0.3k
APIs
$0.4k
Tools
$0.2k
$8,850/mês
$106,200/ano
−78% custo vs. baseline

Time enterprise com modelo próprio (fine-tuning)

8 engenheiros de ML + GPUs dedicadas + MLOps + LLM proprietário fine-tunado.

Equipe
$145.0k
Infra
$22.0k
APIs
$1.5k
Tools
$2.5k
$171,000/mês
$2,052,000/ano
Para dados sensíveis ou volume massivo
Times

Salários de papéis-chave em IA

Brasil (R$ mil/mês) e EUA (US$ mil/ano em total compensation). Faixas referenciais.

PapelBrasil (R$ mil/mês)EUA (US$ mil/ano)Spread
ML Engineer PlenoR$ 1832 milUS$ 180280 mil
ML Engineer SêniorR$ 2855 milUS$ 250450 mil
Data Scientist PlenoR$ 1528 milUS$ 150240 mil
AI Product ManagerR$ 2245 milUS$ 200380 mil
Prompt EngineerR$ 1225 milUS$ 120220 mil
MLOps / Infra GPUR$ 2040 milUS$ 200350 mil
AI Safety / Red TeamR$ 2550 milUS$ 220400 mil
Pesquisador IA (PhD)R$ 3590 milUS$ 350900 mil
Hardware

Custo de GPU/TPU on-demand (USD/hora)

Para quem pensa em treinar ou rodar modelos próprios em vez de usar API.

NVIDIA H100 80GB
$4.5/h
AWS / GCP / Azure

Treino de LLMs até 70B

Mensal contínuo (24×30): $3,240
NVIDIA A100 80GB
$3/h
AWS / GCP

Fine-tuning, inferência pesada

Mensal contínuo (24×30): $2,160
NVIDIA L40S 48GB
$1.6/h
AWS / Lambda

Inferência multimodal

Mensal contínuo (24×30): $1,152
NVIDIA T4 16GB
$0.35/h
GCP / AWS

Inferência leve, embeddings

Mensal contínuo (24×30): $252
Google TPU v5e
$1.2/h
GCP

Treino otimizado JAX/TF

Mensal contínuo (24×30): $864
Apple M3 Ultra
$0.12/h
On-premise

Dev local com LM Studio / Ollama

Mensal contínuo (24×30): $86.4
Casos concretos

O que dá pra fazer em cada faixa de orçamento?

Do chatbot de FAQ ao modelo próprio — cinco cenários reais incluindo OpenCode (OpenCLAW) e Vibe Coding, com stack sugerida e ROI esperado.

Até US$ 50/mês

Chatbot interno para FAQ

Caso 1/5

Atende dúvidas recorrentes de RH, suporte ou vendas com base em PDFs e Notion.

Stack sugerida
Claude Haiku + RAG simples (Supabase pgvector) + Lovable UI
Resultado esperado
Reduz 60–80% dos tickets repetitivos. ROI em < 1 mês.
US$ 200–500/mês

Copiloto comercial (SDR automatizado)

Caso 2/5

Lê CRM, escreve e-mails personalizados, agenda follow-ups e prepara dossiês de leads.

Stack sugerida
GPT-5 mini + n8n + HubSpot + Vibe Coding (Lovable) pra dashboard
Resultado esperado
1 SDR humano + IA = 3 SDRs tradicionais. Payback ~2 meses.
US$ 1–3 mil/mês

Agente de código contínuo (OpenCode/OpenCLAW)

Caso 3/5

Roda no terminal do servidor, lê o repositório, abre PRs, escreve testes e responde issues.

Stack sugerida
OpenCode + Claude 4.8 Sonnet + Claude Skills customizadas + GitHub Actions
Resultado esperado
Squad de 4 entrega como 6–8. Bugs resolvidos durante a madrugada.
US$ 5–15 mil/mês

Plataforma SaaS com IA generativa nativa

Caso 4/5

Produto vertical (jurídico, médico, educacional) com geração, busca semântica e voz.

Stack sugerida
GPT-5 + Gemini 2.5 Pro (longo contexto) + ElevenLabs + Pinecone + Stripe
Resultado esperado
MRR escalável. Margem bruta 60–75% se for bem precificado.
US$ 50–200 mil/mês

Modelo fine-tunado proprietário

Caso 5/5

LLM treinado nos dados internos, rodando em VPC para compliance (LGPD, HIPAA, SOX).

Stack sugerida
Llama 3.1 405B ou Mistral Large + cluster H100 + MLOps (Weights & Biases)
Resultado esperado
Viável para bancos, hospitais e governos. ROI vem da soberania dos dados.
Mercado

Adoção de IA por setor (%)

Investimento

Investimento global em IA (US$ bi)