A promessa era clara: IA reduziria custos operacionais, substituiria tarefas repetitivas e tornaria as empresas mais eficientes. Microsoft e Uber estão descobrindo, com os próprios dados internos, que a conta não fecha assim.
Microsoft freou o próprio entusiasmo
A Microsoft começou a cancelar a maioria das licenças diretas do Claude Code, assistente de programação da Anthropic, e passou a direcionar seus engenheiros para o GitHub Copilot CLI, plataforma própria da empresa. A decisão veio depois que o uso intenso da ferramenta disparou os custos de computação a ponto de se tornarem insustentáveis internamente. Nenhum comunicado oficial explicou os números, mas os dados internos da empresa mostram que rodar agentes de IA em escala corporativa passou a custar mais do que pagar humanos para fazer o mesmo trabalho.
O paradoxo do token
Fluxos de trabalho com agentes de IA não chamam um modelo uma única vez: eles orquestram chamadas repetidas, lançam sub-agentes e percorrem etapas de raciocínio em loop. Cada uma dessas etapas consome tokens, e tokens são cobrados. Quanto mais eficiente o agente, mais tarefas ele executa; quanto mais tarefas, maior a fatura. Bryan Catanzaro, vice-presidente de deep learning aplicado da NVIDIA, disse ao Axios em abril “Para minha equipe, o custo de computação supera em muito o custo dos funcionários”.
Tokens mais caros que salários: executivo da NVIDIA revela paradoxo financeiro da IA
Uber estourou o ano em quatro meses
A Uber foi além. O CTO Praveen Neppalli Naga confirmou ao The Information em abril que a empresa já tinha consumido todo o orçamento de ferramentas de IA para programação de 2026, com o ano ainda na virada do primeiro trimestre. O detalhe que torna o caso irônico: a própria Uber havia criado rankings internos para incentivar as equipes a usar mais IA, premiando times pelo volume de uso. O custo por engenheiro com APIs chegou a variar entre US$ 500 e US$ 2.000 por mês.
Projeção do Gartner
Os preços por token devem cair quase 90% até 2030, segundo projeção da Gartner. Parece alívio, mas ão é. A empresa de análise de mercado alerta que modelos agênticos consomem muito mais tokens por tarefa do que modelos padrão, e que a queda nos preços unitários será absorvida pelo aumento exponencial no consumo.
A Goldman Sachs projeta crescimento de 24 vezes no consumo de tokens até 2030, chegando a 120 quadrilhões de tokens por mês. Um estudo do MIT já havia apontado, com dados de 2024, que automação por IA só se justifica economicamente em 23% das funções que dependem de tarefas visuais. Nos outros 77%, o humano sai mais barato.
.png)
há 3 horas
2








English (US) ·
Portuguese (BR) ·