Microsoft e Uber descobriram que IA sai mais caro do que contratar gente

há 3 horas 2

A promessa era clara: IA reduziria custos operacionais, substituiria tarefas repetitivas e tornaria as empresas mais eficientes. Microsoft e Uber estão descobrindo, com os próprios dados internos, que a conta não fecha assim.

Microsoft freou o próprio entusiasmo

A Microsoft começou a cancelar a maioria das licenças diretas do Claude Code, assistente de programação da Anthropic, e passou a direcionar seus engenheiros para o GitHub Copilot CLI, plataforma própria da empresa. A decisão veio depois que o uso intenso da ferramenta disparou os custos de computação a ponto de se tornarem insustentáveis internamente. Nenhum comunicado oficial explicou os números, mas os dados internos da empresa mostram que rodar agentes de IA em escala corporativa passou a custar mais do que pagar humanos para fazer o mesmo trabalho.

O paradoxo do token

Fluxos de trabalho com agentes de IA não chamam um modelo uma única vez: eles orquestram chamadas repetidas, lançam sub-agentes e percorrem etapas de raciocínio em loop. Cada uma dessas etapas consome tokens, e tokens são cobrados. Quanto mais eficiente o agente, mais tarefas ele executa; quanto mais tarefas, maior a fatura. Bryan Catanzaro, vice-presidente de deep learning aplicado da NVIDIA, disse ao Axios em abril “Para minha equipe, o custo de computação supera em muito o custo dos funcionários”.

Tokens mais caros que salários: executivo da NVIDIA revela paradoxo financeiro da IA

Uber estourou o ano em quatro meses

A Uber foi além. O CTO Praveen Neppalli Naga confirmou ao The Information em abril que a empresa já tinha consumido todo o orçamento de ferramentas de IA para programação de 2026, com o ano ainda na virada do primeiro trimestre. O detalhe que torna o caso irônico: a própria Uber havia criado rankings internos para incentivar as equipes a usar mais IA, premiando times pelo volume de uso. O custo por engenheiro com APIs chegou a variar entre US$ 500 e US$ 2.000 por mês.

Projeção do Gartner

Os preços por token devem cair quase 90% até 2030, segundo projeção da Gartner. Parece alívio, mas ão é. A empresa de análise de mercado alerta que modelos agênticos consomem muito mais tokens por tarefa do que modelos padrão, e que a queda nos preços unitários será absorvida pelo aumento exponencial no consumo.

A Goldman Sachs projeta crescimento de 24 vezes no consumo de tokens até 2030, chegando a 120 quadrilhões de tokens por mês. Um estudo do MIT já havia apontado, com dados de 2024, que automação por IA só se justifica economicamente em 23% das funções que dependem de tarefas visuais. Nos outros 77%, o humano sai mais barato.