Relatório aponta que aumento do consumo de tokens e novos modelos de cobrança podem elevar os custos da Inteligência Artificial além dos ganhos de produtividade esperados
Os custos de codificação com Inteligência Artificial (IA) poderão superar o salário médio de um desenvolvedor até 2028, segundo projeção do Gartner. De acordo com a consultoria, o aumento do consumo de tokens pelos Grandes Modelos de Linguagem (LLMs) e a migração dos fornecedores para modelos de licenciamento baseados em consumo deverão pressionar os orçamentos das empresas e tornar mais difícil justificar os investimentos nessas ferramentas.
Os tokens são as unidades de dados processadas pelos modelos de Inteligência Artificial Generativa (GenAI), e seu consumo influencia diretamente o custo das soluções de codificação baseadas em IA quando a cobrança ocorre conforme a utilização.
Segundo o Gartner, muitas organizações estão migrando rapidamente da fase de experimentação para a implementação em escala de agentes de codificação baseados em Inteligência Artificial, mas ainda subestimam os impactos financeiros desse novo modelo.
“As organizações estão avançando rapidamente da experimentação para a implementação em escala de agentes de codificação baseados em IA, mas muitas estão subestimando o impacto financeiro do aumento do consumo de tokens”, afirma Nitish Tyagi, Diretor Analista Sênior do Gartner. “A disciplina no uso de tokens não surgirá apenas pela escolha dos desenvolvedores, já que eles tendem a priorizar velocidade e conveniência em vez de eficiência de custos. Sem um modelo operacional de engenharia governado, os custos podem crescer mais rapidamente do que os ganhos de produtividade que essas ferramentas prometem entregar.”
Mudança na precificação dificulta previsibilidade dos custos
Além do aumento do consumo de tokens, o Gartner aponta que a migração do licenciamento por usuário para modelos de cobrança baseados em consumo está tornando os custos da engenharia de software mais variáveis. Segundo a consultoria, muitos fornecedores de agentes de codificação com IA ainda não oferecem transparência suficiente sobre a forma como o consumo de tokens é calculado e cobrado, reduzindo a capacidade das empresas de prever e controlar seus gastos.
A consultoria afirma que, sem visibilidade sobre o consumo de tokens nas diferentes atividades de desenvolvimento, as organizações correm o risco de ultrapassar seus orçamentos e perder a capacidade de relacionar os custos ao valor efetivamente gerado pelos projetos.
“A maioria das organizações ainda não possui a maturidade nem os frameworks necessários para medir efetivamente custos versus impacto nos negócios”, afirma Tyagi. “Os líderes de engenharia de software estão cada vez mais preocupados à medida que os gastos com IA baseados em consumo de tokens se tornam mais difíceis de justificar, com orçamentos frequentemente sendo consumidos antes do esperado.”
Governança e uso dos agentes também influenciam os gastos
Segundo o Gartner, a forma como as organizações utilizam os agentes de codificação com IA também contribui para o aumento dos custos. Entre os fatores apontados estão a autonomia dos agentes sem mecanismos adequados de governança, o uso de janelas de contexto excessivamente grandes e a ausência de processos estruturados de feedback para otimizar o consumo de tokens.
A consultoria também destaca que muitos fornecedores ainda não disponibilizam recursos maduros de otimização de custos incorporados às próprias soluções, o que amplia a pressão sobre os orçamentos. “Os custos da codificação com IA continuarão aumentando à medida que os investimentos em infraestrutura e os desafios de rentabilidade pressionarem os preços dos modelos para cima”, afirma Tyagi. “Ao mesmo tempo, conforme mais desenvolvedores adotam ferramentas de IA, usuários ocasionais tendem a se tornar usuários frequentes à medida que aumenta sua familiaridade e dependência dessas tecnologias, impulsionando ainda mais o consumo de tokens e os gastos totais.”
Cinco medidas para controlar os custos
Para reduzir o risco de estouros de orçamento, o Gartner recomenda que líderes de engenharia de software adotem um modelo operacional disciplinado para utilização da Inteligência Artificial. Entre as principais orientações estão:
Estabelecer um framework de decisão orientado por casos de uso: definir em quais atividades os agentes de codificação devem ser utilizados e estabelecer níveis de autonomia adequados para cada tarefa, classificando os fluxos de trabalho entre desenvolvimento conduzido pelo profissional, apoiado por agentes ou totalmente automatizado.
Alinhar a escolha dos modelos à complexidade das tarefas: dividir atividades em tarefas menores permite utilizar modelos menos robustos sempre que possível, reservando modelos mais avançados para demandas complexas e de maior valor, reduzindo o consumo de tokens.
Adotar práticas de engenharia de contexto: treinar desenvolvedores para fornecer apenas informações relevantes aos sistemas de IA, resumindo conteúdos e eliminando dados desnecessários para reduzir o consumo de tokens sem comprometer a qualidade das respostas.
Implementar mecanismos de governança e controle de custos: estabelecer limites de consumo de tokens, políticas de escalonamento e monitoramento automatizado, incorporando esses controles aos fluxos de trabalho de engenharia para evitar aumentos descontrolados dos gastos.
Incluir análises periódicas do consumo de tokens nos ciclos de desenvolvimento: revisar regularmente os fluxos de trabalho com maior utilização de tokens durante retrospectivas de sprint para identificar ineficiências, aprimorar processos e disseminar boas práticas entre as equipes.
Os insights apresentados pelo Gartner estão reunidos no relatório How to Optimize Token Consumption for AI Coding Agents. O material reúne orientações para otimizar o consumo de tokens e aprimorar a gestão dos custos associados ao uso de agentes de codificação baseados em Inteligência Artificial e é disponibilizado aos clientes da consultoria.

