Agentes de IA saem do laboratório: 70% de resolução no atendimento e a corrida pelos “superagentes” no trabalho
Agentes de IA saem do laboratório: 70% de resolução no atendimento e a corrida pelos “superagentes” no trabalho
Do banco ao contact center, a conversa de “IA generativa” está virando operação — com métricas.
Hoje, dois sinais ficam claros: empresas estão medindo autonomia (quanto a IA resolve sem humano) e redesenhando a interface do trabalho para reduzir troca de ferramentas — enquanto a regulação (como o AI Act na UE) continua apertando o cerco sobre governança e controles.
Resumo do dia (em 90 segundos)
- Agentes no atendimento estão virando KPI: o Agibank divulgou 70% de resolução/“retenção” sem humano após implementar agentes com a plataforma Agentforce (Salesforce) e relatou queda de espera no chat de ~3 minutos para zero. (Let’s Money)
- O “lugar” onde o agente vive importa: a Salesforce está reposicionando o Slackbot como um concierge de trabalho e suporte, com “30+” novas capacidades e integração com apps/Agentforce. Um case citado (Engine) fala em 50%+ de resolução autônoma de casos de viagem. (CX Today)
- Governança vira parte do produto: executivos de Agentforce reforçam quatro pilares para dar certo em empresas — contexto, controle, observabilidade e orquestração — e destacam exigências de determinismo em setores regulados (ex.: processos que pedem 99,9% de aderência). (TechTarget)
- Regulação segue como pano de fundo: o Artificial Intelligence Act da União Europeia é um marco de regras harmonizadas e obrigações por risco — e tende a influenciar desenho de produtos e contratos fora da UE também. (EUR-Lex)
Caso real: Agibank e a meta de autonomia (70% sem humano)
Quando a conversa sai de “vamos testar IA” para “quanto do volume a IA resolve?”, o jogo muda. O Agibank afirmou que implementou agentes autônomos com a plataforma Agentforce (Salesforce) e atingiu 70% de retenção no atendimento — ou seja, de cada 10 chamados, apenas 3 chegam ao time humano. Também reportou que o tempo de espera no chat, antes em torno de três minutos, caiu para zero. (Let’s Money)
Por que esse número importa
- Vira benchmark: 70% é um patamar que ajuda outras empresas a calibrar expectativa — principalmente em operações com grande parte de solicitações informacionais.
- Redesenha o trabalho humano: se 30% dos casos “sobram” para pessoas, é provável que sejam os mais complexos, sensíveis e com maior impacto (cobrança, contestação, renegociação etc.).
- Exige controle: autonomia sem trilha de auditoria e limites claros vira risco operacional e reputacional.
O próprio relato destaca que o banco identificou que 80% das demandas eram informacionais e apostou em uma adoção “plug-and-play” integrada ao CRM, o que reduz esforço de integração e acelera a captura de valor. (Let’s Money)
Slack como “interface” de agentes: o que a Salesforce está empurrando
A tese aqui é simples: se o agente estiver “fora do fluxo”, ele não escala. A Salesforce anunciou mais de 30 novas capacidades do Slackbot, tentando transformar o Slack em um lugar onde pessoas, agentes e apps se encontram — reduzindo a troca de telas e a perda de contexto. (CX Today)
Os trechos mais acionáveis (com números)
- Adoção interna: o texto cita que a Salesforce vem rodando a iniciativa desde janeiro, com 55 mil usuários ativos semanais e 87% de retenção semana a semana, além de “tracking” para um milhão de usuários semanais. (CX Today)
- Case (Engine): a empresa teria construído seu primeiro agente em 12 dias e hoje resolveria mais de 50% dos casos de viagem sem intervenção humana. (CX Today)
- Qualidade em escala: o case também cita análise de sentimento e checagens de qualidade em 100% das ligações, versus ~1% quando o processo é manual por amostragem. (CX Today)
O detalhe importante: não é só “um bot no chat”. É uma aposta em orquestração (quem faz o quê, com que permissão, e como registrar decisões) e em governança (canais confidenciais, restrições para IA, opt-in ao agir em sistemas externos). (CX Today)
Como colocar agentes em produção sem dor (contexto, controle, observabilidade e orquestração)
Uma boa parte do hype recente em “agentes” morre quando chega na vida real: processos quebram, exceções aparecem, e o time de compliance pergunta “quem autorizou isso?”. Na entrevista ao TechTarget, o executivo de Agentforce resume quatro elementos para dar certo: (TechTarget)
1) Contexto (de verdade)
Não é só jogar PDFs num banco vetorial e “ver no que dá”. É interpretar e contextualizar conteúdo rico (documentos, imagens, tabelas, fluxos) para entregar respostas mais corretas e úteis. (TechTarget)
2) Controle (determinismo quando precisa)
Em setores regulados, “acertar quase sempre” não basta. A entrevista menciona cenários onde a aderência a processo precisa ser da ordem de 99,9%. Daí a ênfase em combinar execução determinística com o poder probabilístico de LLMs. (TechTarget)
3) Observabilidade (o trabalho começa depois do deploy)
Sem medir, você não melhora: KPIs, taxa de sucesso, causas de falha, custo por resolução, e principalmente quais mudanças melhoram o agente ao longo do tempo. (TechTarget)
4) Orquestração (humano + agente + sistemas)
O valor não está só em um agente isolado, mas no handoff humano-agente e na coordenação de múltiplos agentes e ferramentas no fluxo real de trabalho — o que explica a disputa por “superagentes” em superfícies como Slack. (TechTarget)
Um recorte prático: IA para estudar (o que muda quando há fontes)
Nem toda IA é “a melhor” em tudo — e, na prática, a diferença aparece quando você precisa trabalhar com fontes (PDFs, links, apostilas) versus responder perguntas abertas. Um teste do TechTudo comparou NotebookLM, Claude e Perplexity em cenário de concurseiros e destacou:
- NotebookLM como forte quando o usuário já tem material (com respostas baseadas em fontes anexadas e citações). O texto também lista limites do plano grátis, como 100 notebooks, 50 fontes por notebook e 50 consultas por dia. (TechTudo)
- Claude com destaque para didática e organização, mas com limites variáveis conforme complexidade e tamanho das sessões. (TechTudo)
- Perplexity mais próximo de “busca com IA”; no teste, houve limitação de upload no plano gratuito. (TechTudo)
O paralelo com agentes corporativos é direto: quando você dá fontes e contexto (documentos internos, políticas, histórico), a IA para de ser “palpiteiro simpático” e vira ferramenta de trabalho — desde que exista controle e rastreabilidade.
O que isso significa na prática
Se você toca atendimento (CX/CS)
- Escolha um KPI simples para começar: “% resolvido sem humano” + “tempo de espera” (o case do Agibank explicitamente usou os dois). (Let’s Money)
- Separe o que é informacional do que é sensível: o ganho rápido costuma estar nas demandas repetitivas; já os casos tensos precisam de bom desenho de linguagem, escada de transferência e políticas claras.
- Audite em camadas: amostragem humana + checagens automáticas (o case citado no Slack fala em 100% das ligações com análise/QA). (CX Today)
Se você é gestor de produto/engenharia
- Trate “controle” como feature: permissões, trilha de auditoria, limites de ação, e determinismo quando necessário (a discussão de 99,9% é um bom norte em ambientes regulados). (TechTarget)
- Invista em observabilidade desde o dia 1: logs, métricas, dashboards e um processo de melhoria contínua — porque a operação é onde o custo aparece e onde o ROI se prova.
- Reduza fricção de adoção: colocar o agente na superfície onde as pessoas já trabalham (chat/collab) pode ser tão importante quanto o modelo por trás. (CX Today)
Se você é compliance/jurídico
- Mapeie risco por caso de uso: a lógica do AI Act é justamente classificar e impor obrigações conforme risco. Mesmo fora da UE, clientes e fornecedores tendem a “importar” padrões. (EUR-Lex)
- Exija documentação mínima: o debate de agentes em produção costuma falhar por falta de especificação do que o agente pode fazer, com quais dados, e sob quais condições.
Fique de olho amanhã
- Benchmarks de “autonomia” por setor: além de bancos, quais números começam a aparecer em varejo, telecom e health?
- Orquestração multiagente e “superagentes”: a disputa por interfaces (Slack, suites, navegadores, desktop) deve acelerar — e com ela, guerras de permissão e auditoria.
- Regulação e contratos: veja se fornecedores começam a oferecer “pacotes” de governança (auditoria, restrições por canal, logs) como diferencial comercial, especialmente para atender exigências europeias.