O cliente
A Nexti é uma empresa de tecnologia sediada em São José (SC), fundada em 2017 e especializada em soluções digitais para gestão de Recursos Humanos (RH) e operações. A empresa desenvolveu uma plataforma integrada que automatiza processos críticos, como controle de ponto, gestão de escalas, admissão digital e engajamento de equipes. Com diferenciais tecnológicos como reconhecimento facial e assinatura digital, a Nexti atende atualmente mais de 350 empresas, impactando cerca de 600 mil vidas em todo o Brasil, sempre com foco em eficiência operacional e conformidade legal.
O cenário
No atual contexto de mercado, a velocidade e a precisão das respostas no atendimento ao cliente tornaram-se fundamentais. A Nexti identificou a necessidade de evoluir seu canal de suporte para torná-lo mais eficiente, acessível e personalizado, sem sobrecarregar seus recursos operacionais. Para validar a viabilidade de uma solução moderna, foi solicitada pela Nexti, uma Prova de Conceito (POC) de um chatbot baseado em Inteligência Artificial Generativa. O objetivo era criar uma solução capaz de compreender linguagem natural e recuperar informações de bases documentais internas para gerar respostas consistentes em tempo real, utilizando uma arquitetura escalável e segura na nuvem AWS.
O desafio
A iniciativa nasceu de uma constatação prática: o suporte da Nexti lidava com um alto volume de dúvidas repetitivas e demandas operacionais. Embora simples, esse fluxo constante de interações consumia recursos preciosos das equipes, desviando o foco de atividades maisestratégicas para o crescimento do negócio. Para mudar essa realidade, o desafio não era apenas automatizar, mas evitar uma abordagem genérica que não compreendesse as particularidades da empresa. A solução exigia máxima confiabilidade e precisão, o que significava que a inteligência artificial precisava obrigatoriamente trabalhar sobre uma base de conhecimentos validados, como manuais de clientes, procedimentos operacionais e artigos técnicos da própria organização.
Diante desse cenário, a liderança técnica optou pela implementação da técnica de Retrieval-Augmented Generation (RAG). Essa abordagem resolve o problema ao unir a precisão da busca semântica em bases vetoriais com a fluência de modelos de linguagem de última geração. Na prática, o desafio era construir uma arquitetura híbrida onde cada resposta fosse gerada exclusivamente a partir de documentos institucionais reais, eliminando o risco de alucinações ou informações desalinhadas com as diretrizes da companhia. Ao adotar esse padrão, utilizado pelos principais players de tecnologia do mundo para suporte cognitivo, o objetivo foi transformar o atendimento em um ativo estratégico de alta autonomia, capaz de escalar o conhecimento interno com total segurança e previsibilidade.
A solução
Amazon API Gateway
A infraestrutura da POC foi projetada com serviços nativos da AWS e tecnologias externas de referência em inteligência artificial, com escalabilidade, alta performance e precisão nos resultados. O ponto de entrada da aplicação é o Amazon API Gateway, responsável por receber as requisições do front-end e encaminhá-las para funções serverless executadas via AWS Lambda. Essas funções têm responsabilidades bem definidas, desde a inicialização de sessões de conversa até o registro de histórico em Amazon DynamoDB, passando pelo controle de upload de arquivos e integração com a base de conhecimento.
AWS Step Functions
Por meio de fluxos visuais e lógica baseada em estados, o AWS Step Functions atua como orquestrador entre os componentes da arquitetura. Permitindo controle granular sobre o comportamento do sistema, determinando com precisão quando consultar a base vetorial hospedada no Pinecone, acessar documentos armazenados no Amazon S3 ou realizar inferências por meio do modelo Claude 3.5 Sonnet, via Amazon Bedrock.
Claude 3.5
Escolha estratégica por se tratar de um modelo altamente capacitado para manter coerência contextual, interpretar instruções extensas e lidar com prompts de até 200 mil tokens, o que o torna ideal para fluxos de atendimento densos, técnicos ou com múltiplos encadeamentos. Completam a arquitetura serviços como Amazon Cognito, que gerencia autenticação e controle de acesso; Amazon CloudFront e buckets S3, garantindo entrega de front-end com baixa latência; e Amazon CloudWatch, empregado para monitoramento, diagnóstico e escalabilidade da solução.
Os resultados
Entre os avanços mais expressivos consolidados com esta entrega, destacamos a adoção de uma arquitetura 100% serverless, uma decisão estratégica que eliminou a complexidade do provisionamento de infraestrutura e permitiu uma escalabilidade sob demanda com controle granular de custos. Mais do que uma automação, o projeto entregou um modelo de IA Generativa corporativa responsável, incorporando mecanismos robustos de segurança, governança sobre os conteúdos e rastreabilidade técnica de ponta a ponta, requisitos críticos para ambientes que exigem alto compliance. A clareza arquitetural, com a lógica de negócio desacoplada em módulos independentes, garantiu baixa manutenção e agilidade para ajustes futuros, enquanto a orquestração via AWS Step Functions abriu caminho para novas integrações e análises contextuais avançadas.
Infraestrutura implementada

Em termos operacionais, o rollout do agente IA-N1 foi concluído com sucesso através de uma liberação gradual em seis ondas, alcançando aproximadamente 712 IDs de clientes. Em uma janela de análise de 15 dias, os indicadores consolidaram a eficiência da solução: foram realizados 102 chats, totalizando 558 mensagens, com 47,1% dos atendimentos resolvidos exclusivamente pela inteligência artificial. Esse desempenho permitiu uma escala imediata no atendimento de primeiro nível, reduzindo drasticamente as filas para o time humano. Embora tenha havido oscilações pontuais na última semana devido a timeouts de infraestrutura (AWS/Octadesk), a visibilidade técnica permitiu identificar rapidamente as causas para ajustes finos em futuras fases.

“Para a Nexti, este projeto representa um marco estratégico ao transformar o atendimento em um vetor de eficiência, escalabilidade e governança, permitindo que a empresa amplie sua capacidade de suporte sem abrir mão da confiabilidade, do compliance e do foco em iniciativas de maior valor para o crescimento do negócio.” – Diego Jucélio Koch – Head de Foundation da Nexti
A evolução do projeto demonstrou um crescimento consistente na taxa de fechamentos pela IA, que saltou de 26% no piloto para 54% nas ondas iniciais de expansão, estabilizando-se em 42% na fase final do período observado. Como benefícios centrais, a Nexti passou a contar com um controle de ativação seguro e reversível por cliente e uma gestão baseada em métricas sólidas, distinguindo redirecionamentos por falhas técnicas de necessidades reais de transbordo humano. A infraestrutura implementada, que integra API Gateway, Lambdas orquestradores, Step Functions, Pinecone e o modelo Claude 3.5 via Bedrock, estabelece agora um novo padrão de prontidão tecnológica e eficiência para o suporte da companhia.


