AWS expande a família Amazon Nova 2 e eleva o patamar de IA multimodal 

A Amazon Web Services (AWS) anunciou a expansão da família de modelos fundacionais Amazon Nova 2, adicionando novos recursos de raciocínio multimodal, processamento de fala e automação de interfaces. Em paralelo, apresentou o Amazon Nova Forge, plataforma que permite criar variantes personalizadas desses modelos a partir de checkpoints em diferentes estágios de treinamento.

Na prática, não estamos falando apenas de “modelos maiores e mais rápidos”, mas de uma base tecnológica pensada para empresas que já enxergam IA generativa como parte da arquitetura de negócios, e não apenas como um experimento isolado.

Uma família de modelos para diferentes níveis de complexidade

Os novos modelos da família Amazon Nova 2 foram desenhados para cobrir desde workloads do dia a dia até cenários avançados de agentes, automação e orquestração de sistemas. A lógica é clara: em vez de um único modelo “faz tudo” com trade-offs pesados, a AWS oferece perfis complementares de capacidade, custo e contexto.

Amazon Nova 2 Lite: raciocínio econômico para o dia a dia

O Amazon Nova 2 Lite é o modelo de raciocínio econômico da família, voltado para cargas de trabalho recorrentes e de alto volume. Ele processa texto, imagens, documentos e vídeos, gerando respostas textuais para casos como:

  • Chatbots de atendimento ao cliente.
  • Análise e classificação de documentos.
  • Automação de processos de negócios e backoffice.

Um ponto relevante para arquitetos e times de produto é o suporte a “extended thinking”: é possível controlar o quanto de raciocínio passo a passo o modelo vai aplicar em cada requisição, ajustando o “budget” cognitivo de acordo com a sensibilidade da tarefa. Isso permite equilibrar custo, latência e precisão de forma mais granular.

O Nova 2 Lite também traz, de forma nativa:

  • web grounding: capacidade de buscar e incorporar informações atualizadas.
  • interpretação de código: execução de trechos de código dentro do fluxo de resposta.

Para empresas que já operam em produção com GenAI, isso reduz a necessidade de combinar diversos componentes externos só para cobrir casos de uso relativamente comuns.

Amazon Nova 2 Pro: raciocínio avançado e foco em agentes

O Amazon Nova 2 Pro é posicionado pela AWS como o modelo de raciocínio mais sofisticado da família Nova 2. Ele aceita entradas de texto, imagens, vídeo e fala, com foco em tarefas que exigem:

  • Planejamento de longo prazo.
  • Interpretação de instruções complexas.
  • Automação baseada em agentes, que orquestram ferramentas, APIs e fluxos de sistema.

Assim como o Lite, o Pro integra busca na web e execução de código, mas com um viés mais forte para workflows agentic: migração de sistemas, análise de múltiplas fontes de dados, automação de rotinas complexas e compreensão de arquiteturas inteiras.

Outro diferencial importante é o papel de modelo “professor” em processos de distilação: o Nova 2 Pro pode ser usado como base para treinar variantes menores e mais eficientes, ajustadas a workloads específicos. Isso conversa diretamente com a agenda de empresas que querem performance de alto nível em GenAI, mas com eficiência operacional e controle de custo a médio prazo.

Amazon Nova 2 Sonic: conversas de voz em tempo real com contexto profundo

O Amazon Nova 2 Sonic é o modelo de fala para fala da família. Ele combina compreensão e geração de texto e voz em tempo real, oferecendo:

  • Interações conversacionais naturais em múltiplos idiomas.
  • Vozes poliglotas, com continuidade de contexto ao longo de longas sessões.
  • Execução assíncrona de tarefas de fundo enquanto a conversa continua.

Um ponto técnico bastante relevante é a janela de contexto de 1 milhão de tokens, que permite:

  • Manter o histórico de conversas extensas.
  • Trabalhar com grandes blocos de código.
  • Usar longos documentos como base de contexto.

O Nova 2 Sonic foi desenvolvido para sistemas de voz interativos e se integra diretamente com:

  • Amazon Connect (contact center na nuvem)
  • Parceiros de telefonia como Vonage, Twilio e AudioCodes
  • Frameworks de IA conversacional via API de streaming bidirecional do Amazon Bedrock

Do ponto de vista de negócio, isso habilita experiências de atendimento mais inteligentes, com menos fricção entre canais de voz, dados e sistemas internos.

Amazon Nova 2 Omni: geração multimodal completa em um único modelo

O Amazon Nova 2 Omni é o primeiro modelo da família Nova projetado para geração multimodal completa. Ele recebe texto, imagens, vídeo e fala como entrada, e é capaz de gerar:

  • Texto
  • Imagens

Em um único fluxo multimodal.

O modelo foi pensado para cenários em que a empresa precisa operar sobre grandes volumes de conteúdo heterogêneo:

  • Bibliotecas extensas de documentos.
  • Catálogos de produtos.
  • Vídeos e arquivos de áudio.
  • Ativos de marketing e comunicação.

Em vez de combinar vários modelos especializados (um para visão, outro para texto, outro para imagem, etc.), o Nova 2 Omni oferece uma abordagem unificada. Em termos práticos, é possível, por exemplo:

  • Ingerir um catálogo completo de produtos.
  • Cruzar com depoimentos de clientes e materiais de marca.
  • Gerar campanhas de marketing consistentes, multicanal e alinhadas à identidade visual e textual da empresa.

Esse tipo de capacidade multimodal integrada reduz complexidade de arquitetura e, ao mesmo tempo, aumenta o potencial criativo e analítico das aplicações.

Disponibilidade, Nova Forge e o papel do Amazon Bedrock

Do ponto de vista de arquitetura na AWS, os modelos Nova 2 se encaixam em um cenário onde:

  • Amazon Bedrock continua sendo a camada de orquestração e consumo gerenciado de modelos de IA generativa, com segurança, privacidade e escalabilidade padronizadas.
  • Amazon Nova Forge surge como a camada de criação e customização de variantes proprietárias, permitindo treinar e ajustar modelos Nova 2 com dados específicos do cliente.

Em termos de disponibilidade:

  • Amazon Nova 2 Lite: disponível em Amazon Bedrock, com contexto de até 1 milhão de tokens e foco em workloads do dia a dia.
  • Amazon Nova 2 Pro: disponível em Preview, com acesso antecipado via Amazon Nova Forge, voltado para cenários de raciocínio avançado e uso como modelo “professor” em distilação.
  • Amazon Nova 2 Sonic: disponível em Amazon Bedrock em regiões selecionadas, integrado a ecossistemas de voz e contact center.
  • Amazon Nova 2 Omni: disponibilizado inicialmente com early access para clientes Nova Forge, com deployment via Bedrock para cenários de raciocínio e geração multimodal em um único modelo.

Desenvolvedores podem experimentar os modelos e criar protótipos em nova.amazon.com/dev, enquanto times corporativos podem operar em produção diretamente via Amazon Bedrock, aproveitando políticas de segurança, compliance e governança já consolidadas no ambiente AWS.

Como isso conversa com a visão da Dati

Para a Dati, a evolução da família Amazon Nova 2 reforça um movimento que já vínhamos mapeando com clientes:

a IA generativa deixa de ser apenas “um modelo” e passa a ser uma camada estratégica da arquitetura de negócios, que precisa:

  • Modelos adequados a cada tipo de workload.
  • Ferramentas para personalização com dados proprietários.
  • Governança de custo, segurança e risco tecnológico.
  • Integração nativa com sistemas legados, dados e canais de atendimento.

Modelos como Nova 2 Lite, Pro, Sonic e Omni, combinados com o Amazon Nova Forge e o Amazon Bedrock, abrem espaço para soluções mais sofisticadas em:

  • Automação inteligente de processos.
  • Atendimento omnichannel com voz e texto.
  • Copilots internos para áreas de negócio e times técnicos.

Experiências multimodais de marketing, vendas e produtos.

Na prática, esse novo capítulo da AWS confirma que o jogo da IA generativa não será vencido por quem “tem um modelo”, mas por quem sabe desenhar arquiteturas que conectam agentes, dados, aplicações e pessoas em um mesmo fluxo de valor. É aqui que enxergamos uma mudança importante para as empresas: sair da lógica de experimentos isolados e começar a tratar a IA como parte estruturante da arquitetura de negócios, com atenção a indicadores, níveis de serviço e governança compatíveis com os sistemas centrais.