re:Invent 2024: com foco em IA para empresas, AWS apresenta novos modelos e avanços no Bedrock

Andy Jassy, responsável por transformar a capacidade ociosa de servidores no maior negócio de nuvem do mundo, voltou ao palco do re:Invent para apresentar novas ofertas projetadas para revolucionar o mercado de modelos de inteligência artificial. Essa foi a primeira aparição de Jassy no evento em três anos, agora como presidente-executivo da Amazon, após suceder Jeff Bezos em 2021.

Entre os anúncios de destaque, Jassy apresentou seis novos modelos de base sob a marca Amazon Nova. Esses modelos foram descritos como soluções de última geração que combinam inteligência avançada e desempenho de custo líder no setor. Capazes de lidar com tarefas multimodais, como processamento de texto, imagens e vídeos, os modelos refletem a crescente demanda dos clientes empresariais por opções flexíveis e diversificadas de IA.

“A decisão de lançar novos modelos reflete o crescente interesse dos clientes empresariais por opções diversificadas de IA. Isso nos surpreendeu um pouco”, admitiu Jassy. “Aprendemos que a demanda é por soluções flexíveis, e não por uma única ferramenta universal.”

Bedrock: novas funcionalidades e destaque em inferência

As novidades também incluíram avanços no Amazon Bedrock, a plataforma totalmente gerenciada da AWS para construir e dimensionar aplicativos de IA generativa. Entre os novos recursos, estão verificações automatizadas para evitar erros comuns, ferramentas para gerenciar múltiplos agentes de IA é uma técnica de destilação que reduz custos e acelera a transferência de conhecimento entre modelos. Segundo Matt Garman, CEO da AWS, a inferência – processo pelo qual modelos de IA fazem previsões ou conclusões – será essencial para o futuro dos aplicativos.

“A inferência em IA generativa será um bloco de construção central para cada aplicativo”, afirmou Garman. “Por isso, criamos o Bedrock para oferecer suporte em escala e atender a essa crescente demanda.”

A própria Amazon já utiliza o Bedrock e outras ferramentas de IA em seus negócios. Um exemplo prático é a reconstrução de um chatbot, capaz de antecipar se uma chamada do cliente poderia envolver devoluções e detectar sinais de frustração no diálogo, otimizando a experiência do usuário.

Escalabilidade vertical e desenvolvimento de chips

Escala e custo surgiram como principais fatores na abordagem da AWS para IA. Na noite de segunda-feira, 02/12, Peter DeSantis, Vice-presidente sênior da AWS Utility Computing, destacou que cargas de trabalho de IA exigem escalabilidade vertical – aumentar a capacidade de um único sistema – em vez de escalabilidade horizontal, que distribui cargas em várias máquinas. Para suportar essa visão, a AWS lançou as instâncias Elastic Compute Cloud (EC2) com tecnologia Trainium2 e UltraServers, permitindo treinar e implantar modelos de IA com maior eficiência.

“Nosso foco é construir servidores mais poderosos, como o Trainium2, que não apenas oferece desempenho superior, mas também escalonamento mais rápido do que qualquer servidor anterior”, explicou DeSantis.

Impacto da IA nos negócios e a estratégia AWS

Os lançamentos refletem a visão da AWS de que a IA será essencial para reduzir custos e aumentar a produtividade em empresas de todo o mundo. “À medida que escalamos em aplicativos de IA generativa, o custo da computação realmente importa”, afirmou Jassy.

Com bilhões investidos no desenvolvimento de infraestrutura de IA, a AWS acredita que a combinação de eficiência e desempenho será determinante para liderar o setor de computação em nuvem. “Nosso compromisso é com a tecnologia que realmente importa para nossos clientes. Vamos oferecer a mais ampla e melhor funcionalidade disponível”, concluiu Jassy.