AWS apresenta o Trainium3, chip de última geração para IA, e disponibiliza instâncias Trainium2 na nuvem

Durante o re:Invent 2024, a Amazon Web Services (AWS) apresentou o Trainium3, seu primeiro chip fabricado em processo de 3 nanômetros, e estabelece um novo padrão de eficiência energética e densidade de processamento. A nova versão promete oferecer o dobro de desempenho e uma eficiência energética 40% superior em comparação com o Trainium2. Além disso, as instâncias EC2 Trn2 agora estão disponíveis para uso geral, oferecendo capacidades avançadas para cargas de trabalho de IA na nuvem.

Capacidades técnicas do Trainium3

Desenvolvido para atender às demandas crescentes de modelos de IA de larga escala, o Trainium3 é otimizado para treinar e inferir modelos de linguagem e aprendizagem com bilhões e até trilhões de parâmetros. Essas melhorias tornam o chip ideal para lidar com conjuntos de dados massivos e aplicações de IA generativa.

Novas Instâncias Trn2 e UltraServers

Para modelos de última geração, a AWS também anunciou a disponibilidade das instâncias Trn2 no Elastic Compute Cloud (EC2), equipadas com 16 chips Trainium2.

Essas instâncias oferecem:

  • 20,8 petaflops de computação em desempenho máximo.
  • 30% mais computação e 25% mais memória de alta largura de banda do que as instâncias EC2 equivalentes, mantendo o mesmo custo.

Para workloads ainda maiores, os novos Trn2 UltraServers conectam até 64 chips Trainium2 usando a tecnologia NeuronLink, atingindo 83,2 petaflops de pico de computação. Essa capacidade permite atender modelos com centenas de bilhões de parâmetros, reduzindo o tempo de treinamento e acelerando a implantação.

Project Ranier e colaboração com a Anthropic

A AWS revelou também o Project Ranier, um cluster massivo de UltraServers Trn2 desenvolvido em parceria com a Anthropic PBC. Com centenas de milhares de chips interconectados, o cluster será usado para treinar modelos de linguagem de última geração. Segundo Gadi Hutt, diretor da Annapurna Labs, este é o maior cluster já construído pela AWS, oferecendo cinco vezes mais capacidade do que soluções anteriores.

Impacto e futuro

Com o lançamento das primeiras instâncias baseadas no Trainium3 previsto para 2025, a AWS prepara o terreno para entregar quatro vezes o desempenho dos UltraServers Trn2, possibilitando avanços significativos em IA generativa e aprendizagem. Essas inovações destacam o papel da AWS como líder no mercado de nuvem e IA, oferecendo soluções que impulsionam o desenvolvimento de modelos massivos e permitem que empresas reduzam custos, melhorem a eficiência e liderem em inovação no setor. 

Sobre o re:Invent 

O re:Invent é um evento anual promovido pela AWS e reconhecido como um dos maiores e mais relevantes encontros internacionais voltados à computação em nuvem. Concebido para conectar profissionais de tecnologia, desenvolvedores, engenheiros, arquitetos de nuvem, executivos e entusiastas do ecossistema AWS, o evento serve como uma plataforma estratégica para o lançamento de novos produtos, serviços e atualizações, além de compartilhar cases e insights sobre as principais tendências do setor.