AMD Advancing AI 2025: Série Instinct MI350 é lançada com desempenho até 35x superior em inferência

lin james
2025-06-16
Share :

No dia 13 de junho de 2025, a AMD realizou seu evento anual de destaque no setor de inteligência artificial, o ​Advancing AI 2025​. Liderado pela CEO, Dra. Lisa Su, e acompanhado por executivos, parceiros de ecossistema e desenvolvedores, o evento destacou os mais recentes avanços da ​AMD em IA e computação de alto desempenho (HPC)​.

Série Instinct MI350: os novos GPUs AMD para IA que redefinem performance

O anúncio mais impactante foi o lançamento da nova geração de ​GPUs AMD Instinct MI350​, composta pelos modelos MI350X e o topo de linha ​MI355X​. Esses chips são construídos com a nova arquitetura CDNA 4 e processo de fabricação de ​3 nm​, contendo impressionantes ​185 bilhões de transistores​.

image.png

Principais especificações técnicas:

  • Memória​: 288 GB HBM3E
  • Modelos de IA suportados​: até 520 bilhões de parâmetros (520B) com apenas 1 GPU
  • Precisões suportadas​: FP4, FP6, FP8, FP16
  • Performance de pico​:
  • FP64/FP32: 2x melhor que os concorrentes
  • FP6: mais de 2x superior
  • FP4/FP8/FP16: desempenho igual ou ligeiramente superior
  • Custo-benefício​: 40% mais tokens por dólar comparado ao NVIDIA B200

image.png

Resultados reais com Llama 3.1 405B:

  • Desempenho de agentes inteligentes​: 4,2x melhor que o MI300X
  • Geração de conteúdo​: 2,9x mais eficiente
  • Geração de resumos​: 3,8x superior
  • Desempenho em IA conversacional​: 2,6x mais rápido

Além disso, a série MI350 já alcançou a meta de eficiência energética da AMD para os próximos 5 anos, com um aumento de ​38 vezes​, superando o objetivo inicial de 30x.

image.png

Infraestrutura de IA aberta e escalável

A plataforma MI350 foi desenvolvida com suporte aos padrões abertos UEC e ​OCP​, oferecendo arquitetura de IA ponta a ponta. Ela estará disponível em três configurações de larga escala:

  • 128 GPUs​: 36 TB de HBM3E
  • 96 GPUs​: 27 TB de HBM3E
  • 64 GPUs​: 18 TB de HBM3E

Combinada com os processadores x86 AMD ​EPYC de 5ª geração​, essa infraestrutura é ideal para o treinamento, inferência e implantação de modelos de IA de última geração, suportando tarefas com precisão FP4 a FP8. O lançamento está previsto para o ​3º trimestre de 2025​.

image.png

Prévia da arquitetura Helios: MI400 + Zen 6 + Rede Vulcano

A AMD também revelou a prévia de sua arquitetura de próxima geração, a ​plataforma Helios​, voltada para 2026. Seus principais componentes incluem:

  • GPU Instinct MI400​: 432 GB de HBM4, 19,6 TB/s de largura de banda, performance de pico de 40 PFLOPS (FP4) e 20 PFLOPS (FP8)
  • CPU EPYC “Venice”​: baseada na arquitetura Zen 6
  • Placa de rede Pensando Vulcano

O Helios busca oferecer uma infraestrutura de IA com ​alta largura de banda, conectividade avançada e eficiência energética superior​.

image.png

ROCm 7: novo software open-source e nuvem para desenvolvedores

Além do hardware, a AMD também anunciou a nova versão de sua pilha de software de IA open-source: ​ROCm 7​, que traz melhorias significativas em funcionalidade, compatibilidade e eficiência no desenvolvimento.

Novidades do ROCm 7:

  • Maior suporte para frameworks populares de IA (como PyTorch e TensorFlow)
  • Ferramentas de desenvolvimento mais completas: APIs, drivers e bibliotecas aceleradas
  • Adaptação otimizada para diferentes hardwares

A AMD também lançou oficialmente o ​Developer Cloud​, oferecendo uma plataforma de desenvolvimento de IA hospedada para desenvolvedores e comunidades open-source, suportando desde protótipos até grandes implantações.


Conclusão: AMD assume papel de destaque na infraestrutura de IA generativa

Com o lançamento da série ​Instinct MI350​, a prévia da infraestrutura Helios e o avanço no software com ​ROCm 7​, a AMD reforça sua posição como fornecedora de soluções ​full-stack em IA​.

image.png

Focando em ​performance, eficiência energética e abertura​, a AMD pode se tornar a nova protagonista na corrida pela liderança em ​infraestruturas para IA generativa​, enfrentando gigantes como NVIDIA e Intel com uma estratégia ousada e inovadora.