Directory
Série Instinct MI350: os novos GPUs AMD para IA que redefinem performance
Infraestrutura de IA aberta e escalável
Prévia da arquitetura Helios: MI400 + Zen 6 + Rede Vulcano
ROCm 7: novo software open-source e nuvem para desenvolvedores
Conclusão: AMD assume papel de destaque na infraestrutura de IA generativa

AMD Advancing AI 2025: Série Instinct MI350 é lançada com desempenho até 35x superior em inferência

lin james

2025-06-16

No dia 13 de junho de 2025, a AMD realizou seu evento anual de destaque no setor de inteligência artificial, o Advancing AI 2025. Liderado pela CEO, Dra. Lisa Su, e acompanhado por executivos, parceiros de ecossistema e desenvolvedores, o evento destacou os mais recentes avanços da AMD em IA e computação de alto desempenho (HPC).

Série Instinct MI350: os novos GPUs AMD para IA que redefinem performance

O anúncio mais impactante foi o lançamento da nova geração de GPUs AMD Instinct MI350, composta pelos modelos MI350X e o topo de linha MI355X. Esses chips são construídos com a nova arquitetura CDNA 4 e processo de fabricação de 3 nm, contendo impressionantes 185 bilhões de transistores.

Principais especificações técnicas:

Memória: 288 GB HBM3E
Modelos de IA suportados: até 520 bilhões de parâmetros (520B) com apenas 1 GPU
Precisões suportadas: FP4, FP6, FP8, FP16
Performance de pico:
FP64/FP32: 2x melhor que os concorrentes
FP6: mais de 2x superior
FP4/FP8/FP16: desempenho igual ou ligeiramente superior
Custo-benefício: 40% mais tokens por dólar comparado ao NVIDIA B200

Resultados reais com Llama 3.1 405B:

Desempenho de agentes inteligentes: 4,2x melhor que o MI300X
Geração de conteúdo: 2,9x mais eficiente
Geração de resumos: 3,8x superior
Desempenho em IA conversacional: 2,6x mais rápido

Além disso, a série MI350 já alcançou a meta de eficiência energética da AMD para os próximos 5 anos, com um aumento de 38 vezes, superando o objetivo inicial de 30x.

Infraestrutura de IA aberta e escalável

A plataforma MI350 foi desenvolvida com suporte aos padrões abertos UEC e OCP, oferecendo arquitetura de IA ponta a ponta. Ela estará disponível em três configurações de larga escala:

128 GPUs: 36 TB de HBM3E
96 GPUs: 27 TB de HBM3E
64 GPUs: 18 TB de HBM3E

Combinada com os processadores x86 AMD EPYC de 5ª geração, essa infraestrutura é ideal para o treinamento, inferência e implantação de modelos de IA de última geração, suportando tarefas com precisão FP4 a FP8. O lançamento está previsto para o 3º trimestre de 2025.

Prévia da arquitetura Helios: MI400 + Zen 6 + Rede Vulcano

A AMD também revelou a prévia de sua arquitetura de próxima geração, a plataforma Helios, voltada para 2026. Seus principais componentes incluem:

GPU Instinct MI400: 432 GB de HBM4, 19,6 TB/s de largura de banda, performance de pico de 40 PFLOPS (FP4) e 20 PFLOPS (FP8)
CPU EPYC “Venice”: baseada na arquitetura Zen 6
Placa de rede Pensando Vulcano

O Helios busca oferecer uma infraestrutura de IA com alta largura de banda, conectividade avançada e eficiência energética superior.

ROCm 7: novo software open-source e nuvem para desenvolvedores

Além do hardware, a AMD também anunciou a nova versão de sua pilha de software de IA open-source: ROCm 7, que traz melhorias significativas em funcionalidade, compatibilidade e eficiência no desenvolvimento.

Novidades do ROCm 7:

Maior suporte para frameworks populares de IA (como PyTorch e TensorFlow)
Ferramentas de desenvolvimento mais completas: APIs, drivers e bibliotecas aceleradas
Adaptação otimizada para diferentes hardwares

A AMD também lançou oficialmente o Developer Cloud, oferecendo uma plataforma de desenvolvimento de IA hospedada para desenvolvedores e comunidades open-source, suportando desde protótipos até grandes implantações.

Conclusão: AMD assume papel de destaque na infraestrutura de IA generativa

Com o lançamento da série Instinct MI350, a prévia da infraestrutura Helios e o avanço no software com ROCm 7, a AMD reforça sua posição como fornecedora de soluções full-stack em IA.

Focando em performance, eficiência energética e abertura, a AMD pode se tornar a nova protagonista na corrida pela liderança em infraestruturas para IA generativa, enfrentando gigantes como NVIDIA e Intel com uma estratégia ousada e inovadora.

Exemplos de redação para convites de aniversário: Guia de mensagens de convite e dicas para cartas de agradecimento

Um CEO de 13 anos cria uma startup de agente de IA – e até universitários trabalham para ele