XXAI LogoXXAI

AMD Advancing AI 2025: la serie Instinct MI350 rivoluziona l’IA con prestazioni di inferenza fino a 35 volte superiori

lin james
2025-06-16
Share :

Il 13 giugno 2025, AMD ha tenuto il suo evento annuale ​Advancing AI 2025​, guidato dalla Presidente e CEO Dr. Lisa Su. Insieme a dirigenti, partner e sviluppatori, AMD ha presentato importanti innovazioni nel campo dell’intelligenza artificiale (IA) e del ​calcolo ad alte prestazioni (HPC)​.

Lancio della serie GPU AMD Instinct MI350: un salto di qualità nell’IA

Il protagonista assoluto dell’evento è stata la nuova ​serie GPU AMD Instinct MI350​, che comprende il MI350X e il modello di punta ​MI355X​. Basata sulla nuova architettura CDNA 4 e realizzata con processo produttivo a 3nm, questa GPU integra fino a ​185 miliardi di transistor​, segnando un punto di svolta nell’hardware AI.

image.png

Specifiche tecniche principali:

  • Memoria​: 288 GB HBM3E
  • Modello massimo supportato​: fino a 520 miliardi di parametri (520B) su una singola GPU
  • Precisione AI​: FP4, FP6, FP8, FP16
  • Prestazioni di picco​:
  • FP64/FP32: 2 volte superiori rispetto alla concorrenza
  • FP6: oltre 2 volte più veloce
  • FP4/FP8/FP16: comparabili o leggermente superiori
  • Efficienza economica​: +40% Token/\$ rispetto a NVIDIA B200

image.png

Benchmark su Llama 3.1 405B:

  • Prestazioni degli agenti AI​: 4,2 volte superiori rispetto a MI300X
  • Generazione di contenuti​: +2,9x
  • Riepiloghi di testo​: +3,8x
  • Dialoghi AI​: +2,6x

Inoltre, la serie MI350 ha raggiunto in anticipo l’obiettivo di AMD di migliorare l’efficienza energetica di 30 volte entro 5 anni, toccando un sorprendente +38x.

image.png

Infrastruttura AI aperta e scalabile con supporto UEC e OCP

La piattaforma MI350 supporta gli ​standard aperti UEC e OCP​, offrendo una soluzione AI end-to-end progettata per il ​training, l’inferenza e la distribuzione di modelli di grandi dimensioni​, con supporto da FP4 a FP8.

Configurazioni disponibili:

  • 128 GPU​: 36 TB HBM3E
  • 96 GPU​: 27 TB HBM3E
  • 64 GPU​: 18 TB HBM3E

Il sistema funziona in sinergia con i processori AMD EPYC di quinta generazione e sarà disponibile a partire dal Q3 2025 tramite i partner AMD.

image.png

Anteprima di Helios: la prossima generazione dell’infrastruttura AI per il 2026

AMD ha anticipato anche la sua futura architettura ​Helios​, progettata per il deployment AI a livello di rack nel 2026. I tre componenti chiave sono:

  • Instinct MI400 GPU​: 432 GB HBM4, larghezza di banda 19,6 TB/s, fino a 40 PFLOPS (FP4)
  • CPU EPYC “Venice”​: basata sull’architettura Zen 6
  • Scheda smart Pensando Vulcano

La piattaforma Helios mira a creare una nuova generazione di infrastruttura AI con ​elevata larghezza di banda, interconnessione avanzata ed efficienza energetica​.

image.png

ROCm 7: nuovo software AI open-source e apertura di Developer Cloud

Oltre all’hardware, AMD ha annunciato ​ROCm 7​, il nuovo stack software open-source per l’AI, che offre miglioramenti significativi in compatibilità, strumenti di sviluppo e prestazioni.

ROCm 7 in sintesi:

  • Maggiore compatibilità con framework AI come PyTorch e TensorFlow
  • Toolchain più ricca: driver, librerie accelerate, API
  • Miglior supporto hardware

AMD ha anche annunciato l’apertura completa del suo ​Developer Cloud​, una piattaforma AI gestita pensata per sviluppatori globali e la community open-source, utile dalla ​prototipazione alla distribuzione su larga scala​.


Conclusione: AMD si afferma come contendente chiave nell’infrastruttura AI generativa

Con la nuova ​serie AMD Instinct MI350​, l’arrivo imminente della piattaforma Helios e l’evoluzione del ​ROCm 7​, AMD dimostra di avere una ​strategia AI all’avanguardia​, bilanciando ​prestazioni, efficienza energetica e apertura​.

image.png

Nel panorama altamente competitivo dominato da NVIDIA e Intel, AMD potrebbe presto emergere come un ​outsider di successo nel settore delle infrastrutture AI generative​.