Directory
Lancio della serie GPU AMD Instinct MI350: un salto di qualità nell’IA
Infrastruttura AI aperta e scalabile con supporto UEC e OCP
Anteprima di Helios: la prossima generazione dell’infrastruttura AI per il 2026
ROCm 7: nuovo software AI open-source e apertura di Developer Cloud
Conclusione: AMD si afferma come contendente chiave nell’infrastruttura AI generativa

AMD Advancing AI 2025: la serie Instinct MI350 rivoluziona l’IA con prestazioni di inferenza fino a 35 volte superiori

lin james

2025-06-16

Il 13 giugno 2025, AMD ha tenuto il suo evento annuale Advancing AI 2025, guidato dalla Presidente e CEO Dr. Lisa Su. Insieme a dirigenti, partner e sviluppatori, AMD ha presentato importanti innovazioni nel campo dell’intelligenza artificiale (IA) e del calcolo ad alte prestazioni (HPC).

Lancio della serie GPU AMD Instinct MI350: un salto di qualità nell’IA

Il protagonista assoluto dell’evento è stata la nuova serie GPU AMD Instinct MI350, che comprende il MI350X e il modello di punta MI355X. Basata sulla nuova architettura CDNA 4 e realizzata con processo produttivo a 3nm, questa GPU integra fino a 185 miliardi di transistor, segnando un punto di svolta nell’hardware AI.

Specifiche tecniche principali:

Memoria: 288 GB HBM3E
Modello massimo supportato: fino a 520 miliardi di parametri (520B) su una singola GPU
Precisione AI: FP4, FP6, FP8, FP16
Prestazioni di picco:
FP64/FP32: 2 volte superiori rispetto alla concorrenza
FP6: oltre 2 volte più veloce
FP4/FP8/FP16: comparabili o leggermente superiori
Efficienza economica: +40% Token/\$ rispetto a NVIDIA B200

Benchmark su Llama 3.1 405B:

Prestazioni degli agenti AI: 4,2 volte superiori rispetto a MI300X
Generazione di contenuti: +2,9x
Riepiloghi di testo: +3,8x
Dialoghi AI: +2,6x

Inoltre, la serie MI350 ha raggiunto in anticipo l’obiettivo di AMD di migliorare l’efficienza energetica di 30 volte entro 5 anni, toccando un sorprendente +38x.

Infrastruttura AI aperta e scalabile con supporto UEC e OCP

La piattaforma MI350 supporta gli standard aperti UEC e OCP, offrendo una soluzione AI end-to-end progettata per il training, l’inferenza e la distribuzione di modelli di grandi dimensioni, con supporto da FP4 a FP8.

Configurazioni disponibili:

128 GPU: 36 TB HBM3E
96 GPU: 27 TB HBM3E
64 GPU: 18 TB HBM3E

Il sistema funziona in sinergia con i processori AMD EPYC di quinta generazione e sarà disponibile a partire dal Q3 2025 tramite i partner AMD.

Anteprima di Helios: la prossima generazione dell’infrastruttura AI per il 2026

AMD ha anticipato anche la sua futura architettura Helios, progettata per il deployment AI a livello di rack nel 2026. I tre componenti chiave sono:

Instinct MI400 GPU: 432 GB HBM4, larghezza di banda 19,6 TB/s, fino a 40 PFLOPS (FP4)
CPU EPYC “Venice”: basata sull’architettura Zen 6
Scheda smart Pensando Vulcano

La piattaforma Helios mira a creare una nuova generazione di infrastruttura AI con elevata larghezza di banda, interconnessione avanzata ed efficienza energetica.

ROCm 7: nuovo software AI open-source e apertura di Developer Cloud

Oltre all’hardware, AMD ha annunciato ROCm 7, il nuovo stack software open-source per l’AI, che offre miglioramenti significativi in compatibilità, strumenti di sviluppo e prestazioni.

ROCm 7 in sintesi:

Maggiore compatibilità con framework AI come PyTorch e TensorFlow
Toolchain più ricca: driver, librerie accelerate, API
Miglior supporto hardware

AMD ha anche annunciato l’apertura completa del suo Developer Cloud, una piattaforma AI gestita pensata per sviluppatori globali e la community open-source, utile dalla prototipazione alla distribuzione su larga scala.

Conclusione: AMD si afferma come contendente chiave nell’infrastruttura AI generativa

Con la nuova serie AMD Instinct MI350, l’arrivo imminente della piattaforma Helios e l’evoluzione del ROCm 7, AMD dimostra di avere una strategia AI all’avanguardia, bilanciando prestazioni, efficienza energetica e apertura.

Nel panorama altamente competitivo dominato da NVIDIA e Intel, AMD potrebbe presto emergere come un outsider di successo nel settore delle infrastrutture AI generative.

Esempi di formulazioni per inviti di compleanno: guida ai messaggi di invito e consigli per lettere di ringraziamento

Un CEO di 13 anni lancia una startup di agenti AI – e laureati lavorano per lui