AMD Advancing AI 2025:Instinct MI350 系列震撼发布,推理性能提升高达 35 倍!

lin james
2025-06-13
Share :

北京时间 6 月 13 日,AMD 举办了年度人工智能盛会 ​Advancing AI 2025​,由董事长兼 CEO 苏姿丰博士领衔登场,携手高管团队、生态合作伙伴及开发者,共同展示了 AMD 在 AI 与高性能计算(HPC)领域的最新突破。

Instinct MI350 系列 GPU 重磅登场:性能全面飞跃

本次大会最重磅的发布莫过于新一代 ​AMD Instinct MI350 系列 GPU​,包括 MI350X 与旗舰款 ​MI355X​,采用全新 CDNA 4 架构 和先进的 ​3nm 工艺​,内含高达 ​1850 亿晶体管​。

关键技术参数如下:

  • 显存​:288GB HBM3E
  • 最大支持模型​:单 GPU 支持 5200 亿参数(520B)模型运行
  • AI精度支持​:FP4、FP6、FP8、FP16 等
  • 峰值性能​:
  • FP64/FP32:领先竞品 2 倍
  • FP6:超出竞品 2 倍以上
  • FP4/FP8/FP16:表现持平或略高
  • 性价比​:相比 NVIDIA B200,Tokens/\$ 提升 40%

根据 AMD 公布的实测结果,MI355X 在运行 Llama 3.1 405B 模型时:

  • 智能体性能为 MI300X 的 4.2 倍
  • 内容生成能力提升 2.9 倍
  • 摘要生成提升 3.8 倍
  • 对话式 AI 性能提升 2.6 倍

更令人瞩目的是,MI350 系列已经​提前实现了 AMD 原定五年内能效提升 30 倍的目标​,实际达到了 ​38 倍​。

构建开放、可扩展的 AI 基础设施

MI350 系列平台支持 UEC 与 ​OCP 开放标准​,提供端到端的 AI 架构能力,可支持三种大规模配置选项:

  • 128 GPU系统​:36TB HBM3E
  • 96 GPU系统​:27TB HBM3E
  • 64 GPU系统​:18TB HBM3E

该平台结合第五代 ​EPYC x86 处理器​,专为大模型训练、推理与部署而生,支持 FP4 至 FP8 各类精度任务。产品将于 2025 年 Q3 起 由合作伙伴全面推出。

下一代“Helios”架构预告:MI400 GPU + Zen 6 + Vulcano 网卡

AMD 还正式预告了下一代 ​Helios AI 机架级架构​,目标面向 2026 年部署,三大核心组件为:

  • Instinct MI400 GPU​:432GB HBM4、19.6 TB/s 显存带宽、峰值性能 40 PFLOPS(FP4)/20 PFLOPS(FP8)
  • EPYC “Venice” CPU​:基于 Zen 6 架构
  • Pensando Vulcano 智能网卡

Helios 平台致力于打造具有 高带宽、高互联、高能效 的下一代 AI 基础设施。

ROCm 7 重磅升级,全面开放 Developer Cloud

硬件之外,AMD 同步发布了新一代开源 AI 软件栈 ​ROCm 7​,在功能、兼容性和开发效率方面全面增强,带来:

  • 对主流 AI 框架更强支持
  • 更丰富的开发工具链、驱动、API 与加速库
  • 更强的硬件适配能力

同时,AMD 宣布全面开放 ​Developer Cloud​,向全球开发者和开源社区提供托管式 AI 开发平台,助力从原型验证到大规模部署的全流程开发。

这场大会不仅展示了 AMD 在硬件层面的飞跃,也体现了其在 AI 软件栈、开放生态和数据中心解决方案上的全栈布局。未来,在与 NVIDIA 和 Intel 的激烈竞争中,AMD 凭借 ​性能、能效与开放性并重的策略​,或将成为生成式 AI 基础设施领域的一匹“黑马”。