作为最受市场关注的产品,MI325X与此前上市的MI300X一样,都是基于CDNA 3架构,基本设计也类似。所以MI325X更多可以被视为一次中期升级,采用256GB的HBM3e内存,内存带宽最高可达6TB/秒。公司预期这款芯片将从四季度开始生产,并将在明年一季度通过合作的服务器生产商供货。
在AMD的定位中,公司的AI加速器在AI模型创建内容或进行推理的用例中更具有竞争力,而不是通过处理海量数据训练模型。部分原因在于AMD在芯片上堆砌了更多的高带宽内存,使其能够比一些英伟达芯片表现更好。横向比较,英伟达给最新款B200芯片配置了192GB的HBM3e内存,也就是两颗B100各连接4个24GB内存芯片,不过内存带宽倒是能达到8TB/秒。
AMD掌门苏姿丰在发布会上强调:“你们能看到的是,MI325在运行Llama 3.1时,能提供比英伟达H200高出多达40%的性能。”
根据官方文件,与H200相比,具有参数优势的MI325能够提供1.3倍的峰值理论FP16(16位浮点数)和FP8计算性能。
相较于MI325X,AMD也给市场画了一个大大的“饼”——公司将在明年推出CDNA 4架构的MI350系列 GPU,除了HBM3e内存规模进一步升至288GB,以及工艺制程提升至3nm外,性能的提升也非常惊人。例如FP16和FP8性能比起刚发布的MI325高出80%。公司更是表示,与CDNA 3的加速器相比,MI350系列的推理性能将提高35倍。
页码:下一页