谷歌发布第七代TPU:192GB内存领跑AI推理时代
2025年4月10日,谷歌在拉斯维加斯Cloud Next大会上正式推出第七代TPU芯片Ironwood。这款被官方称为"迄今最强"的AI加速器以突破性的硬件配置和能效表现,重新定义了生成式人工智能的计算边界。
在性能参数方面,Ironwood单芯片峰值算力达到4614 TeraFLOPS,较前代产品提升近5倍。其搭载的192GB高频宽内存容量实现跨越式升级,配合7.4Tbps带宽设计,可支持千亿参数级大模型训练需求。通过创新的芯片间互连技术,双向传输带宽提升至1.2Tbps,大幅优化多芯片协作效率。
该芯片的扩展性设计突破了传统算力集群限制,支持由9216个液冷芯片组成的超级计算阵列,总算力峰值突破42.5 ExaFLOPS。这个数值相当于当前全球最强超算El Capitan的24倍,配合接近10兆瓦的集群供电系统,为复杂AI推理任务提供可持续的算力支撑。
针对实际应用场景,谷歌特别优化了推理模型的运行效率。通过硬件层面整合HBM高带宽存储架构,Ironwood在运行多模态大模型时,数据存取速度提升4.5倍,能耗却降低至前代产品的50%。这种能效优势使企业客户在处理实时语义分析、智能决策等场景时,综合运营成本可下降约30%。
目前谷歌云已开放256芯片和9216芯片两种集群配置,配合自研的Pathways软件生态,开发者可利用数万块TPU芯片的协同计算能力。随着Ironwood的量产部署,全球AI基础设施正式迈入"推理优先"的新阶段,为下一代自主决策型人工智能的商用落地奠定硬件基石。
下篇:暂无
踩一下[0]
顶一下[0]