谷歌发布第八代张量处理单元TPU 8t与TPU 8i,首次实现训练推理任务分离,预计2026年晚些时
谷歌发布第八代张量处理单元TPU 8t与TPU 8i,首次实现训练推理任务分离,预计2026年晚些时候推出
来源: 市场资讯
当地时间2026年4月22日,谷歌在拉斯维加斯举办的Cloud Next 2026大会上发布两款第八代张量处理单元(TPU),首次将AI模型训练与推理任务拆分至不同处理器实现,两款芯片分别命名为TPU 8t与TPU 8i,预计于2026年晚些时候正式推出。
“随着AI智能体的兴起,我们认为社区将受益于分别针对训练和服务需求进行优化的芯片。”谷歌高级副总裁兼AI与基础设施首席技术专家Amin Vahdat在官方博客文章中表示。
据谷歌公开介绍,TPU 8t针对AI模型训练场景优化,可将前沿模型开发周期从数月缩短至数周,性价比较前代产品提升2.8倍;TPU 8i适配推理任务与AI智能体处理需求,单颗芯片搭载384MB静态随机存取存储器(SRAM),容量为前代Ironwood TPU的三倍,性能较前代提升80%。
谷歌自2015年起启动自研TPU项目,2018年开始向云客户出租相关芯片算力。此前有消息显示,谷歌正与芯片设计公司Marvell Technology洽谈合作开发内存处理单元及新型推理TPU,相关谈判暂未形成正式合同。

共有 0 条评论