主题 : 寒武纪官方详解云端 AI 芯片思元 370:采用新一代智能处理器架构 MLUarch03
千山同一月 万户尽皆春 千江有水千江月 万里无云万里天
级别: 总版主

UID: 998
精华: 0
发帖: 605059
威望: 529688 点
无痕币: 0 WHB
贡献值: 0 点
在线时间: 62640(时)
注册时间: 2008-12-25
最后登录: 2024-05-21

0 寒武纪官方详解云端 AI 芯片思元 370:采用新一代智能处理器架构 MLUarch03

11 月 3 日消息,今天,寒武纪发布第三代云端 AI 芯片思元 370、基于思元 370 的两款加速卡 MLU370-S4 和 MLU370-X4、全新升级的 Cambricon Neuware 软件栈。

▲ 寒武纪第三代云端 AI 芯片思元 370
IT之家获悉,基于 7nm 制程工艺,思元 370 是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片,集成了 390 亿个晶体管,最大算力高达 256TOPS (INT8),是寒武纪第二代产品思元 270 算力的 2 倍。
凭借寒武纪最新智能芯片架构 MLUarch03,相较于峰值算力的提升,思元 370 实测性能表现更为优秀:以 ResNet-50 为例,MLU370-S4 加速卡(半高半长)实测性能为同尺寸主流 GPU 的 2 倍;MLU370-X4 加速卡(全高全长)实测性能与同尺寸主流 GPU 相当,能效则大幅领先。

▲ 寒武纪 MLU370-S4(左)与 MLU370-X4 加速卡
思元 370 也是国内第一颗支持 LPDDR5 内存的云端 AI 芯片,内存带宽是上一代产品的 3 倍,访存能效达 GDDR6 的 1.5 倍。
同时,寒武纪全新升级了 Cambricon Neuware 软件栈,新增推理加速引擎 MagicMind,实现训推一体,显著提升了开发部署的效率,降低用户的学习成本、开发成本和运营成本。
寒武纪发布了新一代智能处理器架构 MLUarch03,拥有新一代张量运算单元,内置 Supercharger 模块大幅提升各类卷积效率;采用全新的多算子硬件融合技术,在软件融合的基础上大幅减少算子执行时间;片上通讯带宽是上一代 MLUarch02 的 2 倍、片上共享缓存容量最高是 MLUarch02 的 2.75 倍;推出全新 MLUv03 指令集,更完备,更高效且向前兼容。

▲ Supercharger 和多算子硬件融合技术
有 7nm 先进工艺和全新 MLUarch03 架构的加持,思元 370 芯片算力最高可达 256TOPS (INT8),是上一代产品思元 270 算力的 2 倍。相较于峰值算力的提升,思元 370 在实测性能和能效方面的表现更为优秀:以 ResNet-50 为例,MLU370-S4 加速卡(半高半长)实测性能为同尺寸主流 GPU 的 2 倍;MLU370-X4 加速卡(全高全长)实测性能与同尺寸主流 GPU 相当,能效则大幅领先。

▲ 7nm 先进工艺和全新 MLUarch03 架构加持,
级别: 八片秋叶

UID: 232159
精华: 0
发帖: 45283
威望: 40985 点
无痕币: 10089 WHB
贡献值: 0 点
在线时间: 807(时)
注册时间: 2014-06-03
最后登录: 2024-05-21

谢谢楼主分享,看看,了解一下。
Total 0.045535(s) query 5, Time now is:05-21 09:08, Gzip enabled 粤ICP备07514325号-1
Powered by PHPWind v7.3.2 Certificate Code © 2003-13 秋无痕论坛