寒武纪7纳米AI训练芯片量产,创始人陈天石却只在朋友圈发了9个字

1.jpeg

1月21日,寒武纪在官网披露7纳米AI训练芯片思元290智能芯片及加速卡、玄思1000智能加速器相关信息,并表示该系列产品去年已经实现规模化出货。该披露信息中有几个关键词:“7nm””量产”“AI训练芯片”。网友评价寒

1月21日,寒武纪在官网披露7纳米AI训练芯片思元 290 智能芯片及加速卡、玄思1000智能加速器相关信息,并表示该系列产品去年已经实现规模化出货。该披露信息中有几个关键词:“7nm””量产”“AI训练芯片”。网友评价寒武纪太低调了,其他AI芯片大厂发布一颗7纳米芯片,得开各种发布会让全世界知道,而寒武纪只是在官网披露一下,没有任何其他动作。

异常低调的发布

《中国电子报》记者查看了寒武纪创始人陈天石的微信,他只是于昨天早上9:02分在微信朋友圈发布了一条只有9个字的信息“思元290正式亮相”,转发的是寒武纪公司公众号内容,非常低调。但这并不影响资本市场的敏感嗅觉,昨天寒武纪的股价上涨了17.73%,收报170元。随着寒武纪的训练产品线集中亮相,寒武纪从训练芯片到云、边、端等业务布局已经清晰呈现。

思元290芯片以及这些加速卡为何物?在AI芯片市场处于什么样的地位?对于寒武纪与业界有什么突破价值?

人工智能芯片有很多种分类方法:按功能来说,分为训练芯片和推理芯片;按应用场景来说,分为云端和终端芯片;按照技术架构来说,分为冯诺依曼架构和非冯架构芯片,诸如类脑芯片等。这次寒武纪推出的思元290智能芯片是其首颗训练芯片。为什么要做AI训练芯片? AI训练芯片市场有多大?其红利有多“红”?实际上,看看英伟达公司股价这些年在市场上的“一骑绝尘”,就很好理解。

随着AI算法突飞猛进的发展,越来越多的模型训练需要巨量的算力支撑,才能快速有效实施,可以说算力是人工智能应用取得突破的决定因素。目前,英伟达在全球云端训练芯片市场一家独大,其GPU+CUDA计算平台被认为是最成熟的AI训练方案。此外,还有第三方异构计算平台OpenCL+AMD GPU以及云计算服务商自研加速芯片这两种方案,全球各路芯片厂商基于不同方案,都推出了针对于云端训练的人工智能芯片。

从介绍来看,寒武纪推出的首颗训练芯片思元290,采用台积电7nm制程工艺,集成460亿个晶体管,支持MLUv02扩展架构,全面支持AI训练、推理或混合型人工智能计算加速任务。相比此前寒武纪推出的思元270芯片,思元290芯片可实现峰值算力提升4倍、内存带宽提高12倍、芯片间通讯带宽提高19倍,可提供更优性能功耗比,以及多 MLU 系统的扩展能力。

产品具有标志性意义

思元290芯片有三大关键亮点。

其一采用7纳米工艺制程。目前能够提供7纳米制程芯片的设计企业,除了海思、英伟达等,寒武纪是少数进入这个阵营的创业企业。赛迪顾问集成电路产业研究中心分析师李秧认为,其工艺水平实现7纳米制程,无论在中国还是全球都是比较领先的,而且支持训练。从技术上看是具有标志性意义的。

思元290问世,网友“无关风月”在相关新闻下评论称:“武纪真是低调,发7nm制程的芯片,居然显得如此的平静。目前英伟达的RTX 30系也才用到7nm制程工艺。”工艺越高意味着复杂度也越高,能集成的晶体管数也越多,这次思元290晶体管数超过了460亿个。

网友“无关风月”提及的英伟达RTX 30系列,是去年9月由英伟达创始人兼CEO黄仁勋在自家厨房发布(黄仁勋最近喜欢在家中厨房举行直播发布会),RTX 30基于8纳米工艺由三星代工,黄仁勋认为RTX架构是英伟达有史以来提升最大的产品迭代。

其二是寒武纪的多芯互联技术MLU-Link™。目前,算法模型复杂度在不断增加,对算力和训练的速度提出了更高的要求,为了构建更强大的计算平台,需要多芯片之间进行互联。而寒武纪最新推出的多芯互联技术,首次用在了思元290芯片上。有了这个技术,多卡矩阵就可以很轻松地链接起来。业内人士认为,每颗思元290的多芯互联总带宽能达到600GB/s,这个数据与世界上最快的卡相当。同时称,寒武纪的mlulink多芯互联技术应用起来很方便,尤其是对于算力中心,高效而简洁。据介绍,寒武纪首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超过4100万亿次每秒(4.1 PetaOPS INT4),一台玄思 1000 计算单元就足以替代一个小型传统超级计算中心。

其三是寒武纪对应用生态的支撑进一步提速。寒武纪称Neuware™提供完善的开发工具包和社区支持,帮助用户在思元290芯片上进行方便、灵活的定制开发及部署工作。

软件平台和工具链是芯片公司构建生态的必备武器,英伟达之所以能够聚集起强大的AI生态,不仅仅是因为其芯片性能强大,与其软件平台和工具链的完善息息相关。某种意义上说,英伟达的“硬实力”得益于其“软”实力,一定也不为过。

寒武纪称,其Neuware™软件栈为思元 290 芯片提供完善的软件及应用生态,支持业界主流的TensorFlow和PyTorch等深度学习框架,用户不需要改变使用习惯,即可在思元 290 芯片上实现图形图像、语音、NLP、搜索推荐等多种应用的训练和推理。

寒武纪从终端 IP 场景开始,连续推出了寒武纪1A、寒武纪1H、寒武纪1M 系列处理器,其后布局云端智能芯片及加速卡系列产品思元100和思元270,在2019 年推出基于思元 220 芯片的边缘智能加速卡。由此建立起覆盖云边端、训练、推理的产品矩阵,并打造了平台级基础系统软件Cambricon Neuware。这次发布思元290之后,寒武纪的产品布局就实现了“训推一体、端云融合”。短短几年,寒武纪就成为少数几家全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术的企业。

财报预测仍将持续亏损

此前,有机构希望邀请陈天石去大型会议做演讲,陈天石婉拒并表示目前希望专注把产品和技术做好。或许,对于芯片公司而言,产品是面对市场的核心之剑,做好产品就是最好的宣传。

寒武纪财报显示,2020年上半年营收8720.34万元,同比下降11.01%,亏损2.02亿元,其中研发费用占营收比重为318.1%,同比增加182.69%;去年前三季度营收1.58亿元,同比上涨42.97%,亏损约3.095亿元,研发费用4.33亿元,同比上涨32.78%。财报称,公司预测四季度仍将持续亏损,主要系公司目前仍属于大规模研发投入阶段。

现在是芯片企业最好的时代。埋头苦干,给出更优的产品,或许是芯片企业迎接这个时代最好的姿态。

产品图.jpg

赞 (0)
上一篇 2024年11月22日 15:14
下一篇 2024年11月22日 15:14