智东西(公众号:zhidxcom)
文 | 心缘

手中无剑(jian),胜在(zai)芯。8月29日,阿里平(ping)头(tou)哥新“剑(jian)”出鞘(qiao)。

这(zhei)把新“剑”是一站式AIoT芯(xin)片设计平台,名(ming)字意同武学的至高境界——“无(wu)剑”。

现在国内造芯公司起名越来越讲究(jiu)引(yin)经据典(dian),华(hua)为几乎承包了《山海经》,紫光新芯片取(qu)名为古代皇帝赐(ci)予大臣的(de)第六种(zhong)礼器“虎贲”,如今阿里平头哥的(de)“无(wu)剑”典(dian)出金庸武侠小说。

话(hua)说独孤(gu)求败(bai)40岁(sui)前使用(yong)玄铁重剑(jian),40岁(sui)后(hou),“草木(mu)竹石均可为剑(jian),渐进于无剑(jian)胜有(you)剑(jian)之境(jing)。”

这正是平头(tou)哥(ge)对无剑(jian)平台寄予的厚望(wang),没有芯(xin)片,但却能帮(bang)各类芯(xin)片设计企(qi)业锻就芯(xin)片。

阿里平头哥芯片设计平台“无剑”出鞘!成本周期压缩至50%,解密三大硬核实力

按(an)照平(ping)头哥(ge)的介绍,该平(ping)台能(neng)帮助芯片设计企业(ye)(ye),将设计成本和设计周期压缩(suo)50%,显著(zhu)降(jiang)低定制化芯片的研(yan)发门槛,降(jiang)低效率、提升质量,让企业(ye)(ye)能(neng)更加专注于开发出与应用场景更好融合的芯片产品。

同日,基(ji)于平(ping)头(tou)哥自研玄铁CPU的无(wu)剑(jian)视(shi)(shi)觉AI平(ping)台问世,已应用到媒(mei)体AI芯片、AI视(shi)(shi)觉芯片、边缘AI服务器芯片等IoT产品中。

发(fa)布会(hui)期间,平头哥发(fa)言人不仅详细解(jie)读(du)无剑平台的三大硬核实(shi)力和亮点,解(jie)答(da)无剑如何(he)与(yu)阿里云实(shi)现云端(duan)协同(tong),而且就(jiu)AI芯片(pian)发(fa)展(zhan)现状、AIoT时代对芯片(pian)研(yan)发(fa)的挑战、阿里平头哥在(zai)未来产业扮演的角色等问题(ti)一一回应(ying)。

经透(tou)露,无剑平台采(cai)用的是授权模式(shi),不(bu)排除未来开源的可能。

另外,在云端,平头哥自研的第一款NPU芯片(pian)也将于今年发布,其性能处于业界领先定位,主要用(yong)于阿里(li)云数据(ju)中心。

一、无剑的三大硬核能力

无剑平台(tai)由SoC架构、处理器、各类IP、操作系统(tong)、软件驱动和开发工(gong)具等模块构成,支持第(di)三(san)方AI加速引擎,并(bing)包(bao)含AI必须的基(ji)础软件体系。

它能(neng)提供集芯(xin)片(pian)架构、基(ji)础软(ruan)件(jian)、算法与开发工等一体的整体解决方案,能(neng)够承担AIoT芯(xin)片(pian)约80%的通(tong)用设计工作(zuo)(zuo)量,让芯(xin)片(pian)研发企业只需专(zhuan)注于剩余(yu)20%的专(zhuan)用设计工作(zuo)(zuo)。

1、硬件:异构AI加速引擎框架

为了充分发挥各种(zhong)不(bu)同硬件的(de)效能,平头(tou)哥(ge)打(da)造了一个多场景灵活可配置的(de)异构AI加(jia)速引擎框(kuang)架,允许用(yong)户(hu)自定义(yi)。

平头哥(ge)提(ti)供神经网络加(jia)速库及(ji)异(yi)构编译器技(ji)术,向芯片厂(chang)商提(ti)供多粒度的(de)硬件(jian)抽象(xiang)接(jie)口。

无论是低(di)功(gong)耗低(di)成(cheng)本的(de)语音芯(xin)片,还是高性能低(di)时延(yan)的(de)视(shi)觉芯(xin)片,芯(xin)片厂商可(ke)以根据各种硬件特征,快速对接到AI加速引擎,高效地发挥硬件性能。

该引擎支持当(dang)前所(suo)有主流(liu)框(kuang)架,几乎(hu)所(suo)有的(de)标准模型都能够(gou)在上面一键部署(shu);它也提供一套便(bian)捷(jie)的(de)自定义(yi)层开发接口,方(fang)便(bian)开发者(zhe)多样(yang)化需求。

2、应用开发:标准统一的开发框架

平(ping)头哥开发(fa)了一套标(biao)准统一的(de)应(ying)(ying)用开发(fa)框架,同一个(ge)应(ying)(ying)用可以在(zai)不同算力的(de)硬件上(shang)进行无缝迁移。

据悉,平头哥集成开发(fa)环境完(wan)美融合该(gai)引擎(qing),并添加一(yi)键部署、图形化(hua)算(suan)力分析、异(yi)构(gou)多核联合调试等功能(neng),解(jie)决(jue)实(shi)际开发(fa)过程中最困难的问题。

根(gen)据其实际客户(hu)开(kai)发数据的(de)统计,整个(ge)软(ruan)件框(kuang)架(jia)可为芯片厂(chang)商(shang)节省60%的(de)AI基础软(ruan)件开(kai)发成本(ben),缩短(duan)方案(an)厂(chang)商(shang)50%的(de)应用(yong)开(kai)发时间。

3、基础软件:对接丰富资源

软(ruan)件(jian)(jian)工具(ju)(ju)链是(shi)基础软(ruan)件(jian)(jian),是(shi)芯片推广过程(cheng)中必(bi)不可少的工具(ju)(ju),软(ruan)件(jian)(jian)工具(ju)(ju)链的优(you)劣很大程(cheng)度上决定(ding)着芯片被使用的概率(lv)。

由于基础软(ruan)件商业变(bian)现难,通常不(bu)被(bei)产品(pin)公司重视。

软件生(sheng)态是开发(fa)者能(neng)够获取资源的一个大(da)环(huan)境,开发(fa)者总是愿意(yi)采用生(sheng)态好(hao)、资源丰(feng)富的AI芯片产品。

二、视觉平台已落地,玄铁910是主控CPU

此次(ci)发(fa)布的无剑视觉AI平台(tai),主要面向(xiang)视觉AI场景,会根据客户需求持(chi)续升级。

近(jin)期发布的RISC-V处(chu)理器(qi)玄(xuan)铁(tie)910,是无(wu)剑视觉AI平(ping)台的主控(kong)CPU。

玄铁910与芯(xin)片(pian)设计公(gong)司(si)自研的(de)AI加(jia)速(su)引擎形成高(gao)性能异构(gou)计算的(de)完整方案。

这一视觉平台的其他性能有:最(zui)大(da)存储带(dai)宽400Gbps,单通道PCIE接口带(dai)宽16Gbps,可支(zhi)持16TOPS以下(xia)的边缘侧AI计算需求。

据(ju)介绍(shao),该平台已(yi)应(ying)用到(dao)多媒体AI芯片、AI视觉芯片、边(bian)缘AI服务器芯片等(deng)多家IoT厂商的(de)产品(pin)中。

无剑平台同时(shi)对IP公司(si)开放(fang),吸纳全球最有竞(jing)争力(li)的IP产品(pin)与无剑平台进(jin)行原型流(liu)片验(yan)证,已(yi)经(jing)过硅(gui)验(yan)证,并且(qie)已(yi)在阿里(li)内部和多(duo)家客户的芯片产品(pin)中得到应用。

未来,无剑平台还将面(mian)向(xiang)MCU、工(gong)业、安全(quan)、车载、接入等应用领域开发基础设施及周边技(ji)术,持(chi)续推出(chu)面(mian)向(xiang)领域的SoC平台。

三、无剑如何将设计成本和周期各砍一半?

无剑(jian)能(neng)将设计成(cheng)本和周期(qi)分别降低50%,主要来源于两(liang)个(ge)方(fang)面(mian):

第一,平台化(hua)的(de)(de)设计方法让IP能够很快的(de)(de)接(jie)入到系统,大(da)幅降低IP支持成本,IP的(de)(de)价格将大(da)幅下降。

第二,通过硬件(jian)平台化(hua)和(he)软件(jian)平台化(hua)的思(si)路,研发上(shang)面(mian)的人(ren)力投(tou)入大幅(fu)降低。综合来讲,设(she)计(ji)成本有望降低50%。

平台化的(de)思路,是指减少芯(xin)片设计(ji)过程中的(de)重复性(xing)的(de)投入(ru),50%以上(shang)的(de)设计(ji)验(yan)证工作是可以消除(chu)的(de)。

另外,如(ru)果平台的(de)各种模拟IP与代(dai)工厂工艺(yi)已经完成了(le)验证,可以(yi)跳过3个月以(yi)上(shang)的(de)试(shi)生产(MPW)的(de)阶段,直接进入量产,通常芯片从设计到(dao)量产的(de)时间可以(yi)达(da)到(dao)9个月以(yi)内。

“敏捷(jie)设计(ji)是(shi)下一(yi)(yi)阶段芯(xin)片(pian)设计(ji)领域发展的重点方向,”清华大学微(wei)电子所副所长、清微(wei)智能创始人尹首一(yi)(yi)教(jiao)授(shou)表示,“软硬(ying)件(jian)深(shen)度融(rong)合的有行(xing)业特点的芯(xin)片(pian)平(ping)台让芯(xin)片(pian)设计(ji)公司省去很多(duo)底层的芯(xin)片(pian)开发工(gong)作,更(geng)加(jia)专注于产品定(ding)义与核心技(ji)术(shu)本身,形成(cheng)差(cha)异化(hua)的芯(xin)片(pian)产品,提(ti)升市场竞争力(li)。”

四、端云协同,能天然接入阿里云

AIoT在线智能的特点,需(xu)要端云(yun)协同来实现。

所谓端(duan)云(yun)协同,是指(zhi)在下(xia)一代(dai)芯片开(kai)发时,仅要考虑到(dao)端(duan)上的(de)计算(suan)能力,还要考虑云(yun)上的(de)能力。

例如,AI芯片(pian)的网络(luo)模型需与云端频繁互(hu)动,需要从芯片(pian)底层到操作(zuo)系统方面的架构(gou)支持(chi)。

平(ping)头哥(ge)隶属于阿(a)里云(yun)智能,根(gen)据阿(a)里云(yun)业务场(chang)景进行云(yun)端一体架(jia)构的探索与(yu)尝(chang)试。

无(wu)剑AI芯片平(ping)台(tai)的(de)端(duan)云一体,是(shi)平(ping)头哥软硬件基(ji)础能力的(de)体现(xian),体现(xian)在围绕(rao)云计算的(de)场景(jing)中,端(duan)侧设备具有实(shi)时与云端(duan)应用互动的(de)能力。

基于平头哥芯(xin)片平台(tai)的产品(pin)能天(tian)然接(jie)入阿里(li)云,与云端应用生态对(dui)接(jie)后将形(xing)成新的产品(pin)形(xing)态。

五、“平头哥”模式与阿里的芯片定位

阿里平头哥芯片设计平台“无剑”出鞘!成本周期压缩至50%,解密三大硬核实力

平头哥的长远(yuan)目标(biao),是做AIoT时代芯(xin)片(pian)基础设(she)施提供(gong)者,为了接(jie)近这(zhei)个“小目标(biao)”,它提出了芯(xin)片(pian)设(she)计的“平头哥模式”:

以无剑平(ping)台为核心(xin),从芯(xin)片(pian)到应用(yong)全(quan)栈开放集(ji)成(cheng),实现处理器、算(suan)法、操作系统等软硬件核心(xin)技(ji)术的深(shen)度(du)融合(he),打破传统通用(yong)芯(xin)片(pian)时代(dai)IP授权商用(yong)模(mo)式成(cheng)本(ben)高(gao)、使用(yong)难、周期长的局限,为企业提供(gong)从芯(xin)片(pian)到应用(yong)的全(quan)栈技(ji)术能(neng)力。

简而言之,平头(tou)哥模式(shi)具有三大(da)特点:全栈、开放、被集成。

它(ta)的(de)优势很明显:一是(shi)IP、系统芯片(pian)设(she)计经验丰(feng)富,在处理(li)器(qi)领(ling)域有(you)充足话语权;二是(shi)有(you)钱(qian),也愿(yuan)意长期砸钱(qian)、砸人才;三是(shi)整合丰(feng)富的(de)生(sheng)态资源(yuan),通(tong)过构建平台(tai),降低芯片(pian)设(she)计门槛。

这与阿里在(zai)芯片上的定(ding)位一致,即做好芯片行业(ye)的基础设(she)施。

处理(li)器(qi)是(shi)所有高端(duan)系(xi)统(tong)芯片(pian)都(dou)需要的产(chan)品(pin),是(shi)最核(he)心的基础设(she)施产(chan)品(pin),阿(a)里(li)将(jiang)投入重金打造好技术,同时构建应用生(sheng)态(tai)。

除了处理器以外(wai),阿里还将继续开发操作系统、软硬件融合的(de)(de)算(suan)法、核心的(de)(de)IP等,将这些共性的(de)(de)技术能够做(zuo)好、做(zuo)精、做(zuo)出竞争力(li)。

当(dang)然,大目标是(shi)要形成生态,然后开放给(ji)他们的芯(xin)片设(she)计,使之(zhi)基(ji)于高质量(liang)的基(ji)础设(she)施(shi)打(da)造芯(xin)片产(chan)品(pin),以提(ti)升(sheng)整体的产(chan)业竞争力。

六、芯片设计进入3.0时代

平(ping)头哥半导体研究员孟建熠认为,芯片设计方法正在(zai)进入新(xin)的(de)3.0时(shi)代(dai)。

阿里平头哥芯片设计平台“无剑”出鞘!成本周期压缩至50%,解密三大硬核实力

1.0时(shi)代(dai)从1990至2000年,芯(xin)(xin)片(pian)设(she)计(ji)基(ji)于ASIC流程进行,每次研发新(xin)芯(xin)(xin)片(pian)都需从电路开始重新(xin)设(she)计(ji)。

2000年后进入2.0时代(dai),基于IP的(de)模(mo)块(kuai)化(hua)的(de)设(she)计方法,降(jiang)低了芯片的(de)开发成(cheng)本和设(she)计风险。

AIoT市(shi)场(chang)具有强应用(yong)驱动、场(chang)景碎片化等特征,随着AIoT应用(yong)发展如火如荼,需要(yao)更(geng)加高效的设计方法(fa)。

由此,芯片设计进入(ru)3.0时代(dai),在基础(chu)框架/模板(ban)基础(chu)上,定制符合应用需求的(de)芯片产品,以最快速度推向精准市场。

据(ju)国际数(shu)据(ju)公(gong)司IDC预测,到(dao)2025年,全球(qiu)联(lian)网的(de)IoT设(she)备将(jiang)达到(dao)416亿(yi)台,这些端上设(she)备将(jiang)产生的(de)数(shu)据(ju)量是(shi)79.4ZB,相当于9万亿(yi)部时(shi)长2小时(shi)的(de)高清电影(ying)。

Gartner预测,其中80%的IoT设备将由(you)AI加(jia)持。

在摩尔定律(lv)时(shi)代,芯(xin)片研发(fa)追求通(tong)用性(xing),比工艺、比投入。

在后摩尔定律时(shi)代(dai),碎片化(hua)的(de)AIoT场景对芯(xin)片的(de)要求更多在于市场灵(ling)敏度,芯(xin)片研(yan)发比(bi)的(de)是(shi)需求适(shi)配(pei)和(he)成本(ben)。

传统通用芯片设计(ji)方式(shi)往往太(tai)重,成本投(tou)入高、设计(ji)周期(qi)长(zhang),很(hen)难适应未来AIoT市场小批量(liang)、定(ding)制化(hua)的需求。

很多SoC设(she)计(ji)方法(fa)虽(sui)然效率(lv)较ASIC设(she)计(ji)方法(fa)有很大提(ti)升,但从IP到(dao)系统集成验证、再到(dao)软件调(diao)试过程,依然耗(hao)时耗(hao)成本。

无剑芯片平台正是针对这(zhei)一痛点,试图提供全(quan)新的、更加(jia)高效的设计方法学。

这只是平(ping)(ping)头(tou)(tou)哥(ge)野心的(de)初步成果,平(ping)(ping)头(tou)(tou)哥(ge)的(de)雄伟目标,是以生态营造者(zhe)的(de)角色,引领(ling)芯片3.0时代(dai)。

结语:AIoT芯片或进入更快落地潮

算力(li)是推动(dong)AI产业发(fa)展的(de)重要动(dong)力(li),而在智(zhi)能应用不断快速(su)裂变的(de)今时今日,所有芯片都面临着(zhe)升级。

近年来,传统芯(xin)片公(gong)司(si)、互联网公(gong)司(si)、AI芯(xin)片创企(qi)和算(suan)法公(gong)司(si)纷纷投入AI芯(xin)片的浪(lang)潮之中,开发出满足(zu)自身或市(shi)场(chang)需求的AI芯(xin)片。

AI芯(xin)(xin)片的(de)第一波(bo)浪潮已(yi)经过去,很多产品正(zheng)面临着市场严酷(ku)的(de)考验,大浪淘沙,缺乏应用场景的(de)AI芯(xin)(xin)片将被(bei)市场淘汰。

而随着像无剑这样的(de)一体式芯片设计平台的(de)普及,很多(duo)中小型的(de)设计公(gong)司可(ke)以根据应(ying)用(yong)快速定制出(chu)芯片产(chan)品,形成(cheng)“快鱼(yu)吃慢鱼(yu)”的(de)格局(ju)。

AIoT产(chan)业(ye)或(huo)许(xu)将呈(cheng)现(xian)更(geng)欣(xin)欣(xin)向荣的(de)定制化芯片落地浪潮。