智东西(公众号:zhidxcom)
作者 | 心缘
编辑 | 漠影
智东西8月24日报道,在今日举办的2022 RISC-V中国峰会上,平头哥半导体副总裁孟建熠公布了阿里平头哥的最新“造芯”力作——无剑600。
这次,平头哥发的不是芯片,而是一个高性能RISC-V芯片设计平台。它(ta)一(yi)方面帮助芯片公司(si)(si)降(jiang)低(di)开发芯片成(cheng)本和风险,另一(yi)方面向第三(san)方IP和基(ji)础软(ruan)件公司(si)(si)开放,让更多资源接入到RISC-V生态。
“无剑”是剑法(fa)的(de)至(zhi)高境(jing)界,也寄予了平头哥的(de)雄心:通过“授人以渔”,提供软硬件全栈支持,显著缩(suo)短(duan)芯(xin)片(pian)从研发到量产的(de)时间,推动(dong)更多(duo)面向不同行(xing)业的(de)高性能(neng)RISC-V芯(xin)片(pian)出(chu)现。
更重要的(de)是,它将长期(qi)活跃于(yu)终端市场的(de)RISC-V芯(xin)片,送上了通往高性(xing)能的(de)高速列车。
据孟(meng)建熠(yi)分享,无剑600已经实(shi)现与国产(chan)开源(yuan)云端(duan)操(cao)作(zuo)系统龙蜥的适配,并成功运行(xing)了大(da)型桌面级软件和基于JAVA的应用。
一、“平台+SoC原型”双剑出鞘,突围高性能
近年起势迅猛的RISC-V,与x86、Arm一起,被业界并称为「三大CPU主流架构」。
因开源(yuan)开放、灵活、低功耗(hao)等特性,RISC-V具(ju)备没有历史(shi)包袱、没有高昂授权费用、开发成本更低、无需担忧(you)“断供”风(feng)险等优势,被视作(zuo)发展自主可控本土芯片(pian)生态的关键路径之一。
平头(tou)哥在做的(de)事,就是通过软硬件研发投入(ru)和生态(tai)连接(jie),推(tui)动国内RISC-V生态(tai)快速壮大(da)。
今天发布的无剑600,便意在于此(ci)。
无剑600是一个高性能RISC-V异构芯片的软硬件全栈平台,拥有高性能、高内存带宽、异构计算、人工智能(AI)加速的特点,同时(shi)兼(jian)具高安全、多模态感知(zhi)和软硬(ying)一(yi)体的能(neng)力。

▲无(wu)剑600平台设计图
借助该平台,开发者和企(qi)业能够快(kuai)速开发性能更高(gao)、主(zhu)频更高(gao)、内存更大、边缘(yuan)AI计算(suan)能力更强的SoC芯片。
无剑(jian)600的(de)(de)默认处(chu)理器是(shi)玄(xuan)铁(tie)C910,即平头(tou)哥在2019年(nian)发布的(de)(de)主(zhu)频2.5GHz的(de)(de)高性能RISC-V核。
这将RISC-V的商用性能,从1GHz推向2GHz。
有何意义?孟建(jian)熠打个比方(fang),假如将(jiang)RISC-V比作跳高运动(dong),原来只能(neng)跳1米(mi)高度,现在能(neng)稳定跳2米(mi)以上,突(tu)破了RISC-V性(xing)能(neng)的极限。
在AI加速方面,无剑600平台中,最新版的玄铁C910集成了矢量Vector处理器,支持FP16等新型数据类型,并可提供高达4TOPs的Int8 AI算力,方便AI加速类应用的开发。
无剑600平台还重点实现了CPU+XPU异构架构设计,从运行功耗、内存带宽和软件栈方面都进行了优化,并支持适配GPU、NPU、VPU、DSP、ASIC等多种不同功能的第三方IP。
也就是说,半导体IP公司可以用无剑600来打造RISC-V整体生态上的能力,下游厂商进入了系统级、体系化的框架,可更高效地开发芯片(pian)。
平头哥基于无剑600平台成功“打样”——SoC原型曳影1520。
▲SoC原型(xing)曳影1520
这是一颗多模态AI处理器SoC,内(nei)置4核(he)玄(xuan)铁C910,最高(gao)(gao)吞(tun)吐率4266MT,AI峰值算力达到4TOPS,支持全链路安全防护,具有4K视频(pin)处理能力,同时包含丰富的异构计算和高(gao)(gao)速IO资源,软硬件都已完(wan)成应用的适(shi)配。
开(kai)发(fa)者和(he)企(qi)业也可以在(zai)(zai)定制个性化(hua)芯片的同(tong)时,先在(zai)(zai)曳(ye)影1520上(shang)开(kai)发(fa)自(zi)己的系(xi)统,缩短(duan)产(chan)品(pin)从研发(fa)到量产(chan)上(shang)市的时间(jian)。
二、给软硬协同打个样!用RISC-V芯片跑大型桌面级软件
RISC-V芯片的(de)参数迈进了高(gao)性能的(de)大门,下一(yi)步,就是(shi)考察实际跑应用的(de)表现。
在曳影1520上,平头哥与龙蜥社区、中科院软件所PLCT实验室,联合打造从芯片平台到龙蜥操作系统、再到上层应用软件的全链路能力,已首次实现龙蜥Linux操作系(xi)统的(de)兼容。
▲基于龙蜥(xi)Linux OS的(de)软硬件(jian)全栈平(ping)台
这(zhei)进一(yi)步拓展了RISC-V生态想(xiang)象(xiang)力(li)。
龙蜥操作系统(Anolis OS)是一款基于(yu)Linux的国产主流(liu)开源云计(ji)算操作系统,定位于(yu)服务器端,支持多种主流(liu)芯片(pian)架(jia)构和计(ji)算场景。
因其(qi)丰富(fu)、复(fu)杂的软件栈,龙蜥对芯片(pian)的要求非常高,此前在x86、Arm架(jia)构上都经过了全(quan)(quan)面验证。这一(yi)次(ci),龙蜥首次(ci)对RISC-V提供全(quan)(quan)面支持。
曳影1520帮助RISC-V架构搭载更重的操作系统和应用,完成了3000多个基础组件的适配,并首次运行FireFox浏览器、LibreOffice等大型桌面级软件,以及Hexo和Open Rocket等基于NodeJS和JAVA的应用,这为(wei)更大型应用程序的适配奠定了(le)基础。
▲图(tu)说(shuo):无(wu)剑600平台已适配龙蜥(xi)OS,并首(shou)次运行(xing)LibreOffice Writer/Impress/Calc等桌(zhuo)面级软(ruan)件
这是无剑600平台的(de)一(yi)小步,但是RISC-V的(de)一(yi)大步。
全栈适配龙蜥,印证了(le)无剑600平(ping)台能够适配主流云计算操作系统,并凸显了(le)RISC-V可面向特(te)定领(ling)域及应用进(jin)行深度(du)定制化的软硬联合优化能力。
当(dang)前,无(wu)(wu)剑600平(ping)台针对(dui)的(de)市场主要包括平(ping)板、智(zhi)慧(hui)大屏、智(zhi)能NVR、AR/VR和低(di)速UGV等这类高(gao)性(xing)能旗舰级的(de)产品(pin),也支持医疗成像、视频会议(yi)、家用(yong)机器(qi)人、无(wu)(wu)人机等中高(gao)端应用(yong)。
基(ji)于无剑(jian)600平台现(xian)已能运行龙蜥社区的(de)多种云上(shang)应(ying)用,OpenJDK、NodeJS、Python等上(shang)游社区常见应(ying)用,以(yi)及NCNN等AI应(ying)用。
三、夺榜权威AI基准测试,RISC-V架构创新加速端侧AI计算
实现高性能RISC-V芯片,非常考验芯片设计团队的功底,尤其体现在算力与内存、功耗、成本等多方面之间(jian)的平衡把(ba)握上(shang)。
孟建熠告诉智东西,如今下游合作伙伴已经不仅仅满足于一个硬件IP核,而更加看重软硬件能否很好融合、在稳定性和性能上都做出优势,这些需求的变化正推动市场往软硬件全栈方案发展。
以无剑600平台为例,从RISC-V处理器(qi)的指令(ling)设计(ji)、微架构(gou)实现、工具链和(he)底层库的优(you)化、操作(zuo)系统(tong)优(you)化适配,到(dao)应用的联合调优(you),平头哥(ge)团队都做了大量艰苦的研(yan)发工作(zuo),才在技(ji)术软件上(shang)达(da)到(dao)基本稳(wen)定(ding)的量产水(shui)平。
打磨好这些基本功(gong)后,还要配置专业的团队,对特定应用领域所需的功(gong)能进行锤炼。
作为高性能RISC-V处理器的先行者,平头哥当前的策略是通用计算和DSA(领域专用架构)并行演进。
AI加速是当前一大主流DSA方向。随着AI计算在端侧应用愈发普及,AI开发友好性正成为芯片的一大核心竞争力。国内很多硬件加速器已经能(neng)做到较高的性能(neng),但(dan)输在“用不起来”。
而RISC-V的(de)开放性,使(shi)其相较于Arm芯片有更大(da)的(de)底层(ceng)创(chuang)新(xin)和(he)扩展(zhan)空间,能设计出(chu)更适合跑AI算法(fa)的(de)系统(tong),并能兼顾到不断推陈出(chu)新(xin)的(de)AI算法(fa)对(dui)灵活可扩展(zhan)性的(de)要求。
平头哥正通过矢(shi)量(liang)扩(kuo)展和全链(lian)路(lu)软硬(ying)件能力的提升(sheng),持续优化其RISC-V处理器的AI加速能力。
今年4月,权威AI基准测试MLPerf Tiny V0.7推理性能榜单显示,基于平头哥RISC-V处理器的软硬件联合优化方案,在视觉唤醒、图像分类、语音唤醒、异常监测等4个典型端侧AI任务中均取得第一,遥遥领先于第二名。
▲平(ping)头哥在MLPerf Tiny V0.7测试(shi)拿(na)下4个第一
平头哥近两年也在力推为RISC-V准备的AI部署工具HHB,它支持各(ge)种类型的(de)模型和算法,通过更好地实现AI算子与硬件的(de)适配,帮助开(kai)发者完成AI模型的(de)高效编译(yi)及部署。
据孟建熠观察,对(dui)于1TOPs以下的(de)端侧AI算(suan)力需(xu)(xu)求,平(ping)头哥现(xian)有的(de)RISC-V处(chu)理器(qi)(qi)足(zu)以胜任,不需(xu)(xu)要再(zai)额外加专用加速器(qi)(qi);对(dui)于超过1TOPs的(de)算(suan)力需(xu)(xu)求,平(ping)头哥既提供(gong)基于RISC-V的(de)扩(kuo)展,也支持用户自定义的(de)第三(san)方AI加速IP。
例如在过去两年,平头哥与Imagination在GPU和AI方面进行深度合作,已经能提供硬件IP到优化的软硬件异构计算方案。这也是RISC-V领域最成(cheng)熟的可量产的方(fang)案(an)。
四、推动生态形成合力,三分天下有其一
孟建熠分享说,未来RISC-V将向3个必然趋势演进:高性能、软硬件全栈、更广的生态合作。
如(ru)何构建(jian)更加繁荣的生态?俨然是当(dang)前(qian)RISC-V领域最核心的议题。
“统一形成好的生态,是大家做RISC-V的共识。”孟建熠谈道,RISC-V不是其它架构的革命者,当务之急是证明自己能够成长起来,发展出自己的特色,真正成为“三分天下有其一”的架构。
RISC-V处理器的作战阵地,正从中(zhong)低端(duan)IoT市场(chang)(chang),扩展对高(gao)性能、可靠性有更高(gao)要求的云计算、边缘计算、车载(zai)智(zhi)能计算等应用场(chang)(chang)景。
过去一年,全球RISC-V生态进展飞速,并出现很多标志性事件:在IoT(物联网)领域的应用规模超过100亿颗,中国公司的出货量占到50%;SPECint性能首次超过10分,进入高性能计算的行列。
平头哥也收获了显赫的战绩:玄铁处理器已成为国内RISC-V领域影响力和市占率最大的处理器,广泛应用于MCU、蓝牙、无线、语音、视觉等30多类场景,授权数以每年50%的数量增长。
但(dan)相比(bi)Arm逾(yu)2000亿颗(ke)芯片的(de)出货量、几乎圈(quan)入全球主流科技公司的(de)成熟生(sheng)态(tai),RISC-V在应用规模、行业渗透率、生(sheng)态(tai)多样性上(shang),都还(hai)有很长的(de)路要走。
在平头哥生态副总裁杨静看来,应用和软件,对于整(zheng)个RISC-V生态的发展至为关(guan)键。
这(zhei)也是平(ping)头哥(ge)打造无剑600平(ping)台(tai)的用(yong)意所在,通(tong)过打牢软硬件(jian)全栈地(di)桩和(he)联通(tong)更多的第三方(fang)IP,让企业能基(ji)于RISC-V开发出(chu)满(man)足其(qi)特(te)定应(ying)用(yong)需求的高性能稳(wen)定可靠的SoC芯片产品。
平头哥已实现RISC-V与Anolis、AliOSThings、FreeRTOS、RT-Thread、Linux、安卓等操作系统的适配,并在商业量产芯片中得到了应用。今年4月,平头哥玄铁C910处理器成功运行TensorFlow Lite,首次实现了RISC-V在安卓(zhuo)12新系统上的AI支持。
孟建熠(yi)认为,尽管RISC-V的(de)应用市场会(hui)呈现碎(sui)片化(hua)特征,但是RISC-V生态(tai)(tai)仍然是标准化(hua)和统(tong)一(yi)的(de)。今天(tian),RISC-V国(guo)际基金(jin)会(hui)正在制定(ding)统(tong)一(yi)标准,来推动生态(tai)(tai)形成合力。
平头哥也在积极参与其中,已在RISC-V国际基金会中参与了29个技术方向的标准制定,主导负责了10个技术小组,过去一年向基金会贡献8篇技术文章。
再往(wang)前走,关(guan)键问题是如何将RISC-V架构的可扩(kuo)展性(xing)很好发挥出来,这要求有一(yi)个标(biao)准化的高(gao)性(xing)能RISC-V芯片(pian)平台,能够承载更(geng)加厚重的软件栈,而平头哥正致力于此。
结语:RISC-V仍在生态繁荣的前夜
在孟建(jian)熠看来(lai),如(ru)果将目标定为渗透到桌面级或(huo)云端,那(nei)么RISC-V依然处于生态繁荣的前夜,要把开(kai)发者(zhe)生态培育起来(lai),路还很(hen)长,需(xu)要全球软(ruan)硬件RISC-V开(kai)发者(zhe)的共(gong)同努力。
可以看到,平头哥打造无剑(jian)600平台的(de)(de)(de)(de)目标(biao),不是(shi)(shi)售卖(mai)自己的(de)(de)(de)(de)芯(xin)片(pian),也(ye)不是(shi)(shi)授权(quan)几乎单一(yi)的(de)(de)(de)(de)标(biao)准化处理器IP,而是(shi)(shi)纵向(xiang)上面向(xiang)通用计算(suan)和特定(ding)领(ling)域做软硬件全栈的(de)(de)(de)(de)适配和优化,横向(xiang)上扩展对第三(san)方IP的(de)(de)(de)(de)支持(chi),由(you)此(ci)降低(di)RISC-V芯(xin)片(pian)的(de)(de)(de)(de)开发门槛(jian),来吸(xi)引更多的(de)(de)(de)(de)生态合(he)作(zuo)伙(huo)伴。
这样的策略,将(jiang)在帮助(zhu)RISC-V架(jia)构进入高性能(neng)应用的同(tong)时,助(zhu)力芯片产品及应用走出多样性,共同(tong)推动RISC-V生态繁荣(rong)。