智东西(公众号:zhidxcom)
文 | 心缘
阿里的武侠情结,已经延续到芯片中(zhong)。
阿里巴巴2019云栖大会开幕首日,平头哥发布阿里巴巴第一款芯片含光800,号称全球性能最强的云端AI推理芯片,性能及能效比均全球第一。
含光,正(zheng)是《列子·汤问》中孔周三大神(shen)剑之一。
至此,平头哥集齐AI芯片(含光800)、高性能处理器IP(玄铁系列)和一站式芯片设计平台(无剑SoC平台),端云一体全栈芯片产品家族的雏形已然显现。
阿(a)里(li)巴巴CTO张建锋说,含光芯(xin)片是万里(li)长征的(de)(de)第一步,阿(a)里(li)今(jin)后(hou)会成为一家真正(zheng)软硬件一体化协(xie)同发展的(de)(de)科(ke)技公司。
不过,主(zhu)论坛(tan)仅(jin)简介含(han)光芯片(pian)的性能,芯片(pian)的详细参(can)数、顶层架构设计图、阿里关于芯片(pian)布局(ju)的思(si)考(kao)等细节,都在当日下午的分论坛(tan)上一一揭(jie)晓。
在云栖大会首日下午的平头哥生态论坛上,平头哥阵营首次亮相,不仅大秀产品进展,官宣IP联盟和发布《云端设计白皮书》,还携手清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图等公司连发7款基于玄铁处理器的芯片。当日,天猫精灵与平头哥合作研发的智能语音芯片也正式发布,将用于即将推出的天猫精(jing)灵音箱(xiang)中。
会后,平头哥研究员孟建熠,平头哥AI芯片负责人骄旸,清微智能首席科学家、清华大学微电子所副所长尹首一教授,云天励飞研发副总裁李爱军,炬芯科技董事长&CEO周正宇等接受智东西等媒体的采访,对含光芯片的核心优势,它在微架构设计上做的创新,平头哥三大产品系列的进展、未来计划和生态构建等问题一一予以解答。
一、上古神剑,高端芯片
造芯,头件大事就是(shi)起名字。
国(guo)外有(you)英(ying)特尔(er)青(qing)睐(lai)周(zhou)边的(de)山(shan)川河流(liu),AMD曾(ceng)钟(zhong)情于F1赛道;国(guo)内华为对(dui)高山(shan)和古籍情有(you)独(du)钟(zhong),紫光展(zhan)锐(rui)看上了动植物所(suo)承(cheng)载的(de)意(yi)象,而平(ping)头(tou)哥则继承(cheng)了马云对(dui)武侠(xia)文化的(de)热爱(ai),玄(xuan)铁、无剑、含(han)光三(san)芯(xin)片(pian)产品连发,每(mei)款都是传说(shuo)中的(de)利剑。

含光,上古(gu)三(san)大神剑之(zhi)一。《列子·汤问》中,孔周称其(qi)“视之(zhi)不可见,运之(zhi)不知有。其(qi)所触也(ye),泯然无际(ji),经物而(er)物不觉。”即看(kan)不见、感觉不到,划过(guo)身(shen)体也(ye)不疼,正如含光800带来的(de)无形却强(qiang)劲的(de)算力。
至(zhi)于为何从(cong)800开(kai)始(shi)(shi)命名(ming),平头哥AI芯(xin)片(pian)负责人骄(jiao)旸说,其(qi)实他们(men)最开(kai)始(shi)(shi)想给芯(xin)片(pian)取(qu)名(ming)v1.0,后(hou)来参考业内其(qi)他产品的命名(ming)逻(luo)辑(ji),800、900代(dai)表(biao)高端(duan)系(xi)列(lie),600代(dai)表(biao)中端(duan)系(xi)列(lie),200、300代(dai)表(biao)低端(duan)系(xi)列(lie)。以后(hou)平头哥也会做中端(duan)和低端(duan)芯(xin)片(pian)产品。
据阿(a)里巴(ba)巴(ba)CTO张建锋介绍,这款(kuan)芯(xin)片从设计、验证到(dao)流片,仅用(yong)一年半的时间。
二、1颗含光800=10颗图像GPU
含(han)光800采用台(tai)积(ji)电12nm制程工艺,含(han)170亿晶体管,支持(chi)PCIe 4.0和单机(ji)多(duo)卡,今年第(di)四季(ji)度开(kai)始量产。
在芯片测试标准平台Resnet 50上,含光800的具体分数为:每秒处理78563张图片,能效比达500 IPS/W。

与业界几款领先(xian)的(de)(de)云(yun)端推理(li)芯片(pian)相比,含光800的(de)(de)性能(neng)大约是第(di)二(er)名(ming)的(de)(de)4-5倍,其能(neng)效比约是第(di)二(er)名(ming)的(de)(de)3.3倍。
目前含光800应用于阿里巴巴内部核心业务中。
在杭州城市大脑的图像处理业务测试中,1颗含光800的算力相当于10颗通用GPU。

根据现(xian)场演(yan)示,杭(hang)州(zhou)城市大脑实时(shi)处理(li)主城区交通,需用40颗传统GPU,延时(shi)为300ms,单路视频功耗(hao)2.8W;而(er)使用含光(guang)800仅需4颗,延时(shi)降至150ms,单路视频功耗(hao)1W,有效节约(yue)了硬件和(he)时(shi)间(jian)成本。

再比如,拍立淘商(shang)品库(ku)每天新增10亿商(shang)品图片(pian),使用传统GPU算力识别需1小时,而使用含光800可将时间缩(suo)至5分钟(zhong),搜索效率提(ti)升12倍。
此外,基于含光800的AI云服务也正式上线。相比(bi)传统GPU算力(li),性价比(bi)提(ti)升100%。
这意味着,受限于算力瓶(ping)颈(jing)的(de)(de)企业可通过阿里云(yun),在含光(guang)800上更(geng)(geng)高效地运行(xing)更(geng)(geng)复杂、更(geng)(geng)先进的(de)(de)算法(fa)。
三、高性能背后,芯片架构创新与算法通用性
那么(me),含(han)光800如何实现如此高(gao)的图(tu)像处理(li)能(neng)力,高(gao)性能(neng)的背后又有哪(na)些创新?
骄旸告诉智东西,阿(a)里巴巴算(suan)法团(tuan)队将算(suan)法中的(de)一(yi)些通(tong)用特征提取出(chu)来,帮助含光800芯(xin)片实现(xian)架构的(de)创新。
1、芯片架构设计优化方向
过去一年(nian),平(ping)头哥(ge)(ge)团(tuan)队不断探索芯片(pian)和场景的融合,针(zhen)对场景深度(du)定制了芯片(pian)的软硬(ying)件,包(bao)括自(zi)研(yan)架构(gou)、软件编译器(qi)、框架、工具链等(deng);后期,平(ping)头哥(ge)(ge)也针(zhen)对INT8数(shu)据类型做了大量优化,最终在(zai)性能、良(liang)率、功耗等(deng)指标(biao)上(shang)均(jun)表现良(liang)好。
含(han)光800采用(yong)平(ping)头哥自(zi)研芯(xin)片架(jia)构(gou),集(ji)成达摩院算法,配以(yi)自(zi)动化开发工具(ju)。其顶层架(jia)构(gou)采用(yong)四核设(she)计,任(ren)一NPU Core坏死,都不会影响芯(xin)片工作(zuo)。

具体而(er)言(yan),含(han)光(guang)芯片在架(jia)构(gou)设计中主要做了如(ru)下(xia)优化(hua)方向:
(1)大大减少内存带宽,每次内存访(fang)问会造成较大功耗损失,平头哥自研(yan)架(jia)构将计算(suan)单元放在(zai)离存储(chu)很(hen)近的(de)位置,高密度的(de)计算(suan)和存储(chu)可大幅(fu)减少(shao)对内存的(de)访(fang)问,在(zai)保证高性能的(de)情(qing)况下,将芯片(pian)功耗降到最低水平。
(2)组合算子优化融合,对算法网(wang)络(luo)深(shen)入调(diao)节(jie),单位对内(nei)存、片上寄存器的访(fang)问更加精(jing)简,将计算效(xiao)率(lv)、能源(yuan)利用效(xiao)率(lv)提升至较高水准。
基于冯·诺依曼架(jia)构的传统(tong)通(tong)用处理器,存储和运算分(fen)离,做大量读写操(cao)作时会(hui)遇到带宽瓶颈,效率受限。
含光800根据(ju)神经网(wang)络(luo)推理(li)运算特征,设计特定(ding)的硬件神经元、高速(su)连接的存(cun)储(chu)结构以及专用(yong)指(zhi)令集,对内(nei)存(cun)和计算单(dan)元实(shi)现(xian)高效(xiao)组织管理(li),实(shi)现(xian)单(dan)条(tiao)指(zhi)令完(wan)成多(duo)个操(cao)作(zuo),提高计算效(xiao)率(lv)和内(nei)存(cun)访问效(xiao)率(lv)。
(3)算法压缩,采用(yong)稀(xi)疏、量(liang)(liang)化等推理加(jia)(jia)速技术,以及密集压缩的(de)计算、存(cun)储、流水线技术,有(you)效解决芯片性能瓶(ping)颈问题。除了(le)INT8/INT16 量(liang)(liang)化加(jia)(jia)速外,也覆盖(gai)FP16/BFP16的(de)向(xiang)量(liang)(liang)计算。
比(bi)较突出(chu)的(de)(de)一点是基本(ben)实现全网络量(liang)化,所有数(shu)据(ju)存(cun)储(chu)按(an)照比(bi)较压缩(suo)的(de)(de)形式(shi),计算过程根据(ju)精度要求把数(shu)据(ju)做(zuo)拓展(zhan),保持(chi)其(qi)较高精度,存(cun)储(chu)单(dan)元(yuan)时则变成较压缩(suo)的(de)(de)格式(shi)。
(4)计算中高度并行处理,含光芯片(pian)深度(du)优化(hua)CNN及视觉(jue)类算法(fa),不仅加速(su)矩(ju)阵乘法(fa)、交换机,支(zhi)持(chi)反(fan)卷(juan)积(ji)、空洞卷(juan)积(ji)、3D卷(juan)积(ji)、插值、ROI等,还(hai)可加速(su)向(xiang)量计(ji)算、激活函数(shu)等运算,这些优化(hua)均有效(xiao)提(ti)高其计(ji)算能(neng)力和效(xiao)率。

2、含光的业务定位与算法通用性
含光800中集(ji)成了达摩院算法,深度优化(hua)CNN网络(luo)及视觉DNN模型,有效(xiao)提升(sheng)了视觉计算效(xiao)率。
骄旸介绍(shao)了第一颗NPU的业务(wu)定位,CNN类模(mo)型(xing)(xing)推理加速为主,通用(yong)可扩展(zhan)到其他DNN模(mo)型(xing)(xing),主要应用(yong)于数据中心(xin)、大型(xing)(xing)端上。
例(li)如,阿里的(de)业(ye)务中,城(cheng)市(shi)大脑、工业(ye)大脑、图(tu)像视频(pin)审核、图(tu)像视频(pin)标注、图(tu)文(wen)搜索(suo)等擅长基于CNN的(de)算法加速,搜索(suo)推荐、广告、语音客服(fu)、自动(dong)翻译等则通用(yong)其他DNN模型。
谈(tan)及芯片(pian)(pian)架构能(neng)否适(shi)配(pei)新(xin)的算法(fa),骄(jiao)旸举了个例子。他(ta)(ta)说,当初芯片(pian)(pian)设计时,主要(yao)对(dui)CNN网络(luo)做加速(su),等(deng)芯片(pian)(pian)回来后,他(ta)(ta)看(kan)到(dao)做诸如流行趋势分析、智能(neng)服装设计、流行的网络(luo)视频换(huan)脸游(you)戏等(deng)的一些业务,用到(dao)生成式(shi)对(dui)抗网络(luo)(GAN)等(deng)算法(fa)。
四、平头哥的造芯优势:场景、软件、硬件
阿(a)里(li)巴(ba)(ba)巴(ba)(ba)CTO张建锋表示,阿(a)里(li)巴(ba)(ba)巴(ba)(ba)有足(zu)够信心和能力,去(qu)做(zuo)传统硬件(jian)公司(si)能做(zuo)到的硬件(jian),和不能做(zuo)到的软(ruan)件(jian)变硬件(jian)。他强调,阿(a)里(li)的软(ruan)件(jian)和算法(fa),是其(qi)最大(da)的传统优势。
这一雄心壮志背后的底气,是阿里云的AI验证场景、达摩院的算法、阿里硬件基础设施多年的技术沉淀。
1、AI与云计算催生丰富场景
阿(a)里巴巴造芯的天然优势,正在于(yu)拥有极其丰(feng)富(fu)的AI应用场景。
经过(guo)十年的发展,阿里在AI和(he)云(yun)计算(suan)领域(yu)均(jun)已跻身全(quan)(quan)球前(qian)列。阿里云(yun)更是稳居(ju)全(quan)(quan)球云(yun)计算(suan)厂商前(qian)三、亚太第一的位置,为超(chao)过(guo)一半(ban)的中国A股上(shang)市(shi)公司和(he)80%中国科技(ji)类企业提供云(yun)服务。
阿里(li)经济体(ti)横跨电商、金融、物流、云(yun)计(ji)算(suan)、大(da)数(shu)据、全(quan)球(qiu)化(hua)等场景,用户(hu)规模庞大(da),图像(xiang)视频分析、搜(sou)索、推荐、网络等各种业务场景都(dou)亟待AI专用芯(xin)片,其(qi)中(zhong)图像(xiang)和视频对算(suan)力的(de)需(xu)求(qiu)尤其(qi)大(da),这为平(ping)头(tou)哥研发AI芯(xin)片提供了(le)绝佳平(ping)台(tai)。
2、沉淀19年的硬件实力
尽(jin)管平头(tou)哥才成立一(yi)年,其硬件(jian)能力(li)的积累可远远不止一(yi)年。
平头哥由(you)中(zhong)天微和达摩(mo)院(yuan)自(zi)研芯片业务(wu)整合而成,算上中(zhong)天微的19年(nian),以(yi)及(ji)阿(a)里(li)巴巴在服务(wu)器(qi)、FPGA以(yi)及(ji)存储等(deng)硬件基础设施上早年(nian)的摸索,这些经年(nian)累月的研发经验使其在体系结构(gou)、编译技术(shu)等(deng)领域拥(yong)有深厚的技术(shu)储备。
芯片(pian)(pian)(pian)设(she)计(ji)流(liu)程(cheng)复杂、风险极高。一旦流(liu)片(pian)(pian)(pian)失败,一切(qie)都要推倒(dao)重来,很多芯片(pian)(pian)(pian)公司做不到一次流(liu)片(pian)(pian)(pian)成功;流(liu)片(pian)(pian)(pian)成功后还需(xu)经过(guo)复杂的测试(shi)验证,只有各项(xiang)指(zhi)标(biao)均符合实(shi)际(ji)场景需(xu)求,才到了真正的商用阶(jie)段。
而平头(tou)哥完(wan)成(cheng)芯(xin)片(pian)设(she)计、流(liu)片(pian)等全过(guo)程用时非(fei)常短,7个月完(wan)成(cheng)前端实际,之后仅3个月就一(yi)次成(cheng)功流(liu)片(pian),这在业(ye)界还(hai)是非(fei)常难得的。
3、与达摩院算法高度适配
除适配场(chang)景(jing)、硬件(jian)架(jia)构外,AI芯片(pian)的差异化设计还体现在软(ruan)件(jian)算法(fa),它与硬件(jian)架(jia)构高(gao)度(du)适配、协同创新,才能(neng)发挥出芯片(pian)的最大(da)价值。
算法方(fang)面,阿(a)里巴(ba)巴(ba)达(da)摩(mo)院机(ji)器(qi)智(zhi)能(neng)(neng)实(shi)验(yan)室(shi)过去两年构建了完整的算法体系(xi),涵盖语音智(zhi)能(neng)(neng)、语言(yan)技术(shu)、机(ji)器(qi)视(shi)觉、决策智(zhi)能(neng)(neng)等(deng)方(fang)向(xiang),并且取得(de)多个世(shi)界领先水平的成果(guo),在国际(ji)顶(ding)(ding)级(ji)学(xue)术(shu)会议(yi)上共发表了近400篇(pian)顶(ding)(ding)级(ji)论文。
基于这些能(neng)力,算法和硬件之间的鸿(hong)沟得以突破。
五、定位端云一体,全栈产品雏形已现
去年(nian)9月,阿里以非洲蜜獾的外(wai)号“平(ping)头哥”为(wei)名(ming)成立(li)平(ping)头哥公(gong)司。

这一名字承载了阿里巴巴对芯片公司寄予的厚望,不同于大多数芯片商,面对着有强应用驱动和场景碎片化等特点的AIoT市场,平头哥的目的不是卖芯片,而是通过端云一体芯片生态,端上做芯片技术设施,云端为各行业提供普惠算力,终端玄铁处理器还可以与云端含光芯片协同。
今(jin)年7月(yue),平(ping)头(tou)哥(ge)发布第一(yi)(yi)(yi)款(kuan)基于RISC-V的(de)处理器IP核“玄铁910”;8月(yue),它又推出(chu)第一(yi)(yi)(yi)款(kuan)一(yi)(yi)(yi)站(zhan)式(shi)芯(xin)片(pian)设计(ji)平(ping)台“无剑”;9月(yue),早在一(yi)(yi)(yi)年前就做出(chu)预告(gao)的(de)云端AI芯(xin)片(pian)终于如期而至。

1、基础单元处理器IP
在端侧,有中天微的背景加(jia)持(chi),平头哥已拥有成熟的生态(tai)体系。
其C-Sky系列(lie)中,CK801、CK802、CK803、CK805、CK807、CK810、CK860等7款自研嵌入式CPU IP核均已得到大规模量产的验证,授权客户超100家,累计(ji)销售超十亿颗,广泛应用于机(ji)器视觉、工(gong)业控制、车(che)载终端(duan)、移动通信(xin)和信(xin)息安全等领域。新(xin)发布(bu)的玄(xuan)铁系列(lie)也为(wei)AIoT终端(duan)芯片提供(gong)高(gao)性价比IP。

平头哥研究(jiu)员孟建熠说,玄(xuan)铁更(geng)重要的(de)是在基础架构(gou)之上的(de)可扩展(zhan)性,能在原(yuan)有的(de)一些通用处理器上,定制一些差异化的(de)东西(xi)。
2、一站式芯片设计平台
无剑SoC平台(tai)集成(cheng)CPU、GPU、NPU等,可降(jiang)低芯片设计门槛,将(jiang)研(yan)发周期缩短50%,开(kai)发成(cheng)本(ben)降(jiang)低50%。
目前,无(wu)剑已推(tui)出(chu)MCU、语(yu)音、视觉(jue)三大平台(tai),后(hou)续(xu)还会有(you)更多(duo)平台(tai)推(tui)出(chu)。MCU平台(tai)有(you)5类(lei)IP,3家合作(zuo)伙(huo)(huo)伴;语(yu)音识别平台(tai)有(you)8类(lei)IP,3家合作(zuo)伙(huo)(huo)伴;机(ji)器视觉(jue)平台(tai)有(you)9类(lei)IP,3家合作(zuo)伙(huo)(huo)伴。
除了它(ta)们(men)各自拥有的一些差异化创(chuang)新技术外,平(ping)头哥为(wei)所有平(ping)台(tai)云端(duan)一体保持全链安全。

无剑的(de)主要原理是(shi)让行业软(ruan)硬件很好融合。现在芯片的(de)设计方法是(shi)将买IP、模块(kuai),自己做(zuo)组(zu)合、验证(zheng)、测(ce)试(shi)、流片;而无剑更多在共性基础上(shang)从维持生态的(de)角度去(qu)做(zuo)事,先把硬件上(shang)共性的(de)东西都做(zuo)好,在系统层面也做(zuo)了芯片的(de)试(shi)流片。
玄铁系列(lie)处理器IP和(he)无剑SoC平台均已服务多(duo)家芯(xin)片企业及AI企业。
3、AI芯片
在云端,阿里云目前(qian)排名(ming)全球前(qian)三、亚太第一,这为(wei)平头哥服务企业(ye)提供了绝(jue)佳(jia)平台,含光800通过AI云服务为(wei)各企业(ye)的AI场景(jing)提供极致算力。
在AI场景中,含光800是异构计算的很好补充。据悉,未来其产品形态还会进一步完善,包括云端AI训练芯片和端侧AI推理芯片,平头哥还在研发用于阿里云神龙服务器的SoC专用芯片,以满足更(geng)多场景的(de)算力(li)需求。

AI芯片是人工智能场景(jing)最(zui)高效的算(suan)力单(dan)元(yuan),阿里(li)将投入重金打造好(hao)这些(xie)技术,同(tong)时构建应用生(sheng)态。
除此之外,平头(tou)哥还(hai)将继续(xu)开发操(cao)作(zuo)系统,软硬件融合的(de)算法(fa),核(he)心的(de)IP等,把这(zhei)些共性的(de)技术做(zuo)好、做(zuo)精、做(zuo)出(chu)竞(jing)争(zheng)力,并(bing)形成生态(tai),然后开放给芯片(pian)设计公司,让他们基于高质量的(de)基础(chu)设施(shi)打(da)造(zao)芯片(pian)产(chan)(chan)品,从而催生产(chan)(chan)业(ye)(ye)生态(tai)的(de)繁荣,提升(sheng)整(zheng)体的(de)产(chan)(chan)业(ye)(ye)竞(jing)争(zheng)力。
六、集结平头哥阵营,大晒生态实力
众所周知,服务(wu)器(qi)领域x86阵(zhen)营独大,Arm阵(zhen)营则是移动芯片(pian)时代的主角。如今(jin),平头哥带着它的平头哥阵(zhen)营来了。
目前,平(ping)头哥的(de)玄铁系列处理器和无剑平(ping)台已(yi)拥(yong)有100多家(jia)客户。
在平头哥分论坛(tan)上,清微智能、云天(tian)励(li)飞、炬芯、奉加微、联盛(sheng)德威、艾派克、博雅(ya)鸿图等企业发(fa)布7款(kuan)基于玄铁处理器IP的新款(kuan)芯片(pian),涵盖视觉、语音(yin)、微控制、无线芯片(pian)等应用领域。
这其(qi)中,炬(ju)芯是国(guo)内(nei)老牌IC设计(ji)企业,云天(tian)励飞是国(guo)内(nei)知名AI独角兽,艾派克是中国(guo)打印机主控芯片(pian)的龙头,奉加微是蓝(lan)牙芯片(pian)领(ling)域的新秀,清微智能、联(lian)盛(sheng)德、博雅鸿图(tu)则分别在(zai)AI可重构计(ji)算芯片(pian)、物联(lian)网通信芯片(pian)、数(shu)据视(shi)网膜芯片(pian)领(ling)域各有专长(zhang)。

由于AIoT市(shi)场碎片化,端(duan)侧(ce)芯片性能(neng)、存(cun)(cun)储(chu)、功耗等要求都(dou)不(bu)相同,比如就本次新(xin)发(fa)的(de)芯片中(zhong),云天(tian)励飞采(cai)用的(de)是(shi)玄(xuan)铁(tie)(tie)高端(duan)处理器(qi),需(xu)1GB以上存(cun)(cun)储(chu);清微智能(neng)在其(qi)可(ke)重构(gou)芯片中(zhong)采(cai)用的(de)是(shi)中(zhong)端(duan)处理器(qi)玄(xuan)铁(tie)(tie)804/805,存(cun)(cun)储(chu)需(xu)400-500MB;炬芯重点在低功耗、好声(sheng)音,选(xuan)择的(de)是(shi)高能(neng)效处理器(qi),它对性能(neng)和品质要求更低,存(cun)(cun)储(chu)只要200-300MB。
孟建熠表(biao)示,不是(shi)说存储小就(jiu)代表(biao)差,而是(shi)在行业中(zhong)追求(qiu)的产品不同,玄铁(tie)(tie)面向(xiang)不同AIoT的系列化产品,有两代产品,一代是(shi)玄铁(tie)(tie)老的自(zi)主架构,第二(er)代是(shi)RISC-V。
炬芯(xin)过(guo)(guo)去(qu)使用的是MIPS,炬芯(xin)科(ke)技董事长&CEO周正宇说,改用RISC-V还(hai)是有些(xie)紧(jin)张的,但经过(guo)(guo)实(shi)践,如今他(ta)们已(yi)有4款(kuan)芯(xin)片(pian)用玄铁(tie)802、1款(kuan)芯(xin)片(pian)使用玄铁(tie)803。
周正宇发现,RISC-V在工具链(lian)、指令集使(shi)用上(shang)已超过(guo)MIPS,更(geng)接近Arm;其功耗、压缩(suo)率上(shang)也(ye)比MIPS更(geng)好。除了(le)提供通用CPU,平头哥还专门为(wei)炬芯打(da)造特别指令集,周正宇表示,双方会更(geng)长期的(de)合作。
奉(feng)加微今(jin)年年初(chu)获得(de)平(ping)头哥(ge)玄铁802 MCU、YoC操作系统及CSI外(wai)设接口授权,用6个(ge)月就完成了芯片设计(ji),艾派克预(yu)计(ji)今(jin)年搭(da)载平(ping)头哥(ge)内核的芯片出货量将达到2亿颗。

同(tong)日,阿里人工智能(neng)实验室和平头哥共同(tong)定制开发(fa)智能(neng)语音(yin)芯片TG6100N,天猫精(jing)灵将(jiang)成为(wei)首款采用平头哥定制芯片的家(jia)用产(chan)品。
可以看见,AIoT时代(dai)下,平(ping)头哥已经率先搭建(jian)起生(sheng)(sheng)态,并(bing)正循序渐进地沿着其“普惠芯片(pian)”的目标持续构建(jian)行业生(sheng)(sheng)态和(he)开发者生(sheng)(sheng)态。
一(yi)方面,平(ping)头哥持续(xu)完善其技术及芯(xin)片(pian)产(chan)品阵列;另一(yi)方面,平(ping)头哥还(hai)将成立芯(xin)片(pian)开(kai)放(fang)社区,实现1天(tian)上(shang)手,5天(tian)原(yuan)型,20天(tian)做(zuo)出产(chan)品,进一(yi)步为(wei)芯(xin)片(pian)产(chan)业提供开(kai)放(fang)协作的平(ping)台。

平(ping)头(tou)哥牵(qian)头(tou)发起的IP联盟,已有Cadence等9家半导体IP供应商加入。此外,平(ping)头(tou)哥还(hai)同新思科技、阿(a)里云联合发布(bu)《云端设计(ji),与时间赛跑》白皮书(shu)。
在分论坛期间,孟建熠还谈到了芯(xin)片行业的新趋势——Foundry上(shang)云(yun)、EDA上(shang)云(yun)、开源芯(xin)片、定制化芯(xin)片。

孟(meng)建熠认为(wei),EDA承(cheng)担的角(jiao)色至关重要,云、EDA公司都希望有(you)EDA上云这(zhei)样的交(jiao)集。不(bu)过,目前(qian)阿里(li)还(hai)只(zhi)是在尝试这(zhei)件(jian)事,没有(you)对外推出,新思科(ke)技等合作(zuo)伙伴正在做EDA上云,中国(guo)慢(man)慢(man)也在往这(zhei)一前(qian)沿领域(yu)走(zou)。
他希(xi)望(wang)平(ping)台(tai)能向(xiang)(xiang)越(yue)来(lai)越(yue)开(kai)(kai)放的方向(xiang)(xiang)走,如(ru)果EDA上云(yun),开(kai)(kai)发者可以更快开(kai)(kai)发出芯片产品,和无(wu)剑(jian)平(ping)台(tai)的结(jie)合是有价值的。不(bu)过(guo),平(ping)头哥本身没有EDA的工具,需(xu)要第三方去做这件事情。
结语:云计算巨头跨界造芯成大势
AI的(de)(de)加(jia)速落地(di)使得对(dui)底(di)层技术布局愈发迫(po)切。阿里(li)庞大的(de)(de)电商、金(jin)融、物流、云计算、物联网业(ye)务(wu),都对(dui)芯片(pian)有着越(yue)来越(yue)大的(de)(de)需求。
如今,芯(xin)片、AI与云计算(suan)的(de)协调发展已是大(da)势所趋(qu)。AI算(suan)法逐(zhu)渐集成(cheng)到芯(xin)片,专用AI芯(xin)片为云服务提供更强的(de)算(suan)力(li),云计算(suan)又加速(su)了(le)AI应用的(de)大(da)规模落(luo)地。
对于云计算(suan)厂商而言,自研芯(xin)(xin)片不仅可以降低整体(ti)计算(suan)的经济成(cheng)本,还能以云服务(wu)的方式将(jiang)更高算(suan)力(li)、更低功耗提供(gong)给更多企业(ye)。这一趋势推(tui)动下,阿里巴巴造(zao)芯(xin)(xin)成(cheng)为(wei)必(bi)然。
阿里成立独立芯(xin)片公司平头哥,既是顺(shun)应(ying)云计(ji)算(suan)巨头造芯(xin)的(de)(de)大势,实现从底(di)层硬(ying)件到上层应(ying)用的(de)(de)生态自循环(huan);亦是放眼(yan)云计(ji)算(suan)和AIoT所(suo)带(dai)来的(de)(de)广阔市(shi)场,以(yi)芯(xin)片基(ji)础设施提供商的(de)(de)定位以(yi)期获取新时代的(de)(de)红利。
承载着“普惠(hui)芯(xin)(xin)(xin)片”的美好愿(yuan)景,平(ping)头哥已经发布的产品布局非常清晰:端侧处理(li)器IP+芯(xin)(xin)(xin)片设计平(ping)台,降(jiang)低芯(xin)(xin)(xin)片公司造芯(xin)(xin)(xin)难(nan)度;云端AI芯(xin)(xin)(xin)片,通过阿里云AI使能各(ge)企业智能化升(sheng)级。
阿(a)里能(neng)否如(ru)其所期望(wang)的(de)那(nei)样,成为AIoT时代的(de)芯片基(ji)础设(she)施提(ti)供商(shang),我们拭目以待(dai)。