芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西5月30日报道,生成(cheng)式人工智能(AI)触发(fa)了“AI时代的(de)iPhone时刻”,每个行业(ye)(ye)都(dou)在投资生成(cheng)式AI,推动对(dui)加速计算的(de)需求,电信行业(ye)(ye)亦是如此。
在台北电脑展COMPUTEX 2023期间,英伟达(NVIDIA)与日本电信巨头软银昨日宣布,合作打造一个基于NVIDIA GH200 Grace Hopper超级芯片、面向生成式AI和5G/6G应用的开创性平台。今(jin)日,英伟达(da)技术(shu)(shu)专家(jia)进一步分(fen)享了关于这一平台(tai)的更多(duo)技术(shu)(shu)细节。
软银计划在日(ri)本各地的(de)全新分(fen)布(bu)式AI数据中心(xin)采用(yong)该平台(tai)。
双方合(he)作(zuo)之(zhi)举,是为(wei)了在全球范围内快(kuai)速部(bu)署生成(cheng)式AI应(ying)用和(he)(he)服务铺平道路。软(ruan)银正在为(wei)自动(dong)驾驶、AI工厂、增强(qiang)现(xian)实(shi)和(he)(he)虚拟现(xian)实(shi)、计算(suan)机视(shi)觉和(he)(he)数(shu)字孪生开发(fa)5G应(ying)用。软(ruan)银公司(si)总裁(cai)兼CEO Junichi Miyakawa谈道:“随着我们进入一个社(she)会(hui)(hui)与AI共存的时(shi)代(dai),对数(shu)据处理和(he)(he)电(dian)力的需求将(jiang)不断增长。软(ruan)银将(jiang)提供下一代(dai)社(she)会(hui)(hui)基(ji)础设施,以支持日(ri)本的超(chao)级数(shu)字化社(she)会(hui)(hui)。”
英(ying)伟(wei)达(da)创始人(ren)兼CEO黄仁(ren)勋认为,对加速计算和(he)生成(cheng)式(shi)AI的需求正在推动数据(ju)中(zhong)心架构的根本性(xing)变革。英(ying)伟(wei)达(da)Grace Hopper是专为处理和(he)扩展(zhan)生成(cheng)式(shi)AI服务而设计。他(ta)称赞软银创建一(yi)个电(dian)信网(wang)络来承(cheng)载生成(cheng)式(shi)AI服务的举措“富有远见”。
生成(cheng)式AI的(de)需求爆(bao)发,将重(zhong)塑AI和(he)5G数据(ju)中心,将5G数据(ju)中心改造成(cheng)AI工(gong)厂。相(xiang)比(bi)以往的(de)数据(ju)中心,新型数据(ju)中心的(de)分布将更(geng)加(jia)均衡,并能够同(tong)(tong)时处(chu)理AI和(he)5G工(gong)作(zuo)负(fu)载。这将让它们(men)更(geng)好地保持(chi)峰值(zhi)运行(xing),同(tong)(tong)时保持(chi)低时延并大幅(fu)降低总体能源成(cheng)本,兼具高利用率和(he)最佳ROl。

双方合作打造的平台,是一个面向5G和生成式AI的云平台,与单一用途5G vRAN相比,其投资回报率达4倍。该平台将使(shi)用英(ying)伟达MGX服(fu)务器(qi)参考(kao)架构和基于Arm Neoverse的GH200 Grace Hopper超级芯片(pian),有望提(ti)高应用程序工作负载的性能、可扩展性和资源(yuan)利用率。
具体(ti)而言(yan),英(ying)伟(wei)达(da)GH200超级芯片(pian)兼顾了(le)生成式(shi)AI、5G/6G的(de)需求,在加(jia)速5G Open vRAN上(shang)取得了(le)高(gao)性能和高(gao)能效,能够有效减少(shao)CPU和加(jia)速器(qi)之间的(de)延迟。英(ying)伟(wei)达(da)Grace Hopper和BlueField-3 DPU将(jiang)加(jia)速软件定义的(de)5G vRAN以及生成式(shi)AI应用,而无需定制(zhi)硬件加(jia)速器(qi)或(huo)专用5G CPU。此(ci)外,配备BlueField-3的(de)英(ying)伟(wei)达(da)Spectrum以太网交换机将(jiang)为5G提供(gong)高(gao)精度时间同步协议。

该解决方案在英伟达加速的1U MGX服务器设计上实现了突破性的5G速度。根据公开的5G加速器数据,它实现了业内吞吐量最高的36Gbps下行链路(lu)容量。运营商一(yi)直(zhi)难以通过行业(ye)标准(zhun)服(fu)务(wu)器(qi)实现如(ru)此高的下行链路(lu)容量。
NVIDIA MGX是英伟达(da)(da)昨日最新推出的一(yi)个模块化参考架构(gou),让系统制(zhi)造商(shang)和超大规(gui)模企业客户能够(gou)快速、经济地构(gou)建(jian)100多种(zhong)服务器(qi)机型,适用(yong)于各种(zhong)AI、HPC和英伟达(da)(da)Omniverse应(ying)用(yong)。
Arm首席(xi)执行官Rene Haas认(ren)为:“结合NVIDIA BlueField DPU、Grace Hopper,使得(de)软(ruan)银新(xin)的5G数(shu)(shu)据(ju)中心能(neng)够运行最苛刻的计算和(he)内存密(mi)集型应用,并为Arm上的软(ruan)件定义5G和(he)AI带来指数(shu)(shu)级的能(neng)效提升。”
软件同样不可或缺,英伟达Aerial 5G软件实现了对x86和Arm的兼容。通过将英伟达Aerial软件引入到高性能的软件定义的云原生5G网络中,这些5G基站将允许运营商动态地分配计算资源,实现比竞品高2.5倍的能效。

生(sheng)成(cheng)式AI的(de)未来发展需要高性(xing)能(neng)、节能(neng)的(de)计算(suan)。与英伟达(da)的(de)合(he)作,将(jiang)帮助软(ruan)银(yin)的(de)基础(chu)设施利用(yong)AI实现更高的(de)性(xing)能(neng),包括对RAN的(de)优化。软(ruan)银(yin)将(jiang)打造(zao)能(neng)够在多租户通用(yong)服务器(qi)平台上托管生(sheng)成(cheng)式AI和无线(xian)应用(yong)的(de)数据中心,以(yi)降低成(cheng)本和更节能(neng)。
“我们期待这也可以帮助(zhu)我们降低能耗,创建一个互(hu)连(lian)的数据中心网(wang)络,用(yong)于共享资源(yuan)并(bing)托管一系列生成式AI应用(yong)。”Junichi Miyakawa说。