智东西(公众号:zhidxcom)
作者 | GenAICon 2024

2024中国生(sheng)成式(shi)AI大(da)会于4月18-19日在北京举行(xing),在大(da)会第二(er)天的主会场AI Infra专场上,Zenlayer行(xing)业(ye)拓展总(zong)监陈秀(xiu)忠以(yi)《大(da)数据(ju)、大(da)算力与(yu)大(da)模型驱动下(xia)的全球广(guang)域(yu)网挑战与(yu)策略》为题(ti)发(fa)表(biao)演讲。

大(da)数据(ju)、大(da)算力、大(da)模型推动AI能力涌(yong)现,正(zheng)在改变当代(dai)人们与世界(jie)互动的(de)方(fang)式。要(yao)充分发挥AI的(de)潜(qian)力,需(xu)要(yao)高效、安(an)全、可靠(kao)的(de)全球网络支撑。

然而,当前全球广域网在满足AI应用在对数据流动、算力配备和网络性能的需求方面,依然面临挑战。数据流动的高效与安全、算力资源的优化配置与协同工作,以及训练与推理节点之间网络性能的优化,成为当前全球广域网亟待解决的问题

对此,陈秀忠认为通往更高级AGI,挑战在于更即时的交互、更广的数据、更广的算力。因此(ci),面向AGI的全(quan)(quan)球(qiu)边(bian)缘云方案,不(bu)仅需要考虑支持实(shi)时交互的全(quan)(quan)球(qiu)网络、数据本地存(cun)储和(he)全(quan)(quan)球(qiu)流(liu)动,同时,也要覆(fu)盖大(da)量的边(bian)缘节点。

陈秀忠谈道,安全合规的跨境专线是企业连接全球的第一跳。一大挑战(zhan)在于,数据(ju)合规性(xing)让全球数据(ju)监管力度加(jia)大,一旦数据(ju)本(ben)地化,企业又将何(he)去何(he)从?

以下为陈秀忠的演讲实录:

我有一个问题想(xiang)和大家讨论:CPU和GPU之间的(de)本质区别(bie)是什么(me)?我认为最重要的(de)一点是,GPU专注于图形处(chu)理。

现在(zai),我(wo)们(men)一起快速地(di)探(tan)索AIGC或全球网络的(de)(de)整体情况。以下是大致的(de)(de)议程(cheng):现在(zai)的(de)(de)情况如何,存在(zai)什么挑战(zhan),我(wo)们(men)的(de)(de)方案又是什么?

一、AI能力为何涌现?“大”力出奇迹

今天关于AI基础设施的(de)(de)主题(ti)的(de)(de)演(yan)讲有很多,包括网络、数(shu)据以及模型的(de)(de)训练(lian)和推理等。全球边(bian)缘(yuan)网络中(zhong)主要(yao)的(de)(de)资源集(ji)中(zhong)在(zai)算(suan)力和数(shu)据方面。

这(zhei)(zhei)(zhei)张画(hua)是我(wo)孩子绘制的(de)作品(pin),因为(wei)要(yao)参加比赛,所以需要(yao)给这(zhei)(zhei)(zhei)幅画(hua)取个名(ming)字。我(wo)把这(zhei)(zhei)(zhei)项工作交给了ChatGPT。在(zai)此之前,我(wo)们(men)曾为(wei)这(zhei)(zhei)(zhei)个问题争(zheng)吵不休,不知道该给这(zhei)(zhei)(zhei)幅画(hua)取什么名(ming)字。为(wei)什么ChatGPT有这(zhei)(zhei)(zhei)样的(de)能力?实际上,AI技术(shu)已(yi)经在(zai)学(xue)术(shu)界和(he)工业界发展了四十(shi)多年。然而我(wo)们(men)是在(zai)过去的(de)一两年中才觉得(de)AI非常酷。

我们来看看这个图。

第一,手机很多。现在(zai)(zai)全球手机(ji)数(shu)量已经(jing)高(gao)达86亿部。每一部手机(ji)都在(zai)(zai)扮演(yan)着将物理世界数(shu)字化的角色,从而(er)创(chuang)造了大量的数(shu)据。

第二,NVIDIA很厉害。NVIDIA在GPU领域有着(zhe)几十年的深厚(hou)积累(lei),并且有个(ge)定律——每6个(ge)月,GPU的能(neng)力将翻倍(bei)。这一(yi)速度是摩尔定律的3倍(bei)。

第三,大模型。这(zhei)些“大(da)”模型(xing)已经创造了许多奇迹,并且(qie)它们的能力(li)正在不断涌现。

回(hui)顾过去,去年很多人(ren)开始使(shi)用ChatGPT,但是逐渐地,ChatGPT的(de)活跃(yue)度(du)却在(zai)回(hui)落(luo)。此外,在(zai)我与许(xu)多人(ren)沟通(tong)时,我发现人(ren)们真正敢(gan)将工作交给ChatGPT,是因为仍然有机(ji)会(hui)进行确认。我们也研究了DeepMind团队(dui)对于AGI(通(tong)用人(ren)工智能)的(de)分层。

目前,ChatGPT仍处于非常初级的阶段,即L1阶段。还有许多级别需要攀升,因此实现AGI的道路还非常遥远

刚才提到,AI涌现的三个主要的因素是大数据、大算力和大模型。现在再来思考一个问题,当AIGC变得非常出色时,当一个与真人几乎一模一样的虚拟人与我进行对话和互动时,接下来会发生什么?我需要与这个虚拟人进行快速的交互,这是一个非常重要的因素。

二、通往更高级AGI,面临三大挑战

我们总结了几个挑战。

第一个挑战是更即时的交互。如果AIGC要(yao)给人带来非(fei)常出色的(de)体(ti)验,那么即时交互(hu)就(jiu)会成(cheng)为其(qi)中的(de)关(guan)键。当我观(guan)看(kan)短视频或长(zhang)视频时,这些(xie)内容并非(fei)UGC或者(zhe)PGC产生,因此是(shi)缺乏新鲜感的(de),就(jiu)像(xiang)是(shi)经过冷冻处(chu)理(li)的(de)内容。

这(zhei)张图表展示了人(ren)(ren)(ren)与(yu)人(ren)(ren)(ren)之(zhi)间(jian)的(de)互(hu)动(dong)(dong)以及人(ren)(ren)(ren)与(yu)内(nei)容之(zhi)间(jian)的(de)互(hu)动(dong)(dong)。最终,所有这(zhei)些都指向一个共(gong)同点,那(nei)就是(shi)(shi)人(ren)(ren)(ren)。只不过,这(zhei)个“人(ren)(ren)(ren)”是(shi)(shi)一个机器。如果(guo)这(zhei)个机器人(ren)(ren)(ren)真的(de)能够与(yu)人(ren)(ren)(ren)类如此相似,那(nei)么(me)这(zhei)将是(shi)(shi)一种(zhong)非常好(hao)的(de)体验,而这(zhei)也就意味(wei)着即时交互(hu)在全(quan)球范围内(nei)是(shi)(shi)通(tong)往AGI的(de)重要挑战。

第二个挑战是更广的数据。尽(jin)管我们已经将目(mu)前可以获取(qu)(qu)的(de)(de)所有数(shu)(shu)据(ju)(ju)(ju)(ju)都提供(gong)给了大模型(xing),包括(kuo)所有的(de)(de)书籍、学者发布的(de)(de)论文(wen)以及(ji)各(ge)种各(ge)样的(de)(de)数(shu)(shu)据(ju)(ju)(ju)(ju),但仍然(ran)存在很多(duo)数(shu)(shu)据(ju)(ju)(ju)(ju)难(nan)以提供(gong)给大模型(xing),比(bi)如(ru)一(yi)些政府数(shu)(shu)据(ju)(ju)(ju)(ju)和封闭平台的(de)(de)数(shu)(shu)据(ju)(ju)(ju)(ju)就(jiu)很难(nan)被获取(qu)(qu)。

那(nei)么,我们如何才(cai)能将(jiang)这些数据提供给大(da)(da)模型呢?我们注意到全球范围(wei)内的(de)一个(ge)最大(da)(da)难题是,各国都有自己的(de)数据隐私保护法规,因(yin)此数据在(zai)全球范围(wei)内的(de)流动面临着很大(da)(da)的(de)挑(tiao)战。

第三个挑战是更广的算力。当在美国一个州进行10万张H100训练时,可能导致电网瘫(tan)痪。这意味着我们(men)需(xu)要尽量分散计算力,以缓解电力限(xian)制的压力。

在推理(li)阶(jie)段,我们对计(ji)算力的(de)需求(qiu)更高(gao),因为每(mei)次推理(li)都会(hui)消耗一定的(de)资源,而推理(li)与用户(hu)请求(qiu)数量直接相关。未(wei)来(lai),无(wu)论是因为推理(li)需要更接近(jin)用户(hu),还是推理(li)次数增加,都需要关注推理(li)部分的(de)计(ji)算能力。

根据(ju)这三个(ge)挑(tiao)战,可以得出(chu)一些(xie)小(xiao)的结(jie)论。

首先,对于更即时的交互,需要建立全球范围内的即时交互网络二是需要更广的数据,思考如何生成和流动这些数据,以及如何解决各国对数据隐私的保护。三是需要更广泛的计算能力,同时我们也要考虑到,推理和训练的计算能力应尽量分开。

三、语言、地理、战争,全球网络碎片化的三大挑战

我们说网(wang)络(luo)(luo)很(hen)重要(yao),尤其(qi)是全球范围(wei)内的网(wang)络(luo)(luo)至关重要(yao)。尽(jin)管我们访问外网(wang)时可(ke)能(neng)会遇(yu)到性能(neng)挑(tiao)战,但(dan)国内网(wang)络(luo)(luo)通达性非常好(hao)。

然而,全球范围内的网络却是碎片化的(de)(de)。这(zhei)是因为全球各国之间的(de)(de)网(wang)络(luo)互通主要依(yi)靠海底光缆(lan),而(er)这(zhei)些海底光缆(lan)还面临着诸多问题,导致(zhi)全球网(wang)络(luo)出现了许多挑战。

第一(yi)张图展示了东南(nan)(nan)亚(ya)国家的(de)网络情况。尽管东南(nan)(nan)亚(ya)的(de)面积和(he)(he)人(ren)口仅为(wei)中(zhong)国的(de)一(yi)半(ban),但却有十几个国家,且语言也(ye)各不相同。例如,泰国和(he)(he)越南(nan)(nan)这(zhei)两个毗邻(lin)的(de)国家之间(jian)的(de)互联通信需要70多毫秒,因为(wei)它们需要通过(guo)新(xin)加坡进行中(zhong)转(zhuan)。

第二张图展(zhan)示(shi)了南美洲的(de)情(qing)况。南美洲的(de)地理(li)(li)格(ge)局有些奇特,东(dong)边(bian)是巴西(xi),西(xi)边(bian)是秘鲁(lu),尽管它(ta)们的(de)物理(li)(li)距离很(hen)近,但由于地理(li)(li)因(yin)素,如南北延伸的(de)山脉和(he)亚马逊(xun)热带雨(yu)林的(de)存在,导致陆地光缆(lan)无(wu)法通行,必须绕过(guo)整个(ge)南美洲一圈才能实现互(hu)联。

第三个因素是战争,特别是在中东市场。我们可以清楚地看到以色列到阿联酋之间的网络需要160毫秒,尽管它们的物理距离可能只有十几毫秒。这三个因素共同决定了全球网络与中国国内网络之间存在着非常大的差异。

四、安全合规的跨境专线,中国企业走向国际市场的第一跳

现在所有客户在海外部署关键应用的需求就是专线。中国企业要走向国际市场,跨境专线是非常重要的一部分。这(zhei)张(zhang)图展(zhan)示了中(zhong)国(guo)整个跨境陆(lu)缆(lan)和(he)海缆(lan)的(de)布(bu)局,主要从上(shang)海、广东(dong)、香港以(yi)及北京(jing)前往(wang)俄罗(luo)斯,或者新疆。

这(zhei)张图展示了全(quan)球(qiu)各个(ge)国家(jia)(jia)对个(ge)人隐私的重视程度(du),导致许多数据无法直(zhi)接离开其所在国家(jia)(jia)。

最近我和一位从(cong)事汽车行业(ye)的朋友聊过,他(ta)们(men)在欧洲(zhou)产生了大(da)量数据,但如果要用(yong)这些数据进行研(yan)究,他(ta)们(men)必须亲(qin)自前往(wang)欧洲(zhou)进行处(chu)理(li)。

然而,数据合规性让全球数据监管力度加大,一旦数据本地化,企业又该如何解决?

有一(yi)个案(an)例,同样是一(yi)家汽车企业,他(ta)们在全球产生大量数(shu)据,需要在各(ge)地进行本地存储。因此(ci),他(ta)要回(hui)到杭(hang)州(zhou),用一(yi)些全球加速的方案(an)让数(shu)据快速传回(hui)杭(hang)州(zhou)。

大(da)家对时(shi)(shi)(shi)延有(you)没有(you)概(gai)念?这张图展示的(de)是以(yi)德国(guo)法(fa)兰克福为中(zhong)心(xin),覆盖整(zheng)个欧洲的(de)互联网时(shi)(shi)(shi)间情况,当网络通往东(dong)欧时(shi)(shi)(shi),延迟时(shi)(shi)(shi)间急剧(ju)增加(jia),超过(guo)了30或50毫秒。由于(yu)公有(you)云(yun)很(hen)难在每(mei)个国(guo)家都设置边缘节点(dian),因此(ci)需要大(da)量(liang)的(de)边缘节点(dian)来覆盖这些地区,比如土耳其、保加(jia)利亚等,以(yi)提高真(zhen)正即时(shi)(shi)(shi)交互的(de)体验。

简而言(yan)之,我(wo)们公(gong)司在全球各地(di)(di)(di)(di)都(dou)(dou)设有(you)一些(xie)边缘服务(wu),可以帮助用户在当(dang)(dang)地(di)(di)(di)(di)获取算力,东(dong)南(nan)亚(ya)(ya)、中(zhong)东(dong)地(di)(di)(di)(di)区我(wo)们都(dou)(dou)有(you)覆盖,在东(dong)南(nan)亚(ya)(ya)的十几个国家和每个国家的首都(dou)(dou)也(ye)都(dou)(dou)有(you)当(dang)(dang)地(di)(di)(di)(di)节点(dian),在南(nan)美(mei)(mei)(mei)洲和非洲也(ye)有(you)完整(zheng)的覆盖。至(zhi)于(yu)欧(ou)美(mei)(mei)(mei)地(di)(di)(di)(di)区,这(zhei)是传统网络覆盖比(bi)较好的地(di)(di)(di)(di)方,例如美(mei)(mei)(mei)国的美(mei)(mei)(mei)东(dong)、美(mei)(mei)(mei)西(xi)地(di)(di)(di)(di)区都(dou)(dou)有(you)广泛的覆盖,欧(ou)洲的保加利(li)亚(ya)(ya)和莫斯科(ke)也(ye)有(you)覆盖。

我(wo)们公司已经服务中国(guo)企业出海(hai)十多年了(le),我(wo)们的(de)logo布满了(le)整面墙,包(bao)括最早(zao)的(de)游戏、汽车企业,以及大型公有云,都是我(wo)们出海(hai)的(de)主要客户。

总结(jie)一(yi)下,AI已经(jing)为我们做了一(yi)些事情,但要实现真(zhen)正(zheng)(zheng)的(de)AGI还有很(hen)长的(de)路要走。在(zai)通往真(zhen)正(zheng)(zheng)AGI的(de)路上,有许多挑战,如需要更(geng)多的(de)数(shu)据(ju)、更(geng)广泛的(de)算力,以及全球范围内即(ji)时交互(hu)的(de)网络。我们公(gong)司则可以在(zai)这方(fang)面帮助大家。

以上是陈秀忠演讲内容的完整整理。