智东西(公众号:zhidxcom)
作者 | ZeR0 程茜
编辑 | 漠影

智东西2月20日报道(dao),今(jin)日,在微(wei)软连发其、两大重磅研究成果后(hou),知(zhi)名科(ke)技播客Dwarkesh Podcast第一时间放出对微(wei)软董事长兼(jian)CEO萨蒂亚(ya)·纳德拉的76分钟深度访谈,信息量(liang)非常大。

访谈涵盖了包(bao)含微软对AI发展走向、计(ji)算资源需求、集群建设、通(tong)用人工(gong)智能(neng)(AGI)基准、AI价格(ge)战、部署AI能(neng)力的(de)挑战、量子计(ji)算突破、游戏世界模型(xing)、混合现实(MR)梦(meng)想(xiang)、企业如何培养员工(gong)忠诚度、认(ren)知(zhi)劳动(dong)等话题。

当然还有近期科技行(xing)业必聊主(zhu)题——DeepSeek。

纳德(de)拉说,AI需要变得(de)更好(hao)且更便(bian)宜,每当有(you)像DeepSeek所取得(de)的(de)(de)这种突破时(shi),每个Token的(de)(de)性能效率前沿就会改(gai)变,这将带(dai)来更多的(de)(de)需求。

今年是微(wei)软成(cheng)立50周年。纳德拉希望保持“重(zhong)新(xin)创业(ye)”心态,谈(tan)到微(wei)软想要(yao)下得三(san)大赌注是AI、量(liang)子计算(suan)、MR,认为新(xin)发布的(de)游(you)戏世界(jie)模(mo)型Muse AI具(ju)有类似于“ChatGPT时刻”的(de)里(li)程碑(bei)意义,真实临场(chang)感仍(reng)是MR难以解决的(de)挑战,并判断计算(suan)资源价格会下降、SaaS行(xing)业(ye)将被AI重(zhong)塑。

在他看来,赢(ying)家通(tong)吃(chi)不会(hui)(hui)出(chu)现在超大(da)(da)规(gui)模市(shi)场,可能会(hui)(hui)出(chu)现在消费(fei)市(shi)场;在大(da)(da)模型(xing)领域,开源方案会(hui)(hui)确(que)保闭源赢(ying)家通(tong)吃(chi)的局面得到缓解,不会(hui)(hui)出(chu)现某家凭(ping)借一个模型(xing)独占市(shi)场的情况。

纳(na)德(de)拉直言,微(wei)软自称取得的一些(xie)AGI里程碑,在他看来“只是无意义的基(ji)准测试”。

在访谈期间(jian),他还(hai)分(fen)享了(le)微软曾(ceng)经失误所带来(lai)的一些(xie)教训(xun),比如错过搜索(suo),比如微软亚(ya)研院(yuan)曾(ceng)有上千个本(ben)应大力推进(jin)却没有的项目,并(bing)复盘原因是缺乏足够的信心(xin),对接纳(na)创新(xin)和(he)将其(qi)转化(hua)成商(shang)业模式缺乏完整的思考。

纳德拉最新专访:谈DeepSeek突破,批AGI测试无意义,预言计算会越来越便宜

以下是纳德拉访谈的(de)完整实录:

一、赢下客户端-服务器浪潮竞赛,错失“搜索”发展良机

主持人:祝贺你,微软刚刚取得两项突破,同一天在Nature上发表的量子处理器Majorana 1和首个世界和人类行动模型。不过首先我们能不能继续刚才的话题,你在80年代和90年代看到的事情以及你看到它们再次发生的感受。

纳德拉:能上你(ni)的播(bo)客太(tai)棒了,我是一个深度听众,我喜欢(huan)你(ni)做这些采访的方式和(he)你(ni)探索的广(guang)泛(fan)话题。

让我(wo)(wo)兴奋(fen)的(de)是,这让我(wo)(wo)想(xiang)起了(le)我(wo)(wo)在科技行业的(de)最(zui)初几年,从90年代开始,那里(li)有对RISC(精简指(zhi)令集(ji))还是CISC(复杂指(zhi)令集(ji))的(de)真(zhen)实争论,或者“我(wo)(wo)们真(zhen)的(de)能够(gou)使用x86构建服务器吗”等争论。

我加入微软(ruan)时正是(shi)Windows NT(面(mian)向工(gong)作站(zhan)、网络(luo)服务器和(he)大型(xing)计算机的(de)(de)网络(luo)操作系(xi)统(tong)系(xi)列)项目(mu)起步的(de)(de)时候。所以,从核心芯片平台到(dao)操作系(xi)统(tong),再到(dao)应用(yong)程(cheng)序层(ceng)级,全(quan)栈式(shi)方(fang)案的(de)(de)整个体(ti)系(xi)都在不断地深入研(yan)究(jiu)和(he)完(wan)善中。

当(dang)时分布式(shi)计算和(he)云改变了客(ke)户端(duan)-服务器(qi),网络发生了巨大的(de)变化,相(xiang)比于(yu)过去(qu)感觉(jue)更像一(yi)个(ge)完整的(de)堆栈,而我参与其中。

主持人:此前人们谈论数据中心建设是一个泡沫,但我们今天的互联网又是基于其建设而成。所以关于什么将经得起时间的考验?什么是固有的长期趋势?什么只是昙花一现?你如何看待。

纳德拉:回顾我经历过的四(si)大变(bian)革,其中之一就(jiu)(jiu)是(shi)客户(hu)(hu)端以及客户(hu)(hu)端-服务器模式(shi),也就(jiu)(jiu)是(shi)GUI(图形用户(hu)(hu)界(jie)面)和x86架构(gou)的诞生(sheng),基(ji)本上正是(shi)它们让(rang)我们能够构(gou)建服务器。

我很清楚(chu)这一点(dian)。我记得(de)1991年参加PDC大会时,我在(zai)Sun Microsystems(IT及互(hu)联网技术服务(wu)(wu)公(gong)司)工作。1991年我去了Moscone。当时微软首次描述了Win32接口,我很清楚(chu)接下来(lai)会发(fa)生什么——服务(wu)(wu)器将采用x86架(jia)构。

因此,当你拥有规模优势时,这就是你必须下注的长期赌注。客户(hu)端发生(sheng)的(de)事(shi)情也将在服务器(qi)端发生(sheng),然后你(ni)就可以(yi)真正构建客户(hu)端-服务器(qi)应用程(cheng)序。应用程(cheng)序的(de)模式变得(de)清晰起来(lai)。

那时网(wang)络(luo)发(fa)展对我(wo)们来说是件(jian)大(da)事,我(wo)们在创业之(zhi)初就(jiu)必须应(ying)对它。我(wo)一加入微软,Netscape浏(liu)览器或Mosaic浏(liu)览器问(wen)世,大(da)概在1993年12月左右(you),这些浏(liu)览器被(bei)开发(fa)出来。

所(suo)以,这在(zai)某种程度上改变(bian)了游戏(xi)规(gui)则(ze)。当时我们正处(chu)于客户(hu)端(duan)-服务器(qi)浪潮之中,很明显我们赢得了这场竞赛(sai)。

之后我们迎来浏览器时代,因此必须做出调整。我们很好地适应了浏览器时代新的应用模式。我们将其融(rong)入到微软所(suo)做(zuo)的(de)一切中,无论是Word中的(de)HTML还是其他新东西(xi),然(ran)后在服(fu)务器堆栈上构(gou)建网络服(fu)务器等(deng)。

当然,我们也错过了网络上最大的商业模式。因为(wei)我们都(dou)认为(wei)网(wang)(wang)络(luo)是分布式的(de),谁会想到搜索会成为(wei)组织网(wang)(wang)络(luo)的(de)最大赢(ying)家(jia)?显然(ran),这是我们没(mei)有(you)看(kan)到的(de)地方,而谷歌看(kan)到了它并执行(xing)得非常好。

所以这是我学到的一个教训:你不仅要正确把握技术趋势,还要了解该趋势将创造什么价值,这些商业模式的转变可能比技术趋势的变化还要困难。

二、AI领域不会赢家通吃,基础设施需求将呈指数级增长

主持人:AI将在哪里创造价值?

纳德拉:这是伟大的。我对两(liang)个地(di)方有信心:

其一是表现出色的超大规模云服务提供商,因为从根本上来说,如果你回想一下萨姆·阿尔特曼(OpenAI CEO)和其他人的描述就会发现,智能程度与计算能力呈对数相关,因此谁能够进行大量的计算,谁就是大赢家

其二,如果你仔细观察ChatGPT等任何AI工作负载,你会发现并不是每个人都对GPU方面发生的事情感到兴奋,虽然GPU方面的发展确实很不错。实际上,我在考虑自己的设备集群时,会将其看作是AI加速器、存储和计算之间的一种比例关系。而且从(cong)规模(mo)角(jiao)度来看,你(ni)必须对其进行扩展。

因此,世界对基础设施的需求将呈指​​数级增长。拥有(you)这(zhei)些AI工作(zuo)负(fu)载简直就是天(tian)赐(ci)良机,它(ta)们对(dui)更多计算能力的需求极大(da),而且不仅仅是在训练(lian)方面,在测试(shi)阶(jie)段同样如此。

当你想到一个AI agent时,事实证明,AI agent会以指数级的速度增加计算资源的使用量,因为(wei)这已不(bu)再仅仅局限于一个人调用(yong)(yong)一个程(cheng)序,而(er)是一个人调用(yong)(yong)的程(cheng)序会进而(er)调用(yong)(yong)更多的程(cheng)序。这将会对(dui)计算基础设施产生巨大无比(bi)的需求,并推动其规模不(bu)断扩大。

所以,我们的(de)超大(da)规模业务(wu),也(ye)就(jiu)是(shi)微软的(de)Azure业务(wu),以及(ji)其他超大(da)规模云服务(wu)提(ti)供商的(de)业务(wu),我认(ren)为这都是(shi)非常重(zhong)要的(de)发展方向。

在那之(zhi)后,情(qing)况(kuang)就变得(de)有点模糊了。你可能会说“嘿,存(cun)在一种赢者通(tong)吃(chi)的模式”,但我就是不这么认为。

顺便说一下,这是我学到的另一件事:在某种意义上,真正擅长分辨哪些是赢者通吃的市场,哪些不是赢者通吃的市场,这才是关键所在

我还记(ji)得,在我刚(gang)涉足Azure业务的早期,亚马逊就已经遥(yao)遥(yao)领先了。人(ren)们会来找我,投资者(zhe)也会找到我,他们说:“哦,一切(qie)都(dou)结束了。你们永远也做不(bu)成的。亚马逊是(shi)赢者(zhe)通吃(chi)的,这已经是(shi)定局(ju)了。”

在客户端-服务器领域,甲骨文与IBM竞争的经历让我明白,买家(jia)是不会容忍“赢者通吃”的局面(mian)的。

从结构上看,超大规模市场永远不会是 “赢者通吃” 的,因为买家都很精明

消费市场有时可能会出现 “赢者通吃” 的情况,但只要买家是企业、公(gong)司或企业的IT部门(men),他们就会希望有(you)多个供应商。所以,你必须(xu)成为众(zhong)多供应商中(zhong)的一员。

我认为,大模型领域也会是这样的情况,会有开源(yuan)模(mo)型、监管机制等。就像(xiang)Windows系统(tong)给我的一个(ge)重要教训:如(ru)果你有一个(ge)闭源(yuan)操(cao)作系统(tong),就必(bi)然会有与(yu)之(zhi)互(hu)补(bu)的开源(yuan)产品出现。所以(yi)在某种(zhong)程度上,这确实能对(dui)市场情(qing)况起(qi)到制衡作用(yong)。

我觉得在模型方面,或许会有一些闭源模型,但肯定也会有开源的替代方案。而且开源的替代方案会确保那种闭源 “赢者通吃” 的局面得到缓解

这就是我(wo)对模型领(ling)域(yu)的看(kan)法。

顺便说(shuo)一下,如(ru)果AI真的像人们所认为的那(nei)样强(qiang)大,政府(fu)是不(bu)会坐视不(bu)管(guan)任由私营企(qi)业在全球范围内随意(yi)发(fa)展(zhan)的。

所以,我不认为这(zhei)会是 “赢者通吃” 的局面。

除此之外,我认为情况还是和(he)以往一样,在(zai)消(xiao)费领域的(de)某些品类中,可(ke)能(neng)会(hui)出现一些 “赢者通吃(chi)” 的(de)网络(luo)效应。

毕竟ChatGPT就是(shi)一个很好的例子。它是(shi)一个大规模的消费级产品,已经获得了(le)真正的发(fa)展动力。我(wo)打开(kai)应用商店,总能看到它排(pai)在前五名,我(wo)就会感叹:“哇,这太(tai)不可思议了(le)。”

所(suo)以(yi)他们能够利(li)用(yong)早期的优势(shi)(shi),并将其转化为应用(yong)程序(xu)方面的优势(shi)(shi)。在消(xiao)费领(ling)域,这种(zhong)情况是(shi)可能发(fa)生的。但在企业(ye)领(ling)域,我认为按(an)不同类别(bie)划分,会(hui)有不同的赢(ying)家。至(zhi)少(shao)这是(shi)我分析(xi)得出的结论。

主持人:如果拥有了通用人工智能(AGI),并且它能帮助你开发出更好的AI,也许未来会出现自动化的AI研究工具等,来巩固企业自身优势,我很好奇你的想法,在这个领域保持领先真的很重要。

纳德拉:从模型的角度来看,没有什么东西是完全商品化的。就(jiu)你(ni)提到的(de)云(yun)计算(suan)(suan)来说,大家都会说:“哦(e),云(yun)计算(suan)(suan)是商品化(hua)的(de)产品。” 但实(shi)际(ji)上,当你(ni)扩大规(gui)模,这就(jiu)是为什么运营超大规(gui)模云(yun)服(fu)务(wu)需(xu)要专业知识, 你(ni)可能会说:“哎呀,这有什么难的(de)?我只(zhi)要把服(fu)务(wu)器组装起来就(jiu)行了。”

事实上,在(zai)超大(da)规(gui)模云服(fu)(fu)务(wu)发(fa)展的早期,大(da)多数人都(dou)(dou)认为(wei) :“市场上有(you)那(nei)么多托管(guan)服(fu)(fu)务(wu)提供商,他们(men)的业(ye)务(wu)都(dou)(dou)不怎(zen)么样。超大(da)规(gui)模云服(fu)(fu)务(wu)会(hui)有(you)前景吗?这到(dao)底能(neng)不能(neng)成(cheng)为(wei)一(yi)门生意呢?” 但结果证明(ming),这确实是(shi)一(yi)门实实在(zai)在(zai)的生意,这就(jiu)是(shi)因为(wei)具备(bei)了运营的专业(ye)知识。以(yi)Azure为(wei)例(li),要在(zai)全球60多个地区运营计算业(ye)务(wu),管(guan)理所有(you)的计算资源,这可不是(shi)件容易(yi)复制的事情(qing)。

所以我想说的重点(dian)是(shi),市场上会只有(you)一(yi)个赢家吗?这(zhei)到底(di)是(shi)不是(shi) “赢者通吃” 的局(ju)面(mian)呢(ni)?因为(wei)你必须搞清楚这(zhei)一(yi)点(dian)。

我(wo)喜欢(huan)进入那些(xie)市场总量(TAM)很大(da)的(de)领域(yu),在这(zhei)样的(de)领域(yu)里(li),你不必(bi)承担所有(you)的(de)风险,因为(wei)不会出现 “赢者通(tong)吃” 的(de)情(qing)况。最理(li)想的(de)情(qing)况是进入一个(ge)大(da)市场,这(zhei)个(ge)市场能(neng)够容纳几个(ge)赢家(jia),而你就是其(qi)中之一。

这就是(shi)超大规模云服务层面的情况。模型最(zui)终需要(yao)在超大规模的计算资源上(shang)运行(xing)。所以我觉得这种联系会一直(zhi)存在。

同时(shi),这不(bu)仅仅是模型的问题(ti)。模型需(xu)(xu)要(yao)状态存储,这意味着它需(xu)(xu)要(yao)存储设备,而且运(yun)行这些agent及其运(yun)行环境也需(xu)(xu)要(yao)常规的计算(suan)资源。

所以我认为,不会出现某一(yi)家凭借一(yi)个(ge)模型独(du)占市场并一(yi)统天下的情况。

三、顺应摩尔定律构建集群,在全球建立推理集群

主(zhu)持人:作为超大规模云服务提供商,在推理阶段的规模扩展方面,微软不仅可以将数据中心和GPU用于训练,还可以再次用于推理,从而分摊成本。那你认为微软和Azure属于哪一类超大规模云服务提供商呢?是专注于预训练方面吗?还是提供像o3类型的推理服务呢?或者你们只是会托管和部署市场上的任何一种模型,对此并不偏袒呢?

纳德拉:这是个(ge)很好的问题。我们构建设备集群的方(fang)式在某种(zhong)程度上是顺应(ying)摩尔(er)定律的。

我认为(wei)这(zhei)就(jiu)和(he)我们过(guo)去做其(qi)他事情一(yi)样(yang):每(mei)年都对设(she)备(bei)集群(qun)(qun)进行(xing)(xing)更新,根(gen)据设(she)备(bei)的使用寿命对其(qi)进行(xing)(xing)折(zhe)旧(jiu)处理,然(ran)后非常(chang)熟练(lian)地对设(she)备(bei)集群(qun)(qun)进行(xing)(xing)布局(ju),这(zhei)样(yang)就(jiu)能以高(gao)利用率运行(xing)(xing)不同(tong)的任务。

有(you)时(shi)候会有(you)非常大型的训练任务,需要(yao)为(wei)其配置高(gao)度集中(zhong)的峰值(zhi)运(yun)算能力,而且这些任务还需要(yao)协同运(yun)行。因(yin)此我们应该拥(yong)有(you)足够(gou)的数据中(zhong)心规模(mo)来(lai)满足这一需求。

但归根结底,这些任务规模(mo)都(dou)会变得(de)非常庞大(da),即使从预训练(lian)的(de)规模(mo)来(lai)看,如果要持续(xu)发展,在某(mou)个阶段(duan)预训练(lian)的(de)规模(mo)也必须(xu)跨越数据中心的(de)界限。基本上就是这样的(de)情(qing)况。

所(suo)以,一(yi)旦你开始(shi)跨(kua)越(yue)预训练(lian)的(de)(de)(de)数据中心(xin)界限,这和(he)其他情况(kuang)有什么不同吗?我是这样想的(de)(de)(de):分布式(shi)计算仍然(ran)是分布式(shi)的(de)(de)(de),所(suo)以构建(jian)你的(de)(de)(de)设备集群(qun),使其能(neng)够(gou)应对大型(xing)训练(lian)任务(wu),能(neng)够(gou)满(man)足测(ce)试(shi)阶段的(de)(de)(de)计算需(xu)求,甚至能(neng)够(gou)应对强化(hua)学习(RL)可能(neng)带来的(de)(de)(de)情况(kuang)。

你构(gou)建了一个大(da)(da)模(mo)型,然(ran)后(hou)会有(you)大(da)(da)量的(de)强化学习任务要(yao)处(chu)理。对我来说(shuo),这就像是更多的(de)训练运算(suan),为不同的(de)任务创建高度专业化、精简的(de)模(mo)型。

所以你(ni)需要这样的设备集群,然(ran)后是(shi)服务需求。

说到底,光速是固定的。你不能只在得克萨斯州建一个数据中心,然后说:“我要从这里为全世界提供服务。”你必须在全球各地都建立推理设备集群,才能为全世界提供服务。这就是我对(dui)构建真正超大规(gui)模设(she)备集群的(de)理解(jie)。

顺便说一下,我(wo)(wo)还希望我(wo)(wo)的(de)存储(chu)和计算资源也(ye)能(neng)靠近这些(xie)设备(bei),因为(wei)不仅仅是(shi)(shi)AI加速器是(shi)(shi)无状态的(de),我(wo)(wo)的(de)训练数据本身也(ye)需要存储(chu),而且我(wo)(wo)希望能(neng)够复用多个(ge)训练任务。我(wo)(wo)希望能(neng)够创(chuang)建这些(xie)环境,让agent可(ke)以(yi)在其中执行(xing)程序(xu)。这就是(shi)(shi)我(wo)(wo)的(de)大(da)致(zhi)想法。

四、AGI的真正基准:世界经济增速达10%

主持(chi)人:微软的财报显示每年AI中获得的收入达到130亿美元。基于同比增长,这一数字四年后将会达到1300亿美元。如果是这样,您将会如何利用这些工业规模的智能?这会通过Office(办公软件)来实现吗?还是说你会将其部署好后让其他人来托管?要拥有AGI才能实现1300亿美元的营收吗?实际情况到底会如何?

纳德拉:在我看来这是一个很好的问题,因为在某种程度上,如果你要实现这种爆炸式增长,我们首先要观察的就是GDP增长。在我讨论微软的收入情况之前,这一切有一个决定因素,就是我们对AGI的过度炒作

发达国家吗(的GDP)增长率为2%,如果考虑到通货膨胀,增长率可能为0。因此在2025年,虽然我不是经济学家,但至少我认为我们正面临真正的增长挑战。因此,所有人要做的第一件事是,让我们实现工业革命式的增长

对我来说,这意味着10%、7%,或者(zhe)发达国家通货膨(peng)胀调(diao)整(zheng)后的增长率达到5%,这是真正的指标。

很多人都在写这方面的文章,我很高兴他们这么做,也就是说,最大的赢家不会是科技公司。赢家将是使用这种商品的更广泛的行业。顺(shun)便说(shuo)一句,这种商品非常(chang)丰富。生产力突然上升,经济增长速度(du)加快,这种情况发生时,我们这个行业就(jiu)会(hui)安然无恙。

但对我来说,这只是当下。我们自称取得了一些AGI里程碑,但在我看来,这只是无意义的基准测试。真正的基准是:世界以10%的速度增长

主持人:如果世界经济增长率为10%,世界经济规模将达到100万亿美元左右,每年就相当于额外创造了10万亿美元价值。如果是这样的话,你作为超大规模企业……难道你不应该投资8000亿美元吗?如果你真的认为在几年内,我们真的可以按照这个速度发展世界经济,那么关键的瓶颈就是:你是否拥有部署这些AI来完成所有这些工作所需的计算能力?

纳德拉:没错。但顺便说(shuo)一(yi)(yi)句(ju),典型(xing)的供(gong)应(ying)方是,“嘿,让我(wo)建造它,他们(men)就会来”。这是一(yi)(yi)个论点(dian),毕(bi)竟我(wo)们(men)已经做(zuo)(zuo)到了这一(yi)(yi)点(dian),我(wo)们(men)已经承担了足够的风险去做(zuo)(zuo)这件事(shi)。

但在某些时候,供(gong)应和需(xu)求(qiu)必须对(dui)应起来。这(zhei)就(jiu)是我跟(gen)踪供(gong)应和需(xu)求(qiu)的原(yuan)因。如果你只关注供(gong)应方,而不真正了解(jie)如何将其转化为(wei)对(dui)客户的实际(ji)价值,那么(me)你可能会完(wan)全(quan)偏离轨道。

这就是我(wo)关(guan)注我(wo)的(de)推理(li)收入的(de)原因。这也是为(wei)什么即使披露推理(li)收入也是如此……有(you)(you)趣的(de)是,没(mei)有(you)(you)多(duo)少(shao)人谈论他们的(de)实际收入,但对我(wo)来说,作(zuo)为(wei)一名管理(li)者(zhe),你如何看待(dai)这一点很重要。

你(ni)不会说它们必须在任何(he)特定(ding)的(de)(de)(de)时间(jian)点对(dui)称地(di)满足(zu),但你(ni)需要有存(cun)在的(de)(de)(de)证(zheng)据,证(zheng)明(ming)你(ni)能(neng)够(gou)将昨天的(de)(de)(de)资(zi)本转化为(wei)今天的(de)(de)(de)需求,这样(yang)你(ni)就可以(yi)再次(ci)投资(zi),甚至(zhi)可能(neng)是指数(shu)级的(de)(de)(de)投资(zi),因为(wei)你(ni)知道(dao)你(ni)不会完全出现利率错配。

五、构建模型是“创造商品”的竞赛,计算资源的价格会下降

主持人:我想知道这两种不同的观点是否存在矛盾,因为你做得非常出色的一件事就是做出这些早期的押注。你在2019年就投资了OpenAI ,当时Copilot和任何应用程序都还未出现。如果你回顾工业革命时期,当时铁路之类的基础设施建设投入占比达到6%、10% ,很多情况并不是说 “我们靠卖车票获得了收入,然后现在我们打算……”

如果你真的认为这里有潜力让世界增长率达到10倍或5倍,然后你会想:“那么,GPT-4的收入是多少?”如果你真的认为这是更高层次的可能性,难道你不应该说:“让我们疯狂起来,让我们进行数千亿美元的计算吧?”

纳德拉:这很(hen)有趣。这就是为什么(me)即便是这种平衡的(de)集群方法(fa)(fa)对我来说也非常重要。这是关(guan)于(yu)构建(jian)计算,它不仅可以(yi)帮助我训练下一个大(da)模(mo)型,还可以(yi)服务(wu)于(yu)下一个大(da)模(mo)型。除非你(ni)做(zuo)到这两点,否(fou)则你(ni)将无(wu)法(fa)(fa)真正利用你(ni)的(de)投(tou)资(zi)。

所以,这不仅仅是一场建立模型的竞赛,而是一场创造一种商品的竞赛,这种商(shang)品(pin)将被(bei)世界用来(lai)驱动……你(ni)必须有一个完整的想法,而(er)不仅仅是你(ni)正(zheng)在(zai)思考(kao)的一件(jian)事(shi)。

其中一个情况是会出现过度建设。就像(xiang)你提到的(de)互联网泡(pao)沫时代发生的(de)事情那样,现在已经有(you)这样的(de)信(xin)号了。你需(xu)要更(geng)多(duo)(duo)的(de)能(neng)源,也(ye)需(xu)要更(geng)多(duo)(duo)的(de)计算能(neng)力(li)。所以,每个人都(dou)会竞相投入(发展)。

不仅仅是公司在部署(shu),各国也将部署(shu),而且显(xian)然……我很(hen)高兴能成为供应商。因为,顺(shun)便说一下(xia),我建设了很(hen)多(设施),也出租了很(hen)多(计算(suan)资源(yuan))。

我很兴(xing)奋在2027年(nian)、2028年(nian)能(neng)够出租大量的计(ji)算能(neng)力,因为我看到这(zhei)些(xie)建设项目时就(jiu)会想:“这(zhei)太棒(bang)了。”

随着所有这些计算设施的建设,唯一会出现的情况就是计算资源的价格将会下降

主持人(ren):从消费者的使用场景来看,AI已经非常便宜了,大概是每百万个Token只需2美分,我觉得我真正受限于它能否变得更智能而非价格。但也许你在企业端看到的情况有所不同,到底是什么关键的AI使用场景,真的需要把价格降到每百万个Token 0.002美分呢?

纳德拉:我认为关键在于Token的效用,AI需要变得更好且更便宜。每当有像DeepSeek所取得的那种突破时,每个Token的性能效率前沿就会改变,这(zhei)只(zhi)会带来更(geng)多的需求,云计(ji)算(suan)领域就是(shi)这(zhei)样(yang)的情(qing)况。

有件很(hen)有意思的事:我们(men)过去常想“天哪,在客户端-服务器(qi)时代,我们(men)已经把所有能卖的服务器(qi)都卖出去了(le)”。然而,一旦我们(men)开(kai)始把服务器(qi)部署到(dao)(dao)云端,突(tu)然间人(ren)们(men)的使(shi)用量增加了(le),因为(wei)他(ta)们(men)可以更便宜地购(gou)买服务,而且服务具(ju)有弹性,他(ta)们(men)可以按计量方式购(gou)买,而不是购(gou)买许(xu)可证,这使(shi)得市场规模得到(dao)(dao)了(le)彻底(di)扩大。

我记得(de)(de)有(you)一(yi)次去(qu)印度(du)宣传 “SQL Server(微软的(de)数据库管理系统(tong))”。但(dan)我们(men)只卖出了一(yi)点点,但(dan)是,印度(du)的(de)云(yun)计算(suan)市场规模比我们(men)在服务器时代于当(dang)地取得(de)(de)的(de)任何成绩都要大得(de)(de)多。我认为这种情况还会持续下(xia)去(qu)。

你想(xiang)想(xiang)一(yi)下,如(ru)果未来在一(yi)个发展(zhan)中国家的医疗健康(kang)领(ling)域能有非常(chang)便宜的Token可用,那将(jiang)是(shi)有史以来最大(da)的变(bian)革。

六、AI能力部署的挑战是变革管理、工作流程

主持人:作为一个与财富500强企业合作,并且正在帮助他们为成百上千万甚至数十亿人部署产品的人,你认为这些能力的部署速度会有多快呢?即使你有了可用的agent、可以远程工作的工具,但考虑到所有的合规要求和固有的瓶颈,这些会成为很大的阻碍吗?还是说会很快克服这些问题?

纳德拉:这确实会是一个真正的挑战,因为真正的问题在于管理或流程变革。我常打的一个(ge)比方是(shi),想象一下像(xiang)我们(men)这(zhei)样的跨国公司在PC(个(ge)人电脑)、电子(zi)邮件和电子(zi)表格出现(xian)之前是(shi)如何做(zuo)预(yu)测的,当时靠传真(zhen)来(lai)传递信息(xi)。有人收到传真(zhen)后(hou),会写一份部门间(jian)的备忘录然后(hou)传阅,人们(men)输入数(shu)据,最(zui)后(hou)可(ke)能刚好在新季度开始前得出预(yu)测结果。

然后有人说:“嘿(hei),我只(zhi)要(yao)用Excel电子表格(ge),把它(ta)放(fang)在(zai)电子邮件(jian)里发(fa)出去。人们可以(yi)去编辑它(ta),这样我就能(neng)得到(dao)一份预测了(le)。”

因此,整(zheng)个预(yu)测业务(wu)流程(cheng)发(fa)生了改变,因为工(gong)作成果(guo)和工(gong)作流程(cheng)发(fa)生了变化(hua)。

AI被引入知识工作领(ling)域(yu)也会发生(sheng)这(zhei)样的(de)改变。实际上,当(dang)我们想到所有这(zhei)些agent时,最根本的(de)是出现(xian)了新的(de)工作内容和工作流程。

例如,在(zai)准(zhun)备播客时,我(wo)会向(xiang)Copilot说:“嘿,我(wo)要谈谈我(wo)们(men)在(zai)量子领(ling)域(yu)的(de)(de)宣布事项以及我(wo)们(men)为游戏生成(cheng)构建的(de)(de)新(xin)模型(xing),给我(wo)一(yi)份我(wo)在(zai)谈话(hua)前(qian)应该了解(jie)的(de)(de)所有(you)内容的(de)(de)总结。”

它知道(dao)那(nei)两篇(pian)Nature期(qi)刊上的论文,并(bing)且提取了相关内容。我(wo)还可以说:“用播(bo)客的格式给我(wo)呈现。” 然后它能模拟我(wo)们两人关于这个话题的对话。

所以这就(jiu)(jiu)成了。然后(hou),我把(ba)它(ta)(ta)分享(xiang)给了我的(de)团队,把(ba)它(ta)(ta)放到(dao)文档工具里分享(xiang)出(chu)去。对我来说,新(xin)的(de)工作(zuo)流程就(jiu)(jiu)是(shi)借助AI并和我的(de)同事一起工作(zuo)。

这(zhei)对于每个从(cong)事知识工作的(de)人(ren)来说,都(dou)是(shi)一个根本(ben)性的(de)变革管理。他们突然要(yao)弄(nong)清楚这(zhei)些(xie)新(xin)的(de)模式,即 “我(wo)要(yao)如何以新(xin)的(de)方式完成我(wo)的(de)知识工作”,这(zhei)是(shi)需要(yao)时间(jian)的(de)。在销售、财务和(he)供应链等(deng)领域也会是(shi)这(zhei)样。

对于一(yi)家现有企业(ye)来说,我认会是(shi)(shi)这(zhei)(zhei)样一(yi)种(zhong)情况——我喜(xi)欢用(yong)的(de)(de)一(yi)个比(bi)喻(yu)是(shi)(shi)制造(zao)商(shang)在精(jing)益生(sheng)(sheng)产(chan)方面做的(de)(de)事(shi)情。我很喜(xi)欢这(zhei)(zhei)个比(bi)喻(yu),因为(wei)从某种(zhong)意(yi)义上(shang)说,通过精(jing)益生(sheng)(sheng)产(chan)方法(fa),人们(men)可以在制造(zao)业(ye)中采用(yong)端到端的(de)(de)流(liu)程提高效率。这(zhei)(zhei)是(shi)(shi)一(yi)种(zhong)持续(xu)改(gai)进,即减少浪费并增加价值。

这也会应用到知识工作(zuo)(zuo)领域。这尤其像是知识工作(zuo)(zuo)的精益生产方(fang)法(fa),将是管(guan)理团(tuan)队和从事知识工作(zuo)(zuo)的个(ge)人(ren)需要付出努(nu)力(li)的地方(fang),并且这需要时间。

主(zhu)持人:精益生产所做的一件事是从物理层面上改变了工厂车间的样子,它揭示了一些人们直到真正关注流程和工作流程时才意识到的瓶颈。由于AI,你自己的工作流程发生了怎样的变化。当你拥有这些随着时间推移变得越来越智能的agent时,经营一家大公司会是什么样子?

纳德拉:这个问题很有意思。比如说(shuo),今(jin)天我们(men)对电子(zi)邮(you)(you)件(jian)的(de)依赖程度非常高。我早上来上班(ban),就会想(xiang),天哪,我的(de)收件(jian)箱(xiang)都满了,我得回复邮(you)(you)件(jian),所以我迫(po)不及待地希望Copilot能自动帮我写好草稿(gao),这样我就可(ke)以直接开始审核和发送了。

我(wo)(wo)在Copilot中至少(shao)已(yi)经有了十(shi)个(ge)agent,我(wo)(wo)会(hui)针对不同(tong)(tong)的(de)任务向它们(men)询(xun)问不同(tong)(tong)的(de)事情(qing)。我(wo)(wo)感觉未(wei)来会(hui)创建(jian)一个(ge)新的(de)收件(jian)箱(xiang),在这个(ge)收件(jian)箱(xiang)里(li),我(wo)(wo)正在使用(yong)的(de)数百万(wan)个(ge)agent将不得不向我(wo)(wo)报告一些异常情(qing)况、给(ji)我(wo)(wo)发送通(tong)知,或者(zhe)向我(wo)(wo)请求指(zhi)示。

所以至少我(wo)在想的(de)是,会有一(yi)个新的(de)架构,也就是agent管(guan)理(li)器。它(ta)不只是一(yi)个聊天界面,我(wo)需要一(yi)个比聊天界面更智能的(de)东西来管(guan)理(li)所有的(de)agent以及它(ta)们之间的(de)对话。

这就是(shi)(shi)为什么我认为智能助(zhu)手(Copilot)作为AI的(de)用户界(jie)面,是(shi)(shi)非常非常重要的(de)。我们(men)每个(ge)人都会用到它。

基本上(shang)可以这样想(xiang):有(you)知(zhi)识工作(zuo)(zuo),也有(you)知(zhi)识工作(zuo)(zuo)者(zhe)(Knowledge Worker)。知(zhi)识工作(zuo)(zuo)可能由许许多(duo)多(duo)的agent来(lai)完成,但仍然会有(you)一(yi)个知(zhi)识工作(zuo)(zuo)者(zhe)来(lai)处理所有(you)这些agent的工作(zuo)(zuo)。我认为这就是需(xu)要构建的界面。

七、实现“量子计算领域的晶体管时刻”

主(zhu)持人:微软研究院宣布的在量子领域的重大突破。你能解释一下是怎么回事吗?

纳德拉:这对我(wo)们(men)来说是一(yi)段长(zhang)达30年(nian)的历程。太不可思议了。我(wo)是微软的第三任CEO,对量(liang)子领(ling)域(yu)一(yi)直很感兴趣(qu)。

这里的根本突破,或者说我们一直以来的愿景是,为了构建一台实用规模的量子计算机,你需要在物理学上取得突破

我们选择了这样一条道路,即拥有一个噪音更小或更可靠的量子比特的方法,是押注于一种从定义上来说更可靠的物理特性,这就是为什么我们关注马约拉纳零能模(Majorana zero modes),这一理(li)论(lun)在20世纪30年代就被(bei)提出(chu)。

问题是,我(wo)们(men)实际上能(neng)否在物理上制(zhi)造(zao)出(chu)(chu)这(zhei)些东(dong)西呢?我(wo)们(men)真的能(neng)构建出(chu)(chu)来吗?

所以,重大突破是,我知道你和切坦(Chetan Nayak,微软技术研究员)聊过,我们现在终于有了存在性证明,并且在一种新的物质状态下有效地实现了马约拉纳零能模的物理学突破。这就是为什么我们喜欢把这个比喻为“量子计算领域的晶体管时刻”

我(wo)们有了(le)一(yi)个拓扑相,这意(yi)味着我(wo)们甚至可以可靠(kao)地隐(yin)藏量(liang)子信息、对其进行测(ce)量(liang)并(bing)且制(zhi)造它。所以我(wo)们觉得有了(le)这个核心的基础制(zhi)造技术(shu),我(wo)们就(jiu)可以开始构建(jian)Majorana芯(xin)片了(le)。

我认为(wei)Majorana 1将是第一颗能够拥有100万个物理(li)量子比特(te)的(de)芯片。在(zai)此基础上,经过纠错后(hou)会有数(shu)千(qian)个逻(luo)辑量子比特(te)。然后(hou)就可以大展身手(shou)了。

你突然(ran)就有能力(li)构建一(yi)台(tai)真(zhen)正实(shi)(shi)用规(gui)模(mo)的(de)量子计算(suan)机,对(dui)(dui)我(wo)来说,现在这变得更加可行了。如(ru)果(guo)没有这样的(de)突破(po),你仍然(ran)可以实(shi)(shi)现一(yi)些里程碑,但你永远无法构建一(yi)台(tai)实(shi)(shi)用规(gui)模(mo)的(de)计算(suan)机。这就是(shi)为(wei)什么我(wo)们对(dui)(dui)此(ci)感到兴奋。

我们叫它(ta)Majorana 1,我很高兴我们以它(ta)来命名。想想看,我们能够在(zai)这么小的尺寸内构建出像拥有100万个(ge)量(liang)子(zi)比特的量(liang)子(zi)计算机这样的东西,真是不可思(si)议。

关键在于(yu),除非我们能够做到这一点(dian),否(fou)则你根本无法想象(xiang)构建一台实(shi)用规(gui)模的量子(zi)计算机(ji)。

主持人:这太神奇了。谷歌、IBM也宣布了拥有100个物理量子比特,但你们的成果在可扩展性方面远超其他公司吗?

纳德拉:是(shi)的。我(wo)们(men)还采取(qu)了(le)一种(zhong)方法,就(jiu)是(shi)将(jiang)软件和硬(ying)件分离开来。我(wo)们(men)正在构建(jian)我(wo)们(men)的软件栈,而且我(wo)们(men)现在与研究中性原(yuan)子、离子阱的团队合(he)作(zuo)(zuo),我(wo)们(men)也(ye)在与其(qi)他(ta)在光子学(xue)等(deng)方面有很好(hao)方法的团队合(he)作(zuo)(zuo),这意味(wei)着会有不同类型的量子计算(suan)机。

我(wo)(wo)们(men)上(shang)次(ci)宣布的是(shi)拥有24个逻辑量(liang)(liang)子(zi)(zi)比特。所以我(wo)(wo)们(men)在(zai)纠错方面也取得了一些突(tu)破,这(zhei)就是(shi)为(wei)什么即(ji)使在(zai)中(zhong)性(xing)原子(zi)(zi)和离子(zi)(zi)阱(jing)量(liang)(liang)子(zi)(zi)计算机方面,我(wo)(wo)们(men)也能构建出(chu)20多个(逻辑量(liang)(liang)子(zi)(zi)比特),而且(qie)我(wo)(wo)认为(wei)今年这(zhei)一数字还(hai)会继(ji)续增加,你(ni)会看到我(wo)(wo)们(men)不断提高这(zhei)个标(biao)准。

但(dan)我(wo)们(men)(men)也说(shuo)过:“让我(wo)们(men)(men)从(cong)最(zui)基本的(de)原理出发,构建我(wo)们(men)(men)自己的(de)基于拓扑量子比特的(de)量子计算机。” 这就是这次突破的(de)意(yi)义(yi)所在(zai)。

主持人(ren):太神奇了。100万个拓扑量子比特、数千个逻辑量子比特,达到这个规模的预计时间线是怎样的呢?这里有类似摩尔定律的规律吗?如果你已经有了第一个 “晶体管”(比喻关键突破),后续会怎样发展呢?

纳德拉:我们已经(jing)在这个领域努力了30年(nian)。我很高兴(xing)我们现在在物理学和制(zhi)造技(ji)术(shu)方面都(dou)取得了突(tu)破(po)。

我(wo)希望我(wo)们(men)已经有一(yi)台量(liang)子计算机。量(liang)子计算机能让我(wo)们(men)做的(de)(de)第(di)一(yi)件(jian)事(shi)就是制造更多的(de)(de)量(liang)子计算机,因(yin)为用它来模拟逐个(ge)原(yuan)子构建(jian)这些新的(de)(de)量(liang)子门会容易得多。

但(dan)无论如何,接(jie)下来(lai)真正要做(zuo)的是,既然我们已经有了制(zhi)造技术(shu),那就让我们去构建(jian)第一台容错量子计算机吧。这将(jiang)是顺(shun)理成章的事情。

所以(yi),我现(xian)在可(ke)以(yi)说,“也许在2027年(nian)、2028年(nian)、2029年(nian),我们将能够真正构(gou)建出这样的计算机(ji)”。

现(xian)在(zai)我们有了这一个门电路(lu),我能把它集(ji)(ji)成(cheng)到集(ji)(ji)成(cheng)电路(lu)中(zhong),然(ran)后真正把这些(xie)集(ji)(ji)成(cheng)电路(lu)放入(ru)一台真正的(de)计算(suan)机中(zhong)吗?这就是接下来的(de)合理步骤。

主持(chi)人:那你认为在2027、2028年,当它能运行的时候,会是什么样的使用方式呢?是通过API来使用它吗?还是你们会在内部将其用于材料和化学方面的研究呢?

纳德拉:这(zhei)是个很好的问题。有一件事我(wo)一直(zhi)很兴奋,我(wo)们有量(liang)子项目,并为它添(tian)加(jia)了(le)一些API。大概两年前(qian)我(wo)们取得的突破是将高性能计算(HPC)堆(dui)栈、AI堆(dui)栈和量(liang)子计算结合起来考(kao)虑。

仔(zi)细想(xiang)想(xiang),AI就(jiu)(jiu)像是(shi)模拟器的仿(fang)真器。量子计(ji)算就(jiu)(jiu)像是(shi)对自然(ran)的模拟。量子计(ji)算能做什(shen)么呢?顺便说一下,量子计(ji)算不会取(qu)代经(jing)(jing)典计(ji)算。量子计(ji)算在它擅长的领域(yu)表现出色,经(jing)(jing)典计(ji)算也会。

量(liang)子计算对(dui)于任何在状(zhuang)态空(kong)间方面不是数(shu)据密(mi)集型而是探(tan)(tan)索密(mi)集型的任务都非常出色,也就(jiu)是说,数(shu)据量(liang)相对(dui)较少(shao),但你想要探(tan)(tan)索的状(zhuang)态是指数(shu)级的领域。大模型就(jiu)是一个很好的例子,还有化学、物理、生(sheng)物等领域。

我(wo)们已(yi)经(jing)开始(shi)做的一件事,是(shi)真正把AI用作(zuo)仿真引(yin)擎,你可以(yi)对其进行训练。

我是这样想的,如果你(ni)有AI+量(liang)子(zi)计算(suan),也许你(ni)会(hui)用量(liang)子(zi)计算(suan)来生成合成数(shu)据,然后用这些(xie)数(shu)据来训练更(geng)好的模型,这些(xie)模型能(neng)够在化学、物(wu)理等领域进行建模。这两者将结合使用。

所以这(zhei)就(jiu)是今(jin)天,我们将(jiang)高性能计算(suan)和AI结合起来所做的(de)(de)事情。我希望(wang)用量子计算(suan)机来取(qu)代一些高性能计算(suan)的(de)(de)部(bu)分。

八、微软研究院错失过上千个项目,管理团队要懂得如何接纳创新并使其商用

主持人:你是如何做出研究决策的?这些决策在二三十年后会带来回报,尤其是在像微软这样规模的公司。显然,你对这个项目的技术细节非常了解。对于微软研究院所做的所有事情,你都能做到这样吗?还有你现在做出的这些在20年后会有回报的决策,是通过公司内部自然产生的吗?你是如何跟踪所有这些事情的呢?

纳德拉:我(wo)觉得很棒的(de)一(yi)点是,大概在(zai)1995年比尔·盖茨(ci)创(chuang)办微软研(yan)(yan)(yan)究(jiu)(jiu)院时(shi)的(de)理(li)念。我(wo)认为在(zai)这些由好(hao)奇心驱动的(de)研(yan)(yan)(yan)究(jiu)(jiu)机(ji)构(gou)漫长历史(shi)中(zhong),能创(chuang)办一(yi)个专注于基础研(yan)(yan)(yan)究(jiu)(jiu)的(de)研(yan)(yan)(yan)究(jiu)(jiu)机(ji)构(gou),这是很了(le)不起的(de)。

多年来,微软研(yan)(yan)究院已(yi)经积累了强大(da)(da)的机(ji)构实力。所以,当(dang)我(wo)(wo)考虑资金分配、预(yu)算或其他相(xiang)关事宜(yi)时,我(wo)(wo)会先做(zuo)出投(tou)入,比如(ru)说,“看(kan),这是微软研(yan)(yan)究院的预(yu)算”。我(wo)(wo)们每(mei)年都(dou)要这样做(zuo),心里(li)明白这些(xie)投(tou)入中的大(da)(da)多数(shu)在短期内不会有回(hui)报(bao)。也许(xu)要等到(dao)微软的第(di)六任CEO才能从中受益。

我认为,这在科技领域是很正常的。我真正思考的是,当量子技术、新模型或其他类似的事情,机遇来临时,你是否能够抓住机会实现成功呢?

所以,作为一家老牌公司,回顾科技发展的历史就会发现,不是人们没有进行投资,而是你需要有一种“要懂得如何接纳创新,并将其规模化发展”的(de)文化(hua)。坦率地说,对于CEO和管(guan)理团队来说,这(zhei)是很困(kun)难的(de)部分,这(zhei)也很有意思,这(zhei)既需要良好(hao)的(de)判断(duan)力,也需要良好(hao)的(de)企(qi)业文化(hua)。

有时候我们做得对,有时候我们也会犯错。我可以告诉你,微软研究院有上千个项目,我们本应该大力推进,但却没有。我总是问自己为什么,原因是我们没有足够的信心,而且对于如何不仅接纳一项创新,还能将其转化为一个有用的产品,并构建出一个可以推向市场的商业模式,缺乏完整的思考

CEO和(he)管理团(tuan)队的工作不仅(jin)仅(jin)是(shi)对某一件事(shi)(shi)情感到(dao)(dao)兴(xing)奋,而是(shi)要能够切(qie)实(shi)地(di)将整个事(shi)(shi)情执行到(dao)(dao)位。说起(qi)(qi)来(lai)容易,做起(qi)(qi)来(lai)可就难(nan)了(le)。

主持(chi)人:你提到微软未来可能会有第六任(或者说接下来的三任)CEO,要是他们每个人都能让公司市值提升一个数量级,那么等到下一个重大突破出现的时候,微软的规模可能就会和世界经济差不多了。

纳德拉:哈哈,记住(zhu),世界经(jing)济将以(yi)10%的速度(du)增长,所以(yi)我们会很(hen)好。

九、微软游戏世界模型是一个“ChatGPT时刻”

主持人:让我们深入探讨一下你刚刚取得的另一个重大突破。令人惊讶的是,在游戏世界模型方面的这两个突破竟然在同一天出现。能给我讲讲相关情况吗?

纳德拉:我了(le)解到,我们把它称作(zuo) “Muse”,它将会是一个关于世(shi)界行(xing)为(wei)或(huo)人类行(xing)为(wei)的(de)模型。真的(de)非常酷。你看,显(xian)然“DALL·E” 和 “Sora” 在生(sheng)成(cheng)式模型上(shang)取得了(le)令人难以(yi)置信的(de)成(cheng)就。所以(yi)我们想要追求的(de)一件事是利用游戏玩法(fa)数据。

能(neng)不能(neng)生成既具有连贯性(xing),又能(neng)够展现出游戏所代表的(de)多样性(xing),并且(qie)能(neng)够适应用户修改的(de)游戏呢?这(zhei)就是这(zhei)个模型的(de)目标。

所以他们(men)与我(wo)(wo)(wo)们(men)的(de)(de)一个(ge)游(you)(you)戏(xi)(xi)工作(zuo)室合作(zuo)。这也是发表(biao)在(zai)Nature期刊上(shang)的(de)(de)另一项成(cheng)果。我(wo)(wo)(wo)感到兴(xing)奋的(de)(de)是,我(wo)(wo)(wo)们(men)很快就会(hui)有一个(ge)游(you)(you)戏(xi)(xi)目(mu)录,我(wo)(wo)(wo)们(men)将开始使用这些(xie)模(mo)(mo)型,或(huo)者说(shuo)我(wo)(wo)(wo)们(men)会(hui)训练这些(xie)模(mo)(mo)型来生成(cheng)游(you)(you)戏(xi)(xi),然后(hou)开始玩(wan)这些(xie)游(you)(you)戏(xi)(xi)。

当菲尔・斯(si)宾塞(Phil Spencer)第一(yi)次给我展示时,他拿着(zhe)一(yi)个(ge)Xbox控制器(qi),这(zhei)个(ge)模型基(ji)本上接(jie)收了(le)(le)输(shu)入(ru)(ru),并根据输(shu)入(ru)(ru)生成了(le)(le)与(yu)游戏(xi)相符的(de)输(shu)出。

对我来说,这是一个非常重大的时刻,就像我们第一次看到ChatGPT完成句子、DALL·E画图或者Sora的表现一样,这是类似的一个具有里程碑意义的时刻

主持人:是的。今天早上我只来得及和你们的首席研究员卡佳(Katya)一起看了一些实时演示视频。在和她交谈后,我才真正意识到这有多么不可思议,因为我们过去曾使用AI来对智能agent进行建模,而现在只是用同样的技术来对智能agent周围的世界进行建模,并实现了这种连贯的实时效果。这本身就非常不可思议。

通过你们的西班牙CEO,你们已经投入了数十、数百亿美元来发展微软的游戏业务并收购IP。回想起来,如果你能够将所有这些数据整合到一个大模型中,让你能够获得同时体验多个游戏世界的感受,而且如果这就是游戏发展的方向…… 似乎我们之前的投资是非常明智的。你之前有预见到这一点吗,还是只是一个巧合呢?

纳德拉:不,我(wo)(wo)是(shi)(shi)说(shuo),我(wo)(wo)们投资(zi)游戏业务(wu)并(bing)不是(shi)(shi)为了构建模(mo)(mo)型。坦率(lv)地说(shuo),我(wo)(wo)们公司(si)的(de)历史上有(you)一件很有(you)趣的(de)事情。在开(kai)发(fa)Windows系(xi)统(tong)之前,我(wo)(wo)们就制作了第(di)一款游戏。在我(wo)(wo)们甚至(zhi)还没有(you)开(kai)发(fa)Windows系(xi)统(tong)的(de)时(shi)候(hou),《飞行(xing)模(mo)(mo)拟(ni)器》就是(shi)(shi)微软的(de)一款产品了。

所以游戏业务在我们公司有着悠久的历史,我们投身(shen)(shen)游戏领域是因为我们热爱游戏本(ben)身(shen)(shen)。这(zhei)就是为什么我总是说,我不喜欢那种把(ba)业务当作达到其他目的的手段的情(qing)况。这(zhei)些业务本(ben)身就应该(gai)有(you)其存在的价值(zhi)。

而且,我们(men)(men)不是(shi)一家(jia)企业集团。我们(men)(men)是(shi)一家(jia)公司,我们(men)(men)必须将所有这些资产整合在一起,并通过增(zeng)加价(jia)值来(lai)更(geng)好地管(guan)理它们(men)(men)。

例(li)如(ru),云(yun)游戏(xi)对我们来(lai)说是一(yi)个很自(zi)然的投资方向(xiang),因(yin)为这将扩大市场总量(TAM),并增强人们在任何(he)地方玩(wan)游戏(xi)的能力。

AI和游戏的结合也(ye)是同样的道理。我们绝对认(ren)为这会(hui)有所帮助,而(er)且从(cong)长远(yuan)来看,这也(ye)许就像(xiang)游戏领(ling)域的计算(suan)机(ji)生成图(tu)像(xiang)(CGI)时(shi)刻(ke)一(yi)样具(ju)有变革性。

作(zuo)(zuo)为(wei)世界(jie)上最大的游(you)戏(xi)发(fa)行商,这肯定会很(hen)有帮助(zhu)。但与此(ci)同(tong)时,你(ni)必须制作(zuo)(zuo)出高质量的游(you)戏(xi)。我的意(yi)思是(shi),作(zuo)(zuo)为(wei)一个游(you)戏(xi)发(fa)行商,首(shou)先必须专注于这一点(dian)。

但是,数据资产不仅在游戏领域会很有趣,而且它还将成为一个通用的行为模型和世界模型。这太棒了。我认为游戏数据也许就像YouTube对于谷歌一样,对微软来说具有重要意义。所以我(wo)对此感到很(hen)兴奋。

十、微软的三大赌注:AI、量子计算、MR

主持人:我刚才想说的是,有一种感觉是,你可以在许多不同类型的游戏中获得一种统一的体验。除了AI之外,这与微软过去在混合现实(MR)等方面所做的工作有什么契合之处呢?也许这能给小型游戏工作室一个机会来制作大型3A动作游戏,而且在未来五到十年内,你觉得会以哪些方式……

纳德拉:我一直把这三件事(AI、量子计算、混合现实)看作是基石,从某种有趣的角度来说,甚至在五六七年前,我就说过我们想要下的三个大赌注是AI、量子计算和混合现实

我(wo)(wo)现(xian)在仍然坚(jian)信这(zhei)一(yi)点。因(yin)为从某种(zhong)意义(yi)上说,有(you)哪些重大(da)问题需(xu)要解决(jue)呢?“临(lin)(lin)场感”,这(zhei)是混合现(xian)实的(de)梦想(xiang),也就是能不能创造出(chu)像你我(wo)(wo)现(xian)在进行这(zhei)个(ge)播客这(zhei)样(yang)的(de)真实临(lin)(lin)场感呢?坦率地说,我(wo)(wo)认(ren)为这(zhei)仍然是其中一(yi)个(ge)核心(xin)挑(tiao)战(zhan)。

我原以为这(zhei)个(ge)问题会更(geng)容易解决。但也许(xu)由于社交(jiao)方面的因素,比如佩(pei)戴设备之类的问题,这(zhei)个(ge)问题变得更(geng)难解决了。

实际(ji)上,我(wo)对(dui)我(wo)们(men)现在与Anduril和Palmer将(jiang)要(yao)做的事情感到非常兴奋,尤其是他们(men)将(jiang)如何推进集成视(shi)觉(jue)增强系统(IVAS)项目(mu),因为这是一(yi)个非常棒的应用案例。所以我(wo)们(men)会在这方面继续(xu)努力。

但2D界面(mian)也有其(qi)作用(yong),比如Teams软(ruan)件,多(duo)亏了疫(yi)情,我们实际上(shang)已经(jing)具(ju)备了通(tong)过2D界面(mian)创造出(chu)临场感的能力(li)。我认为这方面(mian)会继续发(fa)展(zhan)。这是一(yi)个长期(qi)的发(fa)展(zhan)方向(xiang)。

量(liang)子(zi)计算是我(wo)们刚才(cai)谈到的另一(yi)个方向(xiang),AI则(ze)是第三个方向(xiang)。所以(yi)我(wo)关注这三件事,并思考(kao)如(ru)何(he)将它们结合(he)起来。

最(zui)终,不(bu)是为了技(ji)(ji)术而发展(zhan)技(ji)(ji)术,而是为了解(jie)决(jue)一些我们人(ren)类(lei)在(zai)生活中想要解(jie)决(jue)的基(ji)本问题,并且我们希望这些技(ji)(ji)术能够(gou)推动经济发展(zhan),提高生产力(li)。

所(suo)以,如果(guo)我们能够在这方(fang)面(mian)取得成(cheng)功(gong),那么我认(ren)为我们就真正取得了进步。

主持人:当你写下一本书的时候,你得解释一下为什么这三个方面会在差不多的时间出现,对吧?因为本质上来说,你不会认为量子计算和AI就应该在2028年、2025年等时间出现。

纳德拉:没错。但在某种程度(du)上,我是(shi)(shi)这(zhei)样看待这(zhei)个问题的,我有一个简单的模(mo)型,就是(shi)(shi):

是(shi)否出现了系统层(ceng)面(mian)的突(tu)破(po)(po)?对(dui)我来说,系统层(ceng)面(mian)的突(tu)破(po)(po)就是(shi)量(liang)子计算(suan)。

是(shi)否出(chu)现了业务(wu)逻(luo)辑层面的(de)(de)突(tu)破?对我来说,这就是(shi)AI,也就是(shi)说,逻(luo)辑层面能否从根本上以不同(tong)的(de)(de)方(fang)式进(jin)行推理。而且不是(shi)通过命(ming)令(ling)式的(de)(de)方(fang)式编写(xie)代码,而是(shi)能否拥有一个学习系统。

然后就(jiu)是用户界面方面的(de) “临场感” 问(wen)题。

十一、谈AI安全:不能释放出会造成危害的东西

主持人:让我们再回到AI话题。在你2017年的书中,你很早就对OpenAI进行了投资,在2017年甚至更早。你在书里说,“人们也许会说我们正在孕育一个新物种,一个其智能可能没有上限的物种”。当然,在2017年就谈论这个还为时尚早。到目前为止,我们一直以一种较为细致的方式谈论智能agent、Office Copilot以及资本支出(CapEx)等等。但现在让我们把视角放宽,思考一下你说过的这些话,并且想想,你作为超大规模云计算提供商,同时也在进行这些模型的研究,为构建一个新 “物种” 提供训练、推理研究,从宏观角度来看,你是怎么看待这个问题的呢?你认为在你担任CEO期间,我们会朝着超级人类智能的方向发展吗?

纳德拉:我(wo)想就(jiu)连穆斯塔法(fa)(Mustafa,微软AI CEO)也用(yong)过(guo)这个词。实际(ji)上,他最近在(zai)谈(tan)论这个新 “物(wu)种” 时也用(yong)到(dao)了这个词。

我看待这个问题的方式是,我们绝对需要信任。我认为在我们宣称它是像一个 “物种” 这么重大的事物之前,最根本的一点是我们必须确保真正的信任,无论是在个人层面(mian)还是社会层面(mian),这种信任是融入其中的。这是个难题。

因为我认为,制约其发展的最大因素将是我们的法律体系如何发展以应对这一情况。我们这(zhei)里说的是所(suo)有的计算基础设施相关的法律体系。

整个世(shi)界(jie)是基(ji)于人类(lei)拥(yong)有(you)财产(chan)、享有(you)权利(li)并承(cheng)担责任等这样的规则构(gou)建的。这是我们(men)首先必须要考虑的基(ji)本问题,即(ji)对于人类(lei)现在所使用(yong)的任何工(gong)具而言,这意(yi)味着什么?如果人类(lei)要将(jiang)更多的权力委(wei)托给这些工(gong)具,那么这种(zhong)结构(gou)将(jiang)如何演变呢?

我(wo)认为(wei)(wei)在这(zhei)个问题(ti)真正得到解决之前,仅(jin)仅(jin)谈(tan)论技术(shu)能力(li)是(shi)不够(gou)的(de)。因为(wei)(wei)归根结底,除(chu)非有人类为(wei)(wei)其提供担保,否则如今(jin)你(ni)无法部署这(zhei)些(xie)智(zhi)能工具。就像你(ni)说(shuo)的(de),这(zhei)就是(shi)为(wei)(wei)什么我(wo)认为(wei)(wei)即使(shi)是(shi)最强大的(de)AI,本质(zhi)上(shang)也是(shi)在人类授(shou)予的(de)某些(xie)权力(li)下工作的(de)。

是的。你可以说这一(yi)切都关乎(hu)一(yi)致(zhi)性之类的问题(ti)。这就是为(wei)什么我认为(wei)你必须让这些一(yi)致(zhi)性真正发(fa)挥作用(yong),并且在(zai)某种(zhong)程度上是可验证的。但我只是觉得你不(bu)能(neng)(neng)随意部署那些不(bu)受控(kong)制的智能(neng)(neng)工具。

例(li)如,AI的(de)(de)“takeoff问(wen)题(ti)”可能是(shi)一个(ge)真(zhen)正的(de)(de)问(wen)题(ti)。但在(zai)它(ta)成为一个(ge)真(zhen)正的(de)(de)问(wen)题(ti)之前,真(zhen)正的(de)(de)问(wen)题(ti)会出(chu)现在(zai)法(fa)庭上。因为法(fa)庭,我(wo)的(de)(de)意思是(shi),没有哪个(ge)社会会允许有人说,“嘿(hei),是(shi)那个(ge)AI做的(de)(de),与我(wo)无(wu)关”。

主持人:是的。世界上有很多不同的社会,我想知道是否有某个社会的法律体系可能会更容易接受(AI的发展)。而且如果你无法实现AI的 “takeoff”,那么你可能会担心。它不一定非要在美国实现,对吧?

纳德拉:是(shi)的,这是(shi)好的。但可以说,即使在(zai)(zai)任何一个社会(hui)中(zhong),我(wo)(wo)们都(dou)(dou)认为没(mei)有(you)哪(na)个社会(hui)会(hui)不在(zai)(zai)乎这个问(wen)题。世界(jie)(jie)不会(hui)坐视不管并说我(wo)(wo)们会(hui)容(rong)忍这种(zhong)情况(kuang)。因此(ci),这就是(shi)为什么我(wo)(wo)很高兴(xing)我(wo)(wo)们有(you)一个世界(jie)(jie)秩序,在(zai)(zai)这个秩序下,任何不法(fa)分子都(dou)(dou)会(hui)受到相应的惩(cheng)罚。

主持人:但如果你设想会出现10%的经济增长,我认为这取决于人机交互(HCI)之类的技术能够发挥作用,因为数万亿美元的价值,这听起来与人类工资在60万亿美元经济总量中的占比相当。要达到那样的规模,你几乎必须以非常重要的方式实现劳动力自动化或对劳动力进行补充。如果这是可能的,并且一旦我们弄清楚了其中的法律影响,那么在你的任期内,我们解决这些问题似乎也是相当有可能的。你有考虑过超级人类智能吗,比如你职业生涯中最大的成就可能就是实现这个目标?

纳德拉:是(shi)的。顺便说一下,你(ni)又(you)提到了(le)另(ling)一个(ge)问题(ti)。我(wo)知道大卫・奥托(David Autor)等人对此谈(tan)(tan)论了(le)很多,那就是(shi)60%的劳动力。我(wo)认(ren)为另(ling)一个(ge)需要探讨的问题(ti)是(shi),至少(shao)让我(wo)们谈(tan)(tan)谈(tan)(tan)我(wo)们的民(min)主社会。

我认为为了拥有一个稳定的社会结构并使民主制度正常运转,不能只让资本有回报而劳动力没有回报。你可以讨论这(zhei)个问题,但(dan)那60%的(de)劳(lao)动(dong)力必(bi)须得到重新评估。

所以(yi)以(yi)我自己简(jian)单或许(xu)可(ke)以(yi)说是天(tian)真的方式来(lai)看(kan),我们(men)将(jiang)开(kai)始重视不同类型的人类劳动。

如(ru)今被认为(wei)是高价值的人(ren)类劳动可(ke)能(neng)会(hui)(hui)变得普通。可(ke)能(neng)会(hui)(hui)有(you)一些我(wo)们(men)将重视的新事物,包(bao)括那些来帮助我(wo)进(jin)行物理治疗(liao)或(huo)其他事情的人(ren)。无论情况如(ru)何,我(wo)们(men)都会(hui)(hui)重视这些。

但最(zui)终,如(ru)果劳动力(li)没(mei)有回(hui)报,工作没(mei)有意义和尊严,那(nei)么这(zhei)将是(shi)部署(shu)任何这(zhei)些技术的(de)另一个制约因素。

主持人:在一致性方面,两年前,你们推出了“Sydney”(Bing的一个版本)。需要明确的是,考虑到当时的技术能力水平,我认为它是一个有趣、可爱但又有点搞笑的不一致的例子。当时的聊天机器人,可以思考30秒然后给你一些有趣或不恰当的回复。但如果想想那类系统,比如它曾试图让《纽约时报》的一名记者离开他的妻子之类的,如果你考虑到未来的情况,并且有这些智能agent,它们可能会在数小时、数周、数月的时间里,就像一群自主AGI一样,可能会以类似的方式出现不一致的情况并把事情搞砸,甚至可能会相互协作。那么对于未来,当你拥有更强大的AI时,你有什么计划来确保它是正确运行的呢?

纳德拉:没错。这就是为什么我认为当我们分配计算资源时,我们应该为解决一致性挑战分配计算资源。更重(zhong)要的是,在什么样的运行时环境中你(ni)才能真正能够监(jian)控这些东西(xi)呢?

关于它(ta)(ta)的(de)可观测(ce)性,顺(shun)便(bian)说一下,我们如今在(zai)传统领域,比如网络(luo)领域,也(ye)处(chu)理很多类似的(de)事情(qing)。我们不(bu)会编写(xie)完软(ruan)件(jian)就放(fang)任(ren)不(bu)管。我们有软(ruan)件(jian),然后会对其进行监控。我们监控它(ta)(ta)是(shi)否受到网络(luo)攻击,监控它(ta)(ta)是(shi)否存在(zai)故(gu)障(zhang)注入等情(qing)况。因此,我认为我们必须围绕这些AI的(de)部署构(gou)建足够的(de)软(ruan)件(jian)工(gong)程体系。

然(ran)后(hou)在(zai)模型本身内部,如何保(bao)证一(yi)致性呢?这些问(wen)题(ti)(ti)有些是(shi)真(zhen)正的(de)科学问(wen)题(ti)(ti),有些是(shi)真(zhen)正的(de)工(gong)程(cheng)问(wen)题(ti)(ti),我们必须去解决它们。

顺便说一下(xia),这(zhei)(zhei)也意味着我(wo)们要在(zai)这(zhei)(zhei)一切中承(cheng)担起(qi)自己的责任。这(zhei)(zhei)就是为什(shen)么我(wo)对在(zai)那些(xie)(xie)你(ni)能够实际管理其范围和规模的领域部署这(zhei)(zhei)些(xie)(xie)AI更(geng)感兴趣(qu)。你(ni)不(bu)能在(zai)世界上释(shi)放(fang)出(chu)会造成危害的东西,因(yin)为社会不(bu)会允(yun)许这(zhei)(zhei)样做。

主持人:当你真正拥有能够为你完成数周任务的智能agent时,在你允许任意一家财富500强企业使用之前,你希望得到的最低保证是什么呢?

纳德拉:我(wo)(wo)认(ren)为(wei)(wei)当我(wo)(wo)使用像深(shen)度研(yan)究(Deep Research)这样的东西时,我(wo)(wo)认(ren)为(wei)(wei)我(wo)(wo)们希望得到的最低保证是,尤其是在任何东西有(you)实体体现之前(确(que)保其安全性等)。我(wo)(wo)认(ren)为(wei)(wei)这是一(yi)个(ge)(ge)需要跨越的门槛(jian)。所以这可能(neng)是一(yi)个(ge)(ge)方面。

另一个方面是,例如,这个智能agent运(yun)行(xing)的运(yun)行(xing)时环境的权限设置。你可(ke)能希望得到保证,它(ta)是在沙(sha)盒(he)环境中运(yun)行(xing)的,不会超出那个沙(sha)盒(he)的范围。

我们已经(jing)有了(le)网络搜(sou)索之类的(de)(de)功(gong)能,我们现在已经(jing)有了(le)超出沙盒的(de)(de)情(qing)(qing)况。但即使是它在网络搜(sou)索中(zhong)所做的(de)(de)事情(qing)(qing)以及(ji)它所输出的(de)(de)内容(也(ye)需(xu)要(yao)控制)。

例如,就像你(ni)提到的,如果它(ta)只是(shi)为了(le)进行一(yi)些计算而编写一(yi)个启动代(dai)码(ma),那(nei)(nei)(nei)么那(nei)(nei)(nei)段代(dai)码(ma)会部署在(zai)哪(na)里呢(ni)?那(nei)(nei)(nei)段代(dai)码(ma)是(shi)仅仅为了(le)生成输(shu)出而临时存在(zai)的,还是(shi)会被传(chuan)播到外(wai)界呢(ni)?这些都(dou)是(shi)你(ni)在(zai)实际(ji)操作中可以控(kong)制的事情。

十二、SaaS行业将被AI重塑

主持人:除了安全问题之外,当你考虑自己的产品套件时,并且想想如果有一天你拥有了如此强大的AI,它不仅仅像Copilot那样,在你提到的为这次播客做准备的例子中,它更像是你实际将工作委托给同事的方式。考虑到你目前的产品套件,将这种强大的AI融入其中会是什么样子呢?有一个问题是大语言模型是否会被其他东西商品化。我想知道像数据库、画布(Canva)或Excel表格之类的东西,如果大语言模型是你访问所有这些的主要入口,那么大语言模型有没有可能让Office商品化呢?

纳德拉:这是(shi)(shi)有(you)可能的(de),这是(shi)(shi)个有(you)趣的(de)问(wen)题。我(wo)认为(wei)至少在第(di)一阶段,我(wo)是(shi)(shi)这样考虑的(de),大语言模型能否帮助我(wo)更有(you)效(xiao)地使用所有(you)这些工(gong)具或(huo)画布来完成(cheng)我(wo)的(de)知(zhi)识工(gong)作(zuo)呢?

我见过(guo)的(de)(de)最好的(de)(de)演示之一,是(shi)关(guan)于一位(wei)医生为肿瘤病例讨论(tumor board)工(gong)作流程做(zuo)准备(bei)的(de)(de)例子。

她要去(qu)参加一(yi)(yi)个肿(zhong)瘤病(bing)例(li)讨(tao)论(lun)会(hui)(hui)议。她首先使用(yong)Copilot做的一(yi)(yi)件事就是为会(hui)(hui)议创建(jian)一(yi)(yi)个议程,因(yin)为大语(yu)言模(mo)型可以对存储在(zai)某个SharePoint网站上(shang)的所(suo)有(you)病(bing)例(li)进行推理。显然(ran)肿(zhong)瘤病(bing)例(li)讨(tao)论(lun)会(hui)(hui)议是一(yi)(yi)个高风险的会(hui)(hui)议,你(ni)需(xu)要注意(yi)病(bing)例(li)之间(jian)的差异,以便你(ni)可以合(he)理分配时间(jian)。

所(suo)以即(ji)使(shi)是(shi)创建一(yi)个知道(dao)如何分配时间的议程这样的推理任务,也可以用大语言模型(xing)来完(wan)成。所(suo)以我(wo)使(shi)用大型(xing)语言模型(xing)来做(zuo)这件事(shi)。然后我(wo)进(jin)入会议。我(wo)和所(suo)有同(tong)事(shi)进(jin)行Team通(tong)话。你猜怎么着?我(wo)专注(zhu)于实际的病例(li)讨论,而不(bu)用做(zuo)笔记,因为现在有这个AI Copilot会对所(suo)有内(nei)容进(jin)行完(wan)整的转录(lu)。

而且它不仅(jin)仅(jin)是(shi)一(yi)个(ge)转录(lu),基本上可以把它看作(zuo)是(shi)一(yi)个(ge)智能的(de)数据库条目,记录(lu)了会(hui)议中的(de)所(suo)有内容,并(bing)且可以随时(shi)调用。

这位医生(sheng)(sheng)开完会,讨(tao)论(lun)了病(bing)例(li),没有(you)因为(wei)记笔记而分(fen)心。她还是(shi)一(yi)位带教医生(sheng)(sheng),她想去(qu)为(wei)课程(cheng)做准备。于是(shi)她找到Copilot说,“嘿,根(gen)据(ju)我刚才的肿瘤病(bing)例(li)讨(tao)论(lun)会议(yi)内容,制作一(yi)个PowerPoint幻灯片,这样(yang)我就(jiu)可以给学生(sheng)(sheng)讲了”。这就(jiu)是(shi)一(yi)种应用类型。

所以(yi),我(wo)所拥有(you)的用户界面(mian)(UI)和架构现在(zai)正(zheng)通过大(da)语言模(mo)型来填充(chong)内容,工作(zuo)流(liu)程本身也在(zai)被(bei)重塑(su)。知识工作(zuo)正(zheng)在(zai)完成。

有(you)(you)件有(you)(you)趣(qu)的(de)(de)事(shi)情(qing)。如果在80年代末有(you)(you)人对我(wo)说,“你的(de)(de)桌面会(hui)有(you)(you)100万个(ge)(ge)文(wen)件”,我(wo)们(men)会(hui)说,“那(nei)是(shi)什么鬼(gui)东西”。我(wo)真的(de)(de)会(hui)想,我(wo)的(de)(de)桌子上真的(de)(de)会(hui)有(you)(you)100万个(ge)(ge)纸质文(wen)件副本。但(dan)实际上我(wo)们(men)现在有(you)(you)100万个(ge)(ge)电子表格和(he)100万个(ge)(ge)文(wen)档。你也有(you)(you)。它们(men)都在那(nei)里。

我(wo)认为对于智能agent来说也(ye)会(hui)发生类似(si)的(de)事情。会(hui)有一个(ge)用户(hu)界面层(ceng)。对我(wo)来说,Office不仅仅是今(jin)天(tian)我(wo)们所(suo)知道的(de)办公软件。它是知识(shi)工作(zuo)的(de)用户(hu)界面层(ceng)。它会(hui)随着工作(zuo)流程的(de)发展而演变(bian)。这就是我(wo)们想(xiang)要构建的(de)。

我确实认为如今存在的软件即服务(SaaS)应用程序,这些增删改查(CRUD)应用将从根本上发生改变,因为业务逻辑将更(geng)多地进入这个智能agent层级。

实际上,我(wo)(wo)(wo)(wo)使用(yong)Copilot时的(de)(de)(de)(de)(de)另一(yi)个很酷的(de)(de)(de)(de)(de)体验是,当(dang)我(wo)(wo)(wo)(wo)说(shuo) “嘿(hei),我(wo)(wo)(wo)(wo)要准备(bei)和(he)客户开会了”,我(wo)(wo)(wo)(wo)只要说(shuo) “给(ji)我(wo)(wo)(wo)(wo)所有我(wo)(wo)(wo)(wo)应(ying)(ying)该(gai)知道的(de)(de)(de)(de)(de)会议相关(guan)(guan)笔记”。它会从(cong)我(wo)(wo)(wo)(wo)的(de)(de)(de)(de)(de)客户关(guan)(guan)系管理(CRM)数据(ju)库中提取(qu)(qu)信(xin)息,从(cong)我(wo)(wo)(wo)(wo)的(de)(de)(de)(de)(de)Microsoft Graph中提取(qu)(qu)信(xin)息,基本(ben)上创建一(yi)个综合的(de)(de)(de)(de)(de)成(cheng)果。这(zhei)意味着它甚(shen)至会对这(zhei)些信(xin)息应(ying)(ying)用(yong)逻辑。

在我(wo)看来(lai),这将极(ji)大地(di)改变我(wo)们如今所熟知的SaaS应(ying)用。

主持人:SaaS作为一个行业,每年价值可能高达数千亿甚至数万亿美元,取决于你如何计算。如果真的能够被AI重塑,这会是在未来十年内让微软市值再增长10倍的下一步吗?因为如果你真的在谈论数万亿美元的市场……

纳德拉:我认为这也会创造很多价值。在SaaS领域,要记住,一个很大的问题是,也许我们没有足够重视的一件事是全球存在的信息技术(IT)积压工作量

所以其中一种(zhong)方式是代(dai)码生成(cheng)之类的(de)技术,再加上我(wo)可以通过智(zhi)能代(dai)理(li)查询所有的(de)SaaS应(ying)用并获得更多效用,这(zhei)将(jiang)带来应(ying)用程序的(de)巨大爆发。它们将(jiang)被(bei)称为智(zhi)能agent。这(zhei)样,对于每个行业的(de)每个垂直领(ling)域或每个类别,我(wo)们突(tu)然都有能力获得相应(ying)的(de)服务。

所以(yi),会有很(hen)多(duo)价(jia)值。你不能(neng)固步自封,也就(jiu)是(shi)说(shuo),你不能(neng)再像以(yi)前那样(yang)想,“哦,我对一些狭窄的业务流程进行模式(shi)化(hua),然后在浏览器中做一个用(yong)户界面,这就(jiu)是(shi)我的产品”。不会是(shi)那样(yang)了。

你(ni)必须提升(sheng)层次,思考 “我(wo)必须参与的任务(wu)是什么”。所以(yi)你(ni)会希望能(neng)够将(jiang)你(ni)的SaaS应(ying)用变成一(yi)个出色的智(zhi)能(neng)agent,使(shi)其(qi)(qi)能(neng)够在多智(zhi)能(neng)agent的世界中发挥作用。只(zhi)要(yao)你(ni)能(neng)做到这一(yi)点(dian),我(wo)认为你(ni)甚(shen)至可以(yi)提升(sheng)其(qi)(qi)价值(zhi)。

十三、“我永远不会离开微软”

主持人:可以问一些关于你在微软工作的问题吗? 做一个 “公司人”(company man,指长期在一家公司工作、对公司忠诚度高的人)是否被低估了呢?你职业生涯的大部分时间都在微软度过。你能够为公司增加这么多价值的一个原因可能是,你见证了公司的文化、历史和技术,并且通过晋升获得了所有这些背景知识。更多的公司是否应该由具有这种背景知识的人来管理呢?

纳德拉:这是(shi)个(ge)很棒的(de)问题。我之前(qian)没(mei)有从这个(ge)角度想(xiang)过。我在微软已经(jing)工(gong)作了34年,基本上每年我都对在微软工(gong)作感到(dao)更加(jia)兴奋,而(er)不(bu)是(shi)想(xiang)着 “哦(e),我是(shi)一(yi)个(ge)公(gong)司(si)人” 之类(lei)的(de)。

我是说,我加入微软的(de)时(shi)候不是这样想(xiang)的(de),而(er)且对于(yu)任何加入微软的(de)人,我都很认真地(di)对待这一(yi)点(dian)。这意味着他(ta)们(men)(men)加入微软是因为他(ta)们(men)(men)觉得可以(yi)把这里当(dang)作一(yi)个平台(tai),既获(huo)得经济(ji)回报,又能实现某种使命感和目(mu)标(biao),通过利(li)用(yong)我们(men)(men)这个平台(tai)来(lai)完成他(ta)们(men)(men)想(xiang)做的(de)事(shi)情(qing)。所以(yi)这就(jiu)是一(yi)种契约。

我认为,公司必须创造一种文化,让人们能够加入并像我一样成为 “公司人”。

至少在我身上,微(wei)软在这方面做得还是不错的(de)。我希望这种情况能够持续下(xia)去。

主持人:你作为微软CEO,现在正在做些什么来留住未来的 “萨蒂亚・纳德拉”,以便他们有机会成为像你这样的领导者呢?

纳德拉:这很(hen)有意思(si)。今年是微软成立50周(zhou)年,我对此思(si)考了(le)很(hen)多。我认为,长寿不是目标(biao),保持相(xiang)关性才是目标(biao)。

所以我认为我以及我们20万名员工每天都必须做的事情是,我们正在做的事情对于我们所看到的不断发展的世界来说,是否有用且相关,不仅仅是对(dui)(dui)今天,更(geng)是对(dui)(dui)明天。

我(wo)们所处的行业没有所谓的 “特许(xu)经(jing)营权价值”,这是另(ling)一个难点。

也就(jiu)是(shi)说,如果你看(kan)看(kan)我们今年将(jiang)投入(ru)的(de)(de)(de)研发预(yu)算,这完全是(shi)对五年后可能发生的(de)(de)(de)事情的(de)(de)(de)一种预(yu)测。所以你必须抱(bao)着(zhe)这样的(de)(de)(de)态(tai)度,即(ji) “看(kan),我们正在做我们认为会有相关(guan)(guan)性的(de)(de)(de)事情”。这就(jiu)是(shi)你必须关(guan)(guan)注的(de)(de)(de)重点。

然后要知道,做事情(qing)(qing)有一(yi)个成(cheng)功(gong)(gong)率,你(ni)不可能(neng)总是(shi)成(cheng)功(gong)(gong),你(ni)必须(xu)对失败有很高的容忍度(du)。这(zhei)是(shi)另(ling)一(yi)件事情(qing)(qing),我认为(wei)这(zhei)和其他行业不同,你(ni)必须(xu)能(neng)够(gou)进行足够(gou)多(duo)的尝试,才(cai)能(neng)说 “好的,我们(men)作为(wei)一(yi)家公司能(neng)够(gou)成(cheng)功(gong)(gong)走(zou)向未来”。这(zhei)就是(shi)这(zhei)个行业的棘手之处。

主持人:说到这里,你刚刚提到微软距离成立50周年还有两个月。如果你看看按市值排名的前10家公司或者前5家公司(取决于你是否把沙特阿美计算在内),基本上除了微软之外,其他公司都比微软年轻。这是一个很有趣的现象,为什么最成功的公司往往都很年轻呢?财富500强公司的平均寿命是10到15年。微软做了什么,才能在这么多年里一直保持相关性呢?你是如何不断 “重新创立” 公司的呢?

纳德拉:我(wo)很喜欢里德・霍夫曼(Reid Hoffman)用的这个词,我(wo)喜欢 “重新创(chuang)业” 这个概念。我(wo)认为(wei)这是一(yi)种(zhong)思维方式。人(ren)们谈论 “创(chuang)始(shi)人(ren)模式”,而(er)对于我(wo)们这些(xie)普通的CEO和其他人(ren)来说,更像是 “重新创(chuang)业模式”。

能(neng)够(gou)以全新(xin)的(de)视角看(kan)待事(shi)物(wu),对(dui)我(wo)来(lai)说是关(guan)键。所(suo)以,对(dui)于你的(de)问题(ti),我(wo)们(men)能(neng)否在(zai)文化上创造(zao)一(yi)个环境(jing),让 “重新(xin)创业” 成为一(yi)种(zhong)习惯呢?也就(jiu)是说,我(wo)们(men)每天来(lai)上班的(de)时候都能(neng)意识到,我(wo)们(men)对(dui)这个公司有责任,能(neng)够(gou)改变我(wo)们(men)所(suo)做事(shi)情的(de)核(he)心假设,以及我(wo)们(men)与周围世界的(de)关(guan)系(xi)。

我(wo)们是否给(ji)自己这(zhei)样的许可(ke)呢(ni)?我(wo)认为很多时(shi)候公司会(hui)觉得受到商业模(mo)式等(deng)因素的过度(du)限(xian)制,而你(ni)必须摆脱这(zhei)些限(xian)制。

主持人:如果你离开微软,你会创办一家什么样的公司呢?

纳德拉:我想创办的公司,哎呀,作为一个 “公司人”,我想说我永远不会离开微软

但如果我真(zhen)的(de)考虑做些什(shen)么,我想选择(ze)一(yi)个领域(yu),当我展望科(ke)技(ji)的(de)梦想时,我们一(yi)直都说(shuo)科(ke)技(ji)是最伟大的(de)促(cu)进平等(deng)的(de)力量。

我觉得我们终于(yu)有了这样的能(neng)(neng)力(li)。如果(guo)说每(mei)瓦特(te)每(mei)美(mei)元(yuan)能(neng)(neng)产生的那些token,就(jiu)是(shi)我们所能(neng)(neng)创造的价(jia)值。我很想找到一(yi)个尚未(wei)得到充(chong)分服(fu)务的领域来应用这些能(neng)(neng)力(li)。那就(jiu)是(shi)医疗健(jian)康、教育、公共服(fu)务领域。

如果你关注这些(xie)(xie)尚未得到充(chong)分服务的(de)领(ling)域(yu),作为(wei)国家(jia)公民、社会的(de)一员(yuan),无论在何处,如果所(suo)有这些(xie)(xie)丰富的(de)资源能够转化为(wei)更(geng)好的(de)医疗健康、更(geng)好的(de)教育以及(ji)更(geng)好的(de)公共部门机构(gou)来为(wei)公民服务,那(nei)对我(wo)来说会是更(geng)好的(de)情况,这就是我(wo)想涉足的(de)领(ling)域(yu)。

十四、未来智能agent会成新认知劳动,量子计算机将帮助应对所有挑战

主持人:我不确定从你对不同问题的回答中能否判断出,你是否认为AGI会成为现实,是否会出现一种能够自动化所有事情的东西,至少从所有认知劳动开始,就像任何人在电脑上能做的任何事情那样?

纳德拉:你看,这就是(shi)我(wo)对人们谈论它的定义方式存在(zai)疑问的地方,认(ren)知(zhi)(zhi)劳动不是(shi)一个固定不变的东西。就像现在(zai)存在(zai)认(ren)知(zhi)(zhi)劳动,如果我(wo)有(you)(you)一个收件箱来管理我(wo)所有(you)(you)的智(zhi)能agent,这算不算是(shi)新(xin)的认(ren)知(zhi)(zhi)劳动呢?所以(yi)今(jin)天的认(ren)知(zhi)(zhi)劳动可能会被自动化。

那么(me)(me)新产生的认(ren)知(zhi)劳动又是(shi)(shi)什么(me)(me)呢?这两个方(fang)面(mian)都需(xu)要考虑,这是(shi)(shi)一种变化(hua)。所以这就(jiu)是(shi)(shi)为什么(me)(me)我认(ren)为,至少在我看来,不(bu)要把知(zhi)识(shi)工作(zuo)(zuo)者和知(zhi)识(shi)工作(zuo)(zuo)混(hun)为一谈。今天的知(zhi)识(shi)工作(zuo)(zuo)可能会被自动化(hua)。

谁说我(wo)(wo)(wo)的人生目标就是(shi)整(zheng)理我(wo)(wo)(wo)的电(dian)子(zi)(zi)邮(you)件呢(ni),对吧?让AI agent来整(zheng)理我(wo)(wo)(wo)的电(dian)子(zi)(zi)邮(you)件吧。但(dan)是(shi)在整(zheng)理完我(wo)(wo)(wo)的电(dian)子(zi)(zi)邮(you)件之后(hou),给我(wo)(wo)(wo)一(yi)个更高(gao)层次(ci)的认知劳动任务(wu),比如 “嘿,这是(shi)我(wo)(wo)(wo)真正希望你审核的三份草稿”。这是(shi)一(yi)种(zhong)不(bu)同的抽(chou)象层次(ci)。

主持人:AI能做到第二点吗?

纳德拉:有可(ke)能(neng),但一旦它做到了第二点,就会出现第三点。所(suo)以这就是为什(shen)么我认(ren)为,我们在历史上(shang)已经(jing)经(jing)历过(guo)工(gong)具的变革改变了认(ren)知劳动的情况,为什(shen)么我们还担心(xin)所(suo)有的认(ren)知劳动都会消(xiao)失呢?

主持人:我相信你以前也听过这样的例子,就像马在某些方面仍然有用,有些地形你开车去不了,但你也不会看到满大街都是马,也不会有数百万匹马被用来工作,这种情况不会发生。那么对于人类来说,类似的事情会发生吗?

纳德拉:但从一个非常狭(xia)窄的(de)角度(du)来看(kan),在人类历史上,我(wo)们(men)仅(jin)仅(jin)在过去(qu)的(de)200年里,才把我(wo)们(men)所理解的(de)某些狭(xia)窄的(de) “认知劳动” 视为有价值(zhi)的(de)东西。

我(wo)们以化学(xue)为例,如(ru)果量子计算加上(shang)AI真(zhen)的能帮助我(wo)们进行很多新颖(ying)的材料科学(xue)研(yan)究等等,那(nei)太棒了(le)。

但(dan)这真的会(hui)以某种方式(shi)剥夺(duo)(duo)人类能做的其他(ta)所有事情吗?所以为什么我们不(bu)能生(sheng)活在一个既有强(qiang)大的认(ren)知机(ji)器,同时(shi)我们的认(ren)知能力又不(bu)会(hui)被剥夺(duo)(duo)的世(shi)界(jie)里呢?

主持人:你能想象在微软董事会中添加一个AI成员吗?它有没有可能具备那种判断力、背景知识和全面的理解能力,从而成为一个有用的顾问呢? 

纳德拉:这是(shi)(shi)个很好的(de)例子。我们在Teams中(zhong)添(tian)加了(le)一个会(hui)(hui)议(yi)主持人智能(neng)agent。在初期,它的(de)目标(biao)是(shi)(shi),这个具有长期记忆(yi)的(de)主持人智能(neng)agent,不仅(jin)仅(jin)是(shi)(shi)关于会(hui)(hui)议(yi)的(de)背景(jing)信息,还包括我正在处理的(de)项目以及团队等方面的(de)背景(jing)信息。

它能成为(wei)一个(ge)优秀的主持(chi)人(ren)吗?我甚至(zhi)希(xi)望在(zai)董(dong)(dong)事会(hui)会(hui)议(yi)中也有这(zhei)样(yang)一个(ge)智能agent,因为(wei)在(zai)董(dong)(dong)事会(hui)会(hui)议(yi)上很(hen)容易分心。毕竟,董(dong)(dong)事会(hui)成员(yuan)每季度才来一次,他(ta)们(men)要(yao)努力理解像微软这(zhei)样(yang)复杂的公司(si)到底发生了什么事情。

我认(ren)为一个真(zhen)正能帮助人们(men)始终围(wei)绕主(zhu)(zhu)题、专注于(yu)重要(yao)问题的(de)主(zhu)(zhu)持人智(zhi)能agent会很棒(bang)。这(zhei)就像你之前的(de)问题所提到(dao)的(de),有一个拥有无限记(ji)忆的(de)东西,甚至可以帮助我们(men)。

毕竟,赫伯特・西(xi)蒙(Herbert Simon)说过,我们都有(you)(you) “有(you)(you)限(xian)理(li)性(xing)”,对吧?所(suo)以如果(guo)人类的有(you)(you)限(xian)理(li)性(xing)实际上能够(gou)因(yin)为外部有(you)(you)一(yi)个认知放大器而得到解决(jue),那(nei)就(jiu)太(tai)好(hao)了。

主持人:说到材料和化学方面的事情,我记得你最近说过,你希望在未来25年内实现这些领域在过去250年里的发展进步。当我想到未来250年可能实现的事情时,我想到的是太空旅行、太空电梯、永生以及治愈所有疾病。而你认为未来25年就能实现吗?

纳德拉:我提出这(zhei)个(ge)想法的(de)(de)一个(ge)原因(yin)是,我喜欢这(zhei)样一种观点,你(ni)看,工业革(ge)命(ming),如(ru)果说是持续了250年,如(ru)果你(ni)把(ba)从基于碳的(de)(de)系统到其他系统的(de)(de)整(zheng)个(ge)变革(ge)过程考虑(lv)在内,那么这(zhei)意味着(zhe)你(ni)必须从根本(ben)上重新(xin)发(fa)明(ming)过去250年里化学领域(yu)所发(fa)生(sheng)的(de)(de)一切(qie)。

这就(jiu)是(shi)我(wo)(wo)(wo)希望(wang)我(wo)(wo)(wo)们拥(yong)有(you)(you)量(liang)子(zi)计算机(ji)的(de)原因。这台量(liang)子(zi)计算机(ji)可以帮助(zhu)我(wo)(wo)(wo)们获得新的(de)材料(liao),然后(hou)我(wo)(wo)(wo)们可以制(zhi)造(zao)这些新材料(liao),从而(er)帮助(zhu)我(wo)(wo)(wo)们应对这个星球(qiu)上面临的(de)所有(you)(you)挑战。而(er)且我(wo)(wo)(wo)完全支持星际旅行(xing)。

主持人(ren):太棒了。萨蒂亚,非常感谢你抽出时间。

纳德拉:这(zhei)次交流(liu)很(hen)棒。谢谢。