智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影

在生成式AI竞(jing)赛中,亚马逊云科(ke)技(AWS)多少(shao)有(you)些“另类”。它不像其他云大厂(chang)那样(yang)强调(diao)自(zi)研模型(xing)的(de)顶尖性能,而是早(zao)早(zao)推(tui)出一个大模型(xing)货架,集邮般摆上了各家头部大模型(xing),供(gong)客户(hu)挑选(xuan)。

没有一个模型能包办一切”,这个被亚马逊频繁强调的理念,已经逐渐深入人心。而在今年的年度云计算产业盛会re:Invent上,亚马逊云科技却又意外地发布全新大模型系列Nova的6款前沿模型,而且剧透了明年将发布的两款特别模型——语音到语音、任意到任意(Any-to-Any)。

这意味着亚马逊(xun)云科技(ji)在重押美国大(da)模(mo)型独角兽Anthropic的同时(shi),对自研模(mo)型也并未松懈。

在re:Invent期间,亚马逊云科技生(sheng)成(cheng)式AI全球副(fu)总裁(cai)兼(jian)总经理Vasi Philomin与(yu)智东(dong)西等少(shao)数媒体就这些问题进(jin)行了深入交流。他谈到当(dang)前文本模型需求(qiu)最大,语(yu)音到语(yu)音也非(fei)常流行(如实时同传翻译),任意到任意则是更远的未(wei)来。

任(ren)意(yi)到(dao)任(ren)意(yi)模(mo)型属于多模(mo)态(tai)到(dao)多模(mo)态(tai),用户(hu)可以输入文(wen)本、语音、图像(xiang)(xiang)或视(shi)频等多种(zhong)形式的内容,并相应地输出文(wen)本、语音、图像(xiang)(xiang)或视(shi)频。

Vasi Philomin向(xiang)我们解释说(shuo),任(ren)(ren)意(yi)到任(ren)(ren)意(yi)模(mo)(mo)型(xing)适用(yong)于变化很多的(de)情(qing)况,比如(ru)不(bu)能(neng)确(que)定(ding)是图(tu)像还是视频类型(xing)。“你不(bu)能(neng)把任(ren)(ren)意(yi)到任(ren)(ren)意(yi)模(mo)(mo)型(xing)用(yong)作(zuo)文本到文本的(de)模(mo)(mo)型(xing),”他强调(diao)道(dao),“它可能(neng)成本挺高,但(dan)效(xiao)果反而(er)不(bu)好。”

最(zui)强未(wei)必是(shi)最(zui)优解,好用(yong)才是(shi)硬道理。

整场re:Invent大(da)会都在源源不断(duan)地传递一(yi)个(ge)信(xin)号——亚马逊云(yun)(yun)科(ke)技的(de)(de)(de)生成式AI竞争力胜在全面,有(you)琳琅满(man)目(mu)的(de)(de)(de)大(da)模型品类,还有(you)加速从训练到(dao)推理的(de)(de)(de)各种(zhong)工具“套(tao)餐(can)”,以及(ji)围绕(rao)平台、存储(chu)、网(wang)络、数据库(ku)的(de)(de)(de)一(yi)系列升级……一(yi)切变动都指向一(yi)个(ge)目(mu)的(de)(de)(de),即让云(yun)(yun)客户(hu)更(geng)(geng)快更(geng)(geng)方(fang)便地用生成式AI产生价值。

在(zai)沙利文大(da)中华(hua)区总监李(li)庆(qing)看来,本(ben)届re:Invent大(da)会上的新发布更加侧(ce)重于产品的实际应(ying)用(yong)和工具(ju)优(you)化,这表明过去(qu)一年(nian)中,全球用(yong)户(hu)正在(zai)积极使用(yong)亚马(ma)逊云科(ke)技进行生成(cheng)式AI应(ying)用(yong)的探索和创新。

有两个方面令他(ta)印象(xiang)深(shen)刻:一(yi)是(shi)随(sui)着全球企业(ye)对(dui)(dui)生成式AI的(de)(de)深(shen)入应(ying)(ying)用(yong),数据(ju)不仅实现(xian)跨区(qu)域的(de)(de)传输(shu)与协同,更实现(xian)跨地域、跨区(qu)域的(de)(de)深(shen)度(du)连接;二是(shi)亚(ya)马逊云科(ke)技进一(yi)步(bu)优化(hua)生成式AI的(de)(de)应(ying)(ying)用(yong),从数据(ju)存储、治理(li)到管理(li)的(de)(de)全流(liu)程提(ti)升,旨在简(jian)化(hua)AI对(dui)(dui)数据(ju)的(de)(de)使用(yong),同时(shi)强(qiang)化(hua)模(mo)型功能、增加AI Agent管理(li)和(he)(he)应(ying)(ying)对(dui)(dui)模(mo)型幻(huan)觉(jue)的(de)(de)功能。此外,新发布的(de)(de)Amazon Nova大模(mo)型家族备受(shou)期待(dai),这一(yi)系(xi)列(lie)的(de)(de)模(mo)型和(he)(he)亚(ya)马逊云科(ke)技的(de)(de)开(kai)放选择理(li)念将为用(yong)户(hu)带(dai)来更多创新机会,进一(yi)步(bu)推动AI的(de)(de)发展。

一、大模型货架上新:不会厚此薄彼,提供试用机会

新发布的Nova基础模型包括MicroLiteProPremier模型,Micro是纯文本模型,后三者都是多模态模型,还有文生图模型Canvas和文生视频模型Reel这些模型(xing)都支持微调和蒸馏,还(hai)与(yu)Amazon Bedrock的(de)知识库深度集成,可用于检索增强(qiang)生成(RAG)。

Vasi Philomin告诉智东西,亚(ya)马(ma)逊云科(ke)技的每个新模(mo)型(xing)、新服务在面世(shi)前都会经过内(nei)部讨论(lun)流(liu)程(cheng),Bedrock寓(yu)意(yi)“基石”,Nova寓(yu)意(yi)“新”。他(ta)说亚(ya)马(ma)逊云科(ke)技不会公布(bu)模(mo)型(xing)参(can)数的情况,怎(zen)(zen)么选(xuan)择取决于客户(hu)想要拥有(you)怎(zen)(zen)样的灵活度。

“我们(men)对所有的(de)模型都(dou)一视同仁(ren)。”作为Amazon Bedrock的(de)负责人,Vasi Philomin称自己的(de)团队非常中立,不会(hui)在模型间(jian)厚此薄彼。

定价由模型提供商设置(zhi),不(bu)同情况下有(you)很多不(bu)同的(de)考量。亚马逊云科技(ji)没有(you)去绑(bang)定某一个特定的(de)模型,始终向(xiang)客户提供选(xuan)择的(de)空间(jian)。

大(da)模(mo)型只(zhi)是生成式AI应用(yong)创(chuang)新的一部分。亚马(ma)逊云科技的(de)全托(tuo)管(guan)AI平台Amazon Bedrock除了提(ti)供了各种(zhong)大模型外(wai),还有专门的(de)试用服务(wu)。客(ke)户可以在尝试后根(gen)据(ju)效果和(he)价(jia)位进(jin)行综(zong)合考虑。

此外,亚(ya)马(ma)逊云科技(ji)提(ti)供(gong)有(you)模型版本(ben)(ben)政策,在(zai)模型生命周期结束的(de)时(shi)候(即新(xin)产(chan)品不再(zai)使用时(shi)),会再(zai)给客(ke)户(hu)6个(ge)月(yue)的(de)时(shi)间。在(zai)Vasi Philomin看来,一些新(xin)老版本(ben)(ben)替代(dai)会占(zhan)用计算(suan)资源,从成本(ben)(ben)、效(xiao)率的(de)角度不见得划算(suan),换(huan)个(ge)新(xin)的(de)可能更省钱。

亚马逊云科技对Nova模型性价比很有信心,称它们比Amazon Bedrock中的其他领先模型大约便宜75%

二、Amazon Bedrock五大功能:挑选模型,结合数据,构建Agent

在re:Invent大会(hui)上,亚马逊CEO Andy Jassy分享了亚马逊内(nei)部构建(jian)近1000个生(sheng)成式AI应用所(suo)积累的(de)三条经验(yan):

1、当生成式AI应(ying)用达到一定(ding)规(gui)模,计算成本的重(zhong)要性就凸显出来。客户普遍希望获得更高(gao)性价(jia)比。

2、打造一个真正(zheng)优质的(de)生(sheng)成式AI应用程(cheng)序颇具难(nan)度,除了有好模型,还要设置恰当的(de)“护栏”,保(bao)证(zheng)消息传递流畅,拥(yong)有合适的(de)用户界面,让用户用起来不(bu)卡(ka)顿,而且要具备(bei)合理的(de)成本结构。

3、不会出现一种工具一统天下的(de)(de)情况(kuang)。开发(fa)者(zhe)并没有一窝蜂地选用(yong)性能最顶尖(jian)的(de)(de)模(mo)型,会采(cai)用(yong)不同模(mo)型,也(ye)会采(cai)用(yong)一些自(zi)研模(mo)型。

亚马逊云科技在2023年9月推出的全托管AI平台Amazon Bedrock则做到了上述能力的集合。据Vasi Philomin分享,该平台已发展成亚马逊云科技目前增长速度最快的服务。

亚(ya)马(ma)逊云科技(ji)CEO Matt Garman称Amazon Bedrock是目(mu)前构建和(he)扩展生成式AI应用最简便的方式,尤(you)其(qi)擅长为客(ke)户提供将生成式AI集成到生产应用程序中所需的一切要素。

Amazon Bedrock的定位是帮助用户更好地试用模型,主要有五大功能:1)选模型;2)找到成本性能和准确性的一个平衡;3)集成业务数据;4)要集成业务的安全性;5)构建Agent。

该(gai)平台的多项(xiang)发布和创新,也围绕这五(wu)大功能(neng)展(zhan)开。

首先在选模型上,除了亚马逊云科技新发布的自研大模型Nova系列以及来自全球9家领先AI公司的高性能基础模型外,这家云计算大厂还推出了Amazon Bedrock Marketplace,提供来自100多个新兴和专业基础模型,支持客户用统一API来调用并利用Amazon Bedrock中的能力来构建应用。

为了让挑模型更省事,Amazon Bedrock智能提示词路由功能可以动态地将请求路由到最有可能以最低成本出最佳响应的模型,在不影响准确性的情况下能将成本降低30%。这样开发人员就不用花大量时间来试验和找到最适合每个用例的模型。

其次在寻求业务需求、专业知识、预算与模型精度、成本、延时的平衡方面,模型蒸馏很有用。

模型蒸馏将特定知识从一个大而准确的教师模型蒸馏出一个更小但在特定场景中非常高效的定制模型。使用新推出的Amazon Bedrock模型蒸馏,蒸馏过的模型相比被蒸馏的模型,运行速度能够快500%,成本降低75%,而且Amazon Bedrock会帮助搞定所有相关工作。

Amazon Bedrock新发布的延迟优化推理选项提示词缓存功能也能进一步降低延迟,大幅缩减成本。

获得合适模型后,下一步是将企业数据与智能模型相结合。

将数据添加到模型中并进行整合的一种热门方法叫检索增强生成(RAG),有助于模型基于企业数据提供更相关、更准确且更具定制化的回应。

亚马逊云科技在今年早些时候推出了Amazon Bedrock知识库功能,它属于托管的RAG索引,能将所有的数据摄取、检索及增强工作流实现自动化,无需用户自行对这些环节进行全面管理。

客(ke)户(hu)(hu)只需将(jiang)知(zhi)识(shi)库(ku)指向自(zi)己的数据源(yuan),它就(jiu)(jiu)会(hui)自(zi)动将(jiang)其(qi)转换为(wei)文本嵌入,然后存储到一个向量数据库(ku)中。这(zhei)样客(ke)户(hu)(hu)就(jiu)(jiu)能随(sui)时(shi)进行自(zi)动检索了,并且所有的检索结果(guo)都(dou)会(hui)自(zi)动包(bao)含引用(yong)信息,方便用(yong)户(hu)(hu)知(zhi)晓信息来(lai)源(yuan)、提升理解程度。

知识库已经是Amazon Bedrock中最受欢迎的功能之一,并在持续添加新功能,比如新增对向量数据库结构化数据检索GraphRAG的支持。

Amazon Kendra GenAI Index则能为知识库提供语义准确性高的托管检索方案,内置超过40多个企业数据源。

Amazon Bedrock知识库支持结构化数据检索、GraphRAG,可查询各种来源的所有结构化数据,自动生成知识图谱。新发布的Amazon Bedrock Data Automation功能则可以自动将(jiang)非结构化的多模(mo)态内容(rong)转换(huan)为结构化数据(ju),无(wu)需写代码,让将(jiang)多模(mo)态内容(rong)用于生成式AI的过程(cheng)变得(de)更容(rong)易。

导入自己的企业数据后,需要考虑安全性和设定AI应用程序的功能边界。

对此亚马逊云科技推出了Amazon Bedrock Guardrails护栏功能,用于轻松定义应用程序的安全性,并实施负责任的AI检查。使用这个功能,你可以限制AI应用只在特定领域回答问题。

针对模型幻觉问题,可行技术之一是自动推理,亚马逊云科技在诸多幕后服务中都运用了该技术。这是一种能够从数学角度证明某事正确的AI形式,通常被用于验证系统是否按照既定要求运行,尤其适用于系统覆盖面大到无法人工逐一查看,且有关于系统运行方式的知识库的场景。

最新推出的是Amazon Bedrock自动推理检查功能,可以对模型所做出的陈述进行准确性检查,防止因模型幻觉而导致错误。

亚马逊云科技还发布了Amazon Bedrock Guardrails多模态毒性检测功能,能够筛查非结构化数据中可能包含的潜在有害内容。

最后涉及到怎么利用优质数据采取行动。

亚马逊云科技此前推出了Amazon Bedrock Agent功能,让构建智能体变得更容易。客户只需用自然语言描述想要Agent完成的任务,它就能快速构建出来。被构建出的Agent可以处理销售订单、编制财务报告、分析客户留存情况等任务。背后用到的模型推理技术使Agent能分解工作流程,调用正确的API来执行操作。

在此基础上,针对多智能体并行操作的任务,亚马逊云科技又推出了Amazon Bedrock多Agents协作功能,能够构建、部署和编排多个Agents,协同处理复杂的多步骤任务。

跟前面的做法差(cha)不多,客户可以创(chuang)建一(yi)个专(zhuan)为特定个性化任务设计(ji)的Agent,再创(chuang)建一(yi)个监督Agent,它就(jiu)好比复杂工作(zuo)流程(cheng)的“大脑(nao)”,负责协(xie)(xie)调(diao)分配、确保多Agent之(zhi)间能(neng)够有效协(xie)(xie)作(zuo),并能(neng)设定哪些Agent能(neng)访问机密信息(xi),把原本难以协(xie)(xie)调(diao)的工程(cheng)任务变(bian)得简单(dan)易行(xing)。

总体来说,Amazon Bedrock的(de)功能(neng)不止(zhi)是(shi)为了(le)(le)方(fang)便客户获取(qu)业界先进模型(xing),而是(shi)内置了(le)(le)很多配(pei)套工具(ju)和(he)工程化(hua)能(neng)力,可(ke)以(yi)让实际业务与生(sheng)成式AI结合的(de)操作过程更方(fang)便、结果更奏效(xiao)。

三、下一代Amazon SageMaker:数(shu)据分析和AI需求的统一访问中(zhong)心

生成式AI应用创新要取得成功,需要有AI ready的数据。因此,亚马逊云科技发布了新一代Amazon SageMaker,从产品及品牌方面将其重新定位为“所有数据、分析和人工智能需求的中”。

很多云客户在数据的治理、发现、处理、分析以及生成式AI应用创新方面的需求越来越融合。对此,亚马逊云科技发布了Amazon SageMaker Unified Studio。这是一个单一的数据和AI开发环境,整合了在亚马逊云科技中分析师和数据科学家所使用的各种服务、查询编辑器、可视化工具,以便客户访问组织中的所有数据,并使用最适合的工具对其进行操作。

亚马逊云科技还推出了面向应用程序的Zero-ETL,帮客户无需构建和管理数据管道,即可分析存储在许多最受欢迎的第三方SaaS应用程序中的数据。

另一个新发布的Amazon SageMaker Lake House兼容Apache Iceberg,针对所有结构化和非结构化数据源提供单一界面,跨不同数据源提供简单统一的数据接入与访问控制。客(ke)户可以在Unified Studio中(zhong)轻松处理所有数据,也(ye)可以直接从(cong)任何支持(chi)Apache Iceberg的第三(san)方AI或(huo)分析(xi)工具或(huo)查询引擎访问该功能。

为了一站(zhan)式(shi)解决生成式(shi)AI全(quan)生命(ming)周期的问题,Amazon SageMaker AI将大数据分析、机器学习、模型开发和生成式AI方面的经验融合到一个统一平台中,统一了数据、分析和AI工作流,从而帮助消除机器学习和分析生命周期中的重复劳动。

针对大规模参数带来的模型训练和推理挑战,亚马逊云科技推出Amazon SageMaker HyperPod灵(ling)活训练计划任(ren)务治理功能(neng),以优化计算资源管理。

灵活训练计划基于Amazon EC2容量块,根据时间线和预算创建最佳训练计划,自动预留容量,设置集群,创建模型训练作业,能够为数据科学团队节省数周训练时间,最大化计算资源利用率,可(ke)节省多达40%的成(cheng)本。

任务治理功能针对管理跨团队的和项目的计算资源的挑战,通过自动化生成式AI任务的优先级排序和管理,确保分配给最高优先级任务并按时完成,从而进一步提高开发效率并降低成本。

这两(liang)个功能(neng)能(neng)够大幅提高(gao)训练和(he)推理工(gong)作负载部署的(de)灵活性和(he)对(dui)底层(ceng)(ceng)硬件(jian)资源的(de)使用(yong),让底层(ceng)(ceng)硬件(jian)资源发挥出更好效能(neng)。

此外,亚马逊云科技宣布合作伙伴的AI应用已在Amazon SageMaker上可用客户(hu)无需预(yu)配(pei)或管理(li)基础设施,可加速模型开发生(sheng)命周期,并有(you)数据安全(quan)和隐私保(bao)障(zhang)。

接下来(lai)一(yi)年,亚马逊云科技还(hai)将为新的Amazon SageMaker添加(jia)大量新功能,如(ru)AutoML、低代码体(ti)验、专业化AI服务(wu)集成、流处理和搜索,以及Zero-ETL的更(geng)多(duo)服务(wu)和数据访问。

四、生成式AI助手Amazon Q再进化,提升企业生产力

Amazon Q是在(zai)Bedrock上搭建起来的一个生成式AI助手应用。即(ji)使你没有写(xie)过(guo)一(yi)行(xing)Python代码,你也(ye)可以用(yong)自然语言简(jian)单(dan)陈述(shu)业务问题(ti),它会指(zhi)导你完成构(gou)建机器学习模型的过(guo)程。

其中Amazon Q Developer是软件开发方面的生成式AI助手,最新推出了3款全新自主Agent,能帮助开发人员生成单元测试、文档、代码审查

针对从Windows、VMware进行现代化改造的情况,亚马逊云科技提供了现代化Windows.NET应用加速VMware工作负载主机迁移的功能,以及首个支持IBM z/OS的主机迁移解决方案,可以大幅缩短迁移时间和成本,并显著降低风险。

在运营环节,亚马逊云科技通过提供Amazon Q Developer Investigate issues across your Amazon environment in a fraction of the time功能,来帮助更轻松地排查问题。

企业级生成(cheng)式AI助手Amazon Q Business可连接不同的业务系统、企业数据源,支持跨越各种数据库与所有企业数据进行对话。Q Business为企业数据创建了一个索引,可以从Adobe、Microsoft Office、SharePoint、Gmail、Salesforce、ServiceNow等(deng)源(yuan)中去索引过去一(yi)年(nian)的(de)数据,并(bing)对所有数(shu)据保持高度安全、控制(zhi)用户(hu)权限(xian)。

最新发布的功能是将Amazon QuickSight和Amazon Q Business的数据结合,以一种视图呈现,通过自然语言与Q系统对话,快速生成商业报告和数据分析,协助客户做出更好的决策并提升业务效率。目前绝大多数信息都是通过商业智能系统来访问的,已有超过10万的客户在使用Amazon QuickSight来满足分析需求。

亚马逊云科技提供了一套全新的Q Business API,以便独立软件供应商访问在自有软件中集成Amazon Q Index。

针对一些涉及多个应用程序、审批环节和手动输入的复杂工作流,亚马逊云科技新发布的Amazon Q Business Automate能够帮助创建跨团队和应用程序的自动任务,通过使用一系列高级Agent来创建、编辑、维护工作流程。在启动工作流后,还会有一个Q Agent持续对其进行监控,确(que)保(bao)能够自(zi)动调整并及时修复。以往完成这(zhei)些工(gong)作可能(neng)需要花费数(shu)周(zhou)或数(shu)月,而现在仅需几分钟。

结语:从服务、工具到基础设施,全栈升级为生成式AI创造价值托举

正如计算(suan)机科学先驱Alan Kay曾经说过(guo)的(de)(de)(de),最好的(de)(de)(de)软件工程师(shi)自己会构建硬(ying)件。新的(de)(de)(de)云计算(suan)、生成(cheng)式(shi)AI浪潮会推(tui)动在(zai)底(di)层的(de)(de)(de)持续(xu)创新,底(di)层创新反之又会加速数据及AI的(de)(de)(de)进一(yi)步(bu)发展。和传统IT一(yi)样,生成(cheng)式(shi)AI需要计算、网络、存(cun)储(chu)基础设施的托载,而这(zhei)些(xie)恰恰是亚马逊云科技(ji)长(zhang)期积累的优(you)势(shi)所在。

将业务和生成式AI结合需(xu)要(yao)很多工程化能力。在生成式AI发(fa)展的早期(qi)阶段,亚马逊云科技将其服务重心放(fang)在提供(gong)“最优(you)组(zu)合”上,将技术(shu)能力分解(jie)为独(du)立的构建单元(building blocks),以高性价比组(zu)件的形式提供(gong)给客(ke)户,让客(ke)户可(ke)以按(an)照自(zi)己期(qi)望的任意组(zu)合去尝(chang)试(shi)和调整,从而(er)节省(sheng)开(kai)发(fa)时间,加速(su)探索生成式AI落地。

总体(ti)来看,亚马逊云科技通(tong)过(guo)(guo)提供丰富(fu)的(de)自(zi)研及(ji)第三方(fang)大模型(xing)货(huo)架来满足云客(ke)户差(cha)异化需求,通(tong)过(guo)(guo)Amazon Bedrock解决(jue)大模型(xing)落地(di)效(xiao)率问题,通(tong)过(guo)(guo)Amazon SageMaker提高资(zi)源利用和数据分(fen)析的(de)速度,通(tong)过(guo)(guo)Amazon Q让人人都能(neng)简便快(kuai)捷地(di)用上生成式(shi)AI生产工具,通(tong)过(guo)(guo)底层(ceng)基础设施的(de)升级进一步降本增效(xiao)。

这些投入在为(wei)广泛客户(hu)带(dai)来更大商业回报的同时,也持续巩固着这家云计算巨头在生成式AI云服务市场的领导者地位和核心(xin)竞(jing)争力。