智东西(公众号:zhidxcom)
编辑 | GenAICon 2024
2024中国生成式(shi)AI大会于4月18-19日在(zai)北京举行,在(zai)大会首日的主会场(chang)开(kai)幕式(shi)上,昆仑(lun)万维董事长兼CEO方汉以《从(cong)天(tian)工SkyMusic音乐大模型谈SOTA红利(li)》为题发表演(yan)讲。
方汉强调了“技术领先”在AI领域的重要性,不同于互联网时代产品的商业模式导向,大模型时代技术导向才能带来市场上的领先优势,吸引大量用户并获取红利。
OpenAI在AI创企中的地位,本质上是其文本大模型的SOTA(当前技术指标第一)能力带来的。对于当前的AI创业者,在图像、视频、音乐等任何赛道,只要能取得SOTA,就能通过技术优势获得大量用户,后续再通过产品创新、商业模式创新把用户固化在平台上,形成自己的护城河。
在AGI和AIGC领域,昆仑万维研发出了天工3.0模型,包含音乐大模型SkyMusic和全球最大规模的开源MoE大模型。其中音乐大模型SkyMusic就处于音乐领域的SOTA地位。
SkyMusic音(yin)(yin)乐(le)大模(mo)型支持多种方言输出,具有(you)辨识度(du)(du)的(de)自(zi)然人声、降(jiang)低(di)音(yin)(yin)乐(le)创作(zuo)门(men)槛和成本(ben)等,便于内(nei)容行业发展。基于音(yin)(yin)质、自(zi)然度(du)(du)和理解度(du)(du)方面(mian)的(de)优势,即使是没有(you)音(yin)(yin)乐(le)背景(jing)的(de)普通人也能(neng)够利(li)用该技术进行音(yin)(yin)乐(le)创作(zuo),而这(zhei)也将极大地扩(kuo)展音(yin)(yin)乐(le)创作(zuo)的(de)可能(neng)性和范围。
此(ci)外,天工3.0大(da)模型数学、推理(li)、代码等方面能力大(da)幅提升(sheng),同(tong)时具有多轮搜索与综合工具的(de)调用能力,将带来内容行业(ye)的(de)爆发,同(tong)时也(ye)将促进文化平权和打破垄断,让每个人更好(hao)地塑造和表达(da)自(zi)我。
以下为方汉的演讲实录:
SOTA其实是一个学术上用得非常多的专有名词,全称是“State of the Art”,这个比较拗口,其实是当前技术指标第一的意(yi)思。这(zhei)本(ben)来是(shi)在机(ji)器学(xue)习领域用来评估模型的一(yi)个(ge)技术指标,原本(ben)是(shi)个(ge)学(xue)术词,为什么会备受关注?
一、在垂类领域拿到SOTA,才能将技术红利转化市场红利
纵观这一波大模型的投资以及创业浪潮,可以发现一个明显的现象。在上一波移动互联网,所有创业公司的CEO或者Leader基本上都是产品或者是商务背景,也就是说移动互联网是商业模式和产品模式的创新,而这一波AI创业的大潮,所有AI公司的CEO基本上都是技术背景。
为什么呢?因为在AI领域技术远远超过产品商业模式,技术的领先才能带来业务上的红利。
举几个例子,首先(xian)不(bu)可(ke)避免要谈到这(zhei)个行业的第一(yi)名,OpenAI。OpenAI为(wei)什么(me)现在(zai)(zai)估值(zhi)这(zhei)么(me)高,为(wei)什么(me)全世界对它这(zhei)么(me)期许?因为(wei)本质上在(zai)(zai)ChatGPT之后,它在(zai)(zai)文本大模型上的SOTA地位一(yi)直非常稳(wen)固。直到Claude 3出(chu)来(lai)之后,才第一(yi)次有(you)大模型可(ke)以(yi)接近GPT-4的位置,所以(yi)它赶忙(mang)抛出(chu)Sora,这(zhei)是在(zai)(zai)视频生成领域的SOTA。也就是说在(zai)(zai)最泛化的通用(yong)人工智(zhi)能、文本大模型领域,OpenAI的SOTA红利非常明显。
但是我们(men)看图像(xiang)(xiang)生成赛道,DALL·E 3出(chu)来(lai)得非常早,但是很(hen)快像(xiang)(xiang)Midjourney、Stable Diffusion出(chu)来(lai)之后,这(zhei)些中小型的(de)创(chuang)业(ye)公(gong)(gong)(gong)司(si)获取大量(liang)的(de)用户,远远超(chao)过OpenAI的(de)DALL·E 3。为(wei)什么?就是因(yin)为(wei)DALL·E 3没有达到SOTA。SOTA被(bei)Midjourney以(yi)及后面的(de)一(yi)些中小创(chuang)业(ye)公(gong)(gong)(gong)司(si)拿到,用户肯定会(hui)选择中小公(gong)(gong)(gong)司(si)的(de)产(chan)品,而(er)不(bu)会(hui)选择其他(ta)公(gong)(gong)(gong)司(si)的(de)产(chan)品。
也就是说在任何一个领域,对于我们所有的创业者和后来者,只要你能在这个领域拿到技术指标上的第一,你就能够获取大量的用户。在获(huo)取大量用户(hu)(hu)之后,才可(ke)以用你(ni)的产品模式、商业模式把这些用户(hu)(hu)固(gu)化(hua)在你(ni)的平(ping)台上。
从长(zhang)期来(lai)看,只要新(xin)的(de)(de)大模型和新(xin)的(de)(de)竞(jing)争(zheng)者没有(you)明显的(de)(de)代际压制的(de)(de)话,你仍然(ran)能够继续(xu)靠(kao)这些用户(hu)获取红利。就(jiu)像(xiang)Midjourney V6出来(lai)之后,它的(de)(de)SOTA地位已经不是(shi)很稳固了,但是(shi)用户(hu)基础仍然(ran)很坚实。
前面是我的一些背景介绍,当然中国企业因为进入大模型赛道,其实大家都蛮晚的,但是我们在全球的竞争中心仍然是坚持技术第一,我们一定要在某个垂类领域拿到SOTA之后,才能够由技术上的红利,转化为用户和市场上的红利。
二、以天工大模型为底座,形成六大业务矩阵
首先给大家汇报一下昆仑(lun)万维是从什么时候(hou)开始做(zuo)AGI和AIGC这件事情。
我们(men)是2020年(nian)GPT-3出(chu)来(lai)的时候就(jiu)成(cheng)(cheng)立了(le)一(yi)支团队做文本大模型的预(yu)训(xun)练工作(zuo),2021年(nian)开始做音乐大模型的生成(cheng)(cheng)预(yu)研工作(zuo),当然我们(men)也走(zou)过很多弯路,比如音乐大模型一(yi)开始走(zou)的符号(hao)生成(cheng)(cheng),再转(zhuan)到端到端。现在所有垂直赛道到终(zhong)局(ju)一(yi)定是端到端。
2022年12月,我们发布了中国首个开源文本大模型,当时海外(wai)的(de)各种开(kai)源大模型也没出来(lai),这(zhei)是来(lai)自中国(guo)企(qi)业(ye)的(de)第(di)一个(ge)基于(yu)中文(wen)的(de)13B开(kai)源文(wen)本(ben)大模型。
2023年4月17日,我们发布了天工1.0;8月23号发布了国内首个AI搜索“天工AI搜索”。今年4月17日,我们发布天工3.0,包含首个中国的音乐AIGC赛道的SOTA,也就是SkyMusic音乐生成模型,以及4000亿参数的全球最大规模的开源MoE大模型。

目前我们有六大业务矩阵,包括AI大模型、AI搜索、AI音乐、AI视频、AI社交和AI游戏。
虽(sui)然矩(ju)阵这么多,但(dan)我们(men)目标非常(chang)清晰。首(shou)先我们(men)一(yi)定(ding)要(yao)做(zuo)底座模(mo)(mo)型——天工大(da)(da)模(mo)(mo)型,从(cong)原来的文(wen)本大(da)(da)模(mo)(mo)型到现(xian)在(zai)的MoE大(da)(da)模(mo)(mo)型,再到下一(yi)代多模(mo)(mo)态大(da)(da)模(mo)(mo)型,我们(men)一(yi)定(ding)要(yao)在(zai)底座大(da)(da)模(mo)(mo)型上持(chi)续去演进(jin)。
为什(shen)么?因为现(xian)在有一个明(ming)显的现(xian)象,所有垂直(zhi)赛道的各(ge)种垂类(lei)模型(xing)(xing),不管音(yin)频、音(yin)乐、视频、图(tu)像还是3D模型(xing)(xing)其实都(dou)严重(zhong)依赖于底(di)座文本(ben)(ben)大模型(xing)(xing)的能(neng)力(li)(li),如果(guo)底(di)座文本(ben)(ben)大模型(xing)(xing)能(neng)力(li)(li)不行,各(ge)种垂类(lei)模型(xing)(xing)能(neng)力(li)(li)上限比较(jiao)低。
社交、音乐、游戏和视频都属于AIGC垂类赛道,我们认为在这些垂类赛道上只要进行持续和长期的投入,就一定可以达到SOTA,从而获取市场上的领先优势。
三、中国首个音乐AIGC上的SOTA,近2000万首全量音乐数据集
首先给大家介绍一下天工音乐大模型SkyMusic,这个现在已经对全量用户开放了,大家在App Store和应用商店搜索“天工”,“天工”里面有一个音乐的type,大家可以立刻去使用,这是中国第一个音乐AIGC上的SOTA。
这是我们把剁(duo)椒鱼头的(de)(de)菜谱做成(cheng)一(yi)首歌的(de)(de)案例演示(shi),是用(yong)粤(yue)语(yu)演唱出来的(de)(de)。

这(zhei)是天工AI音乐和庞博联合的案例,我们(men)把庞博写的词做(zuo)成了一首歌。

下面说一下技术指标,目前SkyMusic和Suno V3版本相比,在人声、BGM音质、人声自然度、发音可懂度方面都已经击败了Suno。我(wo)们相信在下一个版本里面可(ke)以把这个差(cha)距(ju)继续拉大。
AI音乐大模(mo)型,自(zi)2021年(nian)开始研发到现在走过三年(nian)历(li)程(cheng),我们技术路线也在不断地演进。去年(nian)8月份Sora没有出(chu)来,我们就已经转(zhuan)向Diffusion Transformer架(jia)构(gou)(gou)(gou),因为(wei)这个(ge)架(jia)构(gou)(gou)(gou)是最为(wei)Scale up的一(yi)种架(jia)构(gou)(gou)(gou)。
我们的数据集包含将近两千万首全量的音乐数据集,并且经过三年多的清洗和处理,其数据质量是有保障的。我们采用类DiT架构做(zuo)了SkyMusic音乐(le)大模型的研发(fa),目前(qian)这个(ge)大模型还只是我(wo)们的第一个(ge)版(ban)本,后续在实验室版(ban)本会(hui)实现更多的功能。

下(xia)面介绍一下(xia)我们有哪些非(fei)常独特的优势。
用过Suno的(de)(de)都(dou)知(zhi)道,你(ni)选择(ze)的(de)(de)是文本标签(qian)和风(feng)格。我(wo)们现在的(de)(de)制作(zuo)(zuo)方法是,上传一(yi)首你(ni)喜欢听的(de)(de)歌,甚至你(ni)自(zi)己录的(de)(de)一(yi)个(ge)(ge)旋律,我(wo)们都(dou)能根(gen)据这(zhei)个(ge)(ge)生(sheng)(sheng)成音(yin)乐。这(zhei)其实(shi)更像传统的(de)(de)音(yin)乐工(gong)作(zuo)(zuo)者(zhe)(zhe)创作(zuo)(zuo)音(yin)乐的(de)(de)一(yi)个(ge)(ge)逻辑,很多音(yin)乐工(gong)作(zuo)(zuo)者(zhe)(zhe)先在脑海或者(zhe)(zhe)嘴巴哼出(chu)一(yi)段曲子(zi),然后写下(xia)来,根(gen)据这(zhei)个(ge)(ge)再做(zuo)主歌、副歌、编曲的(de)(de)工(gong)作(zuo)(zuo),SkyMusic示例音(yin)源生(sheng)(sheng)成音(yin)乐的(de)(de)能力非常强。
第二,我们支持单一语种方言的输出能力(li)。目前中文版(ban)本已(yi)经支持四川话(hua)(hua)、粤(yue)语、北京话(hua)(hua)、天津(jin)话(hua)(hua)、上海话(hua)(hua)等多种方言版(ban)本,这个对于(yu)用户来说是非常有意义的。
最后是更具辨识度的自然人声。人声的音源质量,以及对于各种人群,女声、男声、幼(you)儿声和成(cheng)人声,SkyMusic都有非常(chang)好的一个泛(fan)化。
当做到技术上的SOTA时,怎么把技术上的SOTA转为产品上的红利?
我们认为所(suo)有的AIGC,包括音乐创作的大模(mo)型出来后(hou),首先极大降(jiang)低了音乐创作门(men)槛(jian)。
就(jiu)(jiu)像我发的(de)(de)朋友圈(quan),“人(ren)人(ren)皆可以歌明志”。以前我们(men)做一首歌的(de)(de)逻辑是(shi)什么?首先(xian)要(yao)从四(si)(si)五岁就(jiu)(jiu)开(kai)始学(xue)(xue)(xue)钢琴(qin)、学(xue)(xue)(xue)乐理、学(xue)(xue)(xue)乐谱。我自己的(de)(de)孩子(zi)在钢琴(qin)方(fang)面可能花(hua)了七(qi)八年才考到(dao)一个(ge)专(zhuan)业级别(bie),这个(ge)训练时间很(hen)长。如果他能成为一个(ge)作曲家,可能还(hai)要(yao)在大学(xue)(xue)(xue)里面再学(xue)(xue)(xue)四(si)(si)年,学(xue)(xue)(xue)完(wan)四(si)(si)年之后这还(hai)只是(shi)作曲,作完(wan)曲还(hai)要(yao)编(bian)曲,编(bian)曲完(wan)还(hai)要(yao)找歌手演唱、找录(lu)音棚来(lai)录(lu)。我们(men)在市场上录(lu)一首歌从头到(dao)尾,哪(na)怕用最简化的(de)(de)配置(zhi)、最普通的(de)(de)设备也要(yao)两万人(ren)民币左右。
这就导致了整个音乐创作,实际上仅仅依靠一个人是没有能力创作歌曲的,但是有了SkyMusic大模型之后,所有人只要花1分钟时间,只要你有歌词,就能生成一首完整的歌曲,极大降低了(le)音(yin)乐创作(zuo)的门(men)槛和(he)造福全体内(nei)容(rong)行业。
以前(qian)大家知道所谓的(de)配(pei)(pei)乐全(quan)是拿现有的(de)曲子往视频(pin)内容上配(pei)(pei),今(jin)天可以把这个(ge)话(hua)题(ti)极(ji)大泛化,比如(ru)今(jin)天的(de)主题(ti)演(yan)讲(jiang),可以给(ji)每一(yi)(yi)位主题(ti)演(yan)讲(jiang)者(zhe)配(pei)(pei)一(yi)(yi)首(shou)歌(ge),比如(ru)微博上每一(yi)(yi)个(ge)大V给(ji)他们(men)写一(yi)(yi)首(shou)关于他们(men)的(de)歌(ge)曲,这个(ge)对于全(quan)体(ti)的(de)内容行业(ye)都非常便利。
最后,SkyMusic证明中国研发也可以在垂直领域取得全球的SOTA,从而让中国企业在(zai)全球的AIGC市场(chang)上去和国外的同(tong)行正面竞争,获取我们应(ying)有的市场(chang)份额。
四、4000亿参数开源MoE大模型天工3.0,拉低全领域创作门槛
下面介绍一下天工3.0,我(wo)们(men)4月17日开启公测的(de)(de)(de)4000亿参(can)数(shu)的(de)(de)(de)全(quan)球最大规(gui)模的(de)(de)(de)开源MoE大模型(xing),目(mu)前(qian)性能已经全(quan)部超越xAI发布的(de)(de)(de)3140亿参(can)数(shu)的(de)(de)(de)MoE大模型(xing)Grok-1。这是(shi)天工(gong)3.0 400B参(can)数(shu)的(de)(de)(de)MoE大模型(xing)的(de)(de)(de)技术(shu)底座(zuo),目(mu)前(qian)在MMBench推理能力测试中标蓝色的(de)(de)(de)是(shi)处(chu)于领(ling)先的(de)(de)(de)技术(shu)指(zhi)标,我(wo)们(men)在这个技术(shu)指(zhi)标上还是(shi)遥(yao)遥(yao)领(ling)先的(de)(de)(de)。

天工(gong)3.0,功能(neng)全面升(sheng)(sheng)级,它(ta)更(geng)聪(cong)明,模(mo)型(xing)的技术知识能(neng)力提升(sheng)(sheng)超过20%;数学(xue)、推理、代码、文创(chuang)能(neng)力提升(sheng)(sheng)30%;内容创(chuang)作能(neng)力,包括能(neng)搜(sou)索、能(neng)写作、能(neng)阅(yue)读(du)、能(neng)聊天,能(neng)够语音对(dui)话(hua),能(neng)够文生图,能(neng)够给你作词作曲(qu)。
给大家演(yan)示一(yi)下多轮(lun)搜索与综合工具的(de)调用能力。图中(zhong)问题是(shi)成(cheng)(cheng)都迪(di)士(shi)(shi)(shi)(shi)尼(ni)怎么去(qu),成(cheng)(cheng)都迪(di)士(shi)(shi)(shi)(shi)尼(ni)实(shi)(shi)际上(shang)是(shi)一(yi)个(ge)梗,它(ta)是(shi)成(cheng)(cheng)都的(de)一(yi)个(ge)小区,并(bing)不(bu)是(shi)真(zhen)正的(de)迪(di)斯尼(ni)乐园。这(zhei)时候通过搜索和(he)大模型结合就判断(duan)出来成(cheng)(cheng)都迪(di)士(shi)(shi)(shi)(shi)尼(ni)实(shi)(shi)际上(shang)是(shi)一(yi)个(ge)网(wang)络(luo)梗,但(dan)它(ta)还是(shi)把怎么去(qu)成(cheng)(cheng)都迪(di)士(shi)(shi)(shi)(shi)尼(ni)这(zhei)个(ge)小区规划做出来。当你(ni)问到(dao)上(shang)海迪(di)士(shi)(shi)(shi)(shi)尼(ni)天气时候,大模型又(you)生成(cheng)(cheng)一(yi)张(zhang)天气卡片(pian),告诉你(ni)今(jin)天上(shang)海迪(di)士(shi)(shi)(shi)(shi)尼(ni)下雨,最后再(zai)调用文生图给你(ni)生成(cheng)(cheng)一(yi)张(zhang)图片(pian)。

第(di)二个(ge)研究模式,做研究需要写大(da)纲(gang)、写知识图(tu)(tu)(tu)谱(pu)和思(si)维(wei)导图(tu)(tu)(tu),而天工3.0在(zai)自动搜索(suo)之(zhi)后(hou)不(bu)仅仅能生成表格(ge),而且可以迅速生成大(da)纲(gang)和自动生成脑(nao)图(tu)(tu)(tu),最后(hou)自动生成脑(nao)图(tu)(tu)(tu),可以即贴即用。
智能体广场可(ke)以(yi)构建超强的(de)AI智能体(ti),去帮(bang)助你完成相(xiang)应的(de)工作(zuo)(zuo)。例如造(zao)一个智能体(ti),帮(bang)助研究小米(mi)汽(qi)车和特斯拉汽(qi)车的(de)一个差别,进(jin)行大量(liang)搜索获取大量(liang)资料后(hou),模(mo)型开始生成文图俱(ju)备的(de)对比表格,对于做文案工作(zuo)(zuo)的(de)同学非常关键。
五、昆仑万维新使命:实现AGI,让每个人更好地塑造和表达自我
昆仑万维作为一家中国的互联网企业,现在的战略是All in AGI与AIGC。我们在2023年宣布了公司的新使命:实现通用人工智能,让每个人更好地塑造和表达自我。

为什么要(yao)做这样(yang)一个使命(ming)的(de)(de)修正?因为实(shi)现(xian)通(tong)(tong)用人工智能(neng),本质上是基(ji)于文本大模型(xing)把人类所有的(de)(de)知识压缩到我们(men)的(de)(de)通(tong)(tong)用大模型(xing)里面,这样(yang)是通(tong)(tong)向通(tong)(tong)用人工智能(neng)的(de)(de)必经之路(lu)。
但(dan)是大家知道通用人工智(zhi)能(neng)在现实(shi)中的(de)落(luo)地是有先后之(zhi)分的(de),什么(me)样的(de)场景会更(geng)容易落(luo)地?
其(qi)实也比较简单(dan),有人开玩笑(xiao)说(shuo),大模型刚出来的(de)时候大家(jia)都觉得(de)所(suo)(suo)有做生产工作的(de)同学(xue)会最(zui)早失业(ye),所(suo)(suo)有做创意艺(yi)术的(de)同学(xue)应(ying)该是位置(zhi)是最(zui)稳固的(de)。但实际上(shang)经过这段时间的(de)发展,大家(jia)可以看(kan)到,所(suo)(suo)有做文艺(yi)创作的(de)同学(xue)失业(ye)概(gai)率会更大一些,也就是说(shuo)在(zai)内容生成领域,其(qi)实AI的(de)落地更容易(yi)。
很简单,因为内容生成(cheng)领(ling)域容错(cuo)率(lv)极高(gao),用户对(dui)于(yu)内容错(cuo)误忍耐度非常高(gao)。我(wo)们可以容忍我(wo)们画上、视频的人(ren)多(duo)一(yi)根(gen)(gen)手指头、少一(yi)根(gen)(gen)手指头。但是(shi)(shi)(shi)(shi)我(wo)们工(gong)作中(zhong),你哪(na)怕小(xiao)数点后面少一(yi)位,这都是(shi)(shi)(shi)(shi)巨大的生产事故。也(ye)就是(shi)(shi)(shi)(shi)说在容错(cuo)率(lv)高(gao)的内容赛道,这一(yi)波大模(mo)型(xing)和人(ren)工(gong)智能的发挥空间是(shi)(shi)(shi)(shi)非常大的。
我们在(zai)人工智能(neng)、AIGC领域,研究目的就是降低创(chuang)作(zuo)的门槛。不(bu)管(guan)是文(wen)生(sheng)图、文(wen)生(sheng)视(shi)频、文(wen)生(sheng)音乐、文(wen)生(sheng)音效还是文(wen)生(sheng)3D资产,本(ben)质上就是移除所有前序我们所需要的长期(qi)的专业(ye)训练,而(er)让任何一个人觉得只要你(ni)会(hui)讲故事,就可(ke)以创(chuang)造出相应的内容来表(biao)达你(ni)自己。
这会带来什(shen)么样(yang)的影响?首先大家知(zhi)道创作(zuo)内容的成本极大降低了,创作(zuo)内容的门槛降低了。我们知(zhi)道创作(zuo)内容方面只要门槛降低,创作(zuo)内容的人数会急(ji)剧膨胀(zhang)。
举个例(li)子,我(wo)小时(shi)候(hou)拍(pai)视频都是(shi)电视台记者扛(kang)几(ji)(ji)十公(gong)斤的摄像(xiang)机(ji)(ji)拍(pai),这(zhei)时(shi)候(hou)创作(zuo)者非常(chang)少。但是(shi)智(zhi)能(neng)手机(ji)(ji)出(chu)现之(zhi)后把(ba)拍(pai)摄者变(bian)成全中国十几(ji)(ji)亿人(ren),人(ren)人(ren)可(ke)以拍(pai)视频,结果就是(shi)短视频行业的巨大发(fa)展。这(zhei)一(yi)(yi)波AI把(ba)全领域的创作(zuo)门槛都拉低了,结果是(shi)什么?整个内容行业会迎来一(yi)(yi)个巨大的爆发(fa)。同时(shi),它还带(dai)来另外一(yi)(yi)个文化平权和打(da)破垄断的作(zuo)用。
为什么?我在(zai)非洲(zhou)待(dai)了蛮长(zhang)时(shi)间,在(zai)尼日(ri)利亚的(de)(de)(de)时(shi)候,了解到尼日(ri)利亚拍(pai)一(yi)部(bu)在(zai)院线(xian)上线(xian)电影的(de)(de)(de)平(ping)均(jun)成本(ben)是(shi)两万美(mei)金到二(er)十万美(mei)金之(zhi)间,这(zhei)样(yang)拍(pai)出来(lai)的(de)(de)(de)片子和(he)中(zhong)国四五亿人民币拍(pai)出来(lai)的(de)(de)(de)《流浪(lang)地球》、美(mei)国四五亿美(mei)金拍(pai)出来(lai)的(de)(de)(de)“漫威”系列电影相比(bi),是(shi)毫无(wu)竞争力的(de)(de)(de)。但是(shi)在(zai)我们(men)下一(yi)代AIGC技术出来(lai)之(zhi)后,我们(men)认为全(quan)世(shi)界所有的(de)(de)(de)弱势文化的(de)(de)(de)人都可以(yi)用非常低(di)廉的(de)(de)(de)成本(ben),创造出媲美(mei)欧美(mei)强势文化的(de)(de)(de)内容(rong)。
这(zhei)(zhei)样的(de)结果是(shi)什(shen)么?每个(ge)弱(ruo)势文(wen)(wen)化(hua)的(de)族(zu)群(qun)都可以通(tong)过AIGC技(ji)术来(lai)产(chan)生(sheng)适合(he)自己民族(zu)的(de)文(wen)(wen)化(hua)、产(chan)生(sheng)适合(he)自己小语(yu)种的(de)文(wen)(wen)化(hua),这(zhei)(zhei)个(ge)对于(yu)全世界的(de)文(wen)(wen)化(hua)平权是(shi)非常有意义(yi)的(de)。这(zhei)(zhei)也(ye)(ye)就是(shi)第二条,让每个(ge)人更好塑造(zao)和表达自我,这(zhei)(zhei)也(ye)(ye)是(shi)研发人员在文(wen)(wen)生(sheng)音乐、文(wen)(wen)生(sheng)视频(pin)、文(wen)(wen)生(sheng)小说、文(wen)(wen)生(sheng)漫画等内容(rong)创(chuang)作领域持续(xu)不断迭代(dai)改进的(de)一个(ge)终极(ji)目的(de)。
以上是方汉演讲内容的完整整理。