智东西(公众号:zhidxcom)
作者 | GenAICon 2024
2024中国生成式AI大(da)会(hui)(hui)于4月(yue)18-19日在北京(jing)举(ju)行,在大(da)会(hui)(hui)第二天的主会(hui)(hui)场AIGC应(ying)用(yong)专场上,极(ji)睿科(ke)技创始人兼CEO武彬以《AIGC全链路电(dian)商(shang)内容生成的前景与(yu)挑(tiao)战》为题(ti)发表演讲。
成立于2017年的极睿科技是一家“清华系”创企,算法团队源自清华大学计算机系NLP实验室,基于AIGC打造电商内容生成引擎。武彬分享说,极睿科技打造了业界唯一的一站式全角色x全链路x全类型电商内容生成方案,把电商内容全(quan)部通过AI的方(fang)式来(lai)做。
在武彬看来,当下电商行业图文和短视频的内容数量与需求都在大幅上升,内容关联着平台、卖家与买家的核心交易诉求,但内容制作效率严重不足。而极睿科技的AIGC工具和方法论在电商场景已经得到很好的验证,帮助商家将成本缩减为原来的1/5。该公(gong)司曾(ceng)用1条视(shi)频帮助一家杭州女装品牌一个月(yue)多卖出两(liang)三千万元。
极睿科技已推出ECGPT+FashionCLIP基座模型及多种电商垂直大模型,可支持商品AI拍摄、AI排版上新、AI直播切片、AI生成商品短视频、AI带货、一站式AI技术与数据服务平台、智能商品操作系统等多种功能,目前已合作超4万电商客户。
以下为武彬的演讲实录:
我们是一家基于AIGC能力做电商内容的公司。为什么选择这个赛道?电商内容满足两个条件:
第一,需求量非常大,大家可(ke)能日常都会(hui)在淘(tao)宝、京东、抖音、快(kuai)手购物(wu),每天都会(hui)产生大量的内容。
第二,电商内容的价值可量化,会极大影响GMV(商(shang)品交(jiao)易总额),电商(shang)内容做得好(hao)(hao)或(huo)者(zhe)不好(hao)(hao),对GMV有很大的(de)影响,我们(men)希望能(neng)够通过AI的(de)方式在这个领域降本增效,开源节流(liu)。

我们团队(dui)主要是(shi)(shi)清华背景的算法(fa)团队(dui),我是(shi)(shi)清华本硕,出身于(yu)自然(ran)语(yu)(yu)言(yan)处理(NLP)实(shi)(shi)验(yan)室,是(shi)(shi)一个专门(men)做(zuo)大(da)模型和自然(ran)语(yu)(yu)言(yan)的实(shi)(shi)验(yan)室。毕业(ye)(ye)后,我创业(ye)(ye)成(cheng)立了(le)这(zhei)家公司,到目前为(wei)止拿了(le)四轮融(rong)资,包(bao)括金沙(sha)江、红(hong)杉(shan)、魔量、顺为(wei)等。
我们现在在专注做“AI+电商”行业里算是比较头部的公司,目前服务全网大概两千家品牌和四万多家店铺,大家打开淘宝、抖音,上(shang)面很多(duo)耳熟能(neng)详的品牌,像安踏(ta)、伊芙(fu)丽、马克华菲,也包括电器、食品品类,图片视频基本是我们帮他们做的。
这样既省掉了原来的电商内容制作成本,也可以帮他们多卖钱。有的品牌通过我们制作的图片、视频,可能一个月多卖两三千万。AI既是一个省钱利器,也是一个挣钱工具。
我们也对接了国内非常多的电商平台,核心做了3个事情:电商内(nei)容的(de)制作(zuo)、管理、分发。我们可以自(zi)动化把电商内(nei)容做好、管好,分发到电商平(ping)台(tai)上,通过这些(xie)内(nei)容做进一步的(de)成交(jiao)。
这是我们整体产品的矩阵(zhen)和(he)链(lian)路,当商(shang)家把(ba)内容上(shang)传上(shang)来之后,通过多个自动(dong)(dong)化(hua)工(gong)(gong)具(ju),包(bao)括PhotoMagic自动(dong)(dong)做(zuo)(zuo)图片,EC Pro自动(dong)(dong)做(zuo)(zuo)排版布(bu)局和(he)加(jia)工(gong)(gong),自动(dong)(dong)化(hua)做(zuo)(zuo)成主(zhu)图、详情(qing)页海报,以及iCLIP视频工(gong)(gong)具(ju),可以自动(dong)(dong)化(hua)做(zuo)(zuo)好(hao)视频。

我们把文本、图像、视频(pin)从拍摄、排版(ban)到短视频(pin)一(yi)站式做好。基本上商(shang)家所需(xu)要的(de)电商(shang)内容,都可以通过AI的(de)方式来做。
一、电商对内容的诉求攀升,内容决定商品卖得好不好
我(wo)们(men)发现(xian)的行业趋势(shi)是整(zheng)个电商对内(nei)容的诉求一直(zhi)在(zai)上(shang)升(sheng)。
一方面,电商变得越来越碎片化。之前淘(tao)宝一家独大,大家只要(yao)把淘(tao)宝图片做好就行,随着抖(dou)音、快手、微(wei)盟、拼多(duo)多(duo)、得物、小红书诞生,商家需要(yao)做各种平(ping)台适合的内容。
另一方面,之前大家只需要做图,现在也需要做视频、直播,做更多的内容,商家的人力成本上升了,同时平台数量也上升了(le)。而每个(ge)(ge)平台对(dui)于内(nei)容的喜好(hao)不一样,比如这(zhei)(zhei)个(ge)(ge)平台主打(da)降价(jia)促销,这(zhei)(zhei)个(ge)(ge)平台主打(da)新品,这(zhei)(zhei)个(ge)(ge)平台主打(da)次(ci)日(ri)达,要做(zuo)出(chu)适合各个(ge)(ge)平台不同的内(nei)容。
我们能帮助商家用AI来自动做多个版本的内容,覆盖这些(xie)平台和消费(fei)者。

对于(yu)平(ping)台(tai)、商(shang)(shang)家和消费(fei)者来说,内(nei)(nei)容(rong)(rong)(rong)是非(fei)常重(zhong)要的枢纽。平(ping)台(tai)希望(wang)通过(guo)内(nei)(nei)容(rong)(rong)(rong)把消费(fei)者留下,拉更(geng)(geng)多停留的时(shi)长,促更(geng)(geng)多的GMV;商(shang)(shang)家希望(wang)通过(guo)内(nei)(nei)容(rong)(rong)(rong)把自己(ji)的商(shang)(shang)品(pin)卖(mai)出(chu)去;消费(fei)者希望(wang)通过(guo)内(nei)(nei)容(rong)(rong)(rong)了解商(shang)(shang)品(pin)。很多消费(fei)者在(zai)线(xian)下购物,对于(yu)商(shang)(shang)品(pin)的感知可(ke)能是触(chu)摸一下、试穿一下,但在(zai)线(xian)上(shang)所有的理解都基于(yu)内(nei)(nei)容(rong)(rong)(rong)。
我们有一个观点,就是商品卖得好不好,极大程度上取决于内容,只有退不退取决于商品。因为(wei)商品到消费者手里之前,所有的理解(jie)(jie)都是基于内(nei)容,包括主(zhu)播的讲解(jie)(jie)、图(tu)片和(he)视频,内(nei)容会(hui)极(ji)大程度上影响成交。
目前我们通过(guo)一(yi)系列SaaS工具帮(bang)助商(shang)家做好内容,在上层通过(guo)工具来引导(dao)和实现更多(duo)的成交。
二、电商要求百分之百的可控性,AI工具能带来上万倍ROI投入产出比
我们(men)定义(yi)一个(ge)产品诞生之(zhi)后,基本(ben)会经历这些流(liu)程(cheng):
第一,拍摄。帮商家(jia)合(he)成图(tu)(tu)片,包(bao)括模特(te)图(tu)(tu)、场景图(tu)(tu)、外拍图(tu)(tu)。
第二,排版布局。把商品图(tu)变(bian)成精美的(de)页面,大家日常去看主图(tu)详情页,可能看到这些海(hai)报的(de)复(fu)杂程度非常高。
第三,短视频。短视频(pin)的(de)制作方式(shi)前(qian)面有人提(ti)到(dao)Sora、Pika、Runway,但在电商里面这些工具很难直接来使用,因为电商要求百(bai)分(fen)之百(bai)的(de)可控性。
如果通过(guo)Prompt指令做了这(zhei)个衣服,有任(ren)何细(xi)节变(bian)化(hua)(hua)(hua)跟(gen)(gen)商品不(bu)一致,在电商里面都(dou)(dou)叫货不(bu)对版、虚假宣传,电商要求百分之百可控(kong)以及(ji)可控(kong)基础上的(de)多样。目前来说不(bu)管图(tu)生视(shi)频还是文生视(shi)频,都(dou)(dou)很难解决这(zhei)个问题。我们做的(de)方式更多是基于图(tu)片或(huo)基于视(shi)频,做自动化(hua)(hua)(hua)剪辑、混剪或(huo)美(mei)化(hua)(hua)(hua)包装,跟(gen)(gen)Sora、Pika和Runway有些区别。
再到后面的运营、种草,我(wo)们(men)也会(hui)通过AI做更(geng)多(duo)的内容。

我们的工具和方法论在电商里面得到很好的验证,比如成本能达到商家原来成本的1/4到1/5。之前商家需要雇很多人,像编辑、美工、运营、文案、剪辑师,一年的成本大概要二三十万,但我们基本上能做到原来成本的20%左右,可能只要三四万,比雇(gu)一个人的成(cheng)本要低很(hen)多就(jiu)能解决这个问题(ti)。
其次,因为我们积累了大量的数据,我(wo)们(men)知(zhi)(zhi)道(dao)这个平台或者(zhe)这个时代用什么样的(de)背(bei)景音乐(le)、特效(xiao)字(zi)幕、水印、LOGO做视频更(geng)(geng)好,也(ye)知(zhi)(zhi)道(dao)不同(tong)的(de)商品如何做包(bao)装更(geng)(geng)好,我(wo)们(men)做出来的(de)图(tu)片(pian)、视频点(dian)击率可能比单人做得更(geng)(geng)好。
通过之(zhi)前的验证(zheng),我们做的单条视(shi)(shi)频(pin)帮助杭(hang)州一(yi)个(ge)女装(zhuang)品(pin)牌(pai),用(yong)1条视(shi)(shi)频(pin)1个(ge)月卖(mai)了100多万,整体1个(ge)月多卖(mai)了两三(san)千万。它只要付给我们一(yi)年(nian)几(ji)万的费用(yong),对于(yu)它们来说一(yi)年(nian)有几(ji)个(ge)亿(yi)的产出(chu),这个(ge)ROI投入产出(chu)比(bi)可(ke)能达到上(shang)万倍。
三、打造首个电商垂直大模型,提供图文、排版、直播多个工具
这是我们的底层模型,一部分是我们自研的基座模型,一部分是通用模型改的垂直电商大模型。

前面(mian)讲过由于(yu)电商的(de)(de)(de)(de)百分之百可控性要求(qiu),以(yi)及在(zai)可控基(ji)础上的(de)(de)(de)(de)多样(yang)性要求(qiu)。在(zai)基(ji)座模型(xing)层(ceng)面(mian),我们通(tong)过NLP或者计算机视(shi)(shi)觉(jue)识(shi)(shi)别(bie)的(de)(de)(de)(de)能力,理解(jie)识(shi)(shi)别(bie)这(zhei)是(shi)一个什(shen)么(me)样(yang)的(de)(de)(de)(de)图(tu)片,以(yi)及图(tu)片当中是(shi)什(shen)么(me)样(yang)的(de)(de)(de)(de)商品,或者这(zhei)是(shi)一个什(shen)么(me)样(yang)的(de)(de)(de)(de)视(shi)(shi)频,视(shi)(shi)频中是(shi)模特走秀、穿搭(da)还是(shi)街拍,这(zhei)个模特在(zai)闲聊还是(shi)讲什(shen)么(me)样(yang)的(de)(de)(de)(de)卖点。在(zai)基(ji)座模型(xing)的(de)(de)(de)(de)基(ji)础之上,我们通(tong)过大模型(xing)做可控的(de)(de)(de)(de)生成(cheng),比如识(shi)(shi)别(bie)到是(shi)碎花V领连衣(yi)裙,应该通(tong)过什(shen)么(me)方式来展现。
这是我们的几个产品基(ji)座(zuo)。

图文板块PhotoMagic,可以通(tong)过假模特(te)自动生成模特(te)图,把衣服(fu)穿到一个真(zhen)人身上。商(shang)家(jia)不需(xu)要请一个模特(te),不需(xu)要场景街拍,就可以实(shi)现一个模特(te)在巴黎香(xiang)榭丽(li)舍大(da)街或(huo)者塞纳河(he)畔的(de)样子,极(ji)大(da)地降低了拍摄成本。

这是我们的排版布局产品ECPro,大家打(da)开日常淘宝的主图详情页海报图,它(ta)可以通过识别(bie)图片生(sheng)(sheng)成(cheng)相应(ying)的标题、文案,生(sheng)(sheng)成(cheng)排版、作出裁剪,做(zuo)出精美(mei)的页面。

这是直播切片工具iCut,我们会通(tong)过识别(bie)能力(li),识别(bie)到在(zai)一(yi)个七(qi)到八小时的(de)直播当中,这(zhei)个主(zhu)播在(zai)哪一(yi)段核心卖点讲得比较(jiao)高,比如讲了(le)(le)商品细(xi)节,讲了(le)(le)面料(liao),讲了(le)(le)垂感、亲肤(fu)的(de)材(cai)质,在(zai)这(zhei)个地(di)方讲了(le)(le)食(shi)品的(de)安(an)全性等。
识别到(dao)这(zhei)个卖(mai)点更(geng)(geng)精准或者卖(mai)点密度(du)更(geng)(geng)高的片段之后,我们把卖(mai)点摘取出来,放(fang)在混(hun)剪里,带(dai)货效果(guo)更(geng)(geng)好。如(ru)果(guo)这(zhei)个商家不做直播的话,我们也会通过图片的方(fang)式帮(bang)它合成视频。
四、立项AI MCN机构,拓展海外业务和更多品类
我们看到做出来的视频或者图片带货效果更好,因此在去年开始立项自己做了AI的MCN机构,它其实更像是一个Agent服务。
我们(men)(men)之前的(de)(de)所有(you)工具服务更像Copilot,商(shang)家使用我们(men)(men)的(de)(de)工具,一起(qi)来创作内(nei)(nei)容,我们(men)(men)通过内(nei)(nei)容的(de)(de)方式跟商(shang)家收SaaS订(ding)阅服务。MCN业务更像Agent服务,商(shang)家直接用我们(men)(men)的(de)(de)MCN,通过我们(men)(men)做出来的(de)(de)内(nei)(nei)容直接做带货成(cheng)交,我们(men)(men)从额外(wai)的(de)(de)成(cheng)交当中赚CPS(按(an)销售成(cheng)功(gong)订(ding)单付费)。
比如我(wo)们(men)帮(bang)助(zhu)商(shang)家一个(ge)月多卖(mai)了一千万(wan),我(wo)们(men)拿10%,100万(wan)左右(you)的(de)佣金(jin)。通过(guo)这(zhei)样的(de)方式也(ye)能(neng)证明我(wo)们(men)的(de)内(nei)容(rong)有(you)价值(zhi),收(shou)集(ji)更(geng)多的(de)数据,让(rang)我(wo)们(men)知道什么样的(de)内(nei)容(rong)有(you)更(geng)好的(de)变现方式,有(you)更(geng)好的(de)商(shang)品展示能(neng)力。
最后总结一下我们的优势。我们相当于有自己的行业Know-how,知(zhi)道电商品类(lei)需要(yao)什(shen)么内容(rong),我们非常专注在电商内容(rong),但是有几个拓展方向(xiang)。
第一是拓展海外。之前我们主要(yao)做(zuo)国内(nei)商家,今年做(zuo)了跨境服务(wu),把(ba)国内(nei)的视频自(zi)动化翻(fan)译(yi)到海外(wai)。比如人脸翻(fan)译(yi),将(jiang)中国模特(te)翻(fan)译(yi)到海外(wai)变(bian)(bian)成欧美、日(ri)韩或者其他模特(te);字幕、音频翻(fan)译(yi),字幕变(bian)(bian)成英文(wen)(wen),音频变(bian)(bian)成英文(wen)(wen)。
其次,拓更多的品类、区域和更多的变现方式,比如从传统(tong)的工具(ju)再到MCN业务(wu),提(ti)供全链(lian)路、全流程、全类(lei)型的服务(wu)。

我们还有一个优势是能帮商家算清楚账。所(suo)有客(ke)户的(de)(de)价值排序都是开(kai)源节流、管(guan)理(li)发展,首先是你能不能帮我(wo)(wo)多赚钱(qian)、省(sheng)钱(qian),再下面才是管(guan)理(li)和发展的(de)(de)需求(qiu)。我(wo)(wo)们(men)可以算出(chu)来商家(jia)一个月通过我(wo)(wo)们(men)的(de)(de)服务能多赚多少(shao)钱(qian),视频帮他们(men)多卖(mai)多少(shao)钱(qian),以及省(sheng)掉多少(shao)人工成(cheng)本。这也是我(wo)(wo)们(men)选择电商的(de)(de)理(li)由,需求(qiu)很大,并且(qie)内容的(de)(de)价值可量化(hua)。
我们(men)在(zai)(zai)全国各(ge)地(di)都有分(fen)布,尤(you)其在(zai)(zai)电(dian)商(shang)聚集带(dai),像杭州、上(shang)海、广州、深圳、厦门,今年(nian)(nian)可(ke)能会扩展一些海外业务(wu)。我也从去(qu)年(nian)(nian)开始(shi)做创始(shi)人IP,定期分(fen)享(xiang)一些AI和(he)电(dian)商(shang)的(de)干货,大家如(ru)果对(dui)我们(men)的(de)业务(wu)感兴趣,或者(zhe)对(dui)电(dian)商(shang)和(he)AI感兴趣,都可(ke)以来关注我们(men)。
以上是武彬演讲内容的完整整理。