智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影

智东西5月6日报道,今(jin)天(tian)下午,讯(xun)飞星火认知(zhi)大模型(xing)发布(bu),以及大模型(xing)在教(jiao)育、办公、汽(qi)车、数字员(yuan)工行业领域的(de)应用(yong)成果同步亮相。

同时,科大讯飞还提出了通用人工智能(AGI)在7大维度481项的评测体系,这七大维度包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。经科大讯飞评测对比,星火认知大模型已经在文本生成、语言理解、数学能力上(shang)优于ChatGPT。

讯飞星火大模型采用了“1+N”的(de)整(zheng)体布(bu)局,其中“1”是通用认知智(zhi)能(neng)大(da)模(mo)型,包(bao)含7大(da)维度的(de)能(neng)力,“N”是大(da)模(mo)型在教育(yu)、办公、汽车(che)、数字(zi)员工(gong)等(deng)多个行业领域的(de)应(ying)用。

科大讯飞董事长刘庆峰还透露了星火认知大模型在2023年的关键里程碑,6月9日,星火认知大模型将突破开放式问答,实现多轮对话能力再升级、数学能力再升级;8月15日,突破代码能力、实现多模态交互再升级;10月24日,通用(yong)大(da)模(mo)型要对(dui)标ChatGPT能(neng)力,实现中文能(neng)力超越(yue)、英(ying)文能(neng)力相当(dang)的目标。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

▲科大讯飞董事长刘庆峰

刘庆峰(feng)认(ren)为,当下认(ren)知大(da)模(mo)型已(yi)经(jing)成为通用人工智能的(de)(de)曙光,这一技(ji)术的(de)(de)出现产生(sheng)的(de)(de)影响不亚于(yu)PC或互联网(wang)的(de)(de)诞生(sheng)。

一、七大通用能力现场演示,语音输入、实时互动

刘庆峰谈(tan)道,从(cong)ChatGPT关(guan)注的(de)48个主要任务方向和讯(xun)飞开(kai)放平台上400多(duo)万开(kai)发者团队的(de)需求分析,通用人工智能(neng)应该具备七大维度能(neng)力,分别是(shi)文本生成、语(yu)言理解、知识(shi)问(wen)答、逻辑(ji)推理、数学能(neng)力、代码能(neng)力、多(duo)模态能(neng)力等。

因此(ci),现场(chang)星火认知(zhi)大模型(xing)基于这七大维(wei)度进行了演(yan)示,并(bing)且(qie)现场(chang)输入完全通过语音(yin)转写文字键(jian)入需求,无需打字输入。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

一开始,星(xing)火认(ren)知大(da)模型就展示了(le)自己名字的由来(lai)。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

1、多风格多任务长文本生成

首(shou)先,星(xing)火认知大(da)模型(xing)为这场发布会生成了一篇欢迎词(ci)(ci),“今天是讯飞星(xing)火认知大(da)模型(xing)的(de)发布会,现场高朋满座,我们(men)也特别希望(wang)和各(ge)位朋友们(men)精诚合(he)作,共同(tong)建设(she)美好世(shi)界。请(qing)帮(bang)我写一篇欢迎词(ci)(ci)”。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

在(zai)故(gu)事生成能力上,星(xing)火(huo)认(ren)知大(da)模(mo)型(xing)(xing)也毫(hao)不(bu)逊色,“在(zai)今(jin)天的(de)(de)讯飞星(xing)火(huo)认(ren)知大(da)模(mo)型(xing)(xing)的(de)(de)发布会上,孙悟空和(he)奥(ao)特曼也偷偷潜入了现场(chang),他们(men)都抢着(zhe)想做星(xing)火(huo)大(da)模(mo)型(xing)(xing)的(de)(de)发言人,还(hai)为(wei)此吵(chao)了一架,根据上述信(xin)息来创作(zuo)一个故(gu)事”。

星火认知大模型不(bu)仅将孙悟(wu)空和奥特(te)曼(man)的(de)相关(guan)情(qing)节(jie)描述得十分生(sheng)动,还在(zai)故事(shi)中(zhong)引入了另一(yi)个主要人物(wu)“一(yi)位白发苍苍的(de)老者”来保证故事(shi)情(qing)节(jie)的(de)完整(zheng)性(xing)。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

星火还能帮(bang)助(zhu)用户起草工(gong)作邮件,如“帮(bang)我写一(yi)封(feng)内部工(gong)作邮件发给讯(xun)飞(fei)翻译机(ji)团队,针对五一(yi)的销售(shou)计(ji)划(hua),明(ming)天上午9点在(zai)201会(hui)议(yi)室讨(tao)论讯(xun)飞(fei)翻译机(ji)4.0新品的营销计(ji)划(hua)和产品功(gong)能”。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

此(ci)外,在多(duo)语言生(sheng)成(cheng)中,星(xing)火还可以快速生(sheng)成(cheng)“英(ying)文的讯飞翻(fan)译机4.0新品品宣文案”。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

有(you)趣的是,当你将文案发布情境(jing)设定到小红书时(shi),星火也可以(yi)快速(su)转换语言风格重新生成(cheng)文本。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

刘庆峰说,经过评测,讯飞星火认知大模型的中文语言理解能力已经超过ChatGPT,在英文理解能力上,ChatGPT的能力达到4.48分,星火认知大模型为4.29分

2、多层次跨语种语言理解

针对英文(wen)文(wen)案,星火还可以快速对其(qi)进行语(yu)法(fa)(fa)检(jian)查和(he)纠(jiu)错。刘庆峰透露(lu),对于英文(wen)语(yu)法(fa)(fa)、句式的纠(jiu)错能力,星火认知大模型已(yi)经(jing)做到(dao)业界最强。

当面对一些模(mo)棱两可的(de)话语需要大模(mo)型(xing)更高层次的(de)理解(jie)能(neng)力时,星火认(ren)知大模(mo)型(xing)也可以准确(que)剖析(xi)其(qi)不(bu)同(tong)含义。如(ru)“俗话说(shuo)男子(zi)汉(han)大丈夫(fu)要宁死不(bu)屈(qu),俗话又说(shuo),男子(zi)汉(han)大丈夫(fu)能(neng)屈(qu)能(neng)伸,这两种说(shuo)法应(ying)该怎么(me)理解(jie)”。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

放到(dao)具(ju)体情境(jing)中(zhong),“如果有个小伙子和女朋友吵架(jia)了,他(ta)应该宁死不(bu)屈还是(shi)能(neng)屈能(neng)伸”,星火也(ye)可以准确回(hui)复。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

对(dui)于一(yi)(yi)些(xie)文字表意(yi)一(yi)(yi)样(yang),但含(han)义不同的(de)词语,如“今天(tian)小(xiao)明参加比(bi)赛拿(na)到冠军,他拿(na)着奖杯默默地站了(le)(le)一(yi)(yi)分钟,今天(tian)我被(bei)老师批评(ping)了(le)(le),走(zou)出教室后(hou)我默默地站了(le)(le)一(yi)(yi)分钟,请(qing)问上面这两(liang)个(ge)‘默默地站了(le)(le)一(yi)(yi)分钟’,分别表达(da)了(le)(le)什么样(yang)的(de)心情(qing)?”

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

星(xing)火还可以使用上(shang)面“默(mo)默(mo)地站了(le)一分钟”组词,并且(qie)能根据(ju)具体需求生成相应句子(zi)(zi)。重新生成后,星(xing)火也(ye)会输出完全(quan)不同(tong)的几个句子(zi)(zi)。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

可(ke)以看(kan)出,星火是确实(shi)理解了(le)文字背后的含义再进(jin)行(xing)文本(ben)输出。

对(dui)于(yu)语(yu)言理(li)解能力,刘庆峰透(tou)露(lu), 和国内可测的现有(you)系(xi)统相比,星火(huo)认(ren)知大模型明显遥遥领先,与ChatGPT有(you)细微差距。

3、泛领域开放式知识问答

饮食(shi)类问题中,当询(xun)问“菠菜和豆腐能(neng)不能(neng)一起吃(chi)”,星火给(ji)出了专业的答案。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

在科技领(ling)域,星火也能(neng)应(ying)对“量(liang)子(zi)科技主要有哪些(xie)应(ying)用领(ling)域?”的问题。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

当将两个不(bu)同的概念放到一起,如(ru)“量子纠(jiu)缠和心灵感应是不(bu)是一回事”,星火也没(mei)有(you)被绕晕。刘庆峰透露,在中国科学院的支(zhi)持下,星火仍在持续(xu)学习科技(ji)领域(yu)的知识。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

对于专(zhuan)业性更强的医疗领域,当(dang)问(wen)及“如果(guo)家中老(lao)人突(tu)然(ran)晕倒,如何(he)判(pan)断(duan)是不是中风?”,星火(huo)给出(chu)了四(si)个判(pan)断(duan)的维度。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

当追(zhui)问“能(neng)(neng)不能(neng)(neng)马上把(ba)他扶到床上去休息(xi)”,星(xing)火(huo)也提出了专业的(de)建议。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

刘庆峰谈道,目前在医(yi)疗治理方面(mian),科(ke)大讯(xun)飞智医(yi)助理的(de)能(neng)(neng)力(li)比GPT-4要强很多,但(dan)由于医(yi)疗领(ling)域对(dui)专业性的(de)更高要求(qiu),这一方面(mian)能(neng)(neng)力(li)的(de)开(kai)放需要更加谨慎(shen),将(jiang)于今年讯(xun)飞1024开(kai)发(fa)者节期间正式发(fa)布。讯(xun)飞的(de)目标是让星火大模型(xing)不仅要成为(wei)医(yi)生的(de)诊疗助手,还(hai)能(neng)(neng)成为(wei)每个人的(de)健康助手。

4、情境式思维链逻辑推理

当提问“孔(kong)子(zi)在2008年(nian)的奥(ao)运会上说了什么?”,星火可以(yi)快速(su)理(li)解“孔(kong)子(zi)不可能出现在2008年(nian)的奥(ao)运会上”。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

换一个风格后,星(xing)火还能编出“孔子在2008年奥运会上(shang)给(ji)大家做(zuo)汉(han)语(yu)培训”的故事。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

面对更复(fu)杂的(de)逻辑问题,“当(dang)黄兔、黑兔、白(bai)兔在赛跑,黑兔说(shuo)自己(ji)跑的(de)不(bu)是最(zui)(zui)快,但比白(bai)兔快,谁跑的(de)最(zui)(zui)快,谁跑的(de)最(zui)(zui)慢”,涉及(ji)三个主体的(de)推理(li)问题时,星火(huo)第一次生成的(de)答案(an)在“谁跑的(de)最(zui)(zui)快”上出现了偏(pian)差。重新生成后,星火(huo)也快速(su)给(ji)出了正确答案(an)。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

5、多题型可解析数学能力

在(zai)一些容易混淆的数字问题(ti)上,如“某个公司的股票昨天涨(zhang)了10%,今天又跌了10%,请问到底是涨(zhang)了还是跌了”,星火也没有被难倒(dao)。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

几何问题(ti)中,但问到(dao)“等腰三角形的(de)底角是顶角的(de)两倍,这一三角形的(de)角度(du)是多少”,星火给出了下面(mian)的(de)答(da)案:

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

6、多功能多语言代码能力

目前星(xing)火(huo)的代码生(sheng)成能力(li)是针(zhen)对工(gong)业互(hu)联网、企(qi)业内(nei)部的应(ying)用。

当(dang)问到“用(yong)代码(ma)找出1到100之内的所(suo)有质数”,星火输出了Python代码(ma)实现过程和(he)最(zui)终结果。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

7、多模态输入和表达能力不断丰富

在多模态(tai)能力上,星(xing)火可以(yi)把(ba)图片中(zhong)的英文翻(fan)译(yi)成中(zhong)文。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

并(bing)且,星(xing)火(huo)还可(ke)(ke)以(yi)化(hua)身一个美食助(zhu)手,可(ke)(ke)以(yi)回答每道菜是(shi)什么(me)口味等(deng)问题。大模型(xing)的加持下,星(xing)火(huo)可(ke)(ke)以(yi)从简单(dan)的文字到文字翻译变为(wei)文字到导游角色的升级。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

文字输(shu)出方(fang)面,星火(huo)以立夏(xia)为主题,生(sheng)成(cheng)了一篇200字左右的散文。同时,星火(huo)还支(zhi)持用语音、虚拟(ni)人合(he)成(cheng)输(shu)出音频(pin)和视频(pin)。在视频(pin)中,不仅有女生(sheng)的虚拟(ni)人形象,还有相对(dui)应的背景画面、虚拟(ni)人手势随着文字内容变化。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

刘庆峰(feng)透露,多模态输入和表达目前还(hai)没(mei)有(you)开(kai)放,这(zhei)一能力将在8月份开(kai)放给VIP客户(hu)使用。

演示现场还有现场随机抽取问题回答环节,针对于一些奇奇怪怪的问题,星火认知大模型也没有被难到。包括外星人(ren)感冒了需(xu)要戴口罩吗(ma)?我想(xiang)把(ba)四十平的房子装(zhuang)修成七十平的感觉等。

在(zai)(zai)输出的答(da)案(an)中,星火(huo)大模型(xing)会对问题(ti)场景进行一些限(xian)制,考(kao)虑到(dao)多个(ge)场景来使得回答(da)更为准确。刘庆(qing)峰说,星火(huo)大模型(xing)在(zai)(zai)不断的进步(bu)过程中,很多答(da)案(an)也(ye)会超出他们(men)的预期(qi)。

二、落地四大应用领域,星星之火“燎原”教育、办公、汽车、数字员工

除了(le)强大的通用(yong)(yong)能力外,星(xing)火(huo)认知大模型也已经在实实在在的产(chan)业场景(jing)中实现(xian)了(le)应用(yong)(yong)落地,包括教育、办公、汽车和数字(zi)员工(gong)四(si)大领(ling)域。

1、教育:批改中英文作文能力升级,形成批改、修订、学习闭环

讯飞AI学(xue)(xue)习机已经可(ke)以(yi)精准分析每个学(xue)(xue)生的(de)薄弱环节,并(bing)在(zai)五万多所中小(xiao)学(xue)(xue)校(xiao)实现应用。此次,星火大(da)模型也(ye)再(zai)次将学(xue)(xue)习机的(de)语言学(xue)(xue)习能力(li)升级。

此前,老(lao)师对一个学(xue)生的(de)作文(wen)进行精批(pi)大(da)(da)概要(yao)花费(fei)半个小时时间,批(pi)改(gai)完一个班的(de)学(xue)生会(hui)付出大(da)(da)量的(de)时间成本(ben)。

在演示中,星火认知大模型针对小(xiao)学四(si)年(nian)级上册第八(ba)单元的作(zuo)文“我(wo)的心儿怦怦跳”的写作(zuo)要(yao)素(su)和(he)写作(zuo)要(yao)求进行批改。

学习机批改的过程包括错别字、语句、内容,最后会生成批改评价以及写作建议,并且用户点(dian)击错别字还能看(kan)到相应(ying)的(de)知识卡片。

批改修订建议还会用不(bu)同颜(yan)色区分,红色代(dai)表不(bu)符合(he)某一条写(xie)作要求,绿色代(dai)表符合(he)写(xie)作要求,此外,学习机还给出了优化参(can)考内容。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

在英文作文批改方面,学习机会批改单词拼写、词汇用法(fa)、句型结构(gou),最后(hou)同样会(hui)给出内容(rong)评价。

并且,学习机在作文有错误的(de)地(di)方会给(ji)出相对应(ying)的(de)学习资(zi)料,完成(cheng)基础批(pi)改、高级(ji)批(pi)改、提示建议(yi)、优化参(can)考的(de)闭环(huan)过(guo)程。

刘(liu)庆(qing)峰谈道:“这在业(ye)界是0到1的(de)突破(po)。”搭(da)载(zai)大模型的(de)讯飞AI学(xue)习机在批改、修订等的(de)准确率上已经超过了一般老师的(de)平均水平。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

口语和听说能力上,讯飞AI学习机可以在家庭里为用户营造一个真实的对话环境,例如(ru)针对“最爱的季节”这一(yi)开放式(shi)问答,讯(xun)飞学习机能够和(he)用户实现类人对话。

并且英文口语对话中(zhong),如果用(yong)户(hu)有(you)不(bu)会说的单词,可以用(yong)中(zhong)文表(biao)述,星火认知(zhi)大模(mo)型(xing)也能理解。

刘庆峰(feng)称(cheng),这一功(gong)能今天已经在讯(xun)(xun)飞AI学习机(ji)上T20 Pro开放,此(ci)前已购买该设备的(de)(de)用(yong)户可(ke)以在线下载更新(xin)获得功(gong)能。讯(xun)(xun)飞AI学习机(ji)上T20 Pro也(ye)是全(quan)球首(shou)款搭(da)载大模(mo)型的(de)(de)AI学习机(ji)。

2、办公:快速生成纪要、摘要,音频能一键转化新闻稿件

讯飞(fei)(fei)此次通过星火大模(mo)型对(dui)办(ban)公(gong)产(chan)品(pin)进(jin)行了升(sheng)级,包括讯飞(fei)(fei)智能(neng)办(ban)公(gong)本、录音笔(bi)、讯飞(fei)(fei)听见、智能(neng)麦克风(feng)。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

现场刘庆峰(feng)讲述(shu)了会(hui)议场景下,用户往往有记不全、找(zhao)不到、对数据安全性担(dan)忧几大(da)痛点。智能办公(gong)本可以通过语音转文字、字音同步、离线(xian)模(mo)式录(lu)音转写的方式解(jie)决上述(shu)痛点。

搭载大模型的智能办公本针对上述内容快速生成了会议纪要,不仅包含(han)文本摘要,还结合了(le)用户的(de)手写笔记。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

在一些演(yan)讲场景(jing)下,演(yan)讲嘉宾的口语(yu)表(biao)达会和书(shu)面成稿内容有较大差(cha)距,智能(neng)办公本可以将重复的语(yu)气词去(qu)掉(diao)并保留演(yan)讲中的关键信(xin)息,同时(shi)调(diao)整口语(yu)语(yu)序,使其(qi)读起来更加通(tong)顺(shun)。

刘庆峰介绍道,语篇规整能力可(ke)以实现原(yuan)文(wen)忠实度保留96%以上,原(yuan)文(wen)篇幅(fu)缩(suo)小40%-60%,阅读效率提(ti)升(sheng)50%以上。

讯(xun)飞(fei)智能(neng)办公本(ben)X2也(ye)是业界首个搭载大模型的(de)智能(neng)办公硬件,同样(yang),用户(hu)可(ke)以免费下载更新相(xiang)关功能(neng)。他补充说,后续讯(xun)飞(fei)也(ye)会将(jiang)大模型搭载到(dao)办公的(de)全(quan)系列产品(pin)上。

同时,讯飞听见还支持一键成稿,用户导入(ru)音频(pin)后,就(jiu)可以立即生成新闻稿件、品宣文案、工(gong)作总结(jie)、工(gong)作计划、工(gong)作待办等(deng)。

演示中,星火接收到一段音(yin)频(pin)文件后(hou),先进行了音(yin)频(pin)转写,再(zai)根据用户需(xu)求生成(cheng)(cheng)相应的文稿。同时,当(dang)用户输入了想要(yao)在这篇“新闻稿件”中涉(she)及的关键信息后(hou),智能办(ban)公(gong)本会将标题、内容(rong)重新生成(cheng)(cheng),并重点突出描(miao)述这一关键信息。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

刘(liu)庆峰(feng)说,现(xian)在登陆讯飞(fei)(fei)听见的官网可以马上运用这些功(gong)能(neng)。除此以外,讯飞(fei)(fei)智(zhi)能(neng)录音笔SR702和讯飞(fei)(fei)智(zhi)能(neng)麦克(ke)风M2也升级了会(hui)议纪要、语篇调(diao)整、一键成(cheng)稿功(gong)能(neng)。

3、汽车:人车对话更加智能,汽车上也能订餐、购票

科大讯飞(fei)汽(qi)车(che)座(zuo)舱人机交互系统(tong)可(ke)以提(ti)供多(duo)(duo)轮、多(duo)(duo)人、多(duo)(duo)区域(yu)、多(duo)(duo)模(mo)态的智能(neng)汽(qi)车(che)人机交互范式,在星(xing)火(huo)大模(mo)型的加(jia)持下,这一(yi)交互模(mo)式可(ke)以让用户(hu)在车(che)上的对话更加(jia)自由、更人性化、更懂汽(qi)车(che)、更加(jia)开放。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

同时(shi),星(xing)火大(da)模(mo)型还支持各种插(cha)件在汽车(che)场(chang)景(jing)下与之行结合,如汽车(che)的导航(hang)、餐(can)饮、购票等功(gong)能都可(ke)以用(yong)星(xing)火大(da)模(mo)型实(shi)现。

在演(yan)示视频中,用户可(ke)以和汽(qi)车(che)上的人机交互系统对话,询问旅(lv)游计划、避开节假日(ri)人流密集的旅(lv)游路线、生成故(gu)事、接听电话等。

刘(liu)庆峰(feng)说,这样一来(lai),汽车(che)上(shang)的(de)体(ti)验和原来(lai)会完全不同,人们(men)在汽车(che)里生活、工作(zuo)的(de)效率也会上(shang)一个台阶。

4、数字员工:生成式自动RPA,自然语言自动生成业务流程

此前,科(ke)大讯飞虚拟(ni)(ni)人智能交(jiao)互机可(ke)以通(tong)过(guo)虚拟(ni)(ni)形(xing)象,以对话的(de)形(xing)式扮演导游、虚拟(ni)(ni)客(ke)服、医院导诊、志愿者服务等角色,这(zhei)些更人性化的(de)交(jiao)互机也大幅提高了各行业的(de)工作效率。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

在演示过(guo)程中(zhong),基(ji)于星(xing)火(huo)认知(zhi)大(da)(da)模型的(de)(de)生成式RPA能够让工(gong)作人员(yuan)通过(guo)自(zi)(zi)(zi)然语(yu)言(yan)输入(ru),大(da)(da)模型去理解员(yuan)工(gong)通过(guo)自(zi)(zi)(zi)然语(yu)言(yan)描述的(de)(de)需求,自(zi)(zi)(zi)动生成业务流(liu)程和(he)可执行的(de)(de)RPA能力(li)清单,并(bing)调度RPA的(de)(de)执行能力(li)实现流(liu)程自(zi)(zi)(zi)动化的(de)(de)运(yun)行。

这(zhei)一能(neng)力在(zai)(zai)人力资源(yuan)领域(yu)的应用也(ye)已经在(zai)(zai)讯(xun)飞内部实现场景落地。

刘庆峰透露,下一(yi)步(bu),讯飞星火认知大(da)模型还会(hui)赋能城市、工业等各个(ge)行业。

三、应用落地引领者,用评测体系指明大模型发展前路

作为国内人工(gong)智能领(ling)域国家队(dui),科大讯(xun)飞早在2011年(nian)就肩负(fu)起语(yu)音(yin)及(ji)语(yu)言处理国家工(gong)程实(shi)验室的(de)重任。

2014年,科(ke)大讯(xun)飞推出“讯(xun)飞超脑(nao)计划”,明确提出要(yao)让(rang)(rang)机器像人一(yi)样具备能(neng)理解会(hui)思考的能(neng)力(li),2022年,这(zhei)一(yi)计划升级为“讯(xun)飞超脑(nao)2030计划”,提出让(rang)(rang)懂(dong)知识、善(shan)学习、能(neng)进化的通用人工(gong)智能(neng)技术成为每个人未来发展的重要(yao)机会(hui),让(rang)(rang)机器人走进家庭。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

星火认知智(zhi)能大模型也是(shi)这一计划的重要一环(huan)。刘(liu)庆峰谈道(dao),在科学常(chang)识推理能力中,单模型已经超(chao)过了人类平均水(shui)平。

事(shi)实上,去年11月(yue)(yue)30日(ri)(ri)ChatGPT发(fa)布(bu)会,科大(da)讯飞就迅速进行了相关技术和研(yan)发(fa)体系验证,12月(yue)(yue)15日(ri)(ri)启动了认(ren)知(zhi)智能大(da)模型(xing)的(de)“1+N”专项攻关。

他认为,想要让这一次智慧涌现的认知智能真的解决社会刚需,要建立一套实实在在的科学系统的评测体系,来告诉这个行业“技术发展到了什么程度、下一个发展趋势应该往哪边走?”

因此,科(ke)大(da)讯飞(fei)与中科(ke)院人(ren)工智能产(chan)学(xue)(xue)研创新(xin)联(lian)盟(meng)和(he)长(zhang)三角人(ren)工智能产(chan)业链联(lian)盟(meng)共同探讨形(xing)成了覆盖7大(da)类(lei)481个细(xi)分任务类(lei)型(xing)的(de)科(ke)学(xue)(xue)系(xi)统评测(ce)体(ti)系(xi)。

讯飞版大模型来了!首发通用人工智能评测体系,三大能力不输ChatGPT

当(dang)下,刘庆峰也谈道(dao),纯(chun)大模型技(ji)(ji)术有(you)很多待(dai)攻克(ke)的(de)技(ji)(ji)术缺陷(xian),如对新知(zhi)识难以及时更新、事(shi)实类问题容易发生张冠李戴的(de)现(xian)象(xiang)等。

但对于这些,讯飞都有非常明确的解决方(fang)案。他透露(lu)在科大讯飞成立24周年之际,星火(huo)大模型要突破开放式问答(da),类搜索插(cha)件可以全部知(zhi)道新知(zhi)识,通过多轮对话进行升级,数(shu)学能力再上一个新的台阶。

这(zhei)都(dou)得(de)益于科大(da)讯(xun)飞(fei)此前在(zai)人(ren)工智能领域的技术积累(lei),以及在(zai)认知智能领域取得(de)的领先成果。如2017年科大(da)讯(xun)飞(fei)让机器在(zai)全球首次(ci)通过(guo)国家职(zhi)业医师(shi)资格考试(shi)、超(chao)过(guo)了96.3%参(can)加考试(shi)的医生,并且在(zai)SQuAD机器阅读理(li)解(jie)中全球首次(ci)超(chao)过(guo)人(ren)类平(ping)均水(shui)(shui)平(ping),2022年在(zai)OpenBookQA科学知识推理(li)中,单模型也超(chao)过(guo)人(ren)类平(ping)均水(shui)(shui)平(ping)。

作为将(jiang)大(da)模(mo)型(xing)(xing)率先(xian)应用落地的玩家(jia),科大(da)讯飞还(hai)通过讯飞开放平(ping)台开放了560项(xiang)AI能(neng)力(li),并且有首(shou)批来自36个行业(ye)的3000余(yu)家(jia)企(qi)业(ye)开发者将(jiang)接入星(xing)火(huo)大(da)模(mo)型(xing)(xing)。基于此,科大(da)讯飞将(jiang)联合行业(ye)合作伙伴共建(jian)大(da)模(mo)型(xing)(xing)“星(xing)火(huo)”生态,让(rang)大(da)模(mo)型(xing)(xing)能(neng)真正落地到行业(ye)中去(qu)。

结语:讯飞打响大模型应用落地“第一枪”!

大模(mo)型的真正(zheng)价(jia)值(zhi)在于(yu)成为生产(chan)力工具,使得产(chan)业(ye)应用真正(zheng)与前沿技术(shu)相结合(he)。当下(xia),大模(mo)型也已经(jing)进入产(chan)业(ye)落地的关键(jian)期。

科大讯飞此前在认知智能领(ling)域的(de)技(ji)术(shu)积累(lei)优(you)势(shi),以(yi)及在教育、办(ban)公等场(chang)景下的(de)深(shen)耕(geng)使得其成为大模型应用落地的(de)率先(xian)突破者。

同时,AI新(xin)的技术革命已经(jing)到来,正在(zai)对各(ge)行各(ge)业产生深远影(ying)响,讯飞(fei)星火大模(mo)型的应(ying)用成果发布将(jiang)进一步助攻大模(mo)型AI技术在(zai)各(ge)行各(ge)业的规模(mo)化普及。