1、夸克App上(shang)线健康大模型应用

2、昆仑万维“天工SkyAgents”Beta版公测

3、智源开源代(dai)码生成训练数据集与评测(ce)基(ji)准TACO

4、首个汽车行业中文大模型测评基(ji)准发布

5、抖音回应内测“AI搜(sou)”功能

6、OpenAI CEO:2024年可能无法(fa)实现(xian)AGI

7、OpenAI拟(ni)进行新一轮融(rong)资 估值1000亿美(mei)元

8、苹(ping)果拟5000万美元购买(mai)新(xin)闻(wen)数(shu)据训(xun)练(lian)AI

9、郭明(ming)錤(qi):苹果春季发布可(ke)能没有(you)AI方面显(xian)著更(geng)新

10、Ai Pin将于(yu)明年(nian)3月开始出货

11、阿(a)里百(bai)度(du)腾讯(xun)360首批通(tong)过(guo)国家(jia)大(da)模型标准评(ping)测

12、中国信通院院长:AI发展将迎来关键窗口期

13、印度(du)正加强(qiang)AI在天(tian)气(qi)预报中的(de)应用

1、夸克App上线健康大模型应用

今(jin)日,夸(kua)克App宣布全面升级(ji)健(jian)(jian)康(kang)(kang)(kang)搜(sou)(sou)索,推出健(jian)(jian)康(kang)(kang)(kang)大模型应(ying)用(yong)(yong)“夸(kua)克健(jian)(jian)康(kang)(kang)(kang)助手(shou)”,并(bing)在(zai)部分搜(sou)(sou)索结(jie)果和(he)功能板块中上线全新(xin)的(de)内容(rong)交(jiao)互方式。升级(ji)后,用(yong)(yong)户在(zai)夸(kua)克中搜(sou)(sou)索健(jian)(jian)康(kang)(kang)(kang)信(xin)息(xi)的(de)正确(que)率超(chao)过(guo)行业(ye)(ye)平均水平。经过(guo)精调和(he)知识增强(qiang)的(de)夸(kua)克大模型,以486分的(de)高分通过(guo)临床执业(ye)(ye)医(yi)师资(zi)格考试(shi),同时在(zai)健(jian)(jian)康(kang)(kang)(kang)内容(rong)上的(de)幻觉率已经降(jiang)低至(zhi)5%以内。

针对AIGC等(deng)全(quan)新(xin)搜索内(nei)容(rong)(rong)形态,夸克(ke)成立了夸克(ke)健康(kang)专(zhuan)家(jia)团,与(yu)全(quan)国(guo)顶级(ji)公立三甲(jia)医(yi)(yi)院的(de)专(zhuan)家(jia)共(gong)建大模型内(nei)容(rong)(rong)生态,确(que)保内(nei)容(rong)(rong)层面的(de)专(zhuan)业性、正确(que)性和科学性。此外,夸克(ke)还会招募健康(kang)大模型精调师,持续地结(jie)合(he)用户需求(qiu)和热门病症,提供最新(xin)的(de)健康(kang)知识。目前,夸克(ke)已(yi)经与(yu)200多位权威医(yi)(yi)学专(zhuan)家(jia)、60多家(jia)全(quan)国(guo)知名公立三甲(jia)医(yi)(yi)院和40多家(jia)医(yi)(yi)学机构合(he)作。

2、昆仑万维“天工SkyAgents”Beta版公测

据(ju)昆(kun)(kun)仑万维集(ji)团微信公众(zhong)号发文(wen),今日,昆(kun)(kun)仑万维AI Agents开(kai)发平台“天(tian)(tian)工SkyAgents”Beta版(ban)正(zheng)式(shi)开(kai)放(fang)测试。据(ju)介绍,天(tian)(tian)工SkyAgents开(kai)发平台基于昆(kun)(kun)仑万维“天(tian)(tian)工大模型(xing)”打造,具备(bei)从感知到(dao)决(jue)策,从决(jue)策到(dao)执行(xing)的(de)自(zi)(zi)主学(xue)习和独(du)立思考能(neng)力。用户(hu)可以通过自(zi)(zi)然语言(yan)构建(jian)自(zi)(zi)己的(de)单(dan)个或多个“私(si)人助理”,并能(neng)将不同任(ren)务模块化,通过操作(zuo)系(xi)统模块的(de)方式(shi),实现执行(xing)包括(kuo)问题预设(she)、指定回(hui)复、知识(shi)库(ku)创建(jian)与(yu)检索(suo)、意(yi)图识(shi)别、文(wen)本提取、http请求等任(ren)务。

体验地址:

model-platform.tiangong.cn

3、智源开源代码生成训练数据集与评测基准TACO

据(ju)(ju)智(zhi)源(yuan)研究院微(wei)信公众号(hao)今日发(fa)文,智(zhi)源(yuan)开源(yuan)了(le)一个(ge)专注于算(suan)法(fa)的(de)(de)代(dai)码(ma)生(sheng)成(cheng)数据(ju)(ju)集TACO(Topics in Algorithmic COde generation dataset),旨在(zai)为(wei)代(dai)码(ma)生(sheng)成(cheng)模(mo)型(xing)领域(yu)提(ti)(ti)(ti)供一个(ge)更具挑战性的(de)(de)训(xun)(xun)练数据(ju)(ju)集与评(ping)测(ce)基准。该数据(ju)(ju)集包含(han)难度(du)更大、更接(jie)近(jin)真(zhen)实(shi)编(bian)程场景(jing)的(de)(de)编(bian)程竞赛题(ti)(ti)目(mu)(mu),强(qiang)调提(ti)(ti)(ti)升(sheng)或评(ping)测(ce)模(mo)型(xing)在(zai)实(shi)际应用(yong)场景(jing)中对问(wen)题(ti)(ti)的(de)(de)理解(jie)和(he)推理(Reasoning)能(neng)力(li),而(er)不仅(jin)仅(jin)是(shi)实(shi)现既定的(de)(de)函数功(gong)能(neng)。据(ju)(ju)悉,TACO包括(kuo)训(xun)(xun)练集(25443道(dao)题(ti)(ti)目(mu)(mu))和(he)测(ce)试(shi)集(1000道(dao)题(ti)(ti)目(mu)(mu)),每个(ge)题(ti)(ti)目(mu)(mu)都尽(jin)可能(neng)匹(pi)配多(duo)样化的(de)(de)解(jie)题(ti)(ti)答(da)案,答(da)案规模(mo)高达155万(wan)条,每个(ge)题(ti)(ti)目(mu)(mu)均包含(han)任务主题(ti)(ti)、算(suan)法(fa)、技(ji)能(neng)及难度(du)等细(xi)粒度(du)标签,为(wei)代(dai)码(ma)生(sheng)成(cheng)模(mo)型(xing)的(de)(de)训(xun)(xun)练与评(ping)测(ce)更精确的(de)(de)参考。经实(shi)验,当(dang)前流行的(de)(de)代(dai)码(ma)生(sheng)成(cheng)模(mo)型(xing)在(zai)TACO评(ping)测(ce)中与GPT-4存在(zai)显著差异,表明这一领域(yu)仍有巨大的(de)(de)提(ti)(ti)(ti)升(sheng)空间。

论文地址:

arxiv.org/abs/2312.14852

智源开放数据仓库:

data.baai.ac.cn/details/BAAI-TACO

4、首个汽车行业中文大模型测评基准发布

据SuperCLUE微(wei)信(xin)公众号(hao)今日发文,SuperCLUE推出了(le)专门针对(dui)汽(qi)车(che)行业的(de)大模(mo)型测(ce)(ce)评基(ji)(ji)(ji)准(zhun)(zhun)(SuperCLUE-Auto)。这(zhei)是首个(ge)汽(qi)车(che)行业大模(mo)型测(ce)(ce)评基(ji)(ji)(ji)准(zhun)(zhun),是一个(ge)多维度的(de)多轮开放(fang)式问题的(de)测(ce)(ce)评基(ji)(ji)(ji)准(zhun)(zhun)。SuperCLUE-Auto包括(kuo)智能(neng)座舱与交互、汽(qi)车(che)营(ying)销、汽(qi)车(che)理解与知识、车(che)辆(liang)使(shi)用指(zhi)南4大核心(xin)基(ji)(ji)(ji)础能(neng)共(gong)十余个(ge)任务,首批测(ce)(ce)评选择了(le)国(guo)内外有(you)代表性(xing)的(de)12个(ge)闭源(yuan)/开源(yuan)的(de)模(mo)型,结果显示(shi),有(you)4个(ge)中文大模(mo)型在中文的(de)汽(qi)车(che)场(chang)景(jing)的(de)表现超过了(le)GPT-3.5。

榜单地址:

cluebenchmarks.com/superclue_auto.html

5、抖音回应内测“AI搜”功能

据(ju)Tech星球今日报(bao)道,抖(dou)音正(zheng)在(zai)主APP内测(ce)(ce)试(shi)AI搜(sou)索功(gong)(gong)能(neng),名(ming)为(wei)“AI搜(sou)”,用户可(ke)(ke)以在(zai)该功(gong)(gong)能(neng)下获得AI提(ti)供(gong)的(de)(de)回(hui)答。在(zai)“AI搜(sou)”内,用户可(ke)(ke)以搜(sou)索相关的(de)(de)问(wen)题和信(xin)息,“AI搜(sou)”为(wei)用户通过智能(neng)搜(sou)索进行(xing)总(zong)结。对于(yu)回(hui)答不完整的(de)(de)信(xin)息,还可(ke)(ke)以再次补(bu)充(chong)细节后提(ti)问(wen),或者在(zai)下方(fang)的(de)(de)“你(ni)可(ke)(ke)能(neng)还想(xiang)了解(jie)”处,选择系统筛选的(de)(de)补(bu)充(chong)看到新的(de)(de)回(hui)答。回(hui)答的(de)(de)信(xin)息参考来源(yuan)于(yu)抖(dou)音内的(de)(de)视频和第三方(fang)网站,并且提(ti)供(gong)跳转,比如(ru)用户可(ke)(ke)以直接(jie)选择视频来源(yuan),查看视频讲(jiang)解(jie)。随后据(ju)中(zhong)(zhong)国证券(quan)报(bao)报(bao)道,抖(dou)音相关负(fu)责人(ren)对此回(hui)应,相关功(gong)(gong)能(neng)还在(zai)测(ce)(ce)试(shi)中(zhong)(zhong),目前尚不成(cheng)熟(shu)。行(xing)业(ye)人(ren)士(shi)称(cheng)该功(gong)(gong)能(neng)可(ke)(ke)能(neng)在(zai)灰度(du)测(ce)(ce)试(shi)中(zhong)(zhong),没有(you)全量(liang)上线(xian)。

6、OpenAI CEO:2024年可能无法实现AGI

12月24日(ri),OpenAI CEO萨姆(mu)·阿尔特(te)曼(man)(Sam Altman)于社交平台X上发帖询问(wen)网友对(dui)于OpenAI明年应该建设或修复哪些(xie)(xie)功(gong)能(neng)(neng)的(de)(de)建议,随后他(ta)总结(jie)了一些(xie)(xie)常(chang)见的(de)(de)请(qing)求,包括AGI、GPT-5、更(geng)好的(de)(de)语音(yin)模式、更(geng)高(gao)的(de)(de)速率限制、更(geng)好的(de)(de)GPTs、更(geng)好的(de)(de)推理、控制行为(wei)的(de)(de)程度、视频(pin)功(gong)能(neng)(neng)、个(ge)性(xing)化、更(geng)好的(de)(de)浏(liu)览、使用OpenAI登录、开源等。其中,他(ta)在(zai)AGI后面(mian)标(biao)注“请(qing)耐心(xin)等待”,并(bing)称“对(dui)于AGI的(de)(de)请(qing)求比(bi)预期多得多,但很抱歉,我认为(wei)我们无法在(zai)2024年实现这一目标(biao)”,他(ta)还(hai)提到将“尽可能(neng)(neng)满足这些(xie)(xie)需求,以(yi)及许多其他(ta)未被网友提及、但令OpenAI团队自己感到兴奋的(de)(de)功(gong)能(neng)(neng)”。

7、OpenAI拟进行新一轮融资 估值1000亿美元

据(ju)(ju)彭博社23日报道,知情人士透露, OpenAI正在(zai)早期讨论(lun)以1000亿美(mei)元或以上(shang)的估值筹集(ji)新一轮融资(zi),可(ke)能参与本轮融资(zi)的投资(zi)者(zhe)已参与初步讨论(lun)。根据(ju)(ju)CBInsights的数据(ju)(ju),如果本轮融资(zi)按计划(hua)进行,OpenAI将成为美(mei)国(guo)市值第二的初创公(gong)司,仅(jin)次于马斯克的SpaceX。据(ju)(ju)知情人士透露,OpenAI还与阿联酋阿布扎比(bi)的G42公(gong)司讨论(lun)了为一家新的芯片(pian)企(qi)业融资(zi)80亿至100亿美(mei)元的问题(ti)。

8、苹果拟5000万美元购买新闻数据训练AI

据《纽(niu)(niu)约时(shi)报(bao)》23日报(bao)道,几位知(zhi)情人士(shi)透露(lu),苹果公司最近几周(zhou)与(yu)主要的(de)新(xin)闻和出版机(ji)构展开谈判,希望获得许(xu)可,在(zai)该公司开发生(sheng)成式AI系(xi)统(tong)时(shi)使(shi)用它们(men)的(de)资料。苹果已经提(ti)出了价值至少5000万美(mei)元(yuan)的(de)多年期交(jiao)易,以获得新(xin)闻文章(zhang)档案(an)的(de)使(shi)用许(xu)可,接触的(de)新(xin)闻机(ji)构包括《时(shi)尚》(Vogue)和《纽(niu)(niu)约客》(The New Yorker)的(de)出版商康泰纳仕(Condé Nast)、美(mei)国(guo)全国(guo)广播公司新(xin)闻(NBC News)以及拥有《人物》(People)、《野(ye)兽日报(bao)》(The Daily Beast)和《美(mei)好家园》(Better Homes and Gardens)的(de)IAC。

9、郭明錤:苹果春季发布可能没有AI方面显著更新

今日(ri),天风国际分析师(shi)郭明錤于社交平(ping)台X发布2024年(nian)(nian)消费电子产业三大关键(jian)投资趋(qu)势预测:安卓(zhuo)库存(cun)回(hui)补(bu)、Vision Pro、AI PC与手机。其(qi)中(zhong)提到,2024年(nian)(nian)AI装(zhuang)(zhuang)置的(de)(de)主流硬件规格将包(bao)括内建7-10B大模型、40-50TOPS的(de)(de)AI算(suan)力、10-20 Tokens/s或以(yi)(yi)上的(de)(de)推理速度、8-16GB或以(yi)(yi)上的(de)(de)DRAM等。随后他(ta)转发称,认为苹果的(de)(de)春季发布会可(ke)能(neng)不会有AI服务方面(mian)的(de)(de)显著(zhu)更新,所(suo)以(yi)(yi)没有明显纳入2024年(nian)(nian)可(ke)能(neng)提供AI装(zhuang)(zhuang)置催化剂的(de)(de)新产品发表中(zhong)。

10、Ai Pin将于明年3月开始出货

12月23日,AI硬(ying)件设备创企Humane于社交(jiao)平台X上宣(xuan)布,其首款AI穿戴设备Ai Pin将于2024年3月开始发货(huo),届时将根据订(ding)单顺(shun)序依次运(yun)送所有订(ding)单。

11、阿里百度腾讯360首批通过国家大模型标准评测

据阿里云、百(bai)度(du)等(deng)微信公众号发(fa)文,12月(yue)22日,在全国信息技(ji)术(shu)标(biao)(biao)准化技(ji)术(shu)委员(yuan)会AI分委会全体(ti)会议上,国内首(shou)(shou)个官方“大(da)(da)模(mo)(mo)型(xing)(xing)标(biao)(biao)准符合性(xing)(xing)评测(ce)(ce)”结(jie)果(guo)公布,阿里云通义千(qian)问、百(bai)度(du)文心大(da)(da)模(mo)(mo)型(xing)(xing)、腾讯混元大(da)(da)模(mo)(mo)型(xing)(xing)、360智脑大(da)(da)模(mo)(mo)型(xing)(xing)首(shou)(shou)批通过评测(ce)(ce),在通用性(xing)(xing)、智能(neng)(neng)性(xing)(xing)等(deng)维度(du)均(jun)达到国家(jia)相(xiang)关标(biao)(biao)准要求。据悉,该测(ce)(ce)试由中(zhong)国电子(zi)技(ji)术(shu)标(biao)(biao)准化研究(jiu)院(yuan)发(fa)起,旨在建立大(da)(da)模(mo)(mo)型(xing)(xing)标(biao)(biao)准符合性(xing)(xing)名录,引领(ling)AI产(chan)业健康(kang)有序发(fa)展。该评测(ce)(ce)对外征集(ji)了(le)学术(shu)界、产(chan)业界几十家(jia)头部单(dan)位意见(jian),覆盖评估语言大(da)(da)模(mo)(mo)型(xing)(xing)通用性(xing)(xing)、智能(neng)(neng)性(xing)(xing)的(de)38项具体(ti)评测(ce)(ce)维度(du),是(shi)基(ji)于官方大(da)(da)模(mo)(mo)型(xing)(xing)测(ce)(ce)试基(ji)准的(de)权威评测(ce)(ce)。

12、中国信通院院长:AI发展将迎来关键窗口期

据财联社报(bao)(bao)道(dao),12月24日,在2024中(zhong)国信(xin)通院(yuan)(yuan)ICT深度观(guan)察报(bao)(bao)告会AI伙伴(ban)分论坛上,中(zhong)国信(xin)息通信(xin)研(yan)究(jiu)院(yuan)(yuan)院(yuan)(yuan)长(zhang)余晓晖称,MaaS(模(mo)(mo)型即服务)和开(kai)源(yuan)大(da)模(mo)(mo)型加速企(qi)业智(zhi)(zhi)能(neng)化将成为大(da)模(mo)(mo)型应用的主要形态,推动应用门槛急剧降低,大(da)模(mo)(mo)型技术创新将进一步加速,多模(mo)(mo)态巨型智(zhi)(zhi)能(neng)等有望获得新突破,AGI的方向日渐清晰,未来几(ji)年(nian)AI发(fa)展将迎来关键窗口期(qi)。

13、印度正加强AI在天气预报中的应用

据(ju)路透(tou)社(she)23日报(bao)道(dao),印(yin)度(du)一位高级气(qi)象(xiang)官员说(shuo),随着暴(bao)雨、洪水和干旱等(deng)极端天气(qi)的(de)增加个,印(yin)度(du)正在测试(shi)试(shi)用(yong)AI来建立气(qi)候模(mo)(mo)型,以改善(shan)天气(qi)预报(bao)。印(yin)度(du)气(qi)象(xiang)局(ju)(IMD)使用(yong)超(chao)级计(ji)算机(ji)根据(ju)数(shu)(shu)学(xue)模(mo)(mo)型提供预报(bao),将(jiang)AI与扩大的(de)观测网络结合使用(yong),有助于(yu)以更(geng)(geng)低的(de)成本生(sheng)成更(geng)(geng)高质量的(de)预报(bao)数(shu)(shu)据(ju)。