1、马(ma)斯克Grok大(da)模型开源 参数量3410亿(yi)

2、苹果谷歌和OpenAI商谈iPhone大模型(xing)使用

3、苹果新研究提升(sheng)服(fu)务(wu)大模型(xing)效(xiao)率(lv)

4、Open-Sora视频(pin)生(sheng)成(cheng)模型(xing)开源

5、AI程序员代码能力(li)超Claude 2

6、月之暗面(mian)智能助手(shou)支(zhi)持200万字上下(xia)文(wen)

7、斯坦(tan)福新研(yan)究提升大模型长视频理(li)解能力

8、高通(tong)手(shou)机(ji)芯片(pian)支(zhi)持(chi)100亿参(can)数大模型

9、国内(nei)首(shou)个AI导演(yan)上岗

10、赛迪四川发布(bu)中国(guo)AI大模型(xing)20强报告

11、OpenAI CTO说不知道Sora训练数据出处

12、阿联酋(qiu)AI投资公司考虑支持OpenAI万(wan)亿芯(xin)片(pian)计划

1、马斯克Grok大模型开源 参数量3410亿

今(jin)天,马斯克(ke)的(de)AI创(chuang)企xAI正式(shi)发(fa)布了(le)大(da)(da)(da)模型(xing)Grok-1,其参数(shu)(shu)量达到了(le)3140亿,超(chao)过OpenAI GPT-3.5的(de)1750亿。这(zhei)是迄(qi)今(jin)参数(shu)(shu)量最(zui)大(da)(da)(da)的(de)开源大(da)(da)(da)语言模型(xing),遵照Apache 2.0协议(yi)开放模型(xing)权重和架构。Grok-1是一个混合专家(jia)(Mixture-of-Experts,MoE)大(da)(da)(da)模型(xing)。xAI称这(zhei)是他们自己从(cong)头训练的(de)大(da)(da)(da)模型(xing),Grok-1没有(you)针(zhen)对特定应用进行(xing)微调。

2、苹果谷歌和OpenAI商谈iPhone大模型使用

今天,据彭(peng)(peng)博社(she)报(bao)道,有知情人(ren)士称,苹果公司(si)正在与谷(gu)歌进(jin)行谈判,希望将谷(gu)歌的(de)(de)(de)Gemini大(da)模型(xing)能(neng)力应用(yong)在iPhone中,以支持(chi)今年iPhone即将增加的(de)(de)(de)各类(lei)生成式AI功能(neng)。彭(peng)(peng)博社(she)记者马克·古尔曼认(ren)为,这将是一项(xiang)重大(da)的(de)(de)(de)协议,可(ke)能(neng)会撼动整个AI行业。该报(bao)道还提(ti)到(dao),苹果最近与OpenAI进(jin)行了(le)讨论,考虑使用(yong)其大(da)模型(xing)。

3、苹果新研究提升服务大模型效率

3月14日,苹果研(yan)究(jiu)人(ren)员发布论文,推(tui)出了(le)一种(zhong)用于大型语(yu)言(yan)(yan)模(mo)(mo)型中快速推(tui)测解(jie)(jie)码的Recurrent Drafter,这种(zhong)改进后的推(tui)测解(jie)(jie)码方(fang)(fang)法(fa)可(ke)以提高服(fu)务大型语(yu)言(yan)(yan)模(mo)(mo)型的效(xiao)率。Recurrent Drafter利用了(le)双模(mo)(mo)型推(tui)测解(jie)(jie)码方(fang)(fang)法(fa)和单模(mo)(mo)型方(fang)(fang)法(fa)Medusa。研(yan)究(jiu)人(ren)员通过实验证明了(le)这种(zhong)方(fang)(fang)法(fa)在几个主(zhu)流(liu)开源大型语(yu)言(yan)(yan)模(mo)(mo)型上的有效(xiao)性。

论文地址:

//arxiv.org/pdf/2403.09919.pdf

HuggingFace地址:

//huggingface.co/papers/2403.09919

4、Open-Sora视频生成模型开源

3月18日(ri)凌(ling)晨(chen),潞晨(chen)科技(ji)创始人尤洋教授在X平台发文(wen),潞晨(chen)科技(ji)旗下Colossal-AI团队开源(yuan)了其(qi)Open-Sora 1.0视频生成模型(xing)(xing),包(bao)括模型(xing)(xing)权重、训练源(yuan)代码和详细的架构。该(gai)模型(xing)(xing)采用了Diffusion Transformer(DiT)架构。据了解(jie),团队以使用了DiT架构的开源(yuan)文(wen)生图模型(xing)(xing)PixArt-α为基础,引入了时间注意力(li)层,并将其(qi)扩(kuo)展到了视频数(shu)据上(shang)。

GitHub地址:

//github.com/hpcaitech/Open-Sora

5、AI程序员代码能力超Claude 2

3月15日,AI创企(qi)Cognition对其团队发布(bu)的(de)(de)首(shou)个AI软件(jian)工程师Devin进行了技术解(jie)读,发布(bu)了关于(yu)Devin的(de)(de)SWE-bench基准测试技术报告。SWE-bench可(ke)以(yi)评估系统解(jie)决现实中代码(ma)库问(wen)(wen)题的(de)(de)能力。测试结果显示,Devin不需要人类辅助(zhu)就可(ke)以(yi)解(jie)决570个问(wen)(wen)题中的(de)(de)79个问(wen)(wen)题,成功率为13.86%,高于(yu)SOTA 大模(mo)型(Claude 2)的(de)(de)4.80%。

GitHub地址:

//github.com/CognitionAI/devin-swebench-results

6、月之暗面智能助手支持200万字上下文

今(jin)天,AI创企月之暗面(Moonshot AI)宣布其智能助手(shou)Kimi在长上(shang)下(xia)文(wen)窗口技术上(shang)取得突(tu)破,无损上(shang)下(xia)文(wen)长度提升至200万字(zi)。今(jin)天起,支持200万字(zi)上(shang)下(xia)文(wen)的(de)Kimi已启动内测。据称,基于新版Kimi,用(yong)户上(shang)传几十万字(zi)的(de)经典德州扑(pu)(pu)克长篇教程后,Kimi可以扮演德扑(pu)(pu)专家为用(yong)户提供出牌(pai)策略的(de)指导(dao)。

7、斯坦福新研究提升大模型长视频理解能力

3月15日(ri),斯坦福研(yan)究人(ren)员发布(bu)论文,推(tui)出(chu)了(le)一(yi)种基于(yu)代(dai)(dai)理(Agent)的系统(tong)——VideoAgent,其将大型语(yu)言模(mo)型作为(wei)中央代(dai)(dai)理,迭代(dai)(dai)地识别(bie)和(he)编译(yi)关键信(xin)息以(yi)回答问题,同时利用视(shi)觉语(yu)言基础模(mo)型作为(wei)翻译(yi)和(he)检(jian)索视(shi)觉信(xin)息的工具。在(zai)EgoSchema和(he)NExT-QA基准测试(shi)中,VideoAgent在(zai)零(ling)样本(ben)准确率上分(fen)别(bie)达到了(le)54.1%和(he)71.3%,平(ping)均仅使用了(le)8.4和(he)8.2帧(zhen)。研(yan)究人(ren)员称,该(gai)(gai)测试(shi)结果表明该(gai)(gai)方(fang)法在(zai)效果和(he)效率上优于(yu)当(dang)前最先进的方(fang)法,在(zai)提升长篇视(shi)频理解方(fang)面有(you)应用潜力。

论文地址:

//arxiv.org/pdf/2403.10517.pdf

GitHub地址:

//wxh1996.github.io/VideoAgent-Website/

8、高通手机芯片支持100亿参数大模型

今(jin)天,高通正式发(fa)布了第三代(dai)骁龙8s芯片,其(qi)在(zai)端侧生成式AI能力方面进行了重点升级,支持(chi)Baichuan-7B、Gemini Nano、Llama 2和(he)智谱ChatGLM等30多个大型(xing)语(yu)言模(mo)型(xing)和(he)大型(xing)视觉(jue)模(mo)型(xing),据(ju)称最高支持(chi)模(mo)型(xing)参数量为100亿。

9、国内首个AI导演上岗

据(ju)上海证券报报道,3月15日,湖(hu)南广电集(ji)团首个AI导(dao)演(yan)爱(ai)芒(英文名(ming)AIM)正式(shi)以助理导(dao)演(yan)的(de)身(shen)份和观众、网(wang)友们见(jian)面。这也是国内首个正式(shi)上岗的(de)AI导(dao)演(yan)。3月17日午(wu)间,该(gai)综艺超前(qian)企划播出,爱(ai)芒正式(shi)亮相。《声生不(bu)息》系列制片人洪(hong)啸说:“AI导(dao)演(yan)会倒逼着我们不(bu)断地去创(chuang)新。”

10、赛迪四川发布中国AI大模型20强报告

智(zhi)(zhi)东西(xi)3月(yue)17日消息(xi),3月(yue)15上(shang)午,赛迪(di)工业和信息(xi)化研究院(集(ji)团)四(si)(si)川(chuan)有限公(gong)司发布了《2024中(zhong)国人(ren)工智(zhi)(zhi)能多模态大(da)(da)模型(xing)企业综合(he)竞争(zheng)力(li)20强研究报(bao)告》,腾讯(xun)混元(yuan)大(da)(da)模型(xing)排(pai)(pai)(pai)(pai)名(ming)第一(yi)、科大(da)(da)讯(xun)飞星(xing)火大(da)(da)模型(xing)排(pai)(pai)(pai)(pai)名(ming)第二、阿里巴(ba)巴(ba)通义千(qian)问排(pai)(pai)(pai)(pai)名(ming)第三、华为盘古大(da)(da)模型(xing)排(pai)(pai)(pai)(pai)名(ming)第四(si)(si)、智(zhi)(zhi)谱(pu)华章智(zhi)(zhi)普清(qing)言(yan)排(pai)(pai)(pai)(pai)名(ming)第五。

据称此(ci)次评价研(yan)究通(tong)过建立覆盖经济、技术(shu)、行(xing)(xing)业、商(shang)业等(deng)多维度指(zhi)标的(de)企业竞争(zheng)力(li)(li)评价模(mo)型,对我国(guo)人工智能自研(yan)多模(mo)态大模(mo)型企业实力(li)(li)进(jin)行(xing)(xing)综合评估,最终形(xing)成人工智能多模(mo)态大模(mo)型企业综合竞争(zheng)力(li)(li)20强评价结果(guo)。其评价体系(xi)包括经济抗衡力(li)(li)(15%)、行(xing)(xing)业影响力(li)(li)(30%)、技术(shu)竞争(zheng)力(li)(li)(40%)、商(shang)业角逐力(li)(li)(15%)。

11、OpenAI CTO说不知道Sora训练数据出处

智(zhi)东(dong)西(xi)3月17日消息,3月14日,《华尔街日报》记者Joanna Stern采(cai)访了(le)(le)OpenAI首席技术官Mira Murati,针对(dui)一段Sora生成(cheng)的虚拟视频(pin)进行了(le)(le)讨论,Mira Murati解释了(le)(le)Sora的工(gong)作(zuo)原(yuan)理,但是回避了(le)(le)大部分有关该模(mo)型训练数据来源的问(wen)题,甚至在回答(da)中出现了(le)(le)“我(wo)其实(shi)不太确(que)定(I’m actually not sure about that)”的说法。

12、阿联酋AI投资公司考虑支持OpenAI万亿芯片计划

智东西(xi)3月17日消息,据英国《金融时(shi)报》报道,阿(a)联(lian)酋阿(a)布(bu)扎比一家(jia)(jia)由(you)国家(jia)(jia)资助的(de)投(tou)资公司(si)MGX正在和OpenAI谈判,讨论支持此前(qian)由(you)OpenAI CEO Sam Altman提(ti)出的(de)“万亿芯片计(ji)划”。报道称,MGX 是一家(jia)(jia)今(jin)年1月刚(gang)刚(gang)成立(li)的(de)专注于AI的(de)投(tou)资公司(si),代表了阿(a)联(lian)酋希望在全球(qiu)AI竞赛中实现(xian)领先(xian)的(de)关键布(bu)局。