智东西(公众号:zhidxcom)
作者 | 陈骏达
编辑 | 云鹏
智东西9月27日报道,近日,月之暗面正在小规模灰度测试Kimi的Agent模式“OK Computer”。OK Computer的目标是通过更多轮次推理、更多工具调用、更多token消耗,带来更多智能,月之暗(an)面将其(qi)定义为(wei)一款“全栈(zhan)助理”。
在OK Computer模式下,Kimi将拥有自己的虚拟电(dian)脑,可以连(lian)续工(gong)作几十分钟(zhong),一步一步自主(zhu)完成需求(qiu)调研、规划、分析、设(she)计、开发(fa)等环节。

▲OK Computer工作界面,左侧(ce)为(wei)聊天框,右(you)侧(ce)为(wei)虚(xu)拟电脑(nao)(图源:智东西)
与传统依赖人工预设工作流的方式不同,OK Computer背后是月之暗面的原生Agent模型Kimi K2,能应对(dui)更(geng)多任务场景和突发情(qing)况。
借助端到端强化学习技术,Kimi K2掌握了文件(jian)系(xi)统(tong)、浏览(lan)器、终端(duan)、代(dai)码、图片生成(cheng)、音频生成(cheng)等20多种工具的使用方式,拥有完成复杂(za)任务所需的内在知识。
官方Demo中,OK Computer能够直接交付功能模块(kuai)丰(feng)富的多页面(mian)网站、移动端友(you)好(hao)的Web应用以及可(ke)编辑的高品质(zhi)演示文(wen)稿等产出物(wu),也能够把几十万行的Excel 数据进行可(ke)视化、交互式呈现。
目前,过去两(liang)年(nian)曾经给予Kimi打赏鼓励(li)的用(yong)(yong)户,将优先获得OK Computer的体(ti)验(yan)席位,这部(bu)分用(yong)(yong)户打开(kai)网页版Kimi即可收到(dao)邀(yao)请。
月之暗面称,Agent模(mo)(mo)式下单个任务的token消耗量可(ke)达常规对话模(mo)(mo)式的几十倍,OK Computer会(hui)根据服务器负载情况(kuang)逐步(bu)扩大灰度测试范围。智东西也对OK Computer的表现进行了体验。
一、一手体验海量数据分析能力,把英伟达投资策略捋清了
获得OK Computer模式体验机会(hui)的(de)用户,在Kimi首(shou)页输入(ru)框的(de)左下角能(neng)找到OK Computer模式的(de)切换按(an)钮(niu),点击后即可使(shi)用。

官方提(ti)(ti)供了OK Computer模(mo)式下(xia)的一些模(mo)板(ban)提(ti)(ti)示词(ci),如果想体(ti)验其能力,又不愿意撰写复(fu)杂(za)提(ti)(ti)示词(ci),可以直接选用(yong)这些模(mo)板(ban)。
智东西从中选择了一(yi)项(xiang)数据(ju)可视化(hua)任务,要求Kimi从雅虎(hu)财经获取英伟达过去两年的(de)股价和财报数据(ju),并(bing)分析股价的(de)暴涨是否主要发生(sheng)在财报发布前后、比较(jiao)估值(市(shi)盈率(lv)P/E)与标普500科技板块的(de)平均值。

此外,Kimi还需模拟在(zai)每次财报(bao)发布(bu)前一周买(mai)入,发布(bu)后(hou)一周卖出的交易策略(lve),长期来看是否盈利(li)。
设计风格方面,提(ti)示词要求Kimi采用低饱和度的英伟达品牌色,保持布局简(jian)洁和谐,仅使(shi)用纯色(无(wu)渐(jian)变(bian)),并(bing)通过优雅图(tu)标提(ti)升清晰度。
收到任务后,Kimi会在(zai)右侧呈(cheng)现它在(zai)虚拟电脑中进行(xing)的各类操作。在(zai)开始任务之前(qian),它一般会撰写待办事项,对任务流程进行(xing)全面规划(hua),然后再(zai)正式(shi)执(zhi)行(xing)。

开启OK Computer模式后,Kimi会列出(chu)其进行的每一步操(cao)作,包括使用(yong)数据(ju)源、使用(yong)文件(jian)、使用(yong)iPython、使用(yong)部署工具(ju)等(deng)等(deng)。分析完成后,它(ta)还用(yong)简洁的语言(yan)给出(chu)了关键发(fa)现,并将(jiang)分析图表和(he)结论做成了一个完整的网站,耗时5分钟左右。

生成结果:
//www.kimi.com/share/19988a15-7962-8c6a-8000-0000857b187e
可以看到,Kimi给(ji)出的网页完(wan)成(cheng)度较高,数据可视化清晰,跳转逻辑正确,还(hai)提供了JSON格式的分析数据。
智东西核验了页面中(zhong)部(bu)分(fen)关键(jian)数据(ju)的(de)正确性(xing),如英伟达市值、股价等等。在我们(men)的(de)抽查(cha)范(fan)围内(nei),数据(ju)基(ji)本无误,不过英伟达的(de)市盈(ying)率与雅虎财(cai)经上显(xian)示的(de)数据(ju)有(you)出(chu)入(ru)。
这一任务考察的(de)(de)(de)能力类(lei)型众多,OK Computer模式下的(de)(de)(de)Kimi需要从指定来(lai)源抓取正确数据和对应时间,理解提示词(ci)中谈到的(de)(de)(de)各种金融术语(yu),还需要利用Python进行(xing)数据分析(xi),并将结果按照风格要求可视化(hua)。如果是人工(gong)完(wan)成,可能需要耗(hao)费数小时。
我们将官方提示(shi)词中的企(qi)业从英伟达改为AMD,切(qie)换(huan)了比(bi)较的基准,Kimi同样能给出类似质(zhi)量的分(fen)析(xi)结果,这在某种(zhong)程度上也(ye)印(yin)证(zheng)了其能力不是(shi)完(wan)全靠“背(bei)题”实现的。

生成结果:
//www.kimi.com/share/19988bb0-9b82-864d-8000-0000e74d03a4
不过,OK Computer并不是市面(mian)上唯一(yi)(yi)一(yi)(yi)款具备类(lei)似(si)能力(li)的(de)Agent,我们也将这一(yi)(yi)任务交给了Manus。
可(ke)以看到,Manus的执(zhi)行(xing)风格更偏(pian)向(xiang)直接上(shang)手做,收到任务(wu)后直接就开始查询(xun)财经数(shu)据的API了。Manus最终(zhong)交付了一份MarkDown文档,以及(ji)四张数(shu)据图表(biao)。

Manus的报(bao)告(gao)内容更(geng)为(wei)宏观,在(zai)具体数据的呈现(xian)上(shang)比OK Computer更(geng)少,报(bao)告(gao)长度也更(geng)短(duan),任务耗时比OK Computer长。数据可视(shi)化方(fang)面,其图表(biao)的美观程度和OK Computer相比还有一定差(cha)距。
二、擅长PPT、多功能网站开发,多位网友给出好评
月之暗面(mian)介绍,OK Computer已掌握的工具集包括列待办(ban)事(shi)项(xiang)、写Python代码、操作终端、浏览(lan)网页(ye)、文(wen)字搜(sou)索、图片搜(sou)索、图片生成(cheng)(cheng)、音频生成(cheng)(cheng)、接入专业财经数据源、网站部署等。
在该公司的内部测试(shi)中,OK Computer目前擅长的任务类(lei)型,包括多(duo)功能网站(zhan)原型开发、海量数据分析与可(ke)视化、高品质演示PPT制作等。
x平台上的(de)一名(ming)科技博主分享,他用OK Computer打(da)造了一个(ge)(ge)功能完备的(de)星(xing)座网站。这个(ge)(ge)网站可以帮(bang)助用户了解(jie)每(mei)个(ge)(ge)星(xing)座的(de)特征(zheng),还可以比较两个(ge)(ge)星(xing)座之(zhi)间是否匹配。其设(she)计风(feng)格也与(yu)网站的(de)主题较为匹配。

▲OK Computer生成(cheng)的星座网站(图源:Gadgetify)
还有网(wang)(wang)(wang)友(you)分享,自(zi)己用OK Computer打(da)造(zao)了(le)一个文(wen)档比较(jiao)网(wang)(wang)(wang)站,可以看到这一网(wang)(wang)(wang)站设(she)计简洁美观,这位网(wang)(wang)(wang)友(you)反馈完成率还不错(cuo)。

官方(fang)Demo中,借助OK Computer,Kimi还打造了一份对电影(ying)《2001太(tai)空(kong)漫游》视觉元素的深(shen)度解析PPT,要求仅使用电影(ying)原图与影(ying)视和学术(shu)深(shen)度解析文章。
Kimi会先设定计划,搜索电影原图素材和关键场景的图片,搜索电影深度解释和学术研究(jiu)资(zi)料,经过深度研究(jiu)和素材资(zi)料收集,然后才开(kai)始按照视觉规范制作PPT。
最终,Kimi可以(yi)交付一份演示文(wen)稿(gao),既可以(yi)在(zai)线分享,也可以(yi)下载到本地。

结语:从问答机器到全栈开发,大模型竞逐Agent能力
月之暗面(mian)称,未来他(ta)们会为(wei)OK Computer模式(shi)带(dai)来更(geng)丰(feng)富的工(gong)具选项(xiang)和自定(ding)义工(gong)具能力,也支持(chi)连接更(geng)多(duo)外部应用,让Kimi可以完成更(geng)多(duo)类型的任务(wu)。
这也顺应了行(xing)业内(nei)的一(yi)大趋(qu)势:通(tong)用(yong)大模型正从知识问答阶(jie)段(duan)、生(sheng)产力工具阶(jie)段(duan)迈向通(tong)用(yong)Agent阶(jie)段(duan)。未来,谁(shei)能率先在工具生(sheng)态(tai)整合(he)、长时任务(wu)执行(xing)、可靠性和合(he)规(gui)性上建立优势,谁(shei)就可能在新一(yi)轮竞争中(zhong)占据先机。