智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影
大模型应用落地的热(re)潮正以前(qian)所未有(you)的力度席卷千(qian)行百(bai)业。
如今产业(ye)界已经(jing)释放出一个(ge)清晰的信号(hao):当大模型的价值真正成为破(po)解行(xing)业(ye)难题的利器,各(ge)行(xing)各(ge)业(ye)开始思考,如何(he)才能让(rang)大模型的“智慧”为己所用(yong)?
商(shang)汤科技与中铁第(di)一勘察设计院集团有限公司(以下简称“铁一院”)的深度合作,正是(shi)解开这(zhei)一行业命题的关键(jian)答案(an)之一。
铁路(lu)勘(kan)察(cha)设计(ji)领域(yu)数十年积(ji)累的技术经验受限于口口相传(chuan),海量有价值(zhi)数据无法被(bei)快速、准确利用起来,且传(chuan)统的数据存档方式效率低下(xia),知识(shi)折损率高。大(da)模(mo)型的出(chu)现,为铁路(lu)勘(kan)察(cha)设计(ji)领域(yu)的知识(shi)传(chuan)承提供了(le)新(xin)的解法。
商汤大装置与铁一院打造国铁价值工程多模态大模型应用平台,首次将多模态大模型应用于铁路工程设计知识的智能传承与应用,其融合文本(ben)、图纸、公式等异构数据,为设计人员提供了知识检(jian)索、智能(neng)(neng)问(wen)答、文本(ben)生成(cheng)、文本(ben)审(shen)核、多模(mo)态对话五大功能(neng)(neng)。
在内部测试中,该平台针对28000条问答测试的准确率都维持在90%以上。
当大模型的技术(shu)红利与(yu)各(ge)行(xing)各(ge)业(ye)(ye)的需求相接,一场(chang)关于智(zhi)(zhi)能变革的序幕已然被拉开。这一背(bei)景(jing)下,智(zhi)(zhi)东西总(zong)编(bian)辑张(zhang)国(guo)仁(ren)与(yu)铁一院数智(zhi)(zhi)化部总(zong)工张(zhang)守利、商(shang)汤科技大装置(zhi)事业(ye)(ye)群(qun)解决(jue)方案副(fu)总(zong)裁杨松进行(xing)了深入交流(liu),从国(guo)铁价值(zhi)工程多模态(tai)大模型应用平台出(chu)发,提(ti)炼(lian)大模型在(zai)实际场(chang)景(jing)中落地(di)的典(dian)型范式。

▲商汤科技大装置事业群(qun)解决方案副(fu)总(zong)裁杨松、铁(tie)一院数(shu)智(zhi)化部(bu)总(zong)工(gong)张守利、智(zhi)东西(xi)总(zong)编辑张国仁(ren)(从(cong)左至右)
一、数据桎梏、经验断层、效率瓶颈待破,大模型解锁铁路勘察设计新可能
今年春节期(qi)间(jian)DeepSeek走红,使得大模型成功破圈,在这之后开(kai)箱即用(yong)的DeepSeek一体机扎堆上新,让企业可(ke)以低成本验证、尝试(shi)大模型的价值(zhi)。
这(zhei)一现象不仅加(jia)速(su)了AI在(zai)更(geng)(geng)广泛行业的(de)深度融(rong)合及(ji)落(luo)地应(ying)用(yong),更(geng)(geng)进一步释放了大(da)模型在(zai)复杂领域的(de)应(ying)用(yong)潜力。
以(yi)铁路勘察(cha)设计为(wei)例,其特征(zheng)是工作流(liu)程复(fu)杂、数据密集(ji)、精(jing)(jing)度要求严苛且涉及多专(zhuan)业协(xie)同(tong),因此需(xu)要高效(xiao)处理(li)海量(liang)信息、精(jing)(jing)准(zhun)应对复(fu)杂变量(liang),而(er)大模型(xing)凭借强(qiang)大的数据处理(li)、深度学习与推理(li)能力,能够精(jing)(jing)准(zhun)匹(pi)配这(zhei)些核心需(xu)求。
具体来看,首先,铁路勘察设计领域属于知识密集型行业,数据量大。张守(shou)利(li)谈道,铁一院已经(jing)成立70余年,这(zhei)期间技术(shu)人员攻克(ke)了(le)沙漠(mo)、高(gao)原冻土、高(gao)寒地(di)带的铁路修建(jian)技术(shu)难题,积淀下海量且宝贵(gui)的实践经(jing)验(yan)。

其次,数据利用率低。此前这(zhei)些数(shu)据的处理、保存完全依靠(kao)人工(gong),如人工(gong)按照原始格式将图(tu)纸、文件(jian)存档,电子(zi)文件(jian)则建立大(da)型(xing)数(shu)据库(ku)等,很难在后续(xu)工(gong)作(zuo)中(zhong)快速检索(suo)到(dao)相(xiang)应信息(xi)。
最后,经验传承(cheng)(cheng)依赖口口相传,导(dao)致经验、知识在传承(cheng)(cheng)过程中被折损,面(mian)对(dui)沙(sha)漠、高原等地质条件建铁路时,现(xian)在的技术人员无法快速、完(wan)整学习先前经(jing)验。
张(zhang)守利称,大模(mo)型的(de)迅猛崛起(qi),为他们破(po)解知识传承的(de)难(nan)题(ti)提供了(le)一个(ge)全(quan)新的(de)工(gong)具视角。
一方(fang)面(mian),自(zi)2022年底ChatGPT发布(bu)至今,大(da)模(mo)型的(de)(de)多模(mo)态数据(ju)处理与(yu)(yu)理解(jie)、知(zhi)识(shi)(shi)整(zheng)合与(yu)(yu)推理等能(neng)力(li)持续提(ti)升,让铁路勘察设计(ji)领(ling)域(yu)看到(dao)了(le)其在(zai)知(zhi)识(shi)(shi)传承(cheng)方(fang)面(mian)的(de)(de)能(neng)力(li);另(ling)一方(fang)面(mian),正如杨松所说,AI走到(dao)今天,正在(zai)经历(li)深入场(chang)景实际解(jie)决问题的(de)(de)阶段(duan)。
在行业痛点与大模型(xing)产业发展的综合影(ying)响(xiang)下,大模型(xing)深入铁路勘(kan)察设计成为可能。
在(zai)此(ci)基础上,商汤和铁一院(yuan)此(ci)次打造的国铁价值(zhi)工(gong)程多模(mo)态(tai)大模(mo)型(xing)应用(yong)平台,成为(wei)开启用(yong)AI解决铁路(lu)工(gong)程问题这扇门的一把钥匙。
二、从知识生成、检索问答到审核,每位员工都有资深专家助力
国铁价值工程(cheng)多模态大模型应用(yong)平台是铁路工程(cheng)领域首次(ci)采用(yong)多模态大模型技术,缺乏(fa)先例参考的同(tong)时就更需要找准痛点“对症(zheng)下药(yao)”。
因此,结合铁路勘察设计领域的痛点,商汤大装置为铁一院提供了覆盖数据(ju)服务、算(suan)法(fa)模型、应用开(kai)发平台等在内的端(duan)到端(duan)大模型私有化整合方案。
这一应用平台的(de)知识库体量(liang)达(da)到420GB,文本类数(shu)据量(liang)超(chao)130GB、标准规范涵盖1400多册、历史项(xiang)目(mu)数(shu)据超(chao)20万份,同时在(zai)铁(tie)路勘(kan)察(cha)设计(ji)(ji)领域中,摘录(lu)了30个具有高价值的(de)项(xiang)目(mu)场景、项(xiang)目(mu)资料(liao),包含(han)从可行性研(yan)究、初步(bu)设计(ji)(ji)到施工图设计(ji)(ji)环节各个环节。
在此之上,这一平台为设计人员提供了知识检(jian)索、智(zhi)能(neng)问答(da)、文(wen)本生(sheng)成(cheng)、文(wen)本审(shen)核、多模态对话五大功能。张守利做了一(yi)个(ge)形象的(de)比喻(yu),这(zhei)相当(dang)于为(wei)每个(ge)技术员工引入一(yi)个(ge)集(ji)几十年经验为(wei)一(yi)身的(de)权(quan)威专(zhuan)家。
从模型具体(ti)表(biao)现来看,在检(jian)索(suo)问答层面,技术(shu)人员可以通(tong)过(guo)语(yu)义(yi)检(jian)索(suo)更(geng)快捷找到数据库(ku)中的资料,如果(guo)对答案(an)存疑,也(ye)可以通(tong)过(guo)生成页面的标注来源再次(ci)进行确认。

▲知识问答与检索示例
对于报告辅助编写(xie),该(gai)平台可以帮助技术人(ren)员搭建报告框架、草(cao)稿,为(wei)了(le)解决(jue)大模型一次(ci)性吞吐量(liang)限制,其还(hai)会(hui)分框架填充章节内容(rong),分段(duan)生成文(wen)本。
在审(shen)(shen)核(he)过程中,此前的(de)报告需(xu)要经历设(she)计者(zhe)、复(fu)核(he)者(zhe)、审(shen)(shen)定者(zhe)三轮人工审(shen)(shen)核(he)才能(neng)最(zui)终成型(xing),这种(zhong)方式耗时耗力,且(qie)无法(fa)快速(su)比对同系(xi)列(lie)不同文(wen)件内容(rong)。大模型(xing)就(jiu)可(ke)以将审(shen)(shen)核(he)人员的(de)经验(yan)化审(shen)(shen)核(he)方法(fa)转化为计算(suan)机可(ke)识(shi)别的(de)算(suan)法(fa)逻辑(ji),并进(jin)行跨(kua)专(zhuan)业的(de)一(yi)致性(xing)审(shen)(shen)核(he),实现(xian)信息(xi)对齐,最(zui)后(hou)再进(jin)行人为把关(guan)。

▲报告辅助编写示例
这五大(da)功能正串(chuan)联起了铁路设(she)计(ji)人员日常工作中的(de)核(he)(he)心(xin)需求。这背后串(chuan)联大(da)模型能力与(yu)铁路设(she)计(ji)领域核(he)(he)心(xin)痛点(dian)(dian)的(de)桥梁,最核(he)(he)心(xin)的(de)支撑(cheng)点(dian)(dian)正是数(shu)据(ju)难(nan)关的(de)突破。
深入理(li)解(jie)场景(jing),是让数据发(fa)挥更大价值的(de)前提(ti)。
杨(yang)松提到,商(shang)汤(tang)在接触项目之初,需要人工先(xian)理解数(shu)据(ju)在哪些业务(wu)环节产生、将为后(hou)续业务(wu)环节提供什么价值、解决(jue)什么问题(ti),然后(hou)针对性(xing)对数(shu)据(ju)进行清(qing)洗、整(zheng)理、拆解。
商汤(tang)(tang)基于此前的数据(ju)处(chu)理(li)经验以(yi)及基于LazyLLM开发平台等进行数据(ju)调优(you),最后实现更精准(zhun)的向量化检索。在多模(mo)态(tai)层(ceng)面,商汤(tang)(tang)原生多模(mo)态(tai)模(mo)型(xing)可以(yi)将图(tu)片作为知识(shi)(shi)的一(yi)部(bu)分,使得大模(mo)型(xing)基于自己对文字知识(shi)(shi)、对图(tu)像的理(li)解加以(yi)判(pan)断(duan)。

▲系统整体架构
张(zhang)守(shou)利补充说,面对(dui)语言类数据,其在(zai)处理铁路工(gong)程的(de)技术报告中相对(dui)容(rong)易,包含图表(biao)、公式的(de)多(duo)模(mo)态信息,基于(yu)商汤的(de)工(gong)具(ju)及成熟(shu)算法可以解决80~90%的(de)问题,剩下10%多(duo)模(mo)态信息依靠工(gong)程师进行(xing)专业标注解读。
其最终的目标就是让模型(xing)真正成为一个懂行的(de)专家(jia),才能真正让大模型在业务环节中被利用起(qi)来。
商汤(tang)与铁一院在大模(mo)型(xing)与铁路工(gong)程(cheng)上的实践(jian),正是当下大模(mo)型(xing)深入(ru)行业的一个缩(suo)影。
三、AI从炫技到实用,商汤探索大模型落地实践样本
上(shang)周刚(gang)结束的世界(jie)人工智能(neng)大会,最(zui)突出的特点就是(shi)“应用为王”。AI不再是(shi)隔(ge)空炫技,而是(shi)真(zhen)正走向实用主义(yi)。
商汤与铁(tie)一院在铁(tie)路工(gong)程领(ling)域的(de)合(he)作仅是一个(ge)起点。围绕价(jia)值工(gong)程大模型(xing)应用(yong)平(ping)台(tai),他们会加快知识库的(de)更新(xin)迭代,每(mei)个(ge)工(gong)程师都可(ke)以对本(ben)专业(ye)知识库进(jin)行更新(xin),以及(ji)模型(xing)更新(xin)、对新(xin)增专业(ye)词汇的(de)向量化等。
但更为关键的是,其为从(cong)铁路勘察设计的单点应用到(dao)全产(chan)业链(lian)应用,以及其他行业的复用都提供了一个实践样本。
张守利谈道,下(xia)一阶段他们(men)的计划是将(jiang)大模(mo)型从勘察设计推(tui)广到施工(gong)、运(yun)营维护的全产业链(lian)应用,并结(jie)合各环(huan)节(jie)的特性重构知识库体系。
而这种探索的最大价值就在于,大模型作为一项通用(yong)技(ji)术,一旦在(zai)某一行业跑通验证,其技(ji)术逻辑与应用(yong)模式便能快速复用(yong)到其他(ta)领域。
与此(ci)同时(shi),为(wei)了验证模型解决问题(ti)的能(neng)力以(yi)(yi)及何时(shi)才能(neng)落地部(bu)署,他们已经积累出一套方法论。杨松解释说(shuo),以(yi)(yi)商汤和铁一院的合作为(wei)例,他们通过前置POC过程得到(dao)正确率(lv)50%的结果,证明模型可以(yi)(yi)解决问题(ti),然后(hou)通过算法工(gong)程、数(shu)据(ju)、数(shu)据(ju)库调优使得准确率(lv)达到(dao)95%,最终实现大模型部(bu)署。
在深入应用的过(guo)程中,商汤(tang)不仅(jin)再次验证(zheng)了其技术、工具在大(da)模型落地过(guo)程中的可用性,同时进一步积累了从挖掘痛(tong)点需求(qiu)、技术创新到解决痛(tong)点的闭环经验。
大模型在(zai)千(qian)行百业落(luo)地的(de)需求(qiu)有(you)共通性(xing)(xing),这(zhei)种(zhong)共通性(xing)(xing)既源于(yu)技(ji)术应用的(de)底层逻辑(ji),也根植于(yu)各行业对(dui)智能化升级的(de)核心诉求(qiu),包括对(dui)数据处(chu)理、知(zhi)识与经验复(fu)用、场(chang)景(jing)适配(pei)、灵(ling)活迭代的(de)共性(xing)(xing)要求(qiu)。
因此,当下商汤在选择深入合作的赛道逻辑非常清晰:场景可以明确被AI解决、数据积累足够多、具备一定可扩展性。
这(zhei)也是在大模(mo)(mo)型(xing)进入应用落地深水区(qu)的(de)当下,技术方(fang)突破概念验证阶段、实(shi)现(xian)规模(mo)(mo)化价(jia)值的(de)核心(xin)路径,锁定需求(qiu)明(ming)确、数据扎实(shi)、可复制延伸的(de)场(chang)景,让大模(mo)(mo)型(xing)真正(zheng)从实(shi)验室走向产业(ye)实(shi)践。
因(yin)此(ci),这(zhei)一(yi)价值(zhi)工程大模型在铁路工程领(ling)域的落地(di),就是商(shang)汤交出的一(yi)份最新答卷。
结语:在技术竞速与场景耦合中,破解大模型落地痛点
大模(mo)型应用落地加速,这背后(hou)是企业需(xu)求与大模(mo)型技术(shu)迭代之间的深(shen)度契合。一方面(mian),大模(mo)型技术(shu)迭代仍(reng)在加速,另(ling)一方面(mian),企业需(xu)要找到(dao)适(shi)配自(zi)己(ji)核心痛点、真正解决实(shi)际问题的模(mo)型。
商汤与铁一院(yuan)的(de)此次合作(zuo)项目,既是(shi)对(dui)铁路工程(cheng)智能化进行持续探索的(de)开始,同时也是(shi)寻找让大模型(xing)真正成(cheng)为破解行业(ye)(ye)痛点利器(qi)的(de)起点,其仍(reng)需要在(zai)挖(wa)掘行业(ye)(ye)痛点与技术迭(die)代的(de)实践中不断校验(yan)、完(wan)善,最终(zhong)交(jiao)出更贴(tie)合行业(ye)(ye)需求的(de)答案。
最新评论