随着互联网+、 云、 5G、 4K、 VR 等(deng)新(xin)业务和新(xin)技术蓬勃发展(zhan), 数(shu)字经济下新(xin)的价值体系(xi)正在重建, 用(yong)户体验要求越(yue)来越(yue)高, 网络规(gui)模越(yue)来越(yue)大。 Ovum 分析报(bao)告显示, 过去 10 年(nian)电信行业收入增长(zhang)低于 OPEX增长(zhang), OPEX 在电信网络 TCO(总体拥有(you)成本) 的占比从 62%上(shang)升到 75%, 平均(jun)每(mei) 1 万台(tai)设备运营维护(hu)需(xu)要(yao)300 名工(gong)程(cheng)师。

对(dui)数据(ju)和信息(xi)(xi)的掌控能(neng)力是(shi)(shi)运(yun)营(ying)(ying)商(shang)数字(zi)化转型的重要基础(chu), AI 技术(shu)的蓬勃发展为运(yun)营(ying)(ying)商(shang)数字(zi)化转型带(dai)来了新的可(ke)能(neng)。 利用(yong)(yong) AI 强大(da)的数据(ju)分析和信息(xi)(xi)提取能(neng)力, 通过对(dui)海量网(wang)络(luo)数据(ju)采集、 分析、 预测(ce)、 决策(ce),为运(yun)营(ying)(ying)商(shang)诊断(duan)网(wang)络(luo)质量, 优(you)化业(ye)务性能(neng), 减轻运(yun)营(ying)(ying)负担, 改善用(yong)(yong)户体(ti)验带(dai)来无限可(ke)能(neng)。 运(yun)营(ying)(ying)商(shang)网(wang)络(luo)引入 AI是(shi)(shi)数字(zi)化转型的必(bi)然方(fang)向。

本期的智能内参,我们推荐中国移动的报告《光网络人工智能(AI)应用白皮书》, 阐(chan)述AI在光网(wang)络领域的总体架(jia)构和(he)关(guan)键技术

来源 中国移动

原标题:

《光网络人工智能(AI)应用白皮书》

作者: 未注明

一、 光(guang)网络 AI 应用场景

1、 AI 分(fen)析(xi)类场景

同缆风险智能识别场景光缆哑资(zi)源长(zhang)期缺乏有效(xiao)(xiao)监控、 运维(wei)手段, 主(zhu)备(bei)业务(wu)(wu)或(huo)关(guan)联业务(wu)(wu)实(shi)际(ji)部署到同一条(tiao)光缆上并不(bu)(bu)(bu)鲜(xian)见,单条(tiao)光缆中断(duan)后主(zhu)备(bei)业务(wu)(wu)或(huo)关(guan)联业务(wu)(wu)同时失效(xiao)(xiao), 不(bu)(bu)(bu)仅导(dao)致(zhi)业务(wu)(wu)中断(duan), 而且部分(fen)网络成为(wei)孤岛缺乏远(yuan)程应(ying)对手段。 以(yi)人(ren)工(gong)巡线(xian)、 人(ren)工(gong)录(lu)入(ru)方式维(wei)护同缆信息, 随(sui)着网络不(bu)(bu)(bu)断(duan)变(bian)更和(he)演(yan)进, 综合资(zi)源管理(li)系统同缆信息数(shu)据不(bu)(bu)(bu)够(gou)准(zhun)确(que), 不(bu)(bu)(bu)足以(yi)支撑精准(zhun)识(shi)别(bie)同缆, 效(xiao)(xiao)率和(he)识(shi)别(bie)准(zhun)确(que)度较(jiao)低, 亟需引入(ru) AI 技(ji)术, 智能识(shi)别(bie)主(zhu)备(bei)业务(wu)(wu)、 关(guan)联业务(wu)(wu)是否存在同缆风险,保障网络高(gao)可(ke)靠运行(xing)。

光缆拓扑智能规划场景网(wang)络(luo)规划与业(ye)务(wu)发展脱节, 造成网(wang)络(luo)负载不均、 资源(yuan)利用效率低下、 资源(yuan)需(xu)求冷热(re)不均, 根因是网(wang)络(luo)拓(tuo)扑已(yi)经无法匹配业(ye)务(wu)流(liu)量(liang)流(liu)向变化(hua), 基于业(ye)务(wu)精(jing)准预测反向优化(hua)网(wang)络(luo)拓(tuo)扑, 通过适量(liang)加纤加缆, 实现网(wang)络(luo)承载能力倍增, 适应业(ye)务(wu)变化(hua)和发展需(xu)要(yao)。

业务故障智能定位定界场景秒级(ji)(ji)、 毫秒级(ji)(ji)甚至微秒级(ji)(ji)业务闪断发生频次(ci)高, 但持续时间短, 无(wu)告警上报, 且故(gu)障很难复现(xian), 基本(ben)靠(kao)用(yong)(yong)户投诉(su), 人工(gong)定位(wei)和(he)回溯困(kun)难, 严重影响客(ke)户感(gan)知和(he)运营商口碑。 同(tong)时, 用(yong)(yong)户卡、 慢、 断体(ti)验(yan)差与应用(yong)(yong)、 带宽、 连(lian)接(jie)多个维度紧密相关, 根因定位(wei)定界涉及大量(liang)网络数据, 人工(gong)分(fen)析效率(lv)很低, 大多数用(yong)(yong)户业务体(ti)验(yan)问题难以根治。 迫切(qie)需(xu)要(yao)引入 AI 技术, 提升光网络瞬(shun)态变(bian)化(hua)感(gan)知精度, 实现(xian)性能(neng)瞬(shun)变(bian)监测和(he)闪断智(zhi)能(neng)定界定位(wei), 实现(xian)用(yong)(yong)户体(ti)验(yan)差根因的(de)高效定位(wei)定界。

2、 AI 预测类场景

光网资源预测场景随着专(zhuan)线业务(wu)的(de)(de)(de)快速发(fa)(fa)展, 业务(wu)发(fa)(fa)放效率(lv)成为运营商(shang)的(de)(de)(de)核(he)心竞争力(li), 而传统(tong)的(de)(de)(de)三滚资(zi)源规划很难适应专(zhuan)线的(de)(de)(de)随机性(xing)和突发(fa)(fa)性(xing), 当前(qian)运营商(shang)对网络投资(zi)收紧加大了(le)资(zi)源精准预(yu)留、 业务(wu)快速发(fa)(fa)放的(de)(de)(de)难度。 引入(ru) AI智能资(zi)源预(yu)测, 结合(he)历史业务(wu)增长趋(qu)势(shi), 实现资(zi)源高效利用(yong), 业务(wu)发(fa)(fa)放“零” 等待。

光网健康预测场景。 光网络的性能劣化、 隐患变故障是渐进式发展的, 基于阈值的人工判断方式难以识别, 故障一旦发生, 经常导致大量业务中断、 修复周期过长等挑战。 随着光网络承载的业务流量增长, 维护压力与日俱增, 迫切需要引入 AI 智能识别网络健康、 提前预测风险。

光波长通道余量预测场景。 随着数字化经济的发展, 光网络上波长增加明显提速, 同时为了增加网络可靠性引入 ASON 智能路由调整, 使得网络中频繁加掉波, 从而对现有波长性能产生影响, 而当前人工方式工作量大, 效率低, 精度差。 引入 AI 智能余量预测, 自动对波长余量进行动态仿真, 精准模拟加掉波对现有波长的性能余量变化和劣化根因分析, 为精准调测提供保障。

3、 AI 优化类场景

光性能智能调测调优场景。 一二干融合、 省本一体化、 区域干线驱动网络组网规模扩大, ASON 智能路由调整加大网络变数, 光模拟网络面临手工调测效率低、 出错概率高、 效果不可控。 引入 AI 智能优化调测步骤, 结合自动性能检测,实时监控关联路径的性能, 保障网络处于稳定、 较优状态。

光网络资源智能优化场景。 为适应动态的业务变化、 保障网络性能指标时刻处于最优并发掘网络利用潜能, 需要对波长、 链路和路由实施动态优化。 以往各类传输优化工具或软件主要借助固化的方法和简单的规则, 甚至依赖工程师的经验来完成优化, 并未识别到本质特征、 考虑维度简单、 相关性分析不足、 局部而非全局, 所以优化的结果往往不是普遍有效。 如今随着网络规模和业务规模的不断扩大, 传统优化方式难堪重任, 需要引入人工智能来完成整个传输网生命周期内的精细化、 动态化、 智能化的优化。

切片智能优化调度场景。 8K 视频业务, VR/云游戏等高清视频类业务强交互、 高并发, 与传统上网、 语音等弱交互、 统计复用业务相比, 对网络带宽、 时延、 丢包率等要求迥异, 需要为此类新兴业务预留独立的资源以保障业务体验,依赖人工根据业务变化动态调整资源分配基本不可行, 引入 AI 智能的切片调度, 保障不同业务的差异化体验需求。

二、 光网(wang)络(luo) AI 关键实现技术(shu)

面向(xiang)光网(wang)(wang)络(luo)(luo)哑(ya)资源数智(zhi)化管理、 网(wang)(wang)络(luo)(luo)数智(zhi)化分析(xi)需求, 通过引入AI和数字化技(ji)术, 提(ti)出光网(wang)(wang)络(luo)(luo)AI应用解决方(fang)案(an), 推进网(wang)(wang)络(luo)(luo)运(yun)维数智(zhi)化转型, 实(shi)现运(yun)维提(ti)质增效, 牵引网(wang)(wang)络(luo)(luo)技(ji)术变革。

光网络AI应用解决方案架(jia)构可以为运营商(shang)提(ti)供(gong)哑资源管理(li)、 智(zhi)(zhi)能(neng)(neng)规划(hua)、 智(zhi)(zhi)能(neng)(neng)运营、 智(zhi)(zhi)能(neng)(neng)维护(hu)和智(zhi)(zhi)能(neng)(neng)优化等AI应用, 实(shi)现全(quan)生命周期自动化、 智(zhi)(zhi)能(neng)(neng)化运维, 支撑政企和家宽业务(wu)高品质发展。 整体架(jia)构图如下图所示(shi)。

AI时代的硬核通信技术,中国移动光网络AI应用白皮书,颠覆三大应用场景 | 智东西内参

光网络(luo) AI 应用解(jie)决方案(an)架(jia)构图

1、 融合(he)感知技术

光网络感知技术面对(dui)高复杂度的(de)多参(can)量光(guang)(guang)网络(luo)系统(tong)(tong), 为了(le)能够(gou)全面、 精准、 实时(shi)感(gan)知光(guang)(guang)网络(luo)状态, 网元(yuan)系统(tong)(tong)和管控系统(tong)(tong)需要从(cong)维(wei)度、 精度、 频度等多个角度进行(xing)光(guang)(guang) Sensor 数(shu)据(ju)的(de)分层采集和汇聚, 并通(tong)过 AI 算(suan)法对(dui)原始光(guang)(guang)Sensor 数(shu)据(ju)进行(xing)数(shu)据(ju)挖(wa)掘, 支(zhi)撑光(guang)(guang)网络(luo)的(de)各类业务(wu)场景。

网元设备, 分层采(cai)集:光(guang) Sensor 技(ji)术是以光(guang)技(ji)术手段感知、 检(jian)测多种(zhong)物理量(liang)(liang), 并将模拟物理量(liang)(liang)数(shu)字(zi)化的(de)一种(zhong)技(ji)术。 网(wang)元系统将光(guang) Sensor 技(ji)术采(cai)集(ji)的(de)数(shu)据(ju)进行 4 层(ceng)划分(fen), 分(fen)层(ceng)采(cai)集(ji): 光(guang)业(ye)务层(ceng)、 光(guang)部件层(ceng)、 光(guang)信道层(ceng)、 光(guang)链路层(ceng)。

光(guang)(guang)业(ye)务(wu)层数据(ju)主(zhu)要是客户关(guan)注的业(ye)务(wu)属性(xing)指(zhi)标, 比(bi)(bi)如带宽、 时延(yan)、 误(wu)码(ma)、 保护倒换时长等(deng)指(zhi)标; 光(guang)(guang)部件(jian)层数据(ju)主(zhu)要是采集(ji)光(guang)(guang)部件(jian)的物理指(zhi)标, 包括功率、 温(wen)度、 电压(ya)、 频偏等(deng); 光(guang)(guang)信(xin)道层数据(ju)关(guan)注点在于信(xin)道的属性(xing)特征, 类(lei)似信(xin)道编号(hao)、 光(guang)(guang)信(xin)噪比(bi)(bi)、 单波功率等(deng); 光(guang)(guang)链路层数据(ju)集(ji)中在链路侧的特征, 包含光(guang)(guang)纤损耗、 光(guang)(guang)纤类(lei)型(xing)、 光(guang)(guang)纤事(shi)件(jian)等(deng)。

管控系(xi)统:1) 数据(ju)汇(hui)聚: 考虑到数据(ju)存(cun)(cun)储结构(gou)和(he)内(nei)容的(de)(de)差异(yi)性, 管(guan)控(kong)系统需要将采集的(de)(de)数据(ju)进行(xing)(xing)分(fen)类汇(hui)聚, 可(ke)分(fen)为资源(yuan)数据(ju)底(di)座(zuo)(zuo)和(he)性能数据(ju)底(di)座(zuo)(zuo)。 资源(yuan)数据(ju)底(di)座(zuo)(zuo)汇(hui)聚的(de)(de)数据(ju)主(zhu)要是(shi)静态(tai)(tai)的(de)(de)存(cun)(cun)量(liang)(liang)数据(ju), 比(bi)如业务存(cun)(cun)量(liang)(liang)数据(ju)、网络(luo)拓扑存(cun)(cun)量(liang)(liang)等(deng)(deng)。 性能数据(ju)底(di)座(zuo)(zuo)汇(hui)聚的(de)(de)数据(ju)主(zhu)要的(de)(de)非静态(tai)(tai)的(de)(de)性能数据(ju), 比(bi)如性能、 告警(jing)、 日志等(deng)(deng)随(sui)着(zhe)网络(luo)运行(xing)(xing)动态(tai)(tai)变化的(de)(de)数据(ju)。

2) 数据(ju)挖掘: 汇聚的资源和性能原始数据(ju)表(biao)达的信(xin)(xin)息量始终是有限的, 因此分(fen)析系统需要(yao)基(ji)于(yu)(yu) AI 算法(fa)技术对光 Sensor 数据(ju)进行数据(ju)挖掘获得(de)额外的信(xin)(xin)息量, 用于(yu)(yu)支(zhi)撑(cheng)感知、 诊(zhen)断、 预测、 控制等(deng)多类(lei)业务(wu)场景。

高性能数据流转技术。 面临光 Sensor 生产的海量数据, 需要一套灵活、 高并发的数据采集技术并确保数据高效流向管控系统。 光网络中使用的高效流转技术是建立网元设备内和网元设备与管控系统间的高速传输通道, 实施网元设备分布式本地决策和管控系统集中式智能控制两层处理, 协同完成决策, 如下图所示。

AI时代的硬核通信技术,中国移动光网络AI应用白皮书,颠覆三大应用场景 | 智东西内参

高性能(neng)数据流(liu)转架构(gou)示意图

网(wang)元(yuan)设(she)(she)备(bei)(bei)内高效(xiao)采(cai)(cai)集(ji): 网(wang)元(yuan)设(she)(she)备(bei)(bei)按照数据量的大小和(he)时(shi)间精(jing)度分为高速(su)采(cai)(cai)集(ji)和(he)低速(su)采(cai)(cai)集(ji)。1) 硬件上, 在(zai)网元设备为关键 Sensor 开辟(pi)快速外(wai)送数据(ju)到硬件通道(dao), 使用高速缓存区存储多端(duan)口高精(jing)度数据(ju)(如毫秒级(ji))。

2) 软件上(shang), 构建统(tong)一(yi)大采集(ji)(ji)数据(ju)框架, 抽象(xiang)建模光(guang) Sensor 数据(ju)采集(ji)(ji)项, 灵活(huo)控(kong)制多单(dan)板多端口的数据(ju)并发采集(ji)(ji), 并使用内存(cun)共享技术高效读写(xie)。

网元设备与管控系统(tong)间高效传输:

1AI 需要更多、 更高频次、 更精准(zhun)的参量采样, 参量上报通道带(dai)宽诉求出现 x104级别(bie)变化, 硬件架构上需(xu)提(ti)供更大的 DCN 吞吐能力。

2) 传(chuan)统的参(can)量(liang)(liang)查(cha)询(xun)式响应仅适合低(di)速、 低(di)频次访问, 无法满(man)足 AI 海量(liang)(liang)参(can)量(liang)(liang)上报(bao)诉求, 软件架构需要(yao)基于订阅式访问机(ji)制(zhi)(如 Telemetry), 用于批(pi)量(liang)(liang)参(can)量(liang)(liang)上报(bao), 提供(gong)高效海量(liang)(liang)数据传(chuan)输。

网元设备与管(guan)控(kong)系(xi)(xi)统(tong)分层(ceng)处(chu)理(li): 网元设备和管(guan)控(kong)系(xi)(xi)统(tong)间需尽量(liang)减少不必要的数(shu)据(ju)(ju)(ju)(ju)传输, 采(cai)用分层(ceng)处(chu)理(li)机制, 网元设备需预(yu)处(chu)理(li)数(shu)据(ju)(ju)(ju)(ju), 对数(shu)据(ju)(ju)(ju)(ju)进行整(zheng)合(例如: 毫秒级(ji)(ji)数(shu)据(ju)(ju)(ju)(ju)提取成(cheng)秒级(ji)(ji)数(shu)据(ju)(ju)(ju)(ju)) 或特征提取, 并(bing)采(cai)用数(shu)据(ju)(ju)(ju)(ju)压(ya)缩(suo)技术降低(di)数(shu)据(ju)(ju)(ju)(ju)传输量(liang)。 管(guan)控(kong)系(xi)(xi)统(tong)根据(ju)(ju)(ju)(ju)必须的网元设备级(ji)(ji)数(shu)据(ju)(ju)(ju)(ju)进行网络级(ji)(ji)决策控(kong)制。

哑资源感知技术1) 多路暗光纤并行感知关键技术: 现(xian)网光缆数量庞(pang)大, 当前主要依(yi)靠人工管理, 性能不(bu)可(ke)(ke)视、 故障不(bu)可(ke)(ke)视, 管理效率和资源准确度面(mian)临(lin)极(ji)大挑战。 例行(xing)巡(xun)检(jian)光纤质量, 耗时耗力、 成(cheng)本高(gao)、 误(wu)差(cha)大; 业务扩容临(lin)时查找可(ke)(ke)用纤芯耗时长, 业务 TTM 保障难(nan)。

通过反射(she)光(guang)(guang)信号(hao)对散射(she)进行数字(zi)化逆向建(jian)模, 在线(xian)轮询(xun), 监控(kong)空闲纤芯质量, 解(jie)决空闲光(guang)(guang)纤性能监控(kong)问题, 实现多路暗(an)光(guang)(guang)纤并行感知, 如下图所示。

AI时代的硬核通信技术,中国移动光网络AI应用白皮书,颠覆三大应用场景 | 智东西内参

空闲纤芯质量智能监控原(yuan)理示意图(tu)

1. 汇(hui)聚机房到(dao)云, 逐站部署, 实时监控(kong)全量芯纤质量。

2. 汇聚机(ji)房到(dao)楼, 按需(xu)预(yu)连接, 1 芯以上监控到(dao)价(jia)值楼宇, 实现点亮(liang)光缆到(dao)楼宇, 资源预(yu)覆盖(gai), 保障专线(xian) TTM。

2ODN 光虹膜关键技术: 传统ODN网络采用人(ren)工管(guan)理模式(shi), 运营商无法直观(guan)地获取资源(yuan)和(he)拓(tuo)扑(pu)信息(xi)。 数(shu)字化(hua)ODN实现了(le)资源(yuan)层数(shu)字化(hua)管(guan)理资源(yuan)和(he)拓(tuo)扑(pu)信息(xi), 业务(wu)层管(guan)理业务(wu)的在线发放(fang)、 扩容和(he)故障管(guan)理服务(wu)。

传统(tong)ODN网络采用(yong)(yong)人工管理模式, 无法直观地获取资(zi)源(yuan)和拓扑信息, 运维困难。 数(shu)字化ODN通过(guo)光(guang)(guang)虹膜技术, 即利用(yong)(yong)不(bu)同用(yong)(yong)户光(guang)(guang)信号相位的改(gai)变, 结合AI算法识别其连接的ODN端口, 实现(xian)了(le)资(zi)源(yuan)层(ceng)的远程数(shu)字化管理, 提升了(le)ODN资(zi)源(yuan)利用(yong)(yong)准(zhun)确率, 支撑(cheng)ODN故障(zhang)的定(ding)界定(ding)位。 如图(tu)4-4所示, 在以下几方面使能ODN哑资(zi)源(yuan)数(shu)字化管理:

远(yuan)(yuan)程(cheng)自(zi)动验(yan)收: 远(yuan)(yuan)程(cheng)检测FAT端口(kou)搜集(ji)插(cha)损数(shu)据并(bing)自(zi)动记录到ODN管理系统中。

ODN拓(tuo)扑(pu)还原: 基(ji)于(yu)ODN资源数据(ju)库, 可以(yi)自动显(xian)示、 恢复(fu)与更(geng)新(xin)端(duan)到端(duan)拓(tuo)扑(pu)信息, 包(bao)括PON端(duan)口、主干(gan)光纤、 FAT端(duan)口、 入户配(pei)线光纤和ONT连接。

ODN光(guang)链路分(fen)析: 实现端到端监(jian)控与分(fen)析光(guang)链路插损数据(ju)。

动态(tai)资(zi)源监控(kong): 可以(yi)远(yuan)程自(zi)动监控(kong)FAT端口利用率。

AI时代的硬核通信技术,中国移动光网络AI应用白皮书,颠覆三大应用场景 | 智东西内参

光虹膜技术(shu)原理(li)示(shi)意图(tu)

业务质量感知关键技术。 业务质量感知包括业务和网络两个方面, 实现对二层, 三层以及传输层时延、 丢包和抖动的监测; 通过 Telemetry 等技术实现运行数据实时订阅上报。

业(ye)(ye)(ye)(ye)(ye)界当前的业(ye)(ye)(ye)(ye)(ye)务(wu)质(zhi)量检测(ce)/探(tan)测(ce)主要(yao)是带外探(tan)测(ce)技术, 业(ye)(ye)(ye)(ye)(ye)务(wu)检测(ce)/探(tan)测(ce)报文(wen)(wen)由相关功(gong)能模块单(dan)独发(fa)送(song)和(he)接(jie)收(shou), 和(he)用户实(shi)(shi)际业(ye)(ye)(ye)(ye)(ye)务(wu)流共用转发(fa)路径(jing), 与业(ye)(ye)(ye)(ye)(ye)务(wu)报文(wen)(wen)分离不(bu)严格(ge)对(dui)应, 因此探(tan)测(ce)结(jie)果与实(shi)(shi)际业(ye)(ye)(ye)(ye)(ye)务(wu)体(ti)验有偏差。 针对(dui)这(zhei)个缺点, 业(ye)(ye)(ye)(ye)(ye)界定义实(shi)(shi)现了(le) IOAM 等带内探(tan)测(ce)技术。 例如在(zai)原始数(shu)据报文(wen)(wen)中增加 OAM 检测(ce)头, 在(zai)业(ye)(ye)(ye)(ye)(ye)务(wu)转发(fa)路径(jing)中根据检测(ce)头进(jin)行数(shu)据采集, 再通过集中处理单(dan)元计算检测(ce)结(jie)果。 另(ling)外, 还可(ke)以通过测(ce)量业(ye)(ye)(ye)(ye)(ye)务(wu)报文(wen)(wen)的 TCP/UDP 传输(shu)特征, 来(lai)提取(qu)和(he)计算报文(wen)(wen)及业(ye)(ye)(ye)(ye)(ye)务(wu) KPI。 该(gai)方案(an)的优势在(zai)于(yu)可(ke)以单(dan)节点部署, 可(ke)随(sui)流检测(ce)连接(jie)质(zhi)量。

基(ji)于(yu)以(yi)上技术采集到的数据(ju), 大致分(fen)为体验 KQI(卡(ka)顿率、 加载时间等(deng)) 和应用(yong)(yong) KPI(时延(yan)、 抖动等(deng))两层; 体验 KQI 可(ke)以(yi)参考行(xing)(xing)标 YDT 2691 的定(ding)义, KQI 指标一(yi)般需要在内容侧和终端侧直接度量, 部(bu)分(fen)应用(yong)(yong)的 KQI 也可(ke)以(yi)采用(yong)(yong) DPI 方式进(jin)(jin)行(xing)(xing)测量, 但(dan)该(gai)方式依赖对应用(yong)(yong)层内容的解析(xi), 定(ding)制化(hua)较强, 不具备通用(yong)(yong)性(xing)。由(you)于(yu)体验 KQI 和应用(yong)(yong) KPI 通常存(cun)在定(ding)性(xing)关系, 应用(yong)(yong) KPI 可(ke)在传(chuan)输(shu)层进(jin)(jin)行(xing)(xing)指标建模, 不依赖于(yu)具体应用(yong)(yong), 具有更(geng)好的通用(yong)(yong)性(xing)。

2、云地协同全栈 AI 技术

 光网(wang)络 AI 技(ji)术(shu)研究面(mian)对模型泛(fan)化能力差、 模型部署(shu)(shu)要(yao)求(qiu)算力高、 本(ben)地样本(ben)少/标(biao)注难、 大数据管理(li)困(kun)难等问(wen)题(ti), 需要(yao)探索一种新(xin)的(de) AI 技(ji)术(shu)架(jia)构应对这些问(wen)题(ti), 加速 AI 应用的(de)规模部署(shu)(shu)。 新(xin)的(de) AI 技(ji)术(shu)架(jia)构需要(yao)满足具有以(yi)下特点:

1) 针对模(mo)型(xing)泛化能(neng)力(li)差问(wen)题: AI 模(mo)型(xing)应(ying)具有在线学习(xi)能(neng)力(li), 能(neng)够不断学习(xi)网(wang)络新特(te)征、 新变化。

2) 针对模型(xing)部(bu)署(shu)算力(li)要求高(gao)问题(ti): AI 模型(xing)训(xun)练(lian)应(ying)可集中(zhong)部(bu)署(shu)在算力(li)中(zhong)心或(huo)者支持(chi)分布式训(xun)练(lian)部(bu)署(shu)。

3) 针对样本(ben)少/标注难问题: 需要发挥(hui)群(qun)体智能, 多数据(ju)持有者(zhe)之间相互贡献(xian)数据(ju), 为(wei) AI 模型在(zai)线学习提供坚实数据(ju)基础。

4) 针(zhen)对大数据管理(li)困难: 网络数据种类(lei)多、 产生(sheng)数据快(kuai), 大量网元(yuan)产生(sheng)的 KPI、 日志(zhi)、 告警等(deng)海量数据, 需要建立专业体(ti)系(xi)化的数据治(zhi)理(li)工程。

针对光网络多边缘设(she)备+中心控制的组(zu)网特点, 云地协(xie)同 AI 技术架(jia)构是解(jie)决上述挑战的最佳(jia)解(jie)决方案。

云(yun)地(di)协同是指云(yun)端(duan)和地(di)端(duan)协作完成数(shu)据(ju)样本(ben)上(shang)云(yun)、 模型(xing)状态管理、 模型(xing)重训练、 模型(xing)/知识(shi)下(xia)发、 择优更新等一系(xi)列的(de)闭环任务, 同时把云(yun)端(duan)汇(hui)集(ji)的(de)全局网络知识(shi)经验、 全量数(shu)据(ju)训练得(de)到的(de)高精度(du)模型(xing), 持续(xu)注入地(di)端(duan), 让光网络 AI 能够进行(xing)智能迭代(dai)升级, 变得(de)越来越聪明, 如下(xia)图所(suo)示。

AI 服务(wu)包含(han)数据(ju)(ju)(ju)治理服务(wu)、 模型训(xun)练服务(wu)、 专家经验辅(fu)助(zhu)服务(wu), 涉(she)及(ji)运营(ying)商大量(liang)运营(ying)数据(ju)(ju)(ju)、 用户数据(ju)(ju)(ju)、网(wang)络数据(ju)(ju)(ju), 对(dui)数据(ju)(ju)(ju)安全要(yao)求很高, 云(yun)端(duan)适合部(bu)署在 IT 云(yun)。 实(shi)(shi)时海(hai)量(liang)数据(ju)(ju)(ju)并发(fa)上报、 处理加剧(ju)整(zheng)网(wang)压(ya)力,在地(di)端(duan)(包含(han)管控系统、 网(wang)元设备) 部(bu)署分布式 AI, 就近处理本地(di)实(shi)(shi)时海(hai)量(liang)数据(ju)(ju)(ju)。

AI时代的硬核通信技术,中国移动光网络AI应用白皮书,颠覆三大应用场景 | 智东西内参

云地协同全栈 AI 示意图

3、智能分析预测技术

网(wang)络(luo)(luo)出现问(wen)题后(hou)生成告(gao)(gao)警(jing), 触发故(gu)障(zhang)(zhang)(zhang)(zhang)定(ding)(ding)位(wei)和修(xiu)复是(shi)当前网(wang)络(luo)(luo)运维的普遍(bian)方式, 海量告(gao)(gao)警(jing)上(shang)报导(dao)致故(gu)障(zhang)(zhang)(zhang)(zhang)根(gen)因(yin)定(ding)(ding)位(wei)困难、 静默(mo)故(gu)障(zhang)(zhang)(zhang)(zhang)无告(gao)(gao)警(jing)上(shang)报导(dao)致无法定(ding)(ding)位(wei)故(gu)障(zhang)(zhang)(zhang)(zhang)根(gen)因(yin), 是(shi)根(gen)因(yin)告(gao)(gao)警(jing)分析的两(liang)大难题。 为了进一步提升网(wang)络(luo)(luo)可靠性和运营效率, 对网(wang)络(luo)(luo)故(gu)障(zhang)(zhang)(zhang)(zhang)、 业务资(zi)源需求等进行提前预测, 也是(shi)当前研(yan)究的热点问(wen)题。

智能(neng)关(guan)(guan)联分(fen)(fen)析(xi)是光网(wang)络(luo)根(gen)因告(gao)警分(fen)(fen)析(xi)和(he)静默(mo)故障(zhang)定(ding)位的关(guan)(guan)键能(neng)力(li)。 由于网(wang)络(luo)数据量大、 维度多和(he)故障(zhang)模式(shi)多样化, 且关(guan)(guan)联影(ying)响发散(san), 需要(yao)(yao)精准(zhun)的筛查(cha)和(he)多维度关(guan)(guan)联分(fen)(fen)析(xi)能(neng)力(li), 需要(yao)(yao)通(tong)过(guo)智能(neng)分(fen)(fen)析(xi)技术, 构(gou)建关(guan)(guan)联模型(xing)和(he)进行(xing)相关(guan)(guan)训(xun)练, 实现根(gen)因告(gao)警识别和(he)静默(mo)故障(zhang)定(ding)位。 智能(neng)资源(yuan)预测(ce)和(he)故障(zhang)风险预测(ce)可提前发现资源(yuan)瓶颈和(he)故障(zhang)风险, 提升业务 TTM 和(he)业务可靠性。

光网(wang)络智(zhi)能分(fen)析预(yu)测(ce)能力(li)需在网(wang)元(yuan)(yuan)和管控(kong)层(ceng)面分(fen)别构筑对(dui)应的智(zhi)能分(fen)析能力(li)。 通过分(fen)层(ceng)实现智(zhi)能 AI分(fen)析预(yu)测(ce)能力(li), 基于(yu)高精度(du)数(shu)据(ju)的短周期预(yu)测(ce), 需在网(wang)元(yuan)(yuan)进(jin)行高速数(shu)据(ju)采集(ji)处理和分(fen)析预(yu)测(ce)闭(bi)环, 提升分(fen)析效(xiao)率; 基于(yu)数(shu)据(ju)粒度(du)较大的长周期预(yu)测(ce), 可(ke)通过管控(kong)系统长周期数(shu)据(ju)采集(ji)和分(fen)析预(yu)测(ce)闭(bi)环。

AI时代的硬核通信技术,中国移动光网络AI应用白皮书,颠覆三大应用场景 | 智东西内参

智能分析预测(ce)分层闭环示(shi)意图

智能(neng)预测一般采(cai)用(yong)时(shi)间序列模(mo)型+训练学习(xi)方(fang)式(shi)实(shi)现。 光(guang)网(wang)络常(chang)见时(shi)间序列模(mo)型:

a) 差分回归(gui)移动平均(jun)模型(ARIMA)[3-4]:在(zai)光网(wang)络(luo)中可以利用 ARIMA 模型进行根(gen)据网(wang)络(luo)资源预测。

b) PROPHET 模型: 该(gai)方法对历史(shi)数(shu)据(ju)(ju)(ju)的依赖(lai)度较低, 可(ke)以在一(yi)定数(shu)据(ju)(ju)(ju)缺失(shi)的情况下, 仍能保持较好的预测效果。 光(guang)波长通道余(yu)量预测因(yin)关(guan)联数(shu)据(ju)(ju)(ju)比(bi)较离散(san)适用于该(gai)方法。

根据实际应用场景选(xuan)择合适的模型后, 还需要进行相(xiang)应的模型训(xun)练(lian)和(he)参(can)数调整(zheng), 使得在特(te)定场景下能够有(you)较高的预测精度。 由于不(bu)同场景特(te)点(dian), 需建立(li)对应特(te)征的参(can)数库和(he)多(duo)样化的训(xun)练(lian)模型样本。

4、智(zhi)能仿真决策技术

光网络(luo)仿(fang)真(zhen)能(neng)够为(wei)网络(luo)规(gui)划、 设(she)计(ji)(ji)、 配(pei)置(zhi)以及网络(luo)自优化(hua)(hua)(hua)(如网络(luo)路径(jing)优化(hua)(hua)(hua)、 网络(luo)资源性能(neng)优化(hua)(hua)(hua)等)提(ti)供可(ke)靠(kao)依(yi)据, 通(tong)过对(dui)配(pei)置(zhi)和优化(hua)(hua)(hua)结(jie)果下发前进行(xing)事前仿(fang)真(zhen)决策, 确保配(pei)置(zhi)和优化(hua)(hua)(hua)结(jie)果的自动、 准确、 可(ke)信任执行(xing), 保障业务安(an)全(quan)。 网络(luo)仿(fang)真(zhen)能(neng)够有(you)效地验证实际方(fang)案或比较多(duo)个不同的仿(fang)真(zhen)设(she)计(ji)(ji)以及组织方(fang)案,以便于对(dui)不同的设(she)计(ji)(ji)方(fang)案建立模型, 实施模拟, 对(dui)网络(luo)性能(neng)预测(ce)数据采取顶定量获取, 为(wei)设(she)计(ji)(ji)、 配(pei)置(zhi)方(fang)案的比较和验证提(ti)供可(ke)靠(kao)的依(yi)据。

网(wang)络(luo)(luo)(luo)仿(fang)真(zhen)决(jue)(jue)(jue)策技(ji)术(shu)(shu)是一(yi)种利用(yong)数学建(jian)模(mo)和统计(ji)(ji)分析(xi)的方(fang)法模(mo)拟(ni)网(wang)络(luo)(luo)(luo)决(jue)(jue)(jue)策行为, 通过建(jian)立网(wang)络(luo)(luo)(luo)信(xin)息的统计(ji)(ji)模(mo)型, 模(mo)拟(ni)网(wang)络(luo)(luo)(luo)操(cao)作(zuo)执行, 获取网(wang)络(luo)(luo)(luo)设计(ji)(ji)及优(you)化所需要的网(wang)络(luo)(luo)(luo)性能数据的一(yi)种技(ji)术(shu)(shu)。 网(wang)络(luo)(luo)(luo)仿(fang)真(zhen)有(you)三个阶(jie)段(duan): 准备(bei)阶(jie)段(duan)-模(mo)型设计(ji)(ji)-仿(fang)真(zhen)与结果分析(xi)。 AI 技(ji)术(shu)(shu)已(yi)经应用(yong)到网(wang)络(luo)(luo)(luo)仿(fang)真(zhen)各(ge)个阶(jie)段(duan), 在光(guang)网(wang)络(luo)(luo)(luo)中, 智能仿(fang)真(zhen)决(jue)(jue)(jue)策技(ji)术(shu)(shu)已(yi)经开始在网(wang)元、 管控(kong)系(xi)统中开始研究。

1. 网元设备中智能(neng)仿(fang)真决策的应(ying)用及(ji)关键技术(shu):

在仿(fang)真的基础准备阶段, 开始构建(jian)全(quan)光(guang)参量(liang)数(shu)字(zi)孪生底座(zuo), 通过 Sensor 体系实(shi)(shi)现(xian)上报全(quan)量(liang)光(guang)参, 在线学(xue)习, 精准计算噪音、 代(dai)价、 余量(liang)等, 支撑(cheng)对网元实(shi)(shi)时(shi)状态(tai)的全(quan)量(liang)认(ren)知。

在(zai)(zai)仿真的(de)模(mo)(mo)型(xing)(xing)设计阶段, 除(chu)了(le)对(dui)网元(yuan), 单(dan)板, 端口, 滤波器等基(ji)础建(jian)模(mo)(mo)外, 通过(guo)离(li)线(xian)和在(zai)(zai)线(xian)大(da)数(shu)据学习(xi), 对(dui)光(guang)传输(shu)质(zhi)量(liang)进行在(zai)(zai)线(xian)建(jian)模(mo)(mo), 比(bi)如: EDFA 模(mo)(mo)型(xing)(xing)(增益、 噪声)、 滤波代价模(mo)(mo)型(xing)(xing)、 Raman 放大(da)器、 BER/Q模(mo)(mo)型(xing)(xing)、 OSNR 模(mo)(mo)型(xing)(xing)、 光(guang)纤质(zhi)量(liang)模(mo)(mo)型(xing)(xing)、 光(guang)模(mo)(mo)块(kuai)质(zhi)量(liang)模(mo)(mo)型(xing)(xing)等。

在仿真(zhen)与结果分析阶段, 通过 AI 迁移学(xue)习算法、 回归算法等实(shi)现余(yu)量动态监(jian)控以及自(zi)优(you)化(hua)执行结果分析, 做到自(zi)动调整(zheng)优(you)化(hua)方(fang)案, 以及实(shi)时(shi)自(zi)调优(you)。

2. 管控系统中智能(neng)仿真决策的应用及关键技(ji)术:

在仿真的基础准(zhun)备阶段, 通过知识(shi)图谱(pu)构建网(wang)络运维知识(shi)库、 图神经网(wang)络来预测网络的 SLA 等(deng)技术来感知(zhi)和理解网络。

在仿真模型(xing)设计阶段, 通过(guo)数(shu)字孪生网(wang)(wang)络的(de)五维(wei)模型(xing), 多维(wei)模型(xing)包(bao)括基础模型(xing)和功能模型(xing), 多维(wei)度(du)刻画网(wang)(wang)络特征(zheng), 支持网(wang)(wang)络规划建议以(yi)及运维(wei)优化的(de)仿真验(yan)证。

在仿真(zhen)(zhen)与结(jie)果分析阶段, 根据仿真(zhen)(zhen)执行(xing)结(jie)果和数(shu)据, 通过从(cong)路径/轨迹决策(ce)规划、 行(xing)为(wei)/任务(wu)决策(ce)规划、执行(xing)计划决策(ce)规划等数(shu)学建(jian)模到数(shu)学求解, 来决策(ce)仿真(zhen)(zhen)执行(xing)的(de)最(zui)终效果。

智东西认为,如今人工智(zhi)(zhi)能的(de)应(ying)用(yong)已无处不在(zai)(zai),智(zhi)(zhi)能语音(yin)助手、人脸识别(bie)、智(zhi)(zhi)能家居(ju)、智(zhi)(zhi)能安(an)防等都开(kai)始(shi)应(ying)用(yong)于我们(men)生活的(de)方(fang)方(fang)面(mian)面(mian),而(er)这些应(ying)用(yong)的(de)背后离不开(kai)通信网(wang)络(luo)的(de)支撑(cheng)。现在(zai)(zai),人工智(zhi)(zhi)能技术在(zai)(zai)光网(wang)络(luo)物理层和(he)网(wang)络(luo)层都获得了(le)初步应(ying)用(yong)尝试(shi);与此同时,光网(wang)络(luo)的(de)智(zhi)(zhi)能化面(mian)临诸多挑战,有(you)待(dai)在(zai)(zai)算法和(he)应(ying)用(yong)方(fang)面(mian)继续(xu)探索!