智东西(公众号:zhidxcom)
作者 |  徐豫
编辑 |  心缘

智东(dong)西(xi)10月25日报(bao)道,在10月23日举行的(de)OceanBase 2024年度发布(bu)会上,OceanBase数(shu)据库OceanBase 4.2.5 LTS、OceanBase 4.3.3正式发布(bu),OceanBase 4.4开启内(nei)测(ce),OceanBase云数(shu)据库即日起免费提(ti)供365天的(de)试用期。而OceanBase首批分布(bu)式数(shu)据库今年已(yi)通过中(zhong)国信息安全测(ce)评中(zhong)心的(de)“安全可靠测(ce)评”。

基于(yu)单机(ji)分布(bu)式一体化架构和AI技术,OceanBase数(shu)据库大幅优化了可扩展性、实时分析(xi)、消除数(shu)据孤岛、跨云部署、多模态、向(xiang)量搜(sou)索、容灾(zai)等方(fang)面的性能。

同时,有了专有云和公有云服(fu)务“双引擎”加(jia)持,今年OceanBase的客户(hu)数成功突破2000家(jia),行业解决方(fang)案伙伴(ban)增速(su)(su)超(chao)100%,热门解决方(fang)案落地增速(su)(su)超(chao)50%,核(he)心(xin)经(jing)销商伙伴(ban)业绩占比超(chao)60%。

一、新版数据库正式对外开放,强化实时数据处理水平

OceanBase CEO杨冰正式宣布推(tui)出OceanBase 4.2.5 LTS版本和OceanBase 4.3.3首个GA版本。

OceanBase 4.2.5 LTS版(ban)本相较于此前的(de)4.2.1 LTS版(ban)本TP性能提升了26%,小规格(ge)4C TP性能则提升了37%,系统的(de)处理能力(li)得到较大提升。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

同时(shi),其(qi)融合了OBKV-HBase和(he)OBKV-Redis两个不同模态的(de)数据库,可以兼(jian)顾HBase的(de)大(da)规模数据存储和(he)处理优(you)势,以及(ji)Redis的(de)高速缓存和(he)实时(shi)读写能力。

此外,据OceanBase CTO杨传(chuan)辉透露,该版本(ben)还(hai)可(ke)兼(jian)容(rong)甲骨文的(de)数(shu)据库(ku),用户托(tuo)管(guan)在(zai)甲骨文数(shu)据库(ku)5.7版本(ben)的(de)数(shu)据,可(ke)以不改(gai)代码平滑迁移至OceanBase 4.2.5 LTS版本(ben)的(de)数(shu)据库(ku)。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

与4.3.0版本相比,OceanBase 4.3.3版本TPC-H 1T提升(sheng)了(le)64%,TPC-DS 1T提升(sheng)了(le)36%,宽表性能(neng)ClickBench hot-run提升(sheng)了(le)49%,还新增了(le)向量(liang)检(jian)索能(neng)力。

杨(yang)传辉称,该版(ban)本是面向实时AP场景的(de)(de)首(shou)个公开版(ban)本,兼容特(te)定的(de)(de)数(shu)(shu)据(ju)类型,支持(chi)快速导入导出(chu),并(bing)且针对(dui)特(te)定场景预设了(le)(le)AP参数(shu)(shu)模板,免去(qu)了(le)(le)用(yong)户重新(xin)补充(chong)参数(shu)(shu)的(de)(de)功夫(fu)。据(ju)杨(yang)冰透露,过去(qu)一(yi)年已(yi)有(you)大约60个客(ke)户试用(yong)该系列的(de)(de)小(xiao)版(ban)本,并(bing)给出(chu)了(le)(le)不错(cuo)的(de)(de)使用(yong)反馈。

二、采取单机分布式一体化架构,兼具性能和成本优势

对于数(shu)据库而(er)言(yan),其采用集中式架构(gou)通常(chang)会(hui)在兼容(rong)性(xing)(xing)、易用性(xing)(xing)、单机性(xing)(xing)能上(shang)较为突出(chu),而(er)选择(ze)分(fen)布式架构(gou)则(ze)更(geng)多是在扩展性(xing)(xing)、可用性(xing)(xing)和(he)成(cheng)本(ben)上(shang)占优势。

OceanBase的数(shu)据库则依(yi)靠的是“单(dan)机(ji)分(fen)布式(shi)一体化”架(jia)(jia)构(gou),既考(kao)虑到分(fen)布式(shi)架(jia)(jia)构(gou)的扩展性,又具备集中式(shi)的功能(neng)和单(dan)机(ji)性能(neng),还能(neng)同时处理结构(gou)化和非结构(gou)化数(shu)据。

杨(yang)传辉解(jie)(jie)释道,这是因为OceanBase希望能用(yong)(yong)一个数据(ju)(ju)库,去解(jie)(jie)决至少80%的数据(ju)(ju)问题,使数据(ju)(ju)库变得普惠和通用(yong)(yong)。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

从OceanBase多个(ge)实际客户案(an)例中可(ke)以(yi)看(kan)到,企(qi)业用户选择单(dan)机分布式一体化架(jia)构(gou)后,等同于只花(hua)费一个(ge)系统(tong)的钱,能获得两份甚(shen)至(zhi)多分复合收益。

例如(ru),山(shan)东移动此(ci)前(qian)用的(de)是(shi)甲骨(gu)文(wen)数(shu)据库,基础设施基于传统“IOE”架构(gou),扩展能力受限,也(ye)难(nan)以应对高峰期流量和复杂查询场(chang)景(jing)。其(qi)转用OceanBase的(de)数(shu)据库后,计费(fei)系(xi)统效率提升了近30%,整体成本降(jiang)低了9成。

同时,通过跨多数据中心分布式集(ji)群部署,山(shan)东(dong)移动的(de)(de)数据库能达到机房级别的(de)(de)容灾效果。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

三、AI Agent的数据底座,可理解并执行复杂语义

OceanBase将其一(yi)体化数据(ju)(ju)库视作(zuo)AI时代的数据(ju)(ju)底座,旨在让(rang)AI技(ji)术像数据(ju)(ju)库一(yi)样通用。目前,AI技(ji)术已渗透该公司数据(ju)(ju)库的开发、运维(wei)、诊断等环节。

如果用(yong)不(bu)同的数据(ju)库处理不(bu)同类型的数据(ju),这通(tong)常存在(zai)研(yan)发(fa)成本高、传(chuan)(chuan)输过程复杂、查询路径繁(fan)琐等弊端(duan)。杨(yang)传(chuan)(chuan)辉称(cheng),在(zai)通(tong)用(yong)数据(ju)库中(zhong)集成向量插件后,OceanBase的所有底(di)层能力都(dou)可以(yi)直接复用(yong)。

除此之外,OceanBase一体化数据库还融入(ru)了LangChain、Llamaalndex、DB-GPT等主流AI技术栈。

现场杨传辉用ANN Benchmarks基准(zhun)测试(shi)验证OceanBase一(yi)体化数(shu)据(ju)库(ku)的(de)向量(liang)性(xing)能。从测试(shi)结果来看,其向量(liang)引擎在准(zhun)确率、速度等多维(wei)度上超过业界头部水平。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

在C端应(ying)用方面,OceanBase与蚂蚁(yi)集团(tuan)(tuan)的(de)生态建(jian)立了(le)紧密结(jie)合。支小(xiao)宝、蚂小(xiao)财、支付(fu)宝百(bai)宝箱(xiang)Agent,以及包括AI健康管家(jia)在内的(de)3个蚂蚁(yi)集团(tuan)(tuan)AI管家(jia),它们的(de)数据底座都用的(de)是OceanBase一体化数据库(ku)和架(jia)构。

其中,支付(fu)宝(bao)百宝(bao)箱Agent是(shi)一个搭载了AI能力(li)的(de)小程(cheng)序。该Agent可(ke)以读懂(dong)复杂语(yu)义,为用户检索、筛选、推荐吃(chi)喝玩乐(le)的(de)店铺。

杨(yang)冰称,此(ci)类Agent背(bei)后需要涉及复(fu)杂的(de)(de)语义交互,过去通常依(yi)赖大量地理(li)位置(zhi)、向量的(de)(de)存(cun)储来实(shi)(shi)现这一(yi)功能,产品开发(fa)周期(qi)也长。而得益于OceanBase一(yi)体化数据库和架(jia)构(gou),该平(ping)台仅由(you)两名开发(fa)者(zhe)耗(hao)时(shi)(shi)一(yi)周的(de)(de)时(shi)(shi)间,便(bian)实(shi)(shi)现了从构(gou)思到(dao)产品的(de)(de)落地。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

▲在支(zhi)付宝(bao)百宝(bao)箱Agent的聊天框中输入“推荐距离两公里以(yi)(yi)内,人均(jun)消费25元以(yi)(yi)下,评价(jia)4.5分以(yi)(yi)上,不用排队的奶茶(cha)店”

四、公有云和专有云成为商业化双引擎,超6成客户为千亿级规模

除(chu)了OceanBase一体(ti)化数据(ju)库和架构,该公司的多云服(fu)务也实现了全新升级。

OceanBase上新(xin)Free Trial入(ru)口(kou),即开发者(zhe)可以在一年内免费(fei)试用(yong)OceanBase云数(shu)据(ju)(ju)库(ku),也能自由(you)选(xuan)(xuan)择所需的云服务商。此外,OceanBase云数(shu)据(ju)(ju)库(ku)不久后将在阿里云精选(xuan)(xuan)市场中(zhong)开放接入(ru)。

而OceanBase 4.4实验室版本正式(shi)开(kai)启内(nei)测,主推存(cun)算(suan)分(fen)离和(he)共享(xiang)存(cun)储(chu)架构。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

迄今为止(zhi),主流计(ji)算机的资源利用率大部分情况(kuang)下只有(you)个位数。OceanBase创始人兼(jian)首席科(ke)学家阳振坤(kun)建议,若想给(ji)客户带来“用一份(fen)(fen)硬(ying)件的钱买到了两份(fen)(fen)硬(ying)件”的使(shi)用体验(yan),公有(you)云、专有(you)云、行业云等多云服务一方(fang)面可以(yi)通过资源池化和(he)(he)复用来降(jiang)低成本,另一方(fang)面可以(yi)通过动态伸缩和(he)(he)按需使(shi)用提升效率。

据(ju)杨传辉透露(lu),OceanBase云数(shu)据(ju)库已(yi)经在公有云上实现(xian)基于对(dui)象存储的存算(suan)分离,并且用(yong)起(qi)来“性价(jia)比高”。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

经(jing)过(guo)4年的(de)商业(ye)化(hua)摸索,OceanBase今年客(ke)户数突破2000家,连续4年增(zeng)速超100%,并且(qie)中小客(ke)户占比相较于(yu)去年进一步扩(kuo)大至80%。

当(dang)前,该公(gong)司形成了“双(shuang)引(yin)擎”的商业发展模式,主(zhu)要增(zeng)长动力来自(zi)专有(you)云(yun)(yun)服(fu)务。从2022年到(dao)2024年,其(qi)专有(you)云(yun)(yun)客户数增(zeng)速达(da)到(dao)50%,包(bao)括中国(guo)南(nan)方(fang)航空等航空公(gong)司,北京、西安等多地地铁运营商,汇(hui)丰银(yin)行、交通银(yin)行等金融单(dan)位。

而同期其(qi)公有云客户(hu)数(shu)增(zeng)速为(wei)(wei)130%,成为(wei)(wei)OceanBase的第二增(zeng)长引擎。其(qi)客户(hu)集中于(yu)零售、智能制造、互联网金(jin)融行业,包括小米、科大讯飞、Vivo等(deng)高增(zeng)长公司和行业独(du)角兽(shou)。

杨冰称,超千亿(yi)交易规(gui)模(mo)的支付企业和超千亿(yi)规(gui)模(mo)的消费电子企业均超6成在使(shi)用(yong)OceanBase公(gong)有云服务(wu)。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

两年(nian)前,OceanBase曾在(zai)当时的(de)年(nian)度发布会上宣布了其“珊瑚计划”,旨(zhi)在(zai)构建一(yi)个以(yi)合作伙伴为中心(xin)的(de)商业生(sheng)态模(mo)式(shi)。该计划的(de)核心(xin)目标是在(zai)未(wei)来3年(nian)内与(yu)60家核心(xin)经销商达成合作,并且合作伙伴的(de)收入占比达到(dao)60%以(yi)上。

从今年的(de)战果(guo)来看,该公(gong)司超前完成了这一目(mu)标。现(xian)在OceanBase累计(ji)有超150家(jia)核(he)心经销(xiao)商(shang),签约(yue)占比(bi)达70%,业绩占比(bi)超过6成。未来该公(gong)司将持续(xu)下沉二线、三(san)线、四(si)线城市,并计(ji)划在出海市场中寻求新(xin)的(de)增长动(dong)力。

五、无论是金融还是出行产品,都需要一个国产的、更安全的数据库

OceanBase的(de)(de)(de)生态合(he)作伙伴覆盖了(le)金(jin)融(rong)、政务、交(jiao)通、能(neng)源、科技、公共服务等多个领域。在《共话云和AI时(shi)代的(de)(de)(de)数(shu)据库》的(de)(de)(de)圆(yuan)桌论坛上(shang),部分(fen)生态合(he)作伙伴分(fen)享(xiang)了(le)他们对于OceanBase新版数(shu)据库的(de)(de)(de)第一感受。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

据IDC中国副(fu)总裁兼首席分析师武连峰(feng)透露,虽然(ran)全(quan)球已有17%的(de)(de)企(qi)业(ye)把(ba)生(sheng)成式AI技术应用到(dao)企(qi)业(ye)生(sheng)产的(de)(de)过程(cheng)中,但实际上只有11%左右的(de)(de)企(qi)业(ye)真正(zheng)落(luo)地了(le)“DateBase for AI”,或者“AI for DateBase”,主要是因为(wei)准确率达不到(dao)95%的(de)(de)标(biao)准。

中国(guo)人保(bao)财险(xian)科(ke)技运(yun)营部副总经理(li)张帆称,单库40个(ge)TB的(de)(de)数据处理(li)是基操,数据库的(de)(de)安全性和稳定性也愈发重要,因此保(bao)险(xian)行业未来(lai)更需(xu)要一个(ge)国(guo)产化的(de)(de)、多(duo)模的(de)(de)、支(zhi)持多(duo)云的(de)(de)、可靠的(de)(de)、具有AI能(neng)力(li)的(de)(de)数据库产品。

T3出(chu)行数(shu)据库负(fu)责人(ren)高(gao)建丰认(ren)为,数(shu)字化出(chu)行的(de)调度(du)过程(cheng)需(xu)要大量实(shi)时(shi)数(shu)据来支撑。因此(ci),一(yi)个实(shi)时(shi)分析能力(li)强,并(bing)且可(ke)(ke)以节省(sheng)人(ren)力(li)、物(wu)力(li)、研发资源,低(di)成本可(ke)(ke)用的(de)数(shu)据库产品,在他看(kan)来是(shi)一(yi)种更好的(de)技术解决(jue)方案(an)。

中国联合(he)航空有(you)限公司信(xin)息(xi)中心(xin)总经理冯振宇则(ze)将数据(ju)库和AI的关系(xi),比作“好马配(pei)好鞍”。在他看来,OceanBase数据(ju)库的新(xin)版本、新(xin)产品可以将原有(you)的系(xi)统原封不动地集成到新(xin)的平台下,能够把现有(you)的资产盘活(huo),变成真正(zheng)的数字资产,已经称得上(shang)是“好马”。

同时,OceanBase结合(he)AI技术,为(wei)其架构(gou)推出全新的(de)向(xiang)量搜索能力(li)。冯振宇(yu)认为(wei),这不仅拓宽(kuan)了图片等(deng)数据资产的(de)范围(wei),也使AI初具“马鞍(an)”的(de)雏形。

六、AI时代的新风口,“让数据好用,把数据用好”

钱卫宁(ning)是华东(dong)师范大学数(shu)据学院(yuan)院(yuan)长(zhang)和CCF数(shu)据库专委(wei)会常(chang)委(wei)。此次OceanBase 2024年度(du)发布会上,他也受邀分(fen)享了自己在数(shu)据库领域(yu),从学生身份(fen)转变(bian)到导师身份(fen)这一过程中的观察。

他认为AI行业(ye)(ye)中的(de)核心变化是(shi)数(shu)据智能的(de)变化。从某种程度上来说,“互联网企业(ye)(ye)是(shi)最早(zao)的(de)AI企业(ye)(ye),”钱卫宁解释道,人(ren)们很(hen)早(zao)就开始尝试把手头上的(de)事(shi)情(qing)交给(ji)机器去(qu)做,这也(ye)意(yi)味着(zhe)人(ren)们逐步建立(li)起对底层数(shu)据库的(de)信任(ren)。

随着互(hu)联网行业不断重构各行各业,该(gai)行业内逐步孵化出了(le)数字化这一概(gai)念。数据可视作一种“新能源”,如(ru)何在(zai)新的(de)AI时代中(zhong)将其真正大众化,将其变得“唾手可得”。在(zai)钱卫(wei)宁看(kan)来,这是对数据库厂商(shang)的(de)关键考(kao)验(yan)。

目前(qian),基本上每个大(da)型企业都(dou)部署(shu)了专用(yong)(yong)的(de)数(shu)据(ju)(ju)库(ku)。然而,同(tong)时(shi)在线使用(yong)(yong)数(shu)据(ju)(ju)库(ku)的(de)用(yong)(yong)户在数(shu)量和(he)使用(yong)(yong)方式上都(dou)愈发不可控(kong),原本单机形式的(de)数(shu)据(ju)(ju)库(ku)已经不足(zu)以满足(zu)用(yong)(yong)户需(xu)求(qiu),也因(yin)此催生了分布式数(shu)据(ju)(ju)技术和(he)分布式数(shu)据(ju)(ju)库(ku),让企业能(neng)够以更(geng)低(di)的(de)成(cheng)本来(lai)管理(li)好(hao)数(shu)据(ju)(ju)。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

分布并行(xing)数(shu)(shu)据(ju)库、云(yun)原生(sheng)(sheng)数(shu)(shu)据(ju)库和开源(yuan)数(shu)(shu)据(ju)库是(shi)未来数(shu)(shu)据(ju)库的(de)(de)三大衍生(sheng)(sheng)方(fang)向。钱卫宁(ning)称,“现在是(shi)中(zhong)国数(shu)(shu)据(ju)库最好(hao)的(de)(de)时代”,而类(lei)似于OceanBase的(de)(de)做法,去集成、协同不同垂直领域的(de)(de)数(shu)(shu)据(ju)库,则(ze)是(shi)新(xin)的(de)(de)机遇。

结语:OceanBase独立分拆后的首次年度发布,商业化成果是其最大的底气

从(cong)V1.0版本(ben)走到(dao)V4.3版本(ben),从(cong)分(fen)布式到(dao)一(yi)(yi)体(ti)化,从(cong)TP到(dao)HTAP再(zai)到(dao)SQL+NoSQL,OceanBase数据库和架构持续(xu)朝着一(yi)(yi)体(ti)化的方向升级迭代。最新的V4.3版本(ben)则基于一(yi)(yi)体(ti)化产品,推出了全新的向量能力,实现SQL+AI的深度融合。

OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AI Agent

目前,OceanBase的业(ye)务不仅覆盖了(le)头(tou)部政(zheng)企、行(xing)业(ye)独(du)角兽,也(ye)兼顾了(le)中小客户。其公有(you)云服务已触(chu)及全球范围内100多个(ge)可用区,并且兼容多家主流公有(you)云基础设施。

OceanBase今年(nian)3月才从(cong)蚂(ma)蚁(yi)集团中(zhong)分拆出来,成(cheng)为(wei)一家独(du)立运营的公(gong)司,这也意味着(zhe)其背负了更(geng)大(da)的财(cai)务压(ya)力(li)。从(cong)此次年(nian)度(du)发(fa)布会中(zhong)可以看到,距离(li)蚂(ma)蚁(yi)集团组织架构改革已过去将近(jin)半(ban)年(nian)的时间,OceanBase不仅持(chi)续迭代升(sheng)级其开源(yuan)数据库,还构建(jian)了在海内(nei)外市(shi)场的商(shang)业竞(jing)争优势。