从边缘到中央:软件国产化的隐秘战线
导语:从边缘到中央:软件国产化的隐秘战线
2008年,中国联通收到了美国数据库企业甲骨文(Oracle)的一纸罚款通知,后者张口就要6000万人民币。
当时,甲骨文是中国联通的数据库供应商,后者的计费、结算、缴费等核心业务都搭载在甲骨文数据库上。按照甲骨文的售卖方式,除了购买软件时按服务器数量支付一次性费用,每年还需要交大概22%的技术服务费,一旦采购新版本的软件,还得额外付费。不过,中国联通嫌服务费太贵,一直没交。
后来,联通有意采购甲骨文的新产品,但后者提出先交清欠下的服务费,这就是“罚款”的来源。最终,联通不仅乖乖交了罚款,还继续购买了它的产品。
众所不周知的是,甲骨文其实是第一个进入中国市场的大型软件公司。2008年,仅在通信行业,甲骨文就覆盖了18家省级以上的通信公司,包括中国移动和上文的中国联通。
和芯片、操作系统一样,数据库曾是国内公司被“卡脖子”的重灾区,也是甲骨文在中国大赚特赚的原因。
2001年,甲骨文在中国总收入增长超过32%,远高于其全球25%的增速。同一年,美国《商业周刊》杂志给国内大公司CEO的薪酬排了个名,甲骨文CEO拉里·埃里森以7.06亿美元名列榜首,比第二位的JDSUniphase光纤公司CEO约瑟夫·斯特劳斯足足多出来6个亿。
和如今国内在芯片制造等环节面对的围堵类似,以数据库、服务器为代表的底层软件技术,一度中国科技领域的重大短板,而在这个普通消费者并不熟悉的领域,也经历过一场长达十多年的漫长攻坚。
甲骨文的中国故事2002年,拉里·埃里森做客央视《对话》栏目,一度口出狂言[2]:“我们(在中国)的目标是既垄断又不违法。”
作为在微软如日中天的年代当过全球首富的人,拉里·埃里森一贯性格张扬口无遮拦,喜欢买飞机玩游艇,说过不少类似“我代表全人类向比尔·盖茨宣战”这种话。1997年,其第一本自传出版,作者迈克·威尔逊(Mike Wilson)将传记定名为《拉里·埃里森与上帝的不同点》(The Difference Between God and Larry Ellison)。
拉里·埃里森在西班牙赢得国际帆船比赛后,挥舞着美洲杯奖杯,2010年
甲骨文的拳头产品是“关系型数据库”,顾名思义,即储存和管理数据的软件产品,和操作系统、中间件并称为软件的三大件。
举例来说,假设需要一张表格来记录书架里的书,每一行都代表不同的书,而每个格子则代表不同的属性,比如书名、数量、作者等等。当我们想要找到某一本书时,只需要在表格里搜索相应的行和格子就可以了。
但如果有几万甚至几十上百万本书需要记录,每本书又有很多不同的属性,比如书名、作者、出版社、ISBN号码等等,这些书还可能还有某种“关系”,比如同一作者写了好几本书,很多书来自一个出版社,这种数据库的储存和调用就会非常复杂。
既需要保证稳定,又需要不断提高效率,其实是很大的技术挑战。《碟中谍5》中,阿汤哥跳进水中数据中心进而黑掉保安系统的片段,看上去科幻,实际上一点不夸张。就连水下数据库在现实中也能找到原型——2015年,微软就在水下部署了一个数据中心。
微软在苏格兰测试水下数据中心
早在1980年,甲骨文就开始为美国军方供应数据库产品,并在随后商业化,起步非常早。后来甲骨文进入中国,恰好赶上金融、电信等领域国企信息化的浪潮,大量的市场需求几乎全被甲骨文收入囊中。根据IDC的调研,甲骨文在中国的市场份额在2008年达到顶峰,接近50%。
考虑到金融、电信、邮政这类业务对系统稳定的极高要求,同时,在一些关键服务上,中国数据库产品拿不到开放端口,导致国产数据库和海外软件不能实现互通,让海外产品形成了事实上的垄断。面对这一层背景,只能无奈地承认,有些钱的确得让甲骨文赚。
甲骨文在中国的如日中天,其实是彼时中国软件产业在底层技术上积累薄弱的一个缩影。甲骨文最风光的时期,中国的互联网公司同样在社交、电商、游戏等各大赛道高歌猛进,但在以“三大件”为代表的底层软件技术上,国内反而在不断积累着欠账。
解决这个问题的答案,并不是技术,而是市场。
昂贵的市场1986年3月,以基础科研项目攻坚为核心的“863计划”出炉,其中就设立了“数据库重大专项”,由高校和科研机构牵头开展技术突围。
如今国内主要的数据库公司,几乎都有高校背景,比如人民大学负责的人大金仓,南开大学牵头的南大通用,浙江大学布局的神舟通用,以及去年交表,由华中科技大学带大的达梦数据。
同一时期,在国家意志的主导下,技术自主的呼声在芯片、操作系统、数据库等各条战线上高歌猛进。但从结果看,即便学界有诸多“达到国际水平”的成果,但往往止步于产业化,难以推向市场。很多技术成果在评审会上展示验收完,就被束之高阁。
具体到数据库,这类产品一方面技术难度大,需要的投资额也非常高,另一方面由于数据体量巨大,基于数据的业务又在时刻运转,因此迁移成本非常高,很容易形成对供应商的依赖。
2021年,中国邮政花费1.45亿美元采购甲骨文数据库,当时的公告中透露着这家巨无霸的悲愤:“当前多个核心生产系统使用Oracle数据库进行数据存储和处理,无法替换”。
新世纪初,国内在技术上虽然取得了一些进展,也有信息化的客观需求,但由于买单方大多是对产品稳定性要求极高的关键行业国企,就算后者有意迁移,不同数据库使用的语言和代码不同,潜在的风险也很容易让人望而却步。因此,很多国产产品度过了研发阶段,就停留在了产业化的前夕,迟迟无法迈出下一步。
而对广大中小企业来说,其普遍心态是与其在IT上搞建设,不如多添置几幅“天道酬勤”和“厚德载物”的牌匾。有支付意愿的客户都对甲骨文和IBM形成了依赖,买不起甲骨文的公司也不会买国产产品,这就导致一个严重问题:
研发团队难以通过利润反哺技术开发,产品迭代无从谈起。
无论是数据库和操作系统,还是ERP系统和WPS这类办公软件,它们既没有流量变现的商业模型,也没有游戏行业里氪佬养全服的性感模式,其利润来源不外乎产品+服务费,这就导致先发者很容易与大客户和开发者形成生态绑定,形成强者恒强的格局,而后来者在产品竞争力落后的局面下拿不到订单,很容易步步落后。
很多人不知道的是,联想曾经还基于Linux研发过操作系统,但仅推广两年后,就将研发团队搁置。大部分国产操作系统的困境也很类似:系统做出来了,但没有对应的软件生态,类似QQ这类日常软件,一直等到2008年才有了Linux版本。
甲骨文在北京的研发中心,员工一度接近2000人,微软Office团队也可以长期维持在2000-3000人的规模,而国内的很多软件公司,订单甚至养不活一个三位数的研发团队,面对积累深厚的海外列强,其产品竞争力可想而知。要知道他们在进入中国市场之前,就已经是富可敌国的软件巨头。
在差距更大的“三大件”等底层技术领域,还要等到中国本土互联网公司的崛起,才迎来了姗姗来迟的历史进程。
在这个过程中,市场始终是关键词。
从边缘到中央今年3月底,数据库领域权威测评机构国际事务处理性能委员会(TPC,Transaction Processing Performance Council),悄悄刷出一条新的记录:
国产数据库TDSQL以每分钟8.14亿笔订单的处理能力,成为新的世界第一。
长期以来,TPC一直是衡量数据库、小型机和服务器性能的核心权威机构之一,甲骨文则是榜单的常驻冠军。
2009年8月,IBM在TPC-C基准测试中成功屠榜,让刚刚斥巨资买下Sun的甲骨文如鲠在喉。随后,甲骨文在经济学人、华尔街日报等刊物上打出“Sun+Oracle is Faster”的巨幅广告,称自家产品性能比IBM快得多,具体测试结果“将在10月14日公布”。
结果,甲骨文的广告被TPC认定违反了“测试结果使用原则”,罚了一万美元。
数据库这类产品,功能特性极其明确,衡量标准几乎只有“Faster”,决定客户采购与否的也就只有性能和成本,以TPC为代表的各类Benchmark,是衡量产品性能的重要标尺。历史上甲骨文每次刷榜,基本都会趁机对友商阴阳怪气一番。
而吃瓜群众可能比较好奇的是:腾讯为什么会做数据库?
早在2007年,腾讯就开始在内部孵化自己的分布式数据库,即后来的TDSQL。到2014年,TDSQL已经为腾讯90%的计费业务提供支持。腾讯做数据库的初衷非常简单,一方面,甲骨文的更新周期,无法满足中国互联网以天为单位的迭代需求;另一方面,以腾讯当时的业务体量,采购海外产品也已不再划算。
同一时期,各类软件领域的技术国产化迅速加速,x86和arm架构的服务器迅速取代了IBM的小型机,EMC的存储则被分布式存储替代,ERP、办公等领域,国产软件也在迅速增长。在这之中,两个很关键的变量推动了这个进程:
其一是云计算的普及。资源池化的特点,大幅降低了企业IT的一次性投入;更大的上云规模,也推动了国内云厂商技术栈的进化,带动数据库、专有云等一众国产底层软件研发,为中国企业创造了弯道超车的路径。恰如中国直接跳过信用卡阶段,在移动支付时代超车欧美。
其二则是互联网公司本身规模的增长和业务的多元化,让自研技术可以现实场景中反复摔打,解决了长期困扰国内公司“无法参与市场验证”的问题。
基于自身业务场景孵化技术原创能力,既是追求商业效率的必然选择,也是一家科技公司走向成熟的标志。
而在大公司内部探索的同时,外部市场也在逐渐打开。2013年棱镜门曝光,数据安全不再是一种假想的动力,而变成了迫近的需求。2018年后,中美贸易摩擦加剧,关键环节的国产替代从从备胎变成了必须,市场需求迅速扩大,国产化的窗口加之产业互联网的趋势,让互联网公司的技术积累迅速走向各行各业。
最典型的是对数据安全极其敏感的金融业:腾讯云数据库TDSQL已服务了国内最大十家银行里的七家,已助力超过20家金融机构核心数据库进行国产化改造。
一个产品突破的背后,其实也是整个国产软件替代系统性的突破。
成建制的突破2019年,日本突然断供了韩国几款半导体材料,搞得三星先进制程研发大受影响,李在镕亲自飞到日本恳请松口。根据SEMI的测算,2019年,日本企业在全球半导体材料市场,所占份额达到66%。19种主要材料中,日本有14种市占率超过50%。
半导体材料是个很特殊的市场,芯片制造中,几万美元货值的材料不达标,就能让产线上几亿美元的产品报废。虽然其市场规模只有几百亿美元,却能影响万亿规模的下游环节。由于材料的配比、试验、改良都依赖漫长的积累,日本人的技术壁垒非常高。
遭日本断供后,三星在接下来两年一口气投资了9家半导体设备和材料厂商——谁能想到半导体世界的庞然大物,也会因为一纸断供文书成为惊弓之鸟。
把国产软件置于这个语境下,其焦虑与半导体产业也有类似之处:一方面产业链很长,既有服务器/芯片、云平台和数据库这类基础软件,又有下游的ERP、办公、会议这类应用,有一个环节没被覆盖,整个链条都很难做到“自主可控”。
此前,就有国内数据库产品由于拿不到对应海外公司的硬件环节接口,导致上下游环节无法适配,产品失去竞争力。
全球贸易和分工畅通无阻的年代,自主可控似乎只是一句打鸡血的口号,但随着各个经济体技术割据的趋势愈发明显,对供应链与数据安全的紧迫性被置于效率至上,曾经遥远的假想敌也在一步步逼近。
相比芯片产业尚且面对的短板,国产软件在过去十多年里,已经在各个环节完成了“从无到有”的突破,组成了一套有一定竞争力、能够覆盖金融、通信等关键领域的“替代系统”。其价值在于,至少在软件这个层面,不再会出现半导体材料这种“几万卡住几个亿”的窘境。
以腾讯为例,过去五年,腾讯在技术研发的投入超过了2000亿。在这种高投入下,腾讯云已经积累了一个“国产化产品矩阵”:包括AI芯片、网络DPU、智能网卡、自研服务器、遨驰分布式云操作系统等等。在逆全球化愈演愈烈之时,科技公司多年的沉淀,其价值在这个背景中被大大放大了。
一方面,云计算的出现,让国内公司在技术路线变化的背景中,有了在同一起跑线上比赛的空间。目前,腾讯的专有云TCE已经在多家金融机构落地,在与民生保险的合作中,70%节点基于通用X86架构,30%节点基于全国产ARM架构,建立了一个符合金融监管要求的“两地三中心”高可用架构和混合云架构。
同时,TCE兼容国产化的芯片、服务器、操作系统、数据库等底层软硬件,组成了一个从产品到体系的替代方案。
另一方面,正如上文所说,科技公司自身业务规模的扩大和多元,为配套的底层软硬件开发提供了一个“参与市场验证”的天然场景,既能够承担大规模的研发投资,也使研发阶段能在自身业务中完成低成本的迭代与试错。
举例而言,2010年,腾讯开始研发操作系统TencentOS。在长达十年的验证、打磨和优化过程中,TencentOS历经了无数次以“春节发微信红包”这类极端场景的考验,逐渐覆盖了腾讯自身所有的业务。这个过程,本质上是腾讯利用自身的规模优势,让自研技术能够在内部完成艰难的迭代过程,继而推向市场。
2018年后,国产替代这个语境再度迎来最大的变量——中美贸易摩擦让技术短板引发的困境直观的暴露,俄乌冲突后,微软、亚马逊、Oracle等西方企业的制裁,更是提供了一个现成的参考案例。
这种持续蔓延的外部压力,最终使得国产替代的渗透速度在过去几年呈现出爆发式的增长。科技公司的技术积累也开始迅速向各行各业输送。一个个重要行业从国外架构中成功抽身。中国银联云、广东政务云、广州地铁等多个行业标杆项目的背后,都来自腾讯专有云TCE。
对整个中国软件行业来说,国产化的趋势也在创造一个“参与市场验证”的窗口期,相比十年前斯诺登引爆全球舆论的年代,如今技术领域的逆全球化愈演愈烈,数据安全的诉求日益迫近。而相对八九十年代令人望而生畏的差距,技术的国产化速度已经大大提高了。
在这背后,既有国家意志的纵横捭阖,也有科技公司的自发探索,整个互联网产业的繁荣,带来了繁荣的投资与人才供给。
从无到有、从弱到强,既是一家科技公司的创新脚步,也是一个产业建立影响力与话语权的必经之路。
参考资料
[1] 国产数据库:三座大山下的妥协与突围,数智前线
[2] 苦难是金:从一贫如洗到亿万富翁,单宝/何宗思
[3] Oracle将大规模进军中国,打响“金色中国”战役,新快报
[4] 中国式去IOE,财新
作者:李墨天
编辑:张泽一
视觉设计:疏睿
责任编辑:李墨天