
【开源生态60问】——开源软件目前的发展状况如何?
简单概要的回答是:开源在当今世界已取得了举世瞩目的成就,然而其发展轨迹正呈现出一些新的态势。从全球范围来看,开源无疑是成功的,但整体增长曲线已步入平台期。在中国,开源虽在近年来获得了长足进步,然而因起步相对较晚,且面临国际竞争与地缘政治等诸多挑战,要迈向更高层次也绝非易事。
1. 开源在全球范围内的成功
1. 技术领域的全面崛起
在技术层面,开源的成功令人瞩目。Linux 操作系统堪称开源领域的璀璨明珠,依据 TOP500 超级计算机榜单,排名前 500 的超级计算机几乎清一色运行 Linux 操作系统。在服务器市场,Linux Server的占有率亦颇为可观,尤其在 Web 服务器与云计算领域表现卓越。据市场研究机构估算,其在全球服务器市场的占有率大致处于 70% 至 80% 之间。尽管在桌面领域长期处于较低水平,仅在 2% - 3% 徘徊,但 2024 年 7 月 StatCounter 发布的数据显示,Linux Desktop取得了历史性突破,首次逼近 4.5%。而在编程语言、开发工具、数据库、中间件、云计算等众多领域,开源技术已然占据主导,呈现出一统天下的格局。在 AI 领域,众多开源的 AI 相关技术正蓬勃发展,展现出无限的活力与潜力。
|
技术领域 |
著名项目 |
|
操作系统 |
Linux、FreeBSD、Ubuntu、Android、OpenEuler、OpenHarmony |
|
编程语言 |
Pythion、Ruby、Rust、GO、Perl、Swift、Moonbit、Cangjie |
|
开发工具 |
Git、Vim、Emacs、GCC、LLVM、VS Code、Eclipse、Jenkins |
|
数据库 |
MySQl、PostgreSQL、SQLite、MongoDB、Redis |
|
中间件 |
Apache Web Server、Nginx、Apache Kafka、RabbitMQ、Apache Tomcat、ZooKeeper |
|
云计算 |
OpenStack、Docker、Kubernetes、Prometheus |
|
人工智能 |
TensorFlow、PyTorch、OpenCV、LLama、Qwen |
表1:各个技术领域中的著名开源项目
2. 商业领域的硕果累累
开源在商业方面同样成绩斐然。早期,Red Hat 和 VA Linux 在 IPO 阶段便创造了惊人的商业奇迹。1999 年 8 月 11 日,Red Hat 公司股票于 Nasdaq 挂牌上市,当日股价飙升 482%。四个月后的 1999 年 12 月 9 日,其股价更是蹿升至 286 美元。同一日,VA Linux 股票以 30 美元首次公开发行,上市当日股价暴涨 733%,创下前所未有的记录,最高价达 320 美元,最终以 239 美元收盘。此后,开源企业斩获巨大商业成功的案例不断涌现,如 2008 年 Oracle 以 10 亿美元收购 MySQL,2009 年 VMware 以 4.2 亿美元收购 Spring Source,2018 年微软以 75 亿美元收购 GitHub,2019 年 IBM 以 340 亿美元收购 Red Hat 等。
3. 开源基金会的蓬勃发展
众多开源基金会也在蓬勃发展,其中 Linux 基金会和 Apache 基金会极具代表性。据 ProPublica 数据,2022 年 Linux 基金会收入高达 1.77 亿美元,旗下拥有 30 多个子基金会,管理着 600 多个开源项目。Apache 基金会在 2023 年的收入达 231 万美元,管理着近 300 个开源项目。这些开源项目作为全球数字基础设施的关键组成部分,正发挥着不可估量的巨大作用,有力地推动着全球数字化进程。

图1:两大开源基金会最近十年的收入情况(来源:ProPublica)
2. 全球开源发展进入平台期
依据开源社发布的《2023 中国开源年度报告》,GitHub 平台年度事件增长数量呈逐年下降趋势,从 2016 年超过 50% 的增长率降至 2023 年接近 10%。与此同时,GitHub 年度活跃用户数在经历近五年的高速增长后,其增长率自 2020 年起也开始逐年下滑,2023 年全域活跃开发者数量为 2193 万,仅比上一年增长 8.88%。综合各类现象与统计数据,可以判定全球开源已迈入平台期,即所谓的 “缓慢增长期”。但究竟是何种因素致使这一现象的产生,仍有待深入探究与剖析。

图2:GitHub 年度事件数趋势 (来源:《2023中国开源年度报告》)

图3:GitHub 年度活跃用户数量趋势 (来源:《2023中国开源年度报告》)
根据Synopsys发布的《2024年开源安全和风险分析报告》,96%的被审代码库中包含开源代码,77%的开源代码存在于被审的代码库中。凭借上面两个数据我们可以看出:绝大多数软件,都已经全面采用开源代码,而且开源成分的比例,也已经接近80%。根据CSDN发布的 《2023中国开发者调查报告》,96%的开发者正在使用开源软件,49%的开发者参与过开源项目。这意味着,软件吞噬世界,开源吞噬软件的历程,已经接近完成,再想要看到突飞猛进的增长,是不可能了。
另一方面,我们也不能只看到开源采用率的不断攀升,还应该看到开源供应链安全问题的日渐突出,在经过风险评估的代码库中84%包含漏洞,74%包含高风险漏洞。一方面,全面采用开源带来的竞争优势,已经逐步降低。另一方面,因采用开源带来的后续维护成本,却在不断提高。一味的高歌猛进已经不太现实,后续该如何更好的发展,全世界的开源玩家们,都还在探索之中。(参见2.8节、2.9节)
3. 开源在中国的发展状况
开源在中国的发展,有几个关键的阶段,早在1985年,陈钟教授作为杨芙清院士的硕士和博士研究生,参与了 AT&T UNIX 操作系统油印纸质版源代码的阅读和分析,成为国内首批 UNIX 操作系统内核研究与开发的骨干之一。1992年,AT&T 贝尔实验室 USL/USG 与中国合作,美方将最新开发的UNIXSVR4.2 版本源代码向中方开放,中方推出的 UNIXSVR4.2 中文版就是开源的。(来源:《陆首群:世界开源发展史》)因此,可以将1992年认定为中国开源发展的元年。
在 20 世纪 90 年代末至 21 世纪初,中国的开源活动主要围绕 Linux 操作系统展开。这一时期,国内的技术社区和高校开始关注并推广 Linux,培养了一批早期的开源爱好者和开发者。1999年,国产操作系统迎来了第一次真正的爆发。以Xteam Linux、蓝点Linux、红旗Linux、中软Linux为代表的众多国产操作系统,走上了历史舞台。
随着互联网、云计算、移动互联网等一系列技术热潮的兴起,中国也诞生了不少著名的大厂开源项目(例如:阿里、华为、百度、腾讯、美团、小米等公司),以及著名的开源企业(例如:PingCAP、Kyligence、DAOCloud、飞致云、白鲸开源、涛思数据等公司)。

图4:中国开源项目 OpenRank 排名(来源:《2023中国开源年度报告》)

图5:中国企业 OpenRank 排名(来源:《2023中国开源年度报告》)
尤其值得注意的是,在全球企业排行榜中,中国企业的排名是华为(第4)、阿里(第6)、百度(第7)、蚂蚁集团(第11)、腾讯(第18)。
2020 年 6 月,开放原子开源基金会正式成立,成为中国首个在民政部注册的致力于开源产业公益事业的非营利性独立法人机构。同年 9 月,华为将其智能终端操作系统基础能力相关代码捐赠给该基金会,项目被命名为 OpenHarmony。这标志着中国在开源操作系统领域迈出了重要一步,促进了国内开源生态的进一步繁荣。
2021年3月12日,新华社授权全文播发《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》。从纲要提到的“支持数字技术开源社区等创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务”,可以看出国家在战略层面对「开源」的肯定和支持。
2021年至今,全国各级政府和机构(如国务院、地方政府、科技园区管委会等)陆续发布了关于开源软件和数字经济创新的政策。整体趋势从早期的国家层面指导政策(如“十四五”规划)逐步延伸到地方政府的具体行动计划,聚焦于促进开源软件生态建设、数字经济发展、人工智能创新等领域。
在国家层面,强调知识产权保护与运用,推动数字经济、人工智能、基础技术等重点领域发展。明确支持开源技术在数字经济和社会发展中的重要地位。在地方层面,各地都提出要构建开源平台、开展试点示范工程、完善开源治理生态,加快推进本地软件名城建设,推动相关技术和服务输出。开源政策兼顾产业创新与社会经济发展,展现出较强的系统性。
根据Gitee发布的《2023中国开源开发者报告》 Gitee 总用户数达到 1200 万,新增用户 200 万。总仓库数量达到 3000 万,新增仓库数量 500 万。开源组织数量达到了 380000 个。
根据COPU发布的《2023中国开源蓝皮书》,中国开源开发者数量突破800万,居全球第二;年新增数量居全球第二。中国前端开源项目占全球一半;AI、云计算等新技术开源项目占全球开源项目的20%;操作系统项目占全球开源不到10%。中国新一代操作系统、数据库等领域开源项目不断涌现,OpenHarmony、openEuler等开源项目应用持续拓展,已形成共创生态。2023年,openEuler技术路径已经占据中国市场36.8%的市场份额,已汇聚26家核心捐赠人,2万名开发者进行操作系统协同攻关。(引用自:郭雪《全球开源生态发展现状、趋势与对策建议》)中国开源在国际开源界的地位和语话权持续提升,开源在传统行业的应用进一步深化,金融电信政务等部分行业处于第一梯队领先态势,开源组织数量和质量不断提升,对开源生态建设发挥着重要推动作用。
4. 中国开源的挑战与不足
中国的开源产业在快速发展的同时,仍面临多重挑战和不足,主要体现在以下几个方面:
1. 开源自主创新能力不足
尽管中国在开源领域取得了一定进展,但核心技术和关键项目的自主创新能力仍显薄弱。许多开源项目的核心技术和话语权主要掌握在国外科技巨头手中,导致国内企业在技术创新和应用中受制于人。根据x-lab发布的最新报告,全球开源项目TOP100中,中国的开源项目只有15个,大约是美国开源项目数量的1/5强一点。目前国内一些头部企业正在努力打造的根技术社区,可以算作是一种积极的应对之道。

图6:2024 Global Projects Top 100(来源:x-lab)
2. 顶尖开源人才短缺,规模化培养体系待完善
根据CSDN发布的《2023中国开发者调查报告》,仅只有8%的开发者是因为企业支付工资,而有17%的开发者志愿投入自己的时间。63%的开发者表示未曾在开源中获得收入。这导致中国在开源人才的质和量上都存在较大不足。开源教育体系不完善,缺乏系统的培养机制,导致高水平开源人才稀缺,制约了开源项目的发展和创新。
3. 开源供应链安全、知识产权合规及法律风险突出
随着开源软件的广泛应用,供应链安全问题日益严峻,包括安全漏洞、许可证合规性等风险。此外,开源许可证的多样性导致的法律风险,如许可证冲突、知识产权纠纷等,也对企业构成挑战。但是与此同时,有超过1/5的开发者,对License毫不关心,确实令人遗憾。国内还是有不少开发者认为开源仅仅与技术相关,仅仅与代码相关,却忽略了License和Copyright的重要性。这样的做法会给自己所在的企业带来极大的风险!
4. 开源社区治理和协作能力有待提升
国内开源社区的治理和协作机制尚不完善,缺乏系统化建设能力。这导致社区活跃度不高,开发者参与度不足,影响了开源项目的持续发展和创新。
5. 面临国际竞争和合作压力
由于近年来地缘政治的原因,中国的开源项目和企业也面临逆全球化趋势带来的风险。如何加强与国际开源社区的合作,提升中国开源项目的国际影响力,也是亟待解决的问题。
综上所述,中国开源产业需在自主创新、高质量项目孵化、人才培养、供应链安全、社区治理和国际合作等方面持续发力,才能打造开源、创新、科技和人才的高地,推动开源生态的健康发展。
下节预告:《为什么开源软件比专有软件更有吸引力?》
转载自 庄表伟 阅读思考与生活 【开源生态60问】——开源软件目前的发展状况如何?


