开源还是闭源？哪个才是大模型的发展之路？

Yu | 2024-04-19

2023年7月，Meta发布了其首款面向市场的开源大模型Llama 2，免费提供给研究和商业开发者使用。自此，闭源与开源两种技术路线的交锋正式拉开序幕。

时至今日，围绕闭源与开源在大模型未来发展路径中哪个更占优势的讨论仍在持续，就在前不久举办的Create2024百度AI开发者大会上，百度创始人、董事长兼首席执行官李彦宏表示，大家以前用开源觉得开源便宜，其实在大模型场景下，开源是最贵的，所以开源模型会越来越落后。

但也有人对此持不同观点，360集团创始人、董事长周鸿祎表示，没有开源就没有Linux，没有Linux就没有今天的互联网。他认为，开源模型为整个科技社区提供了一个共享、协作和创新的平台，推动了技术的快速发展。

那么，开源与闭源究竟谁更胜一筹呢？接下来，本文将对两者之间的差异进行详细阐述。

开源和闭源大模型分别是什么？

开源大模型，顾名思义，其源代码公开、模型架构清晰，并配备了预先训练好的权重，确保了，从而确保了其透明度。任何感兴趣的人都能方便地访问这些基础模型，审查训练数据，并根据个人需求自定义代码。

相反，闭源大模型则由特定企业或组织负责开发，并且其源代码和训练数据均不对外公开。这种模型的使用和修改权限仅限于开发它们的企业或组织内部。

各有哪些优劣？

需要指出的是，开源和闭源大模型因其各自的特点，在多个方面有着不同的优势和劣势。

首先来看开源大模型，其优势在于可访问性、创新力和透明度。其中，在可访问性方面，任何人都可以自由访问开源模型，促进更广泛地采用。这种广泛的可用性促进了全球研究人员和开发人员的更大参与和多样化贡献。在创新力方面，得益于庞大的贡献者社群，开源大模型得以迅速迭代发展，融合了广泛的视角和专业知识，催生出更多具有创造性的解决方案和多样化的应用。在透明度方面，开源模式允许更严格的审查，这可能会带来更高的安全性和可靠性。这一级别的透明度使用户能够识别和解决模型中的潜在偏见或漏洞，培养对技术的信任。

然而，开源大模型也存在一些不足，相较于闭源模型，开源大模型往往缺乏专职团队提供同等水平的支持与维护，可能导致更新滞后、维护不一致性等问题，影响模型性能与稳定性。同时，由于资源投入的局限，开源大模型在技术创新与能力提升上可能略逊于企业支持的闭源模型。另外，企业对技术支持、定制需求及知识产权问题的顾虑，可能导致开源大模型在商业领域的接纳度受限。

再来看闭源大模型，依托企业巨额研发投入与专业研发团队，闭源大模型通常在技术创新与功能表现上占据行业制高点，为用户持续提供最前沿的模型体验。并且，闭源大模型用户通常享受企业级的专业支持与维护，确保模型在商业环境中的稳定运行，问题能得到及时解决，保障用户体验。不仅如此，闭源模式有利于企业保护自身投资与创新成果，形成竞争优势，对于寻求技术壁垒的企业具有重要价值。

但闭源大模型也有其劣势，例如高昂成本与严格的许可限制使得闭源大模型对部分研究人员、小型企业而言可望而不可及，可能抑制创新生态的多元化发展与跨领域合作。而且，闭源大模型的私有属性导致其透明度较低，易引发对模型偏见、伦理风险及安全漏洞的关切，进而削弱公众对其可靠性和公正性的信心。此外，闭源大模型的开发环境倾向于在企业内部或少数合作伙伴间封闭进行，可能导致创新生态的孤立，限制跨界合作与知识交融的机会。

由此可见，开源模型凭借其开放性、创新力与透明度，有力推动了技术普惠与社区共建;闭源模型则以卓越性能、专业服务与知识产权保护，满足了市场对高端技术解决方案的需求。

有专家进一步指出，在大模型领域处于领先地位的企业，更适合选择闭源策略，以确保将核心技术掌握在自己手中。并且，这种策略不仅有助于资源的持续集聚，还能有效保护企业的竞争优势。相反，对于尚处于起步阶段的后来者，开源模型则提供了一个理想的起点，可帮助他们迅速提升技术实力。

因此，对于企业而言，应该根据自身的目标和市场环境，选择最适合自己的开发和发布模式，以实现最大的商业价值。

写在最后：

无论是闭源所代表的核心技术掌控与竞争优势强化，还是开源所赋予的快速技术进步与创新生态共建，都将在大模型领域的未来发展进程中发挥不可或缺的作用。究竟哪种模式将在未来的较量中更胜一筹，抑或是二者将在动态平衡中共同推动行业的繁荣，答案有待市场实践的进一步检验与时间的揭晓。