掀起年中诸神之战，国产大模型谁能决胜华山之巅

潇冷 | 2023-06-16

2023年过半，大模型并没有像元宇宙一样在爆火之后趋于冷静，相反变得越来越热闹。在国外，OpenAI持续发力GPT推出ChatGPT iOS版本，马斯克为Twitter抢购1万块GPU筹备大模型项目，亚马逊大力投资大语言模型和生成式AI......

在国内，百度发布文心一言，阿里发布通义千问、通义千悟，新华三推出“百业灵犀”LinSeer，三六零积极推动智脑大模型落地应用，王小川、王慧文、闫俊杰等跑步进场......如火如荼的大模型市场正在迎来“诸神之战”。

如今，以云为基础的技术浪潮，正以席卷一切的姿势澎湃而来，AI与云计算的深度融合，迸发出耀眼的光芒，而大模型的爆火，不仅是AI技术的自我演进，更是云、数字化的又一次深化。

可以说，相较于深度学习，大模型让AI认知能力更上一层楼，实现所谓的“智能涌现”，催生出ChatGPT、AIGC等新型应用。英伟达创始人、CEO黄仁勋将这一现象归纳为“AI的‘iPhone’时刻”来临。

ChatGPT火爆至今，AIGC、大语言模型、大模型在国内持续走热的深层次原因有哪些？在国内，大模型的发展如何？目前，大模型行业有哪些不足，以及未来将如何发展？今天，我们将进行深入探讨。

百模大战，大炼大模型

在不久前举办的中关村论坛人工智能大模型发展分论坛上，《中国人工智能大模型地图研究报告》发布，该报告提出，我国自2020年进入大模型快速发展期，目前与美国保持同步增长态势。当前，我国人工智能大模型已发布79个。

从数量和增长态势来看，随着众多AI企业的入局，AI大模型引燃了互联网大厂和科技大佬的激情，AI大模型的诸神之战已经打响。

除前文提及的互联网大厂外，还有科技大佬入局：原美团联合创始人王慧文、前搜狗CEO王小川、前京东AI掌门人周伯文、阿里技术副总裁贾扬清、出门问问创始人李志飞等一众大佬争先加入ChatGPT掀起的创业热队伍。

此外，AI大模型领域还有众多北京华丽的创业团队涌现，清华唐杰教授的智谱AI，黄民烈教授的聆心智能，清华大学NLP实验室的孙茂松、刘知远团队，深言科技岂凡超，以及循环智能杨植麟等等，都被头部VC赋予了颠覆行业的希望。

在政策层面，人工智能发展也得到了充分重视。此前召开的中共中央政治局会议提出，要重视通用人工智能发展，营造创新生态，重视防范风险。可以说，推动人工智能大模型产业化应用，是加快实现我国人工智能领域高水平科技自立自强的应时之举，也是提升国家竞争力、维护国家安全的关键举措。

在笔者看来，以ChatGPT为代表的AIGC刺激下，国内AI大模型正在迎来奇幻革命，并进行一场诸神之战，谁会是最后的赢家，让我们拭目以待。

发展大模型之痛在哪里？

在大模型越来越火热的同时，我们还应该认识到发展大模型并非一件易事。通常而言，大模型具有“巨量数据、巨量算法、巨量算力”三大“巨量”特征。这对任何企业来说，打造一个大模型都不是一件容易的事情，需要收集海量的数据，采买海量算力，进行大量研发。比如，ChatGPT模型参数高达1750亿，而与之类似的模型，参数也从数百亿到数千亿不等。

这对算力提出了新的需求。在乐观假设下，国内AI大模型在训练与推理阶段或产生相当于1.1万台至3.8万台高端AI服务器的算力需求。以英伟达单片A100 GPU产品售价10万元、AI加速卡价值量占服务器整机约70%计算，则对应126亿元至434亿元增量AI服务器市场规模。

人才也是人工智能大模型发展遇到的核心难题。《AIGC人才趋势报告》显示，自Open AI在2021年推出以来，对于AIGC相关的人才争夺就已经开始了。2021年1-2月，AIGC相关岗位招聘同比上升281.88%，而在2022年和2023年的1-2月，招聘数量分别保持了76.74%和31.3%的同比增幅。

当然，我们也应该认识到，人才的培养并非一蹴而就，除了要考虑AI技术发展的先进性之外，还要解决AI与行业Know-How结合的问题。只有AI与行业特性相融，才能真正实现技术扩散，带来帮助企业或行业降本增效的实际价值。

此外，在大模型普及的过程中，推动大模型场景创新仅仅是开端，由开端向外延伸，不断收集大模型对于普通群众的实际效用。换言之，大模型要想得到长远健康发展，势必要结合行业、场景进行创新，通过场景创新+经济驱动，来支撑大模型发展。

整体来看，使用大数据训练得到的大模型对于实际应用、提高工业生产力和促进社会发展有巨大的前景，但行业数据源封闭，孤岛化严重，难以提供训练大模型所需的大数据，满足行业AI需求，需要长时间探索。

寻求解决之道，大力发展大模型

应对这些挑战，抢占人工智能大模型产业发展制高点，必须加强源头技术创新，打赢软硬件基础设施国产化攻坚战，化解大模型关键核心技术被“卡脖子”的风险，多措并举推动人工智能大模型产业化应用。

算力先行。在国家、行业层面，应该推进新兴算力生态基础设施建设，实施高端算力芯片研发重大专项扶持计划，建立新型研发机构，推动国产高端算力芯片实现突破，推动新型算力网络基础设施建设的顶层设计，建设国家公共算力开放创新平台。人工智能企业也应该加大算力投入，通过创新推进自身演进、发展。

数据生态的构建也尤为重要。完善国家公共数据开放标准和平台，推动高价值公共数据开放与多元化授权运营，引导行业、企业大数据有条件开放、融通并进场交易，形成多模态、多领域的大规模数据集。同时，也应该打造数据集精细化标注的众包服务平台和数据质量评估标准体系。

依托稳定可靠的算法开源生态。建立大模型算法及工具开源平台，完善具有稳定性、可靠性和安全性的算法监测标准和技术体系。企业也应该积极开展算法创新探索与应用，实现降本增效并创新商业模式，深化数字化转型并引领高质量发展。

持续前行，决战华山之巅

在AI算量需求急剧增加的前提下，算力时代已经悄然开启。伴随而来的是AI大模型技术的影响力，有可能接近印刷术、蒸汽机、电力、互联网。

是机遇的同时也有着巨大的挑战：高算力意味着高成本，没有雄厚的资本支撑无法承担AI训练;AI大模型也对技术有了更严苛的要求，只有真正有技术水平的公司方能在这场AI大潮中屹立不倒;AI大模型需要大量的技术人才，这也是目前紧缺的。

同时，我们也应该认识到，在大模型热潮中，虽然浑水摸鱼、蹭热点的玩家不在少数，但也有一些脚踏实地的团队正在研发大模型技术，推动大模型落地。这些只争朝夕的精神值得我们敬仰。

这场诸神之战中，最终谁将在这场华山论剑中脱颖而出，引领AI2.0时代？至少现在来看，需要中国企业持续探索、攀登。