通用还是行业？哪个才是大模型的未来发展方向

Yu | 2023-08-09

无人不谈大模型，无疑是当下科技界的真实写照。

ChatGPT的出现，瞬间点燃了科技圈对于大模型的热情。无论是科技巨头还是研究机构，亦或是AI创业公司，都纷纷入局该领域，以抢抓发展先机。

自2023年3月以来，大模型相关产品如雨后春笋般涌现，有的专注文学创作，有的善于数学题解答，有的用于工具开发，还有的擅长常识问答……不得不说，目前市面上的大模型产品，难免让人有些眼花缭乱。

通用大模型存在局限性？

实际上，根据应用场景和目标人群的不同，可以将大模型分为通用大模型和行业大模型两大类。

所谓通用大模型，是指具有广泛适用性的大型生成式AI模型，能够处理多种任务和应用于不同领域。这类大模型通常包含深度学习领域中的各种技术和算法，例如神经网络、自注意力机制、预训练等，可以用于处理自然语言处理、计算机视觉、语音识别等领域的任务。

例如，ChatGPT就是一种通用大模型，拥有语言理解和文本生成能力，能够通过连接大量的语料库来训练模型，这些语料库包含了真实世界中的对话，使得ChatGPT具备根据聊天的上下文进行互动的能力，做到像人类一样来聊天交流，甚至能完成编写电子邮件、论文和代码等任务。

不过，需要指出的是，纵使通用大模型非常强大，却也存在着一些局限性。

首先，通用大模型需要大量的数据来进行训练和优化，通常会消耗大量的计算资源、时间和成本。据国盛证券发布的《ChatGPT需要多少算力》估算，ChatGPT的单次训练成本约为140万美元，对于一些更大的大模型，训练成本介于200万美元至1200万美元之间。另外，以ChatGPT在2023年1月的独立访客平均数1300万来计算，其对芯片需求为3万多片英伟达A100 GPU，初始投入成本约为8亿美元，每天的电费支出大约在5万美元。

其次，通用大模型数据主要来自公开文献和互联网信息，专业知识与行业数据积累不足，特别是在医疗、金融等专业性较强的产业，通用大模型提供的服务有限。此外，网上可能存在错误、谣言、偏见的信息，这可能会导致通用大模型精准度不够，生成有误或有偏见的响应。

瞄准行业大模型

行业大模型的出现，可以弥补通用大模型无法最优化适配到各行各业中的不足。

行业大模型是指针对于某个特定行业或领域需求，采用大规模数据训练和先进算法的深度学习模型。行业大模型通常包括该行业的关键流程、价值链、参与者、关系和其他重要要素，可以帮助理解行业的运作机制、业务流程和价值创造方式。不仅如此，由于模型参数少，训练和推理的成本更低。

值得一提的是，如今，有诸多企业加入到了行业大模型赛道。

例如，百度联合行业头部企业、机构打造的文心行业大模型，目前已涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域;

华为发布的盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向，为行业客户、伙伴及开发者提供服务，已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值;

腾讯云打造的大模型一站式服务MaaS(Model-as-a-Service)内置多个高质量行业大模型，涵盖金融、传媒、文旅、政务、教育等多个行业场景;

京东推出的言犀大模型是立足于产业研发，融合了70%通用数据与30%数智供应链原生数据，具有“更高产业属性、更强泛化能力、更多安全保障”的优势，致力于各种产业场景，解决真实的产业问题;

网易有道推出的教育领域垂直大模型“子曰”现已应用于有道生态内的软件和硬件上，包括大模型翻译、AI作文批改、英语语法精讲、虚拟人口语教练、AIBox、文档问答等;

新华三发布的私域大模型百业灵犀(LinSeer)面向的是政府、企业等这类对数据安全天然敏感的场景……

可以说，从目前市场现状来看，大模型竞赛从通用大模型转向行业大模型似乎正成为一种趋势。而且，业内也普遍认为，未来只会有两三家“独大”的通用大模型，并涌现出无数更贴近产业需求的行业大模型。

写在最后：

前不久，IDC对基于大模型的AI市场规模进行了预测，预计中国人工智能市场规模在2023年将超过147亿美元，到2026年这一规模将超过263亿美元。

由此可见，大模型潜力不可小觑。因此，对于入局者而言，无疑将会拥有非常大的发展机遇。至于，未来的大模型会走向何方，还要看厂商们接下来如何布局。毕竟，大模型的竞赛才刚刚开始。