“遍地开花”的大模型，“百模大战”谁能够笑傲江湖？

潇冷 | 2023-04-21

这段时间，由ChatGPT引起这把火，在国内越烧越旺。

当百度官宣“文心一言”时，笔者也曾讶异：“国内有生成式AI实力的远不止百度一家，为何只有百度入局。”话音还未落下，国内类ChatGPT产品便接踵而至，诸如，阿里的“通义千问”、商汤的“商汤日日新大模型”、三六零的“360智脑”，还有腾讯、科大讯飞、字节跳动、出门问问等厂商推出的大模型紧随其后，每隔几天便有新的大模型降生。大模型赛道在迎来选手的同时，也面临新的竞争，上演着一场“百模大战”。哪些大模型能够笑傲江湖，未来又将何去何从？

赛道迎来新“赛车手”

百度的“文心一言”并非最早官宣的类ChatGPT产品。今年2月份，科大讯飞透露其AI学习机、讯飞听见等将成为公司类ChatGPT技术率先落地的产品。日前，笔者获悉，科大讯飞将于5月6日发布讯飞星火认知大模型，届时讯飞AI学习机、讯飞听见、讯飞开放平台将迎来重磅更新，其中最令人期待的莫过于星火认知大模型。

在国内引起广泛关注的当属百度官宣“文心一言”，号称中国版ChatGPT一经官宣火爆整个AI圈。之所以受到广泛关注，是因为早年间百度便将注意力转向AI、自动驾驶领域，而“文心一言”的官宣也是对百度的考验，其次是因为百度在ChatGPT最擅长的搜索领域有庞大的用户基础，也容易商业变现。事实上，“文心一言”推出之后，媒体、企业也都纷纷官宣接入，笔者所在的天极网和比特网也在第一时间宣布接入，目前也在内测。

或许是百度文心一言的不自信，又或许是资本关注度不断攀升，抑或是企业想要借助类ChatGPT这一工具提升产品体验，文心一言尚在内测的时候，阿里、360、商汤等企业开始布局大模型市场。与文心一言同在搜索领域占据优势的有360GPT，2023数字安全与发展高峰论坛上，360创始人周鸿祎演示360GPT，其产品也被网友成为“红孩儿”。日前，360更是推出了“360智脑”。

接下来，大模型市场就更加热闹了。消息称网易有道教育场景下类ChatGPT模型“子曰”将推出，基于“子曰”大模型研发的AI口语老师和中文作文批改将开放内测。京东集团副总裁何晓冬也透露，京东将在今年发布新一代大模型“ChatJD”，定位为产业版本ChatGPT。不久前，昆仑万维宣布与奇点智源合作自研的国产大语言模型“天工3.5”即将发布，并开放邀请内测。

在AI赛道有深厚积淀的华为也并没有放弃这次机会，旗下的“盘古”系列的NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型被标注为即将上线状态，外界也认为华为即将加入大模型竞赛。字节跳动也被曝年初就已开始组建专门的大模型团队。其中大语言模型方向由字节搜索部门牵头。还有消息称，原阿里达摩院科学家，超大规模多模态预训练模型M6的技术负责人杨红霞已加入该团队。随着越来越多的赛车手加入，大模型领域的硝烟越来越浓。

野蛮生长与各自为战

天下大势，合久必分，分久必合。这是规律，尤其是在一个朝代结束时，先是十八路诸侯的争相挞伐，通过兼并战形成三足鼎立或南北对峙，最后一统天下。当前的大模型市场像极了十八路诸侯的征战。每一个涉及AI的企业都想在AIGC中获得竞争优势，又想借助大模型获得客户的信任与认可。然而“百模大战”，多个通用大模型百花齐放显然是不现实的，尽管谁都想在竞赛中脱颖而出。

事实上，与PC操作系统中的Windows、MacOS一样，以AI大模型为基础的商业生态中，最终成功的通用大模型为数不多，其他的竞争者也将成为存活下来的通用大模型的生态组成部分。这其中最大的原因在于算力。我们知道，大型语言模型对算力的需求很大，有需要海量的数据作为支撑，面临很大的资源缺口。据悉，ChatGPT依赖于英伟达的A100显卡，OpenAI为了训练ChatGPT甚至用上了上万片英伟达A100，这是一个巨大的算力消耗。ChatGPT还因需求量太大暂停了升级服务，并停止Plus付费项目的销售。

除了GPU外，存储系统也是限制之一。ChatGPT、文心一言等属于大型语言模型，其他的模型还有BERT、T5等。大型语言模型通常包含百亿级别的神经元或参数，因此对计算机系统的内存构成重大挑战。决定大型语言模型运行的性能瓶颈也通常在于存储系统。此外，还有强大的机器学习能力、海量的数据作为支撑。而这些也都是限制大模型的关键因素。这也成为这些语言大模型在发展中后期与其他大模型拉开距离的关键。事实上，拥有实力的企业屈指可数。

从细分领域、细分场景出发，与其说一些大模型的降生是为了掘金AIGC，倒不如说各大企业都在趁机提升自身产品的服务能力。日前，金山办公宣布推出具备大语言模型能力的生成式人工智能应用，暂定代号“WPS AI”。“WPS AI”未来将以用户体验为优先级，逐步放开公测，嵌入金山办公全线产品。由此可见，大模型的推出是为了部分满足自身的需求，在此基础上再满足其他企业的需求。

同时，我们也应该洞察大模型面向的客户的需求。日前，用友产品经理谈及类GPT产品时表示：“用友对于类ChatGPT是开放的态度，并不会只采用一种产品，而是各个产品的优势，尽可能地博采众长。”

大模型赛道，谁能笑傲江湖？

现在说笑傲江湖还为时尚早，目前大模型市场还处于烧钱入局的阶段。尽管如此，这些大模型依旧绕不开激烈的竞争。大模型市场对最终应用的能力影响极大，尤其是B端市场，基础大模型级别的ChatGPT、GPT4，偏向应用层的Midjourney、Stable Diffusion对于企业来说都已经是被市场验证过的，效果极佳的工具。在这个竞争格局下，国内市场被主流大模型及应用侵蚀是必然的。此外，大模型要想出海还绕不开数据安全、数据合规等问题。

然而，大模型市场的路到底在何方，深入哪些产业能够快速商业化。首先便是搜索，大语言模型彻底改变了“搜索”，从打开搜索引擎获取所需信息，到现在的打开大模型，或是集成了大模型的搜索引擎，不仅能获取所需信息，还能通过持续不断的对话不断精确答案;其实便是对现在应用的改造，智能化、数字化技术本身作为工具服务于人类，而大模型改变的并非一个独立的应用市场，而会对现有的全部应用市场进行改造。

数智化浪潮不断喷涌向前，大模型正如浪潮中的一个阶段，行业和企业要做的也只能是顺应这个趋势，用这些手段不断提升自身实力，以更好地服务千行百业的数字化转型。透过国内掀起的入局AIGC赛道的现象，我们可以清晰地看到百度、阿里、三六零等的大模型商品都是对自身产品和服务的进阶。