GPT-4掀起新一轮AI风暴，被围堵的文心一言能否一战？

潇冷 | 2023-03-17

将文心一言发布时间定在3月16日的百度，没能预料到会遭到来自OpenAI、谷歌、微软的轮番轰炸：先是3月15日凌晨，OpenAI发布大型多模态Transformer模型GPT-4;紧接着，宣布开放大规模语言模型PaLM的API接口，并推出面向开发者的工具MakerSuite;文心一言发布之后，巨头们也并没有歇着，3月16日晚间，微软更是发布由AI驱动的办公神器Microsoft 365 Copilot，号称让Word、PPT、Excel、OutLook、协同办公软件的生产力都飙增。

面对卷起来的AIGC市场，百度文心一言被迫迎来了大考。发布会现场，百度创始人、董事长兼首席执行官李彦宏坦言：“从某种意义上说我们已经为此准备了多年，我们十几年前就开始投入AI研究，但也不能说我们完全ready(准备好)了，文心一言对标ChatGPT、甚至是对标GPT-4，门槛是很高的，全球大厂还没有一个做出来的，百度是第一个，我自己测试感觉还是有很多不完美的地方。”实践出真知，李彦宏也表现出自己的希冀：“一旦有了真实的人类反馈，文心一言的进步速度会非常快，希望它快点成长。”

GPT-4为何会掀起新一轮AI风暴？

2023开年元宇宙余温尚在，ChatGPT径直成为AI领域的热点之一，在经历短时间发酵之后，OpenAI最终放出大招，发布多模态大模型GPT-4，并迅速引爆全球舆论。事实上，GPT-4前代产品正是ChatGPT大模型——GPT3.5。GPT-4不仅对GPT3.5全方位升级，提升了自然语言文本处理能力，还开放了对图片的处理能力，引发了全球对生成式AI以及未来工作方式的畅想。

相较GPT3.5，GPT-4能够识别和处理更复杂的指令。OpenAI工作人员设置了“文本摘要”任务，要求GPT将一段话归纳为一句话，且每一个词都要以“G”开头。GPT-3.5忽视了要求，仅仅将这段话归纳为一句话，而GPT-4则生成了基本符合要求的回答。这也说明，GPT-4不仅能够识别复杂的指令，还能根据复杂的指令执行复杂的操作。据悉，GPT-4能够读取、分析或产生的文字篇幅高达25000词，远超篇幅上限为3000词的ChatGPT，可用于长篇内容创作、扩展对话以及文档搜索和分析等应用场景。

GPT-4还开放了对图片的处理能力，根据演示，GPT-4能够处理图片信息以及带有文本和照片的文档、图表或屏幕截图等图文交错的信息，并以文字的方式输出，不仅能识别照片中的各项事物，还能够理解事物之间的关系。此外，GPT-4响应被禁止内容请求的可能性降低了82%,产生事实响应的可能性提升了40%。由此可见，支持多模态的GPT-4无论在自然语言处理，还是在安全性方面，都有了一定的改进。

谷歌、微软竞赛拓展生成式AI使用场景

极速跟进的微软也成为新一轮AI竞赛中的赢家，表示新版搜索引擎必应已经在GPT-4上运行，而且正在进行商业变现。目前，微软希望利用外界对新必应以及OpenAI的关注去推动商业变现。据悉，微软正在全球各地举办路演活动，并与广告主和广告公司举行非公开会议，展示其测试中的ChatGPT版必应搜索的广告形式。微软在生成式AI商业模式的探索上，可以说走在了前列。

作为生成式AI，类GPT产品绝不止步于搜索领域，其目标是庞大的内容创作市场。至少谷歌、微软是这么想的。在OpenAI发布GPT-4之后，谷歌也宣布了自家产品在AI方面的一系列更新，Gmail、Google Doc、Sheets、Slides等所有Workspace办公组件将上线生成式AI功能。同时，谷歌还开放了自家的大语言模型PaLM的API。

微软也并不示弱，于当地时间3月16日，召开了一场AI主题的发布会，在Word、Excel、PowerPoint、Outlook等工具中，微软推出全新的AI服务产品“Copilot”。Copilot也可以实现自动生成内容，提高办公效率。在发布会上，微软表示，Copilot背后有复杂的处理和编排引擎，将有来自Microsoft Graph、GPT-4等模型的支持。

在文档中，用户给Copilot简单地描述需求，在几秒钟之内就可以获得一个初稿;在表格中，用户只需要导入原始数据，Copilot可以直接让AI助手对话并分析数据集的特点;在PPT中，用户只需要输入几个关键字，提出相关需求，Copilot就能帮助你自动生成一份PPT。事实上，Copoilt最重大的意义在于大幅提高了生产效率，减少了日常不必要的工作时间浪费。

文心一言是不是被苛求了？

从官宣文心一言到正式发布，百度紧锣密鼓地在为文心一言做准备，直到现在文心一言尚在内测阶段，由此可见，百度对文心一言的重视程度。发布会现场，李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。然而，在对文心一言评价时，李彦宏表示：“内测中‘文心一言’并不完美，但市场有需求必须要推出来。”

事实上，文心一言大模型的训练数据包括万亿级网页数据、数亿级的搜索数据和图片数据、百亿级的语言日均调用数据，以及5500亿事实的知识图谱。换言之，单纯从检索角度来看，只要数据库覆盖得足够广，文心一言地回答绝对不是问题。比如，问文心一言这道数学题——在一道减法算式中，被减数加减数再加差的和是674，又知减数比差的3倍多17，求减数。文心一言准确回答了答案，并列出了相应的算式。

如果仅作为检索工具的话，文心一言的价值将被低估，之所以关注度高的原因在于，文心一言的创作能力，然而正是这个创作能力，却让百度付出更多的努力。在文学创作上，文心一言可以抓住需求，进行一定的创作。创作的文案文笔流畅，句式多以排比表达，然而缺乏一定的情感流露。在文章写作上可以辅助创作，参考范式。

深层次的语义理解也为文心一言制造了难度，比如，在回答“我爸妈结婚的时候为什么没有邀请我”的问题时，文心一言并没有充分理解其中的逻辑，以至于用最直接的方式回答——很抱歉听到这个消息，也许你的父母有自己的原因没邀请你……事实上，ChatGPT也没能理解其中的关系。

箭在弦上的文心一言

自2月份百度官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。天极网和比特网也第一时间接入文心一言生态。从这一点来讲，文心一言的发布，不仅是国内生成式AI的期盼，同时也是合作伙伴的要求。百度也期望，经过试用之后，一旦有了真实的人类反馈，文心一言的进步速度会非常快，希望它快点成长。目前，文心一言还在内测阶段。

进入人工智能时代，IT技术栈也发生了根本性变化，由原来的芯片层、操作系统层、应用层三层，进化为芯片层、框架层、模型层和应用层四层。李彦宏坦言，今天，百度是全球为数不多、在这四层进行全栈布局的人工智能公司，从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预训练大模型，到搜索、智能云、自动驾驶、小度等应用，各个层面都有领先业界的自研技术。其中，文心一言位于模型层，目前，ERNIE 3.0每天接收数十亿次用户的搜索请求。

作为近期国内首款大模型，文心一言从回答速度到对话效果整体不错，虽然其中有很多令人啼笑皆非的bug。但是面对OpenAI的强势迭代让人们对生成式AI的期望值拉高，百度还是决定背水一战，官宣文心一言。正如就像李彦宏所说的：“这类大语言模型还远未到发展完善的阶段，进步空间很大，未来这段时间它一定会飞速发展，日新月异。”

在面对竞争激烈的生成式AI市场，笔者还是对国内同类产品充满期待。