GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?

潇冷 |  2023-03-17

  将文心一言发布时间定在3月16日的百度,没能预料到会遭到来自OpenAI、谷歌、微软的轮番轰炸:先是3月15日凌晨,OpenAI发布大型多模态Transformer模型GPT-4;紧接着,宣布开放大规模语言模型PaLM的API接口,并推出面向开发者的工具MakerSuite;文心一言发布之后,巨头们也并没有歇着,3月16日晚间,微软更是发布由AI驱动的办公神器Microsoft 365 Copilot,号称让Word、PPT、Excel、OutLook、协同办公软件的生产力都飙增。

  面对卷起来的AIGC市场,百度文心一言被迫迎来了大考。发布会现场,百度创始人、董事长兼首席执行官李彦宏坦言:“从某种意义上说我们已经为此准备了多年,我们十几年前就开始投入AI研究,但也不能说我们完全ready(准备好)了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。”实践出真知,李彦宏也表现出自己的希冀:“一旦有了真实的人类反馈,文心一言的进步速度会非常快,希望它快点成长。” 

GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?

  GPT-4为何会掀起新一轮AI风暴?

  2023开年元宇宙余温尚在,ChatGPT径直成为AI领域的热点之一,在经历短时间发酵之后,OpenAI最终放出大招,发布多模态大模型GPT-4,并迅速引爆全球舆论。事实上,GPT-4前代产品正是ChatGPT大模型——GPT3.5。GPT-4不仅对GPT3.5全方位升级,提升了自然语言文本处理能力,还开放了对图片的处理能力,引发了全球对生成式AI以及未来工作方式的畅想。

  相较GPT3.5,GPT-4能够识别和处理更复杂的指令。OpenAI工作人员设置了“文本摘要”任务,要求GPT将一段话归纳为一句话,且每一个词都要以“G”开头。GPT-3.5忽视了要求,仅仅将这段话归纳为一句话,而GPT-4则生成了基本符合要求的回答。这也说明,GPT-4不仅能够识别复杂的指令,还能根据复杂的指令执行复杂的操作。据悉,GPT-4能够读取、分析或产生的文字篇幅高达25000词,远超篇幅上限为3000词的ChatGPT,可用于长篇内容创作、扩展对话以及文档搜索和分析等应用场景。

  GPT-4还开放了对图片的处理能力,根据演示,GPT-4能够处理图片信息以及带有文本和照片的文档、图表或屏幕截图等图文交错的信息,并以文字的方式输出,不仅能识别照片中的各项事物,还能够理解事物之间的关系。此外,GPT-4响应被禁止内容请求的可能性降低了82%,产生事实响应的可能性提升了40%。由此可见,支持多模态的GPT-4无论在自然语言处理,还是在安全性方面,都有了一定的改进。 

GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?

  谷歌、微软竞赛拓展生成式AI使用场景

  极速跟进的微软也成为新一轮AI竞赛中的赢家,表示新版搜索引擎必应已经在GPT-4上运行,而且正在进行商业变现。目前,微软希望利用外界对新必应以及OpenAI的关注去推动商业变现。据悉,微软正在全球各地举办路演活动,并与广告主和广告公司举行非公开会议,展示其测试中的ChatGPT版必应搜索的广告形式。微软在生成式AI商业模式的探索上,可以说走在了前列。

  作为生成式AI,类GPT产品绝不止步于搜索领域,其目标是庞大的内容创作市场。至少谷歌、微软是这么想的。在OpenAI发布GPT-4之后,谷歌也宣布了自家产品在AI方面的一系列更新,Gmail、Google Doc、Sheets、Slides等所有Workspace办公组件将上线生成式AI功能。同时,谷歌还开放了自家的大语言模型PaLM的API。

  微软也并不示弱,于当地时间3月16日,召开了一场AI主题的发布会,在Word、Excel、PowerPoint、Outlook等工具中,微软推出全新的AI服务产品“Copilot”。Copilot也可以实现自动生成内容,提高办公效率。在发布会上,微软表示,Copilot背后有复杂的处理和编排引擎,将有来自Microsoft Graph、GPT-4等模型的支持。 

GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?

  在文档中,用户给Copilot简单地描述需求,在几秒钟之内就可以获得一个初稿;在表格中,用户只需要导入原始数据,Copilot可以直接让AI助手对话并分析数据集的特点;在PPT中,用户只需要输入几个关键字,提出相关需求,Copilot就能帮助你自动生成一份PPT。事实上,Copoilt最重大的意义在于大幅提高了生产效率,减少了日常不必要的工作时间浪费。

  文心一言是不是被苛求了?

  从官宣文心一言到正式发布,百度紧锣密鼓地在为文心一言做准备,直到现在文心一言尚在内测阶段,由此可见,百度对文心一言的重视程度。发布会现场,李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。然而,在对文心一言评价时,李彦宏表示:“内测中‘文心一言’并不完美,但市场有需求必须要推出来。”

  事实上,文心一言大模型的训练数据包括万亿级网页数据、数亿级的搜索数据和图片数据、百亿级的语言日均调用数据,以及5500亿事实的知识图谱。换言之,单纯从检索角度来看,只要数据库覆盖得足够广,文心一言地回答绝对不是问题。比如,问文心一言这道数学题——在一道减法算式中,被减数加减数再加差的和是674,又知减数比差的3倍多17,求减数。文心一言准确回答了答案,并列出了相应的算式。 

GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?

  如果仅作为检索工具的话,文心一言的价值将被低估,之所以关注度高的原因在于,文心一言的创作能力,然而正是这个创作能力,却让百度付出更多的努力。在文学创作上,文心一言可以抓住需求,进行一定的创作。创作的文案文笔流畅,句式多以排比表达,然而缺乏一定的情感流露。在文章写作上可以辅助创作,参考范式。 

GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?

  深层次的语义理解也为文心一言制造了难度,比如,在回答“我爸妈结婚的时候为什么没有邀请我”的问题时,文心一言并没有充分理解其中的逻辑,以至于用最直接的方式回答——很抱歉听到这个消息,也许你的父母有自己的原因没邀请你……事实上,ChatGPT也没能理解其中的关系。 

GPT-4掀起新一轮AI风暴,被围堵的文心一言能否一战?

  箭在弦上的文心一言

  自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。天极网和比特网也第一时间接入文心一言生态。从这一点来讲,文心一言的发布,不仅是国内生成式AI的期盼,同时也是合作伙伴的要求。百度也期望,经过试用之后,一旦有了真实的人类反馈,文心一言的进步速度会非常快,希望它快点成长。目前,文心一言还在内测阶段。

  进入人工智能时代,IT技术栈也发生了根本性变化,由原来的芯片层、操作系统层、应用层三层,进化为芯片层、框架层、模型层和应用层四层。李彦宏坦言,今天,百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。其中,文心一言位于模型层,目前,ERNIE 3.0每天接收数十亿次用户的搜索请求。

  作为近期国内首款大模型,文心一言从回答速度到对话效果整体不错,虽然其中有很多令人啼笑皆非的bug。但是面对OpenAI的强势迭代让人们对生成式AI的期望值拉高,百度还是决定背水一战,官宣文心一言。正如就像李彦宏所说的:“这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。”

  在面对竞争激烈的生成式AI市场,笔者还是对国内同类产品充满期待。

查看更多内容
正在加载
第三方账号登录
X
发布