通用还是行业?哪个才是大模型的未来发展方向

Yu |  2023-08-09

  无人不谈大模型,无疑是当下科技界的真实写照。

  ChatGPT的出现,瞬间点燃了科技圈对于大模型的热情。无论是科技巨头还是研究机构,亦或是AI创业公司,都纷纷入局该领域,以抢抓发展先机。

  自2023年3月以来,大模型相关产品如雨后春笋般涌现,有的专注文学创作,有的善于数学题解答,有的用于工具开发,还有的擅长常识问答……不得不说,目前市面上的大模型产品,难免让人有些眼花缭乱。

  通用大模型存在局限性?

  实际上,根据应用场景和目标人群的不同,可以将大模型分为通用大模型和行业大模型两大类。

  所谓通用大模型,是指具有广泛适用性的大型生成式AI模型,能够处理多种任务和应用于不同领域。这类大模型通常包含深度学习领域中的各种技术和算法,例如神经网络、自注意力机制、预训练等,可以用于处理自然语言处理、计算机视觉、语音识别等领域的任务。

  例如,ChatGPT就是一种通用大模型,拥有语言理解和文本生成能力,能够通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备根据聊天的上下文进行互动的能力,做到像人类一样来聊天交流,甚至能完成编写电子邮件、论文和代码等任务。

  不过,需要指出的是,纵使通用大模型非常强大,却也存在着一些局限性。

  首先,通用大模型需要大量的数据来进行训练和优化,通常会消耗大量的计算资源、时间和成本。据国盛证券发布的《ChatGPT需要多少算力》估算,ChatGPT的单次训练成本约为140万美元,对于一些更大的大模型,训练成本介于200万美元至1200万美元之间。另外,以ChatGPT在2023年1月的独立访客平均数1300万来计算,其对芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每天的电费支出大约在5万美元。

  其次,通用大模型数据主要来自公开文献和互联网信息,专业知识与行业数据积累不足,特别是在医疗、金融等专业性较强的产业,通用大模型提供的服务有限。此外,网上可能存在错误、谣言、偏见的信息,这可能会导致通用大模型精准度不够,生成有误或有偏见的响应。

  瞄准行业大模型

  行业大模型的出现,可以弥补通用大模型无法最优化适配到各行各业中的不足。

  行业大模型是指针对于某个特定行业或领域需求,采用大规模数据训练和先进算法的深度学习模型。行业大模型通常包括该行业的关键流程、价值链、参与者、关系和其他重要要素,可以帮助理解行业的运作机制、业务流程和价值创造方式。不仅如此,由于模型参数少,训练和推理的成本更低。

  值得一提的是,如今,有诸多企业加入到了行业大模型赛道。

  例如,百度联合行业头部企业、机构打造的文心行业大模型,目前已涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域;

  华为发布的盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,为行业客户、伙伴及开发者提供服务,已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值;

  腾讯云打造的大模型一站式服务MaaS(Model-as-a-Service)内置多个高质量行业大模型,涵盖金融、传媒、文旅、政务、教育等多个行业场景;

  京东推出的言犀大模型是立足于产业研发,融合了70%通用数据与30%数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,致力于各种产业场景,解决真实的产业问题;

  网易有道推出的教育领域垂直大模型“子曰”现已应用于有道生态内的软件和硬件上,包括大模型翻译、AI作文批改、英语语法精讲、虚拟人口语教练、AIBox、文档问答等;

  新华三发布的私域大模型百业灵犀(LinSeer)面向的是政府、企业等这类对数据安全天然敏感的场景……

  可以说,从目前市场现状来看,大模型竞赛从通用大模型转向行业大模型似乎正成为一种趋势。而且,业内也普遍认为,未来只会有两三家“独大”的通用大模型,并涌现出无数更贴近产业需求的行业大模型。

  写在最后:

  前不久,IDC对基于大模型的AI市场规模进行了预测,预计中国人工智能市场规模在2023年将超过147亿美元,到2026年这一规模将超过263亿美元。

  由此可见,大模型潜力不可小觑。因此,对于入局者而言,无疑将会拥有非常大的发展机遇。至于,未来的大模型会走向何方,还要看厂商们接下来如何布局。毕竟,大模型的竞赛才刚刚开始。 

查看更多内容
正在加载
第三方账号登录
X
发布