AI再进化:系统二思维让大模型学会深思熟虑

Yu |  2024-10-29

  如果要问近几年人工智能领域哪个研究方向火爆,恐怕非大模型莫属。随着2022年年底OpenAI推出ChatGPT产品,围绕大模型的人工智能商业化进程驶入快车道,深刻地改变着各行各业的生产方式和服务模式。

  根据市场调研机构Precedence Research的数据,2023年,全球人工智能市场规模已达约11879亿元,预计到2030年,这一数字将飙升至114554亿元,实现超过35%的复合增长率。但需要指出的是,模型的训练需要海量的数据,包括文本、图像、语音等,并且在训练过程中,可能还要调整模型的参数来优化性能、提升准确性,这就要有强大的计算能力提供支撑。

  数据显示,ChatGPT一次完整的模型训练成本超过8000万元。如果进行10次完整的模型训练,成本便高达8亿元,这显然成为了大模型发展的一大障碍。

  不过,近期OpenAI高级科学家Noam Brown提出了一项引人注目的理论,为解决这一难题提供了新的思路。他表示,让AI模型在每次决策前思考20秒,其性能提升相当于扩大模型体积和训练时间至十万倍,而“系统二思维”(System 2 thinking)正是实现这一突破的关键所在。

  AI领域新的思维模式

  系统二思维这一概念源于心理学,由诺贝尔奖得主Daniel Kahneman提出。该理论认为,人类思维是由两个截然不同的系统驱动的。系统一思维是快速、直观和自动的,控制着我们的快速判断,比如对突发事件的反应或对熟悉模式的识别。相比之下,系统二思维则是缓慢的、深思熟虑的、善于分析的,支持复杂的问题解决、计划和推理。

  尽管这两个系统通常被分开对待,但它们在不断地相互作用。系统一思维产生印象、直觉和意图;系统二思维对建议进行评估,如果认同,就将其整合进深思熟虑的选择中。这使得人类能够无缝地驾驭各种情况,从日常生活到具有挑战性的问题。

  Brown将这一理论引入AI领域,并主张通过促使AI进行更深层次的分析与推理,能够在不大幅增加资源的前提下,显著提升模型的性能。具体来看:

  第一,提升推理和解决问题的能力。具有系统二思维的大模型将在逻辑推理、理解复杂概念以及解决需要仔细思考和考虑的问题方面表现得更好。这可能包括从高级数学问题解决到更微妙的道德推理等方面。

  第二,改善对上下文和细微差别的理解。当前的大模型在理解上下文和细微差别方面可能会遇到困难,尤其是在复杂或模棱两可的情况下。系统二思维将使大模型更好地掌握人类语言的微妙之处和现实世界场景的复杂性。

  第三,减少偏见和错误。虽然系统一思维反应迅速,但也更容易受到偏见和错误的困扰。通过纳入系统二思维,大模型有可能减少这些偏见,导致更公平和准确的结果。

  第四,更好制定决策。在商业或医学等决策通常具有重大后果的领域,具有系统二思维的大模型可以分析大量数据,权衡不同的选项,并根据逻辑推理和证据提出决策建议。

  第五,增强学习和适应能力。大模型中的系统二思维可能会导致改进的学习能力,使其不仅能够从数据中学习,而且能够理解和应用各种情况下的抽象概念、原则和策略。

  第六,更有效地人机协作。有了系统二思维,大模型能更好地理解和预测人类的需求和行为,从而带来更有效和直觉的人机互动和合作。

 发展未来可期

  值得注意的是,在AI领域实现真正的系统二思维是一项重大挑战。这不仅需要改进算法方法和计算能力,还需要更好地理解人类的认知和推理过程。到目前为止,大模型主要以一种更接近人类系统一思维的方式运行,依赖于模式识别和快速反应生成,而不是深入的逻辑推理。

  但我们也看到,已经有科技企业迈出了探索的步伐。例如,OpenAI推出的o1模型融入了系统二思维,从而使得AI能够执行更为深入的推理过程。据悉,在国际数学奥林匹克资格考试中,该模型的正确率高达83%,远超目前主流模型的13%。

  同样值得关注的,还有DeepMind推出的Talker-Reasoner框架。这一框架结合了两种思维模式。其中,Talker组件负责处理与用户和环境的实时交互,感知观察,解释语言,从记忆中检索信息,并产生对话反应。Reasoner组件负责执行复杂的推理和规划,并与工具和外部数据源互动,以增加其知识并作出明智的决策。

  我们认为,通过模拟人类的深思熟虑过程,大模型不仅能够提高其解决问题的能力,还能更好地理解和适应复杂多变的环境。这种进步不仅限于技术领域内的应用扩展,更意味着在更多的行业中实现更加人性化和高效的服务。

  写在最后:

  毫不夸张地说,将系统二思维整合到大模型标志着AI迎来了进化的关键时刻。可以预见的是,随着大模型的广泛应用,将帮助我们解决更为复杂的问题、提供更加精准的服务,推动人类社会迈向一个全新的智能时代。

查看更多内容
正在加载
第三方账号登录
X
发布