11月15日消息,日前,微软发布了一种让人工智能推理变得更好的方法,称为“Everything of Thought”(XOT)。这种方法的灵感来自谷歌DeepMind的AlphaZero,它利用紧凑的神经网络,与较大的神经网络相比可以表现得更好。
新的XOT方法是与佐治亚理工学院和华东师范大学合作开发的。他们将强化学习和蒙特卡洛树搜索(MCTS)相结合,这两种技术以其在复杂决策中的有效性而闻名。
研究人员说,这些技术结合在一起可以使语言模型有效地概括未知问题。研究人员对各种具有挑战性的任务进行了试验,如24人游戏、8拼图和口袋魔方,取得了令人印象深刻的结果。XOT在解决阻碍其他方法的问题方面已经超越了同时代人。然而,这种优越性并非没有局限性。尽管该系统取得了进步,但它还没有达到100%的可靠性。