9月11日,在2025 Inclusion·外滩大会主论坛上,2024年图灵奖得主、“强化学习之父”理查德·萨顿(Richard Sutton)发表主旨演讲,他认为,人类数据红利正逼近极限,人工智能正在进入以持续学习为核心的“经验时代”,潜力将远超以往。

理查德·萨顿在2025外滩大会主论坛发表主旨演讲
萨顿表示,今天大多数机器学习的目标,是把人类已有的知识转移到静态、缺乏自主学习能力的AI上。“我们逐渐达到人类数据的极限,现有的方法不能生成新的知识,不适合持续学习,而持续学习对智能的效用至关重要。”
他认为,“我们正进入‘经验时代’,需要一种新的数据源,由智能体与世界直接交互中生成。”萨顿解释,“经验”指的是观察、行动和奖励,这三种信号在智能体与世界之间来回传递。“知识来自于经验,可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度。经验是一切智能的核心与基础。”
他指出,强化学习带领我们进入了新的经验时代,但要释放全部潜力,还需要两项目前尚不成熟的技术——持续学习(continual learning)和元学习(meta-learning)技术。
面对外界对AI带来偏见,萨顿认为,这种对人工智能的恐惧被夸大了。他以经济社会的运行为例,只有当每个人有不同的目标和能力,经济才能运行得最好。同样,目标不同的智能体,可以通过去中心化的协作实现“双赢”。
“人类最伟大的成功在协作本身——经济、市场与政府都是成功协作的产物。”萨顿表示,人工智能和人类繁荣将来自去中心化协作。萨顿谈道,“人工智能是宇宙演化的必然下一步,我们应以勇气、自豪和冒险精神来迎接它。”
文/广州日报新花城记者:文静
广州日报新花城编辑:周裕妩


















































