啃书文库 > 生活 >
编辑|梁金
从微小的细菌到复杂的动物,包含人类,都可以被看作是具备某种形式智能的存在。比如,培养皿中的细菌可以通过细胞膜上的受体蛋白来测试环境中化学物质的浓度梯度,并通过化学趋向性这一过程,向有利的化学物质浓度方向移动,同时避开有害物质。细菌这种单细胞生物,尽管结构简单,却拥有了感知环境和做出行动的基本能力,这使得它们可以探寻食物或逃避危险。
当很多单细胞生物通过简单行为进行交互汇聚成多细胞生物时,大家便见证了更为丰富和复杂的智能行为的诞生。以人类大脑为例,它由大约1000亿个神经元组成,这类神经元通过约100万亿个连接形成了一个庞大而复杂的互联网,一同构成了大家对世界的感知,控制身体运动,还赋予了大家意识、考虑、学习和记忆的能力。
从单细胞生物的适应性行为,到多细胞生物复杂神经元互联网所孕育的智能行为,大家不禁好奇:这类现象之间是不是存在一种常见适用的原理?自由能原理(Free Energy Principle)及其衍生的主动推理(Acitive Inference,也译作主动判断)框架,尝试从第一性原理出发,为大家提供一个可能的答案。
图1. 自由能原理尝试从第一性原理出发为生命和智能提供统一的讲解。
1. 生命、意识与智能的统一原理
在探讨生命起源到意识奥秘这一宏大话题时,很多科学家曾做出要紧贡献。比如,达尔文在《物种起源》中提出了演化论,觉得生物的多样性和复杂性是通过自然选择和适者存活的过程渐渐形成的。薛定谔在《生命是什么》中探讨了生命体怎么样在物理定律的框架内保持其高度有序的状况,尤其是通过引入“负熵”的定义来讲解生命体怎么样抵抗热力学第二定律所描述的无序趋势。他指出,生命系统通过与外面环境交换物质和能量,达成了内部的秩序和复杂性,这与开放系统通过能量流动保持秩序的思想相呼应。
普利高津的耗散结构理论进一步阐释了开放系统怎么样在离得远远的平衡态的条件下,通过能量和物质的流动生成和保持秩序。这一理论讲解了在非平衡状况下,系统怎么样通过耗散过程形成新的稳定结构,这类结构表现出高度的组织性和复杂性,与生命系统的特点相吻合。普利高津的工作扩展了大家对生命系统怎么样在动态过程中保持其复杂性的理解,可以视为是对薛定谔“负熵”定义的物理和数学上的深化与扩展。
目前,探索生命及意识起源奥秘的接力棒交到了自由能原理手中,这可能是大家距离揭示生命和意识起源与智能的奥秘近期的一次尝试。大家发现,这与以预测为核心的大语言模型之间存在很多相似之处,对于下一代AI算法的开发,可能可以带来新的的洞见和启示。
自由能原理(Free Energy Principle, FEP),由目前全球最具影响力的理论神经科学家 Karl Friston 提出,它揭示了生物系统怎么样通过最小化内部状况与外部环境预期之间的差异,即最小化自由能,来达成与环境的和谐共存和保持内部稳态。这一理论在过去二十年间不断深化,其理论基础根植于生物物理学和系统生物学,广泛应用于神经科学、认知科学和心理学范围,并对新一代AI算法产生了深远的影响。
图2. 达尔文,薛定谔,普利高津,和Karl Friston 。|源自互联网
基于自由能原理的主动推理(ActiveInference)提供了一个统一的框架,用于建模感知、学习和决策过程。在这一框架中,感知和行动被视为判断过程的一部分。主动推理进一步阐释了这一过程,它不只包含被动适应环境,还涉及主动通过行为改变环境,以达成预期状况。
主动推理理论的核心看法是,生物体的认知和行为都遵循相同的规则,即最小化感官观测的惊奇(surprise)。惊奇是衡量智能体目前感官观测与偏好观测之间的差异的指标。
在主动推理框架下,感知过程可以看作是调整智能体脑中的信念,使其与观测尽量一致。比如,当大家在路上行走,远看一个人影,走近后发现其实是一棵树,大家就更新了之前的错误信念。其次,行动过程则是通过改变世界,使感官观测与大家的信念(脑中的先验信念、偏好、表现型)尽量一致。譬如,大家在路上行走时忽然遇见大雨,为了防止被雨淋湿(这可以看作是大家脑中的先验信念),大家会飞速探寻避雨的地方,通过行动改变了感官观测,使世界状况与大家的预期相符。
主动推理理论框架可以通过两条路径来理解:一条是更贴日前常直觉的贝叶斯路径(Low road),另一条是更符合底层原理的物理路径(Highroad)[6]。下面,我将简要介绍这两条道路的思路和逻辑。关于这两条道路的更深入内容,将在后续的文章中进行详细讨论。
图3. 主动推理的两条路径:贝叶斯路径(Low road)和物理路径(Highroad)
2. 主动推理的第一条道路:从贝叶斯定理出发
在介绍贝叶斯定理的主动推理路径之前,大家第一需要区别一组重点定义:生成过程(Generative Process)与生成模型(Generative Model)。生成过程指的是现实世界中实质发生的事件过程,反应了现实世界的真实状况与这类状况怎么样决定大家的观测结果。相对地,生成模型则是智能体(无论是人类还是AI系统)对世界的信念和理解的内部表示。
图4. 生成过程和生成模型
因为大家没办法直接知道真实世界的生成过程,只能依据观测到的有限信息来构建对真实世界的认知。智能体通过这类观测信息在其大脑中构建一个模型,力图尽量地复原外部世界的生成过程。在AI范围,这种内部构建的模型有时也被叫做“世界模型”。
古希腊哲学家柏拉图提出过一个著名的洞穴思想实验,抛开更深层次的隐喻,这里不太严谨的借用这个实验进行举例:想象一个深洞穴,里面有一群囚徒自出生以来就被锁链束缚,面朝墙壁,不可以转身看到背后。在他们背后有一堆火,火光将洞穴外走过的人和手持物体的影子投射到囚徒面前的墙壁上。因为囚徒只能看到这类影子,他们便觉得影子是现实世界的全部。其中生成过程对应外面士兵及他手持的三维物体的运动,这是现实世界状况的真实演变。而洞穴中的囚徒所看到的,不过是这类三维物体在墙上的二维投影,这构成了囚徒头脑中的生成模型。囚徒所能做的就是通过阴影来判断物体的真实形态。
图5. 柏拉图洞穴思想实验
这种依据已知观测信息去判断未知信息(在这里指世界背后的真实状况)的过程就是贝叶斯定理的核心思想。比如,当大家从远处辨认一个模糊的轮廓时,大家可以运用贝叶斯定理来评估这个轮廓是人还是树的概率,并据此做出判断,这个过程一般是在大家大脑的潜意识中自动完成的,并无需进行刻意的、有意识的计算。这种由察看结果反推缘由的办法,展示了智能体怎么样借助已有些信念和新的观测数据不断更新对世界的理解。
比如,大家的视觉感知不止是被动地接收外面的信息,而是包括了一个主动的判断过程。在一些状况下,假如呈现给大家的视觉信息是模糊或误导性的,大脑会依据以往的经验和预期来做出判断,致使大家“看到”一些事实上并没有的事物。一个例子是著名的“缪勒-莱尔错觉”(Müller-Lyer illusion),两条相同长度的线由于箭头的指向不同,给人导致了长度不一样的错觉。
图6. 缪勒-莱尔错觉
19世纪德国物理学家赫尔曼·冯·亥姆霍兹(Hermannvon Helmholtz)是第一将大脑比作一个假设检验机器的科学家。他提出,人类的感知系统可以被视为一个统计判断引擎,功能是依据感官输入来判断最可能是什么原因。亥姆霍兹对产生知觉的“物理活动”进行了如下描述:“(它们)一般不是有意识的,而是无意识的。就结果来看它们就像推理活动,由于大家是从察看到的感官结果得出这种结果是什么原因。即便大家事实上只能直接接触神经层面的事件,也就是说,大家感知到的是感官结果,而不是外部对象。”(亥姆霍兹,1867年,翻译来自《预测心智》一书中文版)
到了20世纪末,Peter Dayan和Geoffrey Hinton在他们的开创性工作“sleep-wake算法”和“亥姆霍兹机”中[1,2],将热力学与统计物理学中的自由能定义引入机器学习范围。在热力学中,亥姆霍兹自由能概念为系统的能量减去其熵与绝对温度的乘积,用公式表示为 F=U-TS,其中U是系统的内能,T是温度,S是熵。在机器学习中引入变分分布后,变分自由能的定义被提出,它可以视为热力学自由能的信息论同构物。变分自由能通过结合模型的生成概率和观测数据的概率分布,为学习算法提供了一个优化目的。在这一框架下,变分自由能的最小化等价于数据的最大似然,这使得学习过程可以看作是在探寻可以最好讲解观测数据的模型参数。
进入21世纪,这一关于感知判断的视角得到了进一步的进步,形成了所谓的“贝叶斯大脑假说”,它将大脑的感知和决策过程视为一个贝叶斯判断的过程。这一假说觉得,大脑不断地依据先验常识和新的感官证据更新其对世界的估计和预测。
图7. “贝叶斯大脑假说”将大脑的感知和决策过程视为一个贝叶斯判断的过程。
上图是贝叶斯定理的数学形式,贝叶斯定理是概率论中的一条要紧定理,告诉大家怎么样依据了解到的结果逆向判断出潜在缘由,可以看作是一种由果溯因的推理方法。以贝叶斯定理为基础,大家可以将智能体的感知和行动过程视为贝叶斯判断的实践。在感知方面,大家依据观测到的状况来判断和更新对世界真实状况的估计;而在行动方面,大家依据自己的偏好和信念来判断应采取的行动。
然而,从公式中可以看到仅凭贝叶斯公式直接获得状况的后验估计面临一个复杂的数学挑战。观测的边际概率P(B)需要对所大概的状况进行积分才能得到。为应付这一难点,大家引入一个近似的后验分布,将判断问题转化为最佳化问题:探寻一个近似后验分布,使其尽量地接近真实后验分布。变分自由能作为衡量两者距离的上界,大家的目的便转变为最小化这一变分自由能,以此达到优化判断的目的。关于变分贝叶斯更详细的内容与具体的公式推导会在后续系列文章中进行介绍。
感知、模型学习和动作选择均可以理解为追求最小化自由能的过程。在这一过程中,感知与模型学习主要依托于目前及历史观测数据,而动作选择则着眼于将来还未发生的观测数据。在主动推理的框架下,依据时间维度的划分,自由能被分解为两个部分:一部分是着眼于过去的变分自由能,它涉及对现有和历史数据的剖析;另一部分是着眼于将来的期望自由能,它关乎通过行动使得将来的观测数据符合预期信念。
从贝叶斯定理演进到主动推理的道路中,大家看到了什么是自由能,与怎么样最小化自由能。然而,一个更深层次的问题尚未得到解答:为什么大家会追求最小化自由能,或者说,为什么生物体要致力于最小化惊奇(surprise)?为了深入这一问题,大家需要将视线提高至更高层次——透过随机动力系统这一数学习物理视角,大家将看到生物体得以存在的必要条件就是最小化自由能。
通过这种高层次的剖析,大家开始理解,自由能最小化不止是一个数学上的定义,而是生物体适应环境、保持内部稳态、并有效预测将来事件的重点机制。这一原理指导着生物体怎么样通过内部模型来预测和讲解外部世界,从而在不断变化的环境中存活和延续。
3. 主动推理的第二条道路:从随机动力系统出发
生物系统可以被视为一个处于非平衡稳态的开放系统,它们不断地与外面交换物质和能量。在数学上,这种系统可以被建模为随机动力系统,以捕捉其内在的动态性和随机性。其中,“非平衡”指的是系统与外面之间有能量或物质的交换,意味着系统不是封闭的,更不是静止的,而是处于持续的变化之中。而“稳态”则指尽管有交换发生,系统的一些宏观性质在肯定时间内相对稳定,表现出一种动态的平衡。这种稳定性是通过系统内部的调节机制和反馈循环达成的,使得生物系统可以在面对环境变化时维持功能和结构的连贯性。
一个典型的例子就是人体的体温调节。无论外部环境怎么样变化,人体的生理机制都能通过调节血管的扩张与缩短、汗腺的分泌与代谢率等,维持体温在大约37摄氏度的恒定水平。
从随机动力系统出发的自由能原理路径想要回答的一个核心问题就是,生物系统怎么样抵抗外面环境波动所带来的耗散效应?换句话说,外面环境在不断变化,假如生物系统不可以抵抗这种变化保持内部状况的稳定就会死亡。有两种方法可以保持内部状况的稳定,一种方法是改变内部状况减少对环境的“惊奇”,也就是内部状况应该尽量准确预测外部的环境状况,另一种方法是通过行动改变外面状况使得内部状况保持在预期的范围内。
还是以体温调节为例,设想你穿着短袖衣物站在冰天雪地的户外,短期内,你的身领会通过内在的调节机制来维持体温接近37摄氏度,这是人体的理想内稳态。这一过程涉及到改变身体的内部状况,以适应外部环境的挑战。然而,假如长期暴露在这样恶劣的低温环境中,即使是最健康的身体也终将没办法承受,没办法继续保持这一内稳态,最后致使死亡。幸运的是,与单纯的内部调节相比,大家还拥有另一种强大的能力——通过行动来改变环境状况,进而保持体内温度的稳态。比如,大家可以增添衣物,或是探寻一个温暖的地方避寒。这类行动改变了大家所处的环境条件,帮助大家保持了体内温度的稳定。
应该注意的是,这个例子虽然直观,但它简化了实质状况。事实上,身体对内部状况的调节不只关注于目前时刻的状况,而是着眼于整个随机动力系统的稳态分布。这种稳态分布遭到智能体感知过程和行动方案的影响,不一样的感知过程或行动方案或许会致使不一样的稳态分布。概括来讲,生物体通过复杂的内在调节和行为适应,不断寻求在变化的环境中维持稳态。而那些不那样幸运的生物系统,因为不可以有效使稳态分布的熵达到最小化,在自然选择的过程中很难存续。
图8. 系统的状况可分为四类:代表外部环境的外部状况(external state)、智能体的观测状况(sensation state)、内部状况(internal state)与动作状况(action state)。
以上提供了一种直观的理解,从更正式的随机动力系统的角度出发建模生物系统,大家可将系统的状况分为四类:代表外部环境的外部状况、智能体的观测状况、内部状况与动作状况。在感知过程中,观测状况映射到内部状况,在采取行动方案时,内部状况映射到动作状况。智能体的观测状况和动作状况一同构成了所谓的马尔可夫毯(Markov blanket)。在给定马尔可夫毯的条件下,智能体的内部状况与外部环境状况在统计上是独立的。这种独立性为智能体提供了一种基础,使其可以抵抗环境扰动带来的耗散效应。
正如薛定谔指出,生命系统拥有一种非凡的能力:它们可以抵御外面环境的干扰,违背热力学第二定律所描述的自然趋势,保持自己的有序状况。相较之下,非生命系统总是因没办法抵御这类干扰而走向解体。以雪花的消失为例,当它从高空飘落,接近地面时,温度渐渐升高使其融化成雨滴。大家可以说雪花这个物体因为不可以抵抗外面温度的升高保持内部状况的稳定从而走向消亡,设想假如雪花能装上一双翅膀,向上飞行,它就能维持原有些形态。
这里,大家所要探讨的问题不止是生命系统怎么才能抵御外面的干扰,更要紧的是,一个系统需要满足什么条件,才能拥有这种抵御能力,从而成为大家所理解的生命。答案是只有那些可以最小化自己自由能的系统,才能有效抵抗环境的扰动,持续存在。
图9. 生命系统拥有一种非凡的能力,可以抵御外面环境干扰,保持自己的有序状况,而像雪花如此的非生命系统则不可以。
从系统生物学的角度,生命体可以类比为一个处于稳态分布的随机动力系统[4,5]。在这个系统中,大家假设存在可遍历(ergodic)的随机动态吸引子(random dynamical attractor),意味着有一组常常被访问的吸引状况。还是以体温为例,它不会进行无序的随机游走,而是在某个特定值附近波动。该动力系统在长期演化下,这类吸引状况的时间平均可以代表状况的分布密度,这个密度被叫做遍历密度(ergodic density),遍历密度可以通过Fokker-Planck方程的稳态解得到(Fokker-Planck方程表示连续时间随机过程的概率密度函数的演化)。借用于遍历密度的定义,大家得以进一步借助香农熵来概念随机动力系统的遍历熵(ergodic entropy)。遍历熵是对系统长期行为的统计特质的一种度量,它可以被理解为当时间趋向于无穷大时,系统状况的“惊奇”路径积分。在这里,“惊奇”(surprise)指的是状况的负对数似然概率(即-lnp(s)),一个状况的惊奇越大,该状况发生的概率越小。
图10. 生命体可以类比为一个处于稳态分布的随机动力系统,大家假设这个系统中存在可遍历的随机动态吸引子。
智能体应该使得系统的遍历熵维持在一个尽量低的水平。然而,因为智能体没办法直接访问外部状况,因此需要通过最小化观测状况的熵,间接地达成对外部隐藏状况熵的控制。为了使观测状况的熵尽量低,系统需要在内部状况中包括尽量多的关于外部状况的信息,达成对观测状况尽量准确的预测,这等同于最小化观测状况的“惊奇”度。换句话说,智能体的感知和动作应该旨在最小化“惊奇”。自由能可以视为感官惊奇的一个上界。因此,通过最小化自由能,智能体事实上也在最小化其“惊奇”。
通过改变感知过程和行动方案,系统可以大大降低自由能,隐含地使得该系统可以将外部状况的“惊奇”最小化,同时使得系统的熵达到最小化,从而保持其有序的存在状况。用一个简单的比喻来讲,想象一个在森林中探寻食物的动物。假如这个动物可以预测食物出现的地方(譬如通过察看其他动物的行为或者环境的线索),它就能更有效地找到食物,而不是在森林里随机游荡。通过最小化自由能,动物事实上是在最小化探寻食物时的“惊奇”和不确定性,确保自己可以存活下去。
由此可以看出,最小化自由能是生物系统为了存活和适应环境所演化出的一种必要机制。这一过程将问题从“生物体需要怎么样行动来获得食物”转变为“为了存活,生物需要实行什么行动”。可以通过物理学哈密顿力学中局部视角和全局视角进行类比。局部视角关注于粒子在相空间中遵循哈密顿正则方程的具体演化过程。相对地,全局视角——即哈密顿的最小用途量原理——表明,在所大概的运动路径中,真实的系统演化路径是那条使得用途量取极小值的路径。同样地,智能体使用使自由能取最小值的方法进行感知和行动,这也为何自由能原理被誉为统一生物体感知和行动的第一性原理。
至此,大家分别从底层路径和顶层路径介绍了自由能原理及主动推理框架的基本思想。作为一种高度抽象的底层原理,自由能原理在认知科学与神经科学范围等具备广泛应用,大家将在下一篇继续介绍。
参考文献
1. HintonG E, Dayan P, Frey B J, et al. The wake-sleep algorithm forunsupervised neural networks[J]. Science, 1995, 268(5214): 1158-1161.
2. DayanP, Hinton G E, Neal R M, et al. The helmholtz machine[J]. Neural computation,1995, 7(5): 889-904.
3. FristonK, Kilner J, Harrison L. A free energy principle for the brain[J]. Journal ofphysiology-Paris, 2006, 100(1-3): 70-87.
4. FristonK, Ao P. Free energy, value, and attractors[J]. Computational and mathematicalmethods in medicine, 2012, 2012.
5. KarlF. A free energy principle for biological systems[J]. Entropy, 2012, 14(11):2100-2121.
6. ParrT, Pezzulo G, Friston K J. Active inference: the free energy principle in mind,brain, and behavior[M]. MIT Press, 2022.
7. ClarkA. Surfing uncertainty: Prediction, action, and the embodied mind[M]. OxfordUniversity Press, 2015.
8. Hafner D, Ortega P A, Ba J, et al. Action and perception asdivergence minimization[J]. arXiv preprint arXiv:2009.01791, 2020.
9. Mazzaglia P, Verbelen T, Çatal O, etal. The free energy principle for perception and action: A deep learningperspective[J]. Entropy, 2022, 24(2): 301.
本文为科普中国·创作培育计划扶持作品
出品:中国科协科普部
监制:中国科技出版社公司、北京中科星河文化传媒公司
- 上一篇:夹竹桃的奥秘
- 下一篇:没有了
猜你喜欢
- 2024-05-24 无师自通!目前的人工智能欺骗方法有多“高明”
- 2024-05-07 一个人将来会不会痴呆新型人工智能算法提前15年预测!
- 2024-05-06 将来新科技巨头人工智能智能体技术应用及展望
- 2024-04-16 小米手环怎么样?小米智能手环拆解图文解释说明
- 2024-03-27 联合国关于AI的首个决议!全文来了→
- 2024-03-18 害虫:咋吃个饭还能暴露身份证号呢!
- 2024-03-16 首个玩好游戏世界的人工智能智能体!能像人类一样按指令接任务
- 2024-03-07 河北高职单招有什么专业2024 河北高职单招有什么专业2024年
- 热点排行
- 热门推荐
- 热门tag