问题表示
有很多概率问题,尤其是独立重复实验问题,如果用生成函数的方法来做,会显得特别方便。本文要讲的“随机游走”问题便是其中一例,它又被形象地叫做“醉汉问题”,其本质上是一个二项分布,但是由于取了极限,出现了很多新的性质和应用。我们先考虑如下问题:
考虑实数轴上的一个粒子,在 \(t=0\) 时刻它位于原点,每过一秒,它要不向前移动一格(+1),要不就向后移动一格(-1),问 \(n\) 秒后它所处位置的概率分布。
不难发现,这个问题跟二项分布是雷同的。如果把这个粒子形象比喻成一个“喝醉酒的人”,那么上面的走法就类似于一个完全不省人事的醉汉走路问题了。(当然,醉汉是在三维空间走路的,这里简单起见,只描述了一维的。)这是一个独立重复实验,每秒的行走可用函数描述为 \(\frac{1}{2}(z+z^{-1})\),于是\(n\) 秒后的运动分布情况可以用
来描述,\(z^i(i=-n,-n+1,\dots,n-1,n)\) 的系数表示粒子位于 \(i\) 的概率。
💡 \(\frac{1}{2^n}(z+z^{-1})^n\) 是生成函数, 为什么用这个函数:
计算期望
首先,生成函数 \(f(z)\) 乘以 \(z\) 后求导可以得到位置乘以概率的和,也就是位置的期望。原因如下
我们的生成函数 \(f(z)=\frac{1}{2^n}(z+z^{-1})^n\) 可以写成如下形式:
$$
f(z)=\sum_{i=-n}^n p_iz^i
$$
其中 \(p_i\) 是位置i的概率, 对这个函数求导:
再乘以 \(z\) :
当 \(z=1\) 时:
这正是期望的定义:位置 \(i\) 乘以对应的概率( \(p_i\) )的和, 即
具体来说,
也就是说,随机游走的期望为0,这是符合直觉的:因为向左和向右的概率相等,整个过程是对称的,无论走多少步,平均位置都在原点.
随机游走(维纳过程)
下面我们考虑一个更细致的随机行走问题,它导出了我们关于“随机游走”的基本结果。
考虑实数轴上的一个粒子,在 \(t=0\) 时刻它位于原点,每过 \(\Delta t\) 秒,它要不向前移动 \(\Delta s\) 格(\(+\Delta s\)),要不就向后移动 \(\Delta s\) 格(\(-\Delta s\)),考虑\(\Delta t\),\(\Delta s\to 0\),问 \(t\) 秒后它所处位置的概率分布。
类似上面的做法,我们得到生成函数
由于\(\Delta t,\Delta s\to 0\),我们用 \(e^{-i\omega}\) 代替 \(z\),得到用傅里叶变换描述的生成函数:
使用欧拉公式化简得
为了得到意义明显的结果,取 \(\Delta s^2 =\alpha \Delta t,\Delta t\to 0\),得到
根据我们的推导过程,这就是随机游走问题概率分布的傅里叶变换结果。也就是说,假如 1 秒后,粒子位于\([x,x+dx]\) 处的概率是 \(P(x)dx\),那么就有
通过傅里叶变换的逆变换,得到
这就是随机游走的概率分布,结果表明粒子的位置服从正态分布。上面的结果可以不费力地推广到高维。
随机游走(英语:Random Walk,缩写为 RW),是一种数学统计模型,它是一连串的轨迹所组成,其中每一次都是随机的。它能用来表示不规则的变动形式,如同一个人酒后乱步,所形成的随机过程记录。1905年,由卡尔·皮尔逊首次提出。随机游走是很多物理现象的数学基础,比如,在生产一个产品的时候,如果每个步骤的误差大概是一样的,那么最终的误差就是随机游走问题。类似的还有布朗运动、扩散定律等等,甚至量子力学的薛定谔方程在某种意义上也是一种随机游走。不过,由于\(\Delta t \propto \Delta s ^2\),它居然是无穷大的速度!这背后的内涵还让笔者在困惑之中,但我们很快会继续回到这个话题上的。