6. 中心极限定理与信息论
6.1 中心极限定理的严格推导
辅助变量构造
定义标准化变量:
Y=NX−N⋅⟨x⟩c
其中:
- X 是 N 个独立随机变量的和
- ⟨x⟩c 是单次试验的累积量(期望值)
累积量变换
⟨Yn⟩c⋅N1−2nN→∞{⟨x2⟩c,0,n=2n>2
高斯分布收敛
N→∞limpY(y)=2π⟨x2⟩c1e−2⟨x2⟩cy2
中心极限定理表述
设 {Xi} 为独立同分布随机变量序列,满足:
⟨Xin⟩c≪O(Nn/2),∀n
则标准化和:
Y=σN1i=1∑N(Xi−μ)
的概率密度函数收敛到标准正态分布,其中 μ=⟨Xi⟩, σ2=⟨(Xi−μ)2⟩
Lévy 分布
当高阶累积量不满足有限性条件时,收敛到更一般的 Lévy 分布(参考 Bowers 书 P46-47)
6.2 大数定律与热力学极限
热力学极限的分类
当 N→∞ 时:
- 强度量:O(1)
- 广延量:O(N)
- 指数依赖量:O(eNϕ)
注意:长程相互作用(如引力)会破坏广延性
Stirling 公式的严格推导
N!=∫0∞xNe−xdx=∫0∞eN(lnx−x/N)dx≈eNlnN−N2πN
lnN!=NlnN−N+21ln(2πN)+O(1/N)
6.3 信息熵与概率分布
信息量的定义
设离散随机变量 X 取值 {x1,…,xM},概率分布 {p1,…,pM}。发送 N 个独立符号的消息:
- 无先验知识时:需要 log2MN=Nlog2M 比特
- 已知概率分布时:典型序列数 g=∏i=1M(Npi)!N!
lng=−Ni=1∑Mpilnpi+O(lnN)
信息熵
S[{pi}]=−i=1∑Mpilnpi=−⟨lnpi⟩
性质:
- 最小值 Smin=0 (确定性分布 pi=δij)
- 最大值 Smax=lnM (均匀分布 pi=1/M)
信息熵的物理意义
度量概率分布的"无序程度":
- 高熵:高不确定性,高信息含量
- 低熵:高确定性,低信息含量
6.4 统计力学中的熵
玻尔兹曼熵
SB=kBlnΩ
其中 Ω 为宏观态对应的微观状态数
香农熵与统计力学
统计力学中的熵本质上是香农信息熵在热力学极限下的体现:
N→∞limN1SB(E,V,N)=s(ε,v)
其中 ε=E/N, v=V/N
熵的物理意义
- 热力学第二定律:孤立系统熵不减
- 信息解释:系统微观状态不确定性的度量
- 能量品质:熵越高,能量可用性越低