如何理解中心极限定理?

学到中心极限定理的时候,很多同学一看到那一大堆的公式与叙述的时候,就感到头大。实际上,中心极限定理很容易理解。

我们看到,一般的正态分布 \(X\sim N(\mu,\sigma^2)\) 可以通过变换 \(\displaystyle Y=\frac{X-\mu}{\sigma}\sim N(0,1)\) 将一般正正态分布化成标准正态分布。我们知道一般正态分布 \(X\sim N(\mu,\sigma^2)\) 中的参数 \(\mu\) 就是随机变量的期望,\(\sigma^2\) 就是方差,\(\sigma\) 就是标准差。一般正态分布的这个变换用文字来表示就是

\[\frac{\text{随机变量}-\text{期望}}{\text{标准差}}\]

服从标准正态分布。

那么中心极限定理可以这么理解:\[\frac{\text{随机变量}-\text{期望}}{\text{标准差}}\] 近似服从标准正态分布,它以标准正态分布为极限。

我们首先来看一下独立同分布的中心极限定理,若 \(X_1,X_2,\cdots, X_n\) 相互独立,服从同一分布,具有期望(均值)\(E(X_i)=\mu\) 和方差 \(D(X_i)=\sigma^2, 1\le i\le n\),那么 \(\sum_{k=1}^nX_k\) 的期望与方差为 \(E(\sum_{k=1}^nX_k)=n\mu\), \(D(\sum_{k=1}^nX_k)=n\sigma^2\),标准差为 \(\sqrt{n}\sigma\),而中心极限定理给出了随机变量

\[\frac{\sum_{k=1}^nX_k-n\mu}{\sqrt{n}\sigma}\]

以正态分布为极限。

同样的分析,二项式分布 \(X\sim B(n,p)\) 的均值为 \(E(X)=np\),方差为 \(D(X)=npq\),中心极限定理给出了

\[\frac{X-np}{\sqrt{npq}}\]

以标准正态分布为极限。

李雅普诺夫定理是一样的。若 \(X_1,X_2,\cdots,X_n\) 相互独立,具有期望 \(E(X_i)=\mu_i\),方差 \(D(X)=\sigma^2_i, 1\le i\le n\),那么由期望与方差的性质,\(\sum_{k=1}^nX_k\) 的期望为 \(E(\sum_{k=1}^nX_k)=\sum_{k=1}^n\mu_k\),方差为 \(D(\sum_{k=1}^nX_k)=\sum_{k=1}^n\sigma^2_k\),中心极限定理给出了

\[\frac{\sum_{k=1}^nX_k-\sum_{k=1}^n\mu_k}{\sqrt{\sum_{k=1}^n\sigma^2_k}}\]

以标准正态分布为极限。