离散型随机变量期望、方差的一些公式与证明
声明
本文基于人教版高中数学选修 2-3,本中随机变量均为离散型随机变量。
本文中 x∑ 为 x∈Range(X)∑(Range(X) 表示随机变量 X 可能的取值的集合)的简写。
期望
期望的线性性质
E(aX+b)=aE(X)+b
课本上就有,证明略。
公式 1
E(X+Y)=E(X)+E(Y)
证明
E(X+Y)=x∑y∑(x+y)P(X=x,Y=y)=x∑y∑xP(X=x,Y=y)+x∑y∑yP(X=x,Y=y)=x∑xy∑P(X=x,Y=y)+y∑yx∑P(X=x,Y=y)=x∑xP(X=x)+y∑yP(Y=y)=E(X)+E(Y)
公式 2
在 X,Y 相互独立的情况下,有
E(XY)=E(X)E(Y)
证明
由 X,Y 相互独立知 P(X=x,Y=y)=P(X=x)P(Y=y)
所以
E(XY)=x∑y∑xyP(X=x,Y=y)=x∑y∑xyP(X=x)P(Y=y)=x∑xP(X=x)y∑yP(Y=y)=x∑xP(X=x)E(Y)=E(Y)x∑xP(X=x)=E(X)E(Y)
方差
定义
D(X)=x∑(x−E(X))2P(X=x)
换种写法
D(X)=E(x−E(X))2
再换种写法
D(X)=E[X−E(X)]2=E[X2−2X⋅E(X)+(E(X))2]=E(X2)−2E(X)E(X)+(E(X))2=E(X2)−(E(X))2
即
D(X)=E(X2)−(E(X))2
公式 1
D(aX+b)=a2D(X)
课本上就有,证明略。
公式 2
在 X,Y 相互独立的情况下,有
D(X+Y)=D(X)+D(Y)
证明
D(X+Y)=E(X+Y)2−(E(X+Y))2=E(X2+Y2+2XY)−(E(X)+E(Y))2=E(X2−E2(X))+E(Y2−E2(Y))+E(2XY)−2E(X)E(Y)=D(X)+D(Y)+0
即:D(X+Y)=D(X)+D(Y)
超几何分布
定义
N 个物品中有 M 个次品,超几何分布描述了在这 N 个样本中选 n 个,其中有 k 个次品的概率。
P(X=k)=CNnCMkCN−Mn−k
若随机变量 X 服从参数为 n,M,N 的超几何分布,则记为
x∼H(n,M,N)
期望
若 x∼H(n,M,N),则
E(X)=NnM
证明
引理 1
由组合数公式可以得到 k⋅CMk=M⋅CM−1k−1
引理 2
由组合数公式可以得到 CNn=nN⋅CN−1n−1
引理 3
由超几何分布概率和为 1,即 k=0∑mP(X=k)=k=0∑mCNnCMkCN−Mn−k=1
可得 k=0∑mCMkCN−Mn−k=CNn
推导过程
E(x)=k=0∑mk⋅CNnCMk⋅CN−Mn−k=CNn1k=0∑mkCMK⋅CN−Mn−k=CNn1k=1∑mMCM−1k−1CN−Mn−k=CNnMk=1∑mCM−1k−1CN−Mn−k=CNnMCN−1n−1=NnM
方差
D(x)=(N−1)n(NM)(1−NM)(N−n)
二项分布
定义
二项分布(Binomial distribution)是 n 个 独立重复试验中成功的次数的离散概率分布,其中每次试验的成功概率为 p。这样的单次成功/失败试验又称为 伯努利试验。
实际上,当 n=1 时,二项分布就是两点分布。
一般地,如果随机变量 X 服从参数 n 和 p 的二项分布,我们记 x∼b(n,p) 或 X∼B(n,p). n 次试验中正好得到 k 次成功的概率为
P(x=k)=Cnk pk (1−p)n−k
期望
若 X∼B(n,p),则
E(x)=np
证明
简单的证明
记
xi={10第 i 次试验成功第 i 次试验不成功
显然 E(xi)=p
由于 X=x1+x2+⋯+xn,根据期望的线性性质,
E(X)=E(x1)+E(x2)+⋯+E(xn)=np
复杂的证明
记 q=1−p,那么
E(X)=k=0∑nkP(X=k)=k=0∑nkCnkpkqn−k=k=1∑nkCnkpkqn−k=pk=1∑nnCn−1k−1pk−1q(n−1)−(k−1)=npk=1∑nCn−1k−1pk−1q(n−1)−(k−1)=np⋅(p+q)n−1(二项式定理)=np
方差
D(x)=np(1−p)
证明
简单的方法
类似于期望的那种证明方法。
复杂的方法
D(X)=k=0∑n[k−E(X)]2⋅pk=k=0∑n(k−np)2⋅Cnkpkqn−k=k=0∑nk2⋅Cnkpkqn−k+k=0∑n−2npk⋅Cnkpkqn−k+k=0∑nn2p2⋅Cnkpkqn−k=k=0∑n(k−1)⋅k⋅Cnkpkqn−k+k=0∑nk⋅Cnkpkqn−k−2npk=0∑nk⋅Cnkpkqn−k=+n2p2k=0∑nCnkpkqn−k=k=1∑n(k−1)⋅k⋅Cnkpkqn−k+np−2np⋅np+n2p2=nk=2∑n(k−1)⋅Cn−1k−1pkqn−k+np−n2p2=n(n−1)p2k=2∑nCn−2k−2pk−2q(n−2)−(k−2)+np−n2p2(令k−2=i)=n(n−1)p2i=0∑n−2Cn−2ipiq(n−2)−i+np−n2p2=n(n−1)p2+np−n2p2=npq