条件数学期望是研究不独立随机变量的重要工具.
这里仅对离散型和连续型随机变量的条件数学期望作简单介绍.
简单地讲, 条件数学期望就是关于条件分布求数学期望.
设 (X,Y) 为二维离散型随机向量,有有限的数学期望.
在 {Y=bj} 发生的条件下, X 的条件数学期望 (简称为条件期望),就是在条件分布
P(X=ai∣Y=bj),i=1,2,⋯
下求数学期望, 即
E[X∣Y=bj]=i=1∑∞aiP(X=ai∣Y=bj).(4.2.14)
在 {X=ai} 发生的条件下, Y 的条件数学期望,就是在条件分布列
P(Y=bj∣X=ai),j=1,2,⋯
下求数学期望, 即
E[Y∣X=ai]=j=1∑∞bjP(Y=bj∣X=ai).(4.2.15)
设 (X,Y) 为二维连续型随机向量, 有有限的数学期望.
在 {Y=y} 发生的条件下, X 的条件数学期望, 就是在条件分布密度函数 fX∣Y(x∣y) 下求数学期望, 即
E[X∣Y=y]=∫−∞∞xfX∣Y(x∣y)dx.(4.2.16)
在 {X=x} 发生的条件下, Y 的条件数学期望, 就是在条件分布密度函数 fY∣X(y∣x) 下求数学期望, 即
E[Y∣X=x]=∫−∞∞yfY∣X(y∣x)dy.(4.2.17)
从 (4.2.14)-(4.2.17) 的定义式中,我们看到 E[X∣Y] 和 E[Y∣X] 分别为 Y 和 X 的函数.
比如在 E[X∣Y=bj] 中, 就与 Y 的取值有关, 条件期望值随 Y 的取值而变化.
另外,由于随机变量 X 与 Y 相互独立时, 条件分布与各自的边缘分布相同.
所以此时条件期望等于无条件期望, 即 E[X∣Y]=E[X],E[Y∣X]=E[Y].
容易证明,
E[E[X∣Y]]=E[X],E[E[Y∣X]]=E[Y].(4.2.18)
这是两个非常重要的公式, 它们对应于全概率公式 (参见定理 1.3.2).
为帮助读者理解 (4.2.18) 中 E[E[X∣Y]] 的含义, 我们就离散型随机变量的情形来证明
E[E[X∣Y]]=E[X].
事实上, 由于 E[X∣Y] 是 Y 的函数, 则由随机变量函数的期望的计算公式 (4.1.2) 和 (4.2.14) 有
E[ E[ X∣ Y] ] =j=1∑∞E[ X∣ Y=bj] ⋅ P(Y=bj)=j=1∑∞(i=1∑∞aiP(X=ai∣ Y=bj)) ⋅ P(Y=bj)=j=1∑∞(i=1∑∞aiP(Y=bj)P(X=ai,Y=bj)) ⋅ P(Y=bj)=i=1∑∞ai(j=1∑∞P(X=ai,Y=bj))=i=1∑∞aiP(X=ai)=E[ X] .
请读者对连续型随机变量的情形,用公式 (4.1.4) 和 (4.2.17) 证明 E[E[Y∣X]]= E[Y].
因为条件数学期望是研究非独立随机变量基本工具之一, 我们通过一个例子来体会其应用.
例 4.2.5 (随机个随机变量的和)
另外,由 (3.3.6) 和 (3.3.7) 我们看到, 若 (X,Y)∼N(μ1,μ2,σ12,σ22,ρ) (参见例 3.3.4), 则
E[X∣Y]=μ1+ρσ2σ1(Y−μ2),
E[Y∣X]=μ2+ρσ1σ2(X−μ1),
即 E[X∣Y] 和 E[Y∣X] 分别为 Y 和 X 的线性函数, 这是正态分布的很独特的性质之一.