4.2.3 条件数学期望

条件数学期望是研究不独立随机变量的重要工具.

这里仅对离散型和连续型随机变量的条件数学期望作简单介绍.

简单地讲, 条件数学期望就是关于条件分布求数学期望.

设 (X,Y) 为二维离散型随机向量,有有限的数学期望.

在 {Y=bj​} 发生的条件下, X 的条件数学期望 (简称为条件期望),就是在条件分布

P(X=ai​∣Y=bj​),i=1,2,⋯

下求数学期望, 即

E[X∣Y=bj​]=i=1∑∞​ai​P(X=ai​∣Y=bj​).(4.2.14)

在 {X=ai​} 发生的条件下, Y 的条件数学期望,就是在条件分布列

P(Y=bj​∣X=ai​),j=1,2,⋯

下求数学期望, 即

E[Y∣X=ai​]=j=1∑∞​bj​P(Y=bj​∣X=ai​).(4.2.15)

设 (X,Y) 为二维连续型随机向量, 有有限的数学期望.

在 {Y=y} 发生的条件下, X 的条件数学期望, 就是在条件分布密度函数 fX∣Y​(x∣y) 下求数学期望, 即

E[X∣Y=y]=∫−∞∞​xfX∣Y​(x∣y)dx.(4.2.16)

在 {X=x} 发生的条件下, Y 的条件数学期望, 就是在条件分布密度函数 fY∣X​(y∣x) 下求数学期望, 即

E[Y∣X=x]=∫−∞∞​yfY∣X​(y∣x)dy.(4.2.17)

从 (4.2.14)-(4.2.17) 的定义式中,我们看到 E[X∣Y] 和 E[Y∣X] 分别为 Y 和 X 的函数.

比如在 E[X∣Y=bj​] 中, 就与 Y 的取值有关, 条件期望值随 Y 的取值而变化.

另外,由于随机变量 X 与 Y 相互独立时, 条件分布与各自的边缘分布相同.

所以此时条件期望等于无条件期望, 即 E[X∣Y]=E[X],E[Y∣X]=E[Y].

容易证明,

E[E[X∣Y]]=E[X],E[E[Y∣X]]=E[Y].(4.2.18)

这是两个非常重要的公式, 它们对应于全概率公式 (参见定理 1.3.2).

为帮助读者理解 (4.2.18) 中 E[E[X∣Y]] 的含义, 我们就离散型随机变量的情形来证明

E[E[X∣Y]]=E[X].

事实上, 由于 E[X∣Y] 是 Y 的函数, 则由随机变量函数的期望的计算公式 (4.1.2) 和 (4.2.14) 有

​E[ E[ X∣ Y] ] =j=1∑∞​E[ X∣ Y=bj​] ⋅ P(Y=bj​)=j=1∑∞​(i=1∑∞​ai​P(X=ai​∣ Y=bj​)) ⋅ P(Y=bj​)=j=1∑∞​(i=1∑∞​ai​P(Y=bj​)P(X=ai​,Y=bj​)​) ⋅ P(Y=bj​)=i=1∑∞​ai​(j=1∑∞​P(X=ai​,Y=bj​))=i=1∑∞​ai​P(X=ai​)=E[ X] .​

请读者对连续型随机变量的情形,用公式 (4.1.4) 和 (4.2.17) 证明 E[E[Y∣X]]= E[Y].

因为条件数学期望是研究非独立随机变量基本工具之一, 我们通过一个例子来体会其应用.

例 4.2.5 (随机个随机变量的和)

另外,由 (3.3.6) 和 (3.3.7) 我们看到, 若 (X,Y)∼N(μ1​,μ2​,σ12​,σ22​,ρ) (参见例 3.3.4), 则

E[X∣Y]=μ1​+ρσ2​σ1​​(Y−μ2​),

E[Y∣X]=μ2​+ρσ1​σ2​​(X−μ1​),

即 E[X∣Y] 和 E[Y∣X] 分别为 Y 和 X 的线性函数, 这是正态分布的很独特的性质之一.