2_0 多维随机变量及其分布

2_0 多维随机变量及其分布

内容来源于教材第三章,作为讲义的补充

学习目标

  • 了解为什么要引入二维随机变量, 理解二维随机变量和联合分布的定义
  • 理解一维随机变量和二维随机变量的差异, 掌握边缘分布和联合分布之间, 以及边缘密度函数和联合密度函数之间的联系
  • 理解条件密度函数的定义, 掌握条件密度函数、边缘密度函数和联合密度函数三者之间的关系
  • 掌握随机变量相互独立的定义, 并能熟练地应用独立性来求有关事件的概率
  • 掌握求多个随机变量函数的分布的方法

多维随机变量及其分布

多维随机变量

有时候, 我们对随机试验的结果要用两个或两个以上的随机变量来描述, 例如为了研究某学区学龄前儿童的身体发育情况, 需要了解他 (她) 们的身高 (H)(H) 和体重 (W)(W) .记 Ω={该学区学龄前儿童的全体}\Omega = \{\text{该学区学龄前儿童的全体}\}, 学龄前儿童记为 ω\omega ,则 {ω:X(ω)=(H(ω),W(ω))}\{\omega :X(\omega) = (H(\omega),W(\omega))\} 表示该儿童的身高体重. XX 称为二维随机变量, 它可以用来描述学龄前儿童的身体发育状况.

定义 3.1 多维随机变量

X1(ω),X2(ω),,Xn(ω)X_{1}(\omega),X_{2}(\omega),\dots ,X_{n}(\omega)同一样本空间上的随机变量, 则称

>X(ω)=(X1(ω),X2(ω),,Xn(ω))> > X(\omega) = (X_{1}(\omega),X_{2}(\omega),\dots ,X_{n}(\omega)) >

nn 维随机变量, 或称为 nn 维随机向量. 通常简记为 (X1,X2,,Xn)(X_{1},X_{2},\dots ,X_{n})XX

在多维随机变量中, 每个坐标都是同一样本空间中的随机变量 (图 3.1), 它们之间还会有某种关系, 所以研究单个随机变量是不够的. 我们必须把它们放在一起进行研究.

先研究二维随机变量. 类似于一维随机变量, 我们也是要研究它们取哪些值以及取这些值的概率多大. 这就引入如下定义:

定义 3.2 二维分布函数

(X,Y)(X,Y) 是二维随机变量, (x,y)R2(x,y)\in \mathbb{R}^{2} ,称二元函数

>F(x,y)=P(Xx,Yy)=P({ω:X(ω)x,Y(ω)y})=P({Xx}{Yy})> > \begin{aligned}F(x,y)&=P(X\leqslant x,Y\leqslant y)=P(\{\omega:X(\omega)\leqslant x,Y(\omega)\leqslant y\})\\&=P(\{X\leqslant x\}\cap\{Y\leqslant y\})\end{aligned} >

(X,Y)(X,Y) 的分布函数, 或 (X,Y)(X,Y) 的联合分布函数 (joint cdf).

由二维联合分布函数 F(x,y)F(x,y) ,我们可以求出二维随机向量 (X,Y)(X,Y) 落在矩形区域 (x1,x2]×(y1,y2](x_{1},x_{2}]\times (y_{1},y_{2}] 中的概率

P(x1<Xx2, y1<Yy2)=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1) P(x_1 < X \leq x_2,\ y_1 < Y \leq y_2) = F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1)

性质 - 二维联合分布函数

二维随机变量的联合分布函数 F(x,y)F(x,y) 具有如下性质:

(1) F(x,y)F(x,y) 分别对 x,yx,y 单调不减的:

(2) (x,y)R2\forall (x,y)\in \mathbb{R}^{2}

0F(x,y)1,F(,)=1,F(,y)=F(x,)=F(,)=0;0\leqslant F(x,y)\leqslant1,\quad F(\infty,\infty)=1,\quad F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0;

(3) F(x,y)F(x,y) 分别关于 x,yx,y 右连续;

(4) x1<x2,y1<y2,P(x1<X<x2,y1<Y<y2)\forall x_{1}< x_{2},y_{1}< y_{2},P(x_{1}< X< x_{2},y_{1}< Y< y_{2}) 非负, 即

P(x1<X<x2,y1<Y<y2)=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)0.P(x_{1}< X< x_{2},y_{1}< Y< y_{2}) = F(x_{2},y_{2}) - F(x_{1},y_{2}) - F(x_{2},y_{1}) + F(x_{1},y_{1})\geqslant 0.

这 4 条性质的证明容易, 它们刻画了一个二维联合分布函数, 即一个二元实函数 F(x,y)F(x, y) 如果满足上述 4 条性质, 那么必存在随机变量 XXYY , 使得 F(x,y)F(x, y) 为它们的联合分布函数. 值得注意的是, 二维随机变量与一维随机变量不同, 刻画一个联合分布函数需要加上 (4). 也就是说从条件 (1)~(3) 推不出 (4).

例 3.1 定义二元函数

F(x,y)={0,x0 或x+y1 或y0,1,其他. \left.F(x,y)=\begin{cases}&0,&x\leqslant0\ \text{或}x+y\leqslant1\text{ 或}y\leqslant0,\\&1,&\text{其他}.\end{cases}\right.

F(x,y)F(x, y) 满足上述性质中的 (1)~(3), 但不满足 (4), 因而不是一个分布函数.

证 性质 (1)~(3) 容易验证. 对 (4), 因为

F(1,1)F(1,13)F(13,1)+F(13,13)=1110=1<0, F(1,1) - F\left(1, \frac{1}{3}\right) - F\left(\frac{1}{3}, 1\right) + F\left(\frac{1}{3}, \frac{1}{3}\right) = 1 - 1 - 1 - 0 = -1 < 0,

从而得证. 事实上, 我们容易找到无穷多个不满足性质 (4) 的矩形.

当然, 对于二维离散型随机变量, 即每个分量都是离散型的随机变量, 我们不必用联合分布函数来描述其概率分布情况, 而可以指出它们在每个可能的取值点上的概率值即可.

定义 3.3 二维离散型随机变量

X,YX, Y 的可能取值为 {(xi,yj),i=1,2,,j=1,2,}\{(x_i, y_j), i = 1, 2, \dots , j = 1, 2, \dots \} . 记

P(X=xi,Y=yj)=pij,i,j=1,2,,P(X = x_i, Y = y_j) = p_{ij}, \quad i, j = 1, 2, \dots,

称其为二维离散型随机变量的联合概率质量函数或联合分布律 (joint pmf).

容易验证

(1) pij0,i,j=1,2,p_{ij} \geqslant 0, i, j = 1, 2, \dots ;

(2) i,jpij=1\sum_{i, j} p_{ij} = 1 .

X,YX, Y 都取有限个值时, 也常用下面的列表表示它们的联合分布律:

XX \\backslash YY y1y_1 y2y_2 \cdots yny_n
x1x_1 p11p_{11} p12p_{12} \cdots p1np_{1n}
x2x_2 p21p_{21} p22p_{22} \cdots p2np_{2n}
\vdots \vdots \vdots \vdots
xmx_m pm1p_{m1} pm2p_{m2} \cdots pmnp_{mn}

一般地, 对 nn 维离散型随机变量, 我们有下述定义:

定义 3.4 nn 维离散型随机变量

X=(X1,X2,,Xn)X = (X_{1},X_{2},\ldots ,X_{n})nn 维离散型随机变量, 若每一个 XiX_{i} 都是一个离散型随机变量, i=1,2,,ni = 1,2,\dots ,n .并设 XiX_{i} 的所有可能取值 (有限个或可数个) 为 {ai1,ai2,}\{a_{i1},a_{i2},\dots \} i=1,2,,ni = 1,2,\dots ,n ,则称

p(j1,j2,,jn)=P(X1=a1j1,X2=a2j2,,Xn=anjn),j1,j2,,jn=1,2,(3.1)p(j_{1},j_{2},\cdots,j_{n})=P(X_{1}=a_{1j_{1}},X_{2}=a_{2j_{2}},\cdots,X_{n}=a_{n j_{n}}),\quad j_{1},j_{2},\cdots,j_{n}=1,2,\cdots \tag{3.1}

nn 维随机变量 XX 的联合概率质量函数或联合分布律。

容易证明联合分布律具有下列性质:

(1) p(j1,j2,,jn)0,ji=1,2,,i=1,2,,n;p(j_{1},j_{2},\dots ,j_{n})\geqslant 0,\quad j_{i} = 1,2,\dots ,i = 1,2,\dots ,n;

(2) j1,j2,,jnp(j1,j2,,jn)=1.\sum\limits_{j_1,j_2,\cdots,j_n}p(j_1,j_2,\cdots,j_n)=1.

元宝的解释

例 3.2 期末有高等数学和普通物理两门课程的考试, 高等数学先考. 对某些同学而言, 第一门课程的成绩对第二门课程成绩有影响. 设某学生高等数学考试优秀的概率为 0.6, 若高等数学成绩优秀, 则他的普通物理考试优秀的概率为 0.8, 反之, 若他的高等数学成绩良好或以下, 则物理考试成绩为良好或以下的概率为 0.7. 求该学生两门课程考试得分概率的所有情况.

解令 X=IAX = I_{A} Y=IBY = I_{B} .其中 A={A = \left\{ \begin{array}{l l} \end{array} \right. 高等数学考试成绩优秀 }\} B={B = \left\{ \begin{array}{l l} \end{array} \right. 普通物理考试成绩优秀}. 题意就是求 X,YX,Y 的联合分布.

P(X=1,Y=1)=P(Y=1X=1)P(X=1)=0.8×0.6=0.48,P(X=1,Y=0)=P(Y=0X=1)P(X=1)=0.2×0.6=0.12,P(X=0,Y=1)=P(Y=1X=0)P(X=0)=0.3×0.4=0.12,P(X=0,Y=0)=P(Y=0X=0)P(X=0)=0.7×0.4=0.28. \begin{array}{r l} & {P(X = 1,Y = 1) = P(Y = 1|X = 1)P(X = 1) = 0.8\times 0.6 = 0.48,}\\ & {P(X = 1,Y = 0) = P(Y = 0|X = 1)P(X = 1) = 0.2\times 0.6 = 0.12,}\\ & {P(X = 0,Y = 1) = P(Y = 1|X = 0)P(X = 0) = 0.3\times 0.4 = 0.12,}\\ & {P(X = 0,Y = 0) = P(Y = 0|X = 0)P(X = 0) = 0.7\times 0.4 = 0.28.} \end{array}

列表表示如下:

XY
01
00.280.12
10.120.48

例 3.3 (多项分布) 设 A1,A2,,AnA_{1},A_{2},\dots,A_{n} 为某一试验下的完备事件群, 即 A1,A2,,AnA_{1},A_{2},\dots ,A_{n} 两两不相容且和为 Ω\Omega .记 pk=P(Ak)(k=1,2,,n)p_{k} = P(A_{k})(k = 1,2,\dots ,n) ,则 pk0,p1+p2++pn=1p_{k}\geqslant 0,p_{1} + p_{2} + \dots +p_{n} = 1 现将试验独立重复进行 NN 次, 分别用 XiX_{i} 表示事件 AiA_{i} 出现的次数 (i=1,2,,n)(i = 1,2,\dots ,n) .则 X=(X1,X2,,Xn)X = (X_{1},X_{2},\dots ,X_{n}) 为一离散型随机变量, 试求 XX 的分布函数. 此分布律称为多项分布, 记为 M(N;p1,p2,,pn)M(N;p_{1},p_{2},\dots ,p_{n})

解 由于试验独立进行, 总的结果数为 NN , 记结果 AiA_{i} 出现的次数为 kik_{i} , 则 k1+k2++kn=Nk_{1} + k_{2} + \dots + k_{n} = N . 因此相当于多组组合, 所以

P(X1=k1,X2=k2,,Xn=kn)=N!k1!k2!kn!P(A1A1k1AnAnkn=N!k1!k2!kn!p1k1pnkn, \begin{array}{l}{{P(X_{1}=k_{1},X_{2}=k_{2},\cdots,X_{n}=k_{n})=\frac{N!}{k_{1}!k_{2}!\cdots k_{n}!}P(\underbrace{A_{1}\cdots A_{1}}_{k_{1}\uparrow\uparrow}\cdots\underbrace{A_{n}\cdots A_{n}}_{k_{n}\uparrow\uparrow}}}\\ {{=\frac{N!}{k_{1}!k_{2}!\cdots k_{n}!}p_{1}^{k_{1}}\cdots p_{n}^{k_{n}},}}\end{array}

其中 k1,k2,,knk_{1}, k_{2}, \dots , k_{n} 为非负整数且 k1+k2++kn=Nk_{1} + k_{2} + \dots + k_{n} = N .

连续型多维随机变量的联合密度函数

回想我们定义一元连续型随机变量的思路, 对随机变量在 R\mathbb{R} 上任意 (可测) 区间的概率, 通过寻找其概率密度函数这一本质工具, 从而可以将其表示为概率密度函数在该区间上的积分. 由于多维欧式空间和直线有着相似的优良性质, 一元连续型随机变量的定义可以自然地推广到二维和多维场合, 我们首先看二维连续型随机变量的定义:

定义 3.5 二维连续型随机变量

(X,Y)F(x,y)(X, Y) \sim F(x, y) , 若存在可积的非负函数 f(x,y)f(x, y) , 使得对于 (x,y)R2\forall (x, y) \in \mathbb{R}^{2} , 有

F(x,y)=xyf(u,v)dudv,(3.2)F(x, y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f(u, v) \mathrm{d}u \mathrm{d}v, \tag{3.2}

则称 (X,Y)(X, Y) 为二维连续型随机变量, F(x,y)F(x, y) 称为其联合分布函数, 称 f(x,y)f(x, y) 为其联合概率密度函数 (joint pdf), 简称联合密度函数.

性质 - 联合概率密度函数

f(x,y)f(x, y) 具有以下性质: (1) 对任意的 x,yRx, y \in \mathbb{R} , 有 f(x,y)0f(x, y) \geqslant 0

(2)

R2f(x,y)dxdy=1(3.3)\iint_{\mathbb{R}^{2}} f(x, y) \mathrm{d}x \mathrm{d}y = 1\tag{3.3}

(3) 若 f(x,y)f(x, y) 在点 (x0,y0)(x_{0}, y_{0}) 处连续, 则

2F(x,y)xy(x0,y0)=f(x0,y0),(3.4)\left. \frac{\partial^{2} F(x, y)}{\partial x \partial y} \right|_{(x_{0}, y_{0})} = f(x_{0}, y_{0}), \tag{3.4}

由此知

P(x<Xx+dx,y<Yy+dy)f(x,y)dxdy,(3.5)P(x < X \leqslant x + \mathrm{d}x, y < Y \leqslant y + \mathrm{d}y) \approx f(x, y) \mathrm{d}x \mathrm{d}y, \tag{3.5}

f(x,y)dxdyf(x, y) \mathrm{d}x \mathrm{d}y 大约是二维随机变量落在矩形 (x,x+dx]×(y,y+dy](x, x + \mathrm{d}x] \times (y, y + \mathrm{d}y] 中的概率.

(4) 设 GG 是平面上的一个区域, 则

Pc(X,Y)G)=(x,y)Gf(x,y)dxdy.(3.6)P_{\mathrm{c}}(X,Y)\in G) = \iint_{(x,y)\in G}f(x,y)\mathrm{d}x\mathrm{d}y. \tag{3.6}
  • 这里有个问题没有解决,那就是条件概率的情形,其中一个概率是固定的,如 概率论第三章题目 中的第 23 题

可以从质量来理解二维联合概率密度函数和联合分布函数, f(x,y)f(x,y) 可以解释为面密度, 该公式解释为该区域的质量. 从几何角度看, 上面的公式是平面区域 GG 上方和曲面 f(x,y)f(x,y) 之间的柱形体积.

Tip

从定义可以看出, 连续型随机向量与离散型随机向量不同, 不能简单地定义为 " 每个分量都是一维连续型随机变量 “. 即使随机向量的每个分量都是连续型随机变量,它们的联合分布也不一定存在联合概率密度函数

例 3.4 设 X1U(0,1)X_{1}\sim U(0,1) , X2=X1X_{2} = X_{1} ,则随机向量 (X1,X2)(X_{1},X_{2}) 的两个分量都是连续型随机变量, 但 (X1,X2)(X_{1},X_{2}) 只能在单位正方形的对角线取非 0 值, 因而不可能存在一个非负函数 f(x,y)f(x,y) 满足性质 (2)(因为二元黎曼可积函数在平面上任一有限线段上的积分为 0), 即 (X1,X2)(X_{1},X_{2}) 不存在密度函数. 3 均匀分布

性质 (4) 中的区域 GG 通常用 (x,y)(x,y) 的若干个函数不等式来表示, 大多数情况下为由 (x,y)(x,y) 的线性函数和二次函数围成的.

例 3.5 设 (X,Y)(X,Y) 的概率密度函数为

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xa)2σ122ρ(xa)(yb)σ1σ2+(yb)2σ22]}, f(x,y) = \frac{1}{2\pi\sigma_{1}\sigma_{2}\sqrt{1 - \rho^{2}}}\mathrm{exp}\left\{-\frac{1}{2(1 - \rho^{2})}\left[\frac{(x - a)^{2}}{\sigma_{1}^{2}} -2\rho \frac{(x - a)(y - b)}{\sigma_{1}\sigma_{2}} +\frac{(y - b)^{2}}{\sigma_{2}^{2}}\right]\right\} ,

其中 <a,b<- \infty < a,b< \infty , 0<σ1,σ2<0< \sigma_{1},\sigma_{2}< \infty, 1ρ1.- 1\leqslant \rho \leqslant 1.(X,Y)(X,Y) 服从参数为 a,b,σ1,σ2,ρa,b,\sigma_{1},\sigma_{2},\rho二元正态分布, 记为 N(a,b,σ12,σ22,ρ)N(a,b,\sigma_{1}^{2},\sigma_{2}^{2},\rho) .图形参考

例 3.6 设 GG 是平面上的一个有界区域, 记 G|G|GG 的面积, 若

(X,Y)f(x,y)=1GIG(x,y), (X,Y)\sim f(x,y) = \frac{1}{|G|} I_{G}(x,y),

(X,Y)(X,Y)GG 上服从均匀分布.

例 3.7 设

(X,Y)f(x,y)=e(x+y)I(0,)×(0,)(x,y), (X,Y)\sim f(x,y)=\mathrm{e}^{-(x+y)}I_{(0,\infty)\times(0,\infty)}(x,y),

设区域 G 由

x+y1,x0,y0 x+y\leqslant1,\quad x\geqslant0,\quad y\geqslant0

围成 (见图 3.4). 求 F(x,y)F(x,y)P((X,Y)G)P((X,Y)\in G)

解 联合分布函数为

F(x,y)=0xeudu0yevdvI(u>0,v>0)=(1ex)(1ey)I(x>0,y>0),P((X,Y)G)=∫∫x>0,y>0,x+y1e(x+y)dxdy=01dx01xe(x+y)dy=01(1e1x)dx=12e1=0.2642. \begin{aligned}F(x,y)&=\:\int_{0}^{x}\mathrm{e}^{-u}\mathrm{d}u\int_{0}^{y}\mathrm{e}^{-v}\mathrm{d}vI_{(u>0,v>0)}\\&=\:(1-\mathrm{e}^{-x})(1-\mathrm{e}^{-y})I_{(x>0,y>0)},\\ P((X,Y)\in G)&=\underset{x>0,y>0,x+y\leq1}{\operatorname*{\int\int}}\mathrm{e}^{-(x+y)}\mathrm{d}x\mathrm{d}y \\&=\:\int_{0}^{1}\mathrm{d}x\int_{0}^{1-x}\mathrm{e}^{-(x+y)}\mathrm{d}y=\int_{0}^{1}(1-\mathrm{e}^{1-x})\mathrm{d}x\\&=\:1-2\mathrm{e}^{-1}=0.264\:2.\end{aligned}

注 二维随机变量的联合分布函数和联合概率密度函数可以毫无困难地推广到 nn 维. 设 X=(X1,X2,,Xn)T\boldsymbol {X} = (X_{1}, X_{2}, \dots , X_{n})^{\mathrm{T}} , x=(x1,x2,,xn)TRn\boldsymbol{x} = (x_{1}, x_{2}, \dots , x_{n})^{\mathrm{T}} \in \mathbb{R}^{n} , 称

F(x)F(x1,x2,,xn)=P(X1x1,X2x2,,Xnxn)P(Xx) F(\pmb {x}) \equiv F(x_{1}, x_{2}, \dots , x_{n}) = P(X_{1} \leqslant x_{1}, X_{2} \leqslant x_{2}, \dots , X_{n} \leqslant x_{n}) \equiv P(\pmb{X} \leqslant \pmb {x})

nn 维随机变量 XX 的联合分布函数. 若存在非负的 nn 元函数 f(x1,x2,,xn)f(x_{1}, x_{2}, \dots , x_{n}) , 使得

F(x)F(x1,x2,,xn)=f(u1,u2,,un)du1du2dun()nxf(u)du, \begin{array}{l}{{ F(\pmb x)\equiv F(x_{1},x_{2},\cdot\cdot\cdot,x_{n})=\int_{-\infty}^{\infty}\cdot\cdot\cdot\int_{-\infty}^{\infty}f(u_{1},u_{2},\cdot\cdot\cdot,u_{n})\mathrm{d}u_{1}\mathrm{d}u_{2}\cdot\cdot\cdot\mathrm{d}u_{n}}}\\ {{\qquad\equiv\int_{(-\infty)^{n}}^{x}f(u)\mathrm{d}u,}}\end{array}

f(x)f(x1,x2,,xn)f(\pmb {x}) \equiv f(x_{1}, x_{2}, \dots , x_{n}) 称为 XX 的联合密度函数, XX 称为连续型的 nn 维随机变量, 对应的联合分布函数 F(x)F(x1,x2,,xn)F(\pmb {x}) \equiv F(x_{1}, x_{2}, \dots , x_{n}) 称为连续型的联合分布函数.

可以验证联合分布函数 F(x1,x2,,xn)F(x_{1}, x_{2}, \dots , x_{n}) 具有下述性质:

(1) F(x1,x2,,xn)F(x_{1}, x_{2}, \dots , x_{n}) 对每个变元单调不减;

(2) 对任意的 1jn1 \leqslant j \leqslant n 有, limxjF(x1,x2,,xn)=0\lim_{x_{j} \to -\infty} F(x_{1}, x_{2}, \dots , x_{n}) = 0 ;

limx1,x2,xnF(x1,x2,,xn)=1. \lim_{x_{1} \to \infty , x_{2} \to \infty \dots , x_{n} \to \infty} F(x_{1}, x_{2}, \dots , x_{n}) = 1.

边缘 (际) 分布

多维随机向量的每个分量或子集均为随机变量,那么它们的分布函数可以从联合分布函数导出。我们称这些分量或子集的分布函数为边缘(际)分布函数,以强调它们可以从联合分布函数中导出来。

定义 3.6 边缘(际)分布

(X,Y)(X,Y) 的联合分布函数为 F(x,y)F(x,y) ,则其分量 XXYY 的分布函数 F1(x)F_{1}(x)F2(y)F_{2}(y) 称为 (X,Y)(X,Y)FF 的边缘(际)分布 (marginal distribution).

视频扫描视频 9 的二维码观看关于边缘分布和条件分布的讲解

由于 {Y<}=Ω\{Y< \infty \} = \Omega ,故

F1(x)=P(Xx)=P({Xx}Ω)=P(Xx,Y<)=limyF(x,y)F(x,). \begin{array}{r l} & {F_{1}(x) = P(X\leqslant x) = P(\{X\leqslant x\} \cap \Omega) = P(X\leqslant x,Y< \infty)}\\ & {\qquad = \lim_{y\to \infty}F(x,y)\equiv F(x,\infty).} \end{array}

同理, F2(y)=P(Yy)=F(,y).F_{2}(y) = P(Y\leqslant y) = F(\infty ,y).

由此知联合分布可以唯一确定边缘分布. 下面分别对二维离散型和二维连续型随机变量的边缘分布进行讨论.

二维离散型随机变量的边缘(际)分布

设二维离散型随机变量 (X,Y)(X,Y) 的联合分布律为

P(X=xi,Y=yj)=pij,i,j=1,2,, P(X = x_{i},Y = y_{j}) = p_{i j},\quad i,j = 1,2,\dots ,

则随机变量 XX 的边际分布律为

P(X=xi)=j=1P(X=xi,Y=yj)=j=1pijpi,i=1,2,. \begin{array}{c}{{P(X=x_{i})=\sum_{j=1}^{\infty}P(X=x_{i},Y=y_{j})=\sum_{j=1}^{\infty}p_{i j}}}\\ {{\equiv p_{i},\quad i=1,2,\cdots .}}\end{array}

同理,随机变量 YY 的边缘分布律为

P(Y=yj)=i=1pijpj,j=1,2,. P(Y = y_{j}) = \sum_{i = 1}^{\infty}p_{i j}\equiv p_{\cdot j},\quad j = 1,2,\dots .

在例 3.2 中,由联合分布律容易得到 XX 的边缘分布律为

P(X=0)=0.4,P(X=1)=0.6, P(X = 0) = 0.4,\quad P(X = 1) = 0.6,

以及 YY 的边缘分布律为

P(Y=0)=0.4,P(Y=1)=0.6. P(Y = 0) = 0.4,\quad P(Y = 1) = 0.6.

用列表表示更清楚:

XYpi.
01
00.280.120.4
10.120.480.6
p.j0.40.61

例 3.8 袋中有 5 张外形相同的卡片, 3 张写上数字 0^{\ast}0^{\ast} ,另 2 张写上数字 1^{\ast}1^{\ast} .现从袋中任取两张卡片, 分别以 X,YX,Y 表示第一张和第二张卡片上的数字, 试求分别在有放回和不放回两种情形下, (X,Y)(X,Y) 的联合分布律及 X,YX,Y 的边缘分布律.

解简单计算得到

YXp.j
01
0963
25255
1642
25255
pi.321
55
YXp.j
01
0663
20205
1622
20205
pi.321
55

这个例子说明, 边缘分布律不能决定联合分布律. 其中, 左边表为有放回抽取下的分布律, 右边表为不放回抽取下的分布律. 口

二维连续型随机变量的边缘分布

设二维连续型随机变量 (X,Y)f(x,y)(X,Y)\sim f(x,y) ,由于

F1(x)=F(x,)=xf(u,y)dudy F_{1}(x) = F(x,\infty) = \int_{-\infty}^{x}\int_{-\infty}^{\infty}f(u,y)\mathrm{d}u\mathrm{d}y

右边在积分号下对 xx 求导, 得 XX 的边缘概率密度函数为

f1(x)=Rf(x,y)dy, f_{1}(x) = \int_{\mathbb{R}}f(x,y)\mathrm{d}y,

同理, YY 的边缘概率密度函数为

f2(y)=Rf(x,y)dx. f_{2}(y) = \int_{\mathbb{R}}f(x,y)\mathrm{d}x.

定义 3.7 边缘概率密度函数

XXYY 的概率密度函数 f1(x)f_{1}(x)f2(y)f_{2}(y) 称为二维随机变量 (X,Y)(X,Y) 或者联合概率密度函数 f(x,y)f(x,y) 的边缘概率密度函数 (marginal pdf), 简称边缘密度函数.

由定义不难看出, 计算二维连续型随机变量的边缘密度函数就是联合密度函数 f(x,y)f(x,y)

另一个变量求积分.

例 3.9 (例 3.5 续) 二元正态分布的联合概率密度函数 f(x1,x2)f(x_{1},x_{2}) 可以表示为下述形式 (表示为 nn 元正态分布密度函数的一般形式): 如果 (X1,X2)f(x1,x2)(X_{1},X_{2})\sim f(x_{1},x_{2}) ,其中概率密度函数为

f(x)=(2π)12A12exp{12(xμ)TA1(xμ)},(3.7) f(\pmb {x}) = (2\pi)^{-\frac{1}{2}}|\pmb {A}|^{-\frac{1}{2}}\exp \Big\{-\frac{1}{2} (\pmb {x} - \pmb {\mu})^{\mathrm{T}}\pmb{A}^{-1}(\pmb {x} - \pmb {\mu})\Big\} , \tag{3.7}

其中 n=2,x=(x1,x2)Tn = 2,\pmb {x} = (x_{1},x_{2})^{\mathrm{T}} μ=(μ1,μ2)T\pmb {\mu} = (\mu_{1},\mu_{2})^{\mathrm{T}} 为常数列向量, A\mathbf{A} 为正定方阵, A|\mathbf{A}|A\mathbf{A} 的行列式,

A=(σ12ρσ1σ2ρσ1σ2σ22), A = \left( \begin{array}{cc}\sigma_{1}^{2} & \rho \sigma_{1}\sigma_{2} \\ \rho \sigma_{1}\sigma_{2} & \sigma_{2}^{2} \end{array} \right),

其中 ρ1|\rho |\leqslant 1f1(x1)f_{1}(x_{1})f2(x2)f_{2}(x_{2})

解不难得到

A1=11ρ2(σ12ρσ11σ21ρσ11σ21σ22), A^{-1} = \frac{1}{1 - \rho^{2}}\left( \begin{array}{cc}\sigma_{1}^{-2} & -\rho \sigma_{1}^{-1}\sigma_{2}^{-1} \\ -\rho \sigma_{1}^{-1}\sigma_{2}^{-1} & \sigma_{2}^{-2} \end{array} \right),

(xμ)TA1(xμ)=11ρ2{(x1μ1)2σ122ρ(x1μ1)(x2μ2)σ1σ2+(x2μ2)2σ22}, (x - \mu)^{\mathrm{T}}A^{-1}(x - \mu) = \frac{1}{1 - \rho^{2}}\left\{\frac{(x_{1} - \mu_{1})^{2}}{\sigma_{1}^{2}} -2\rho \frac{(x_{1} - \mu_{1})(x_{2} - \mu_{2})}{\sigma_{1}\sigma_{2}} +\frac{(x_{2} - \mu_{2})^{2}}{\sigma_{2}^{2}}\right\} ,

A=(1ρ2)σ12σ22. |A| = (1 - \rho^{2})\sigma_{1}^{2}\sigma_{2}^{2}.

要得到 X1X_{1} 的边缘概率密度函数, 只要在联合概率密度函数 f(x1,x2)f(x_{1},x_{2}) 中对 x2x_{2} 积分. 作变量代换

x2μ2σ2=ρ(x1μ1)σ1+1ρ2t, \frac{x_{2} - \mu_{2}}{\sigma_{2}} = \rho \frac{(x_{1} - \mu_{1})}{\sigma_{1}} +\sqrt{1 - \rho^{2}} t,

tt 积分, 注意到标准正态分布密度函数 ϕ(x)\phi (x) 的积分为 1, 得

f1(x1)=12πσ1exp{12(x1μ1)2σ12}, f_{1}(x_{1}) = \frac{1}{\sqrt{2\pi}\sigma_{1}}\exp \Big\{-\frac{1}{2}\frac{(x_{1} - \mu_{1})^{2}}{\sigma_{1}^{2}}\Big\} ,

同理,

f2(x2)=12πσ2exp{12(x2μ2)2σ22}, f_{2}(x_{2}) = \frac{1}{\sqrt{2\pi}\sigma_{2}}\exp \Big\{-\frac{1}{2}\frac{(x_{2} - \mu_{2})^{2}}{\sigma_{2}^{2}}\Big\} ,

可以看到, 随机变量 X,YX,Y 都服从正态分布, 但是它们都与参数 ρ\rho 无关, 这说明联合分布可以唯一确定边缘分布, 但是两个边缘分布不能唯一确定联合分布. 口

例 3.10 设随机变量 (X,Y)(X,Y) 有如下的联合概率密度函数:

f(x,y)=12[12π(1ρ2)exp{12(1ρ2)(x22ρxy+y2)}+ f(x,y) = \frac{1}{2}\left[\frac{1}{2\pi\sqrt{(1 - \rho^{2})}}\exp \left\{-\frac{1}{2(1 - \rho^{2})}\left(x^{2} - 2\rho xy + y^{2}\right)\right\} +\right.

12π(1ρ2)exp{12(1ρ2)(x2+2ρxy+y2)}], \frac{1}{2\pi\sqrt{(1 - \rho^{2})}}\exp \left\{-\frac{1}{2(1 - \rho^{2})}\left(x^{2} + 2\rho xy + y^{2}\right)\right\} \Biggr ],

则不难验证, 它的两个边缘概率密度函数都是正态分布密度函数.

解 事实上, 在例 3.9 中, 取 μ1=μ2=0,σ1=σ2=1\mu_{1} = \mu_{2} = 0, \sigma_{1} = \sigma_{2} = 1 , 则容易得到

f1(x)=12πex22,f2(y)=12πey22. f_{1}(x) = \frac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^{2}}{2}}, \quad f_{2}(y) = \frac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{y^{2}}{2}}.

本例也说明边缘概率密度函数不能决定联合概率密度函数.

例 3.11 考虑两个概率密度函数

p(x,y)=x+y,0<x,y<1,q(x,y)=(x+12)(y+12),0<x,y<1, \begin{array}{c}p(x, y) = x + y, \qquad 0 < x, y < 1, \\ q(x, y) = \left(x + \frac{1}{2}\right)\left(y + \frac{1}{2}\right), \qquad 0 < x, y < 1, \end{array}

试求边缘概率密度.

解 易得所求边缘概率密度都是如下形式:

f(t)=t+12,0<t<1. f(t) = t + \frac{1}{2}, \quad 0 < t < 1.

这说明边缘概率密度函数不能决定联合概率密度函数.

注 多维随机变量的边缘分布和边缘密度函数

(1) 边缘分布的概念可以推广到多维随机变量, 其中仅仅是把随机变量换成随机向量. 设 X=(X1,X2,,Xn)\boldsymbol{X} = (X_{1}, X_{2}, \dots , X_{n}) , 从这 nn 个随机变量中任取 kkXn1,Xn2,,XnkX_{n_{1}}, X_{n_{2}}, \dots , X_{n_{k}} , 记 U=(Xn1,Xn2,,Xnk)U = (X_{n_{1}}, X_{n_{2}}, \dots , X_{n_{k}}) , 为方便起见, 不妨设 U=(X1,X2,,Xk)U = (X_{1}, X_{2}, \dots , X_{k}) , 剩下的 nkn - k 个随机变量记为 V=(Xk+1,Xk+2,,Xn)V = (X_{k + 1}, X_{k + 2}, \dots , X_{n}) , 则 UU 的分布就称为 nn 维随机变量 XX 的边缘分布, 记为 FU(u)F_{U}(u) , 其中 u=(x1,x2,,xk)\boldsymbol{u} = (x_{1}, x_{2}, \dots , x_{k}) , 注意到

FU(u)=P(X1x1,,Xkxk,,Xk+1<,Xn<)=F(x1,,xk,,,)F(u,,,) \begin{array}{r l} & {F_{U}(\pmb {u}) = P(X_{1}\leqslant x_{1},\dots ,X_{k}\leqslant x_{k},\dots ,X_{k + 1}< \infty ,\dots X_{n}< \infty)}\\ & {\qquad = F(x_{1},\dots ,x_{k},\infty ,\dots ,\infty)\equiv F(\pmb {u},\infty ,\dots ,\infty)} \end{array}

即在联合分布函数中, 把另一个变量用 \infty 代替就得到边缘分布.

(2) 类似于讨论二元随机变量的边缘密度函数, 边缘密度函数等于联合密度函数对另一个变量的积分. 用随机向量 (u,v)(u, v) 代替二元函数中的 (x,y)(x, y) , 得到多维随机向量的边缘密度函数等于联合密度函数对另一个变量 vv 的积分, 其中 v=(xk+1,xk+2,,xn)v = (x_{k + 1}, x_{k + 2}, \dots , x_{n}) , 即

fU(u)=Rnkf(u,v)dv, f_{U}(u) = \int_{\mathbb{R}^{n - k}} f(u, v) \mathrm{d}v,

其中 dv=dxk+1 dxk+2 dxn\mathrm{d}v = \mathrm{d}x_{k + 1} \mathrm{~d}x_{k + 2} \dots \mathrm{~d}x_{n} .

(3) nn 维随机变量的边缘分布函数有 2n22^{n} - 2 个.

条件分布

一个随机变量 (或向量) 的条件概率分布, 就是在给定 (或已知) 某种条件 (某种信息) 下该随机变量 (向量) 的概率分布.

(X,Y)(X,Y) 为二维离散型随机变量时, 设联合分布律为

P(X=xi,Y=yj)=pij,i,j=1,2,, P(X = x_{i},Y = y_{j}) = p_{ij}, \quad i,j = 1,2,\dots ,

P(Y=yj)>0P(Y = y_{j}) > 0 , 则根据条件概率的定义, 在给定 Y=yjY = y_{j}XX 的条件分布律为

pij=pijpj,i=1,2,,(3.8) p_{i|j} = \frac{p_{ij}}{p_{\cdot j}}, \quad i = 1,2,\dots , \tag{3.8}

同理若 P(X=xi)>0P(X = x_{i}) > 0 , 则给定 X=xiX = x_{i}YY 的条件分布律为

pji=pijpi,j=1,2,,(3.9) p_{j|i} = \frac{p_{ij}}{p_{i}}, \quad j = 1,2,\dots , \tag{3.9}

(X,Y)(X,Y) 为二维连续型随机变量时, 记联合概率密度函数为 f(x,y)f(x,y) . 由于连续型随机变量取任意一点的概率为 0, 故此时不能直接使用条件概率. 但是注意到, 如果定义条件分布函数

FXY(xy)=P(XxY=y)limϵ0P(XxyYy+ϵ)=limϵ0(F(x,y+ϵ)F(x,y))/ϵP(y<Yy+ϵ)/ϵ=F(x,y)y/F2(y)y=xf(u,y)f2(y)duxfXY(uy)du, \begin{array}{r l} & {F_{X|Y}(x|y) = P(X\leqslant x|Y = y)\equiv \underset {\epsilon \to 0}{\lim}P(X\leqslant x|y\leqslant Y\leqslant y + \epsilon)}\\ & {\qquad = \underset {\epsilon \to 0}{\lim}\frac{(F(x,y + \epsilon) - F(x,y)) / \epsilon}{P(y< Y\leqslant y + \epsilon) / \epsilon}}\\ & {\qquad = \frac{\partial F(x,y)}{\partial y}\big / \frac{\partial F_{2}(y)}{\partial y}}\\ & {\qquad = \int_{-\infty}^{x}\frac{f(u,y)}{f_{2}(y)}\mathrm{d}u}\\ & {\qquad \equiv \int_{-\infty}^{x}f_{X|Y}(u|y)\mathrm{d}u,} \end{array}

其中 YY 的概率密度函数在 yy 处的值 f2(y)>0f_{2}(y) > 0 (显然, FXY(xy)F_{X|Y}(x|y) 在固定 yy 时是一个分布函数). 根据连续型随机变量的定义和概率密度函数的性质, 上式定义了 XX 在给定条件 Y=yY = y 下的分布函数和概率密度函数. 也就是说, 条件分布函数 FXY(xy)F_{X|Y}(x|y) 可以表示为非负函数 fXY(xy)f_{X|Y}(x|y) 的积分, 故其为概率密度函数, 则定义

定义 3.8 条件概率密度函数

如果 YY 的概率密度函数在 yy 处的值 f2(y)>0f_{2}(y) > 0 , 那么称

fXY(xy)=f(x,y)f2(y)(3.10) f_{X|Y}(x|y) = \frac{f(x,y)}{f_{2}(y)} \tag{3.10}

为给定 Y=yY = y 下随机变量 XX 的条件概率密度函数 (conditional pdf), 简称条件密度函数. 同理, 给定 X=xX = x 下随机变量 YY 的条件概率密度函数 fYX(yx)f_{Y|X}(y|x)

fYX(yx)=f(x,y)f1(x),f1(x)>0.(3.11) f_{Y|X}(y|x) = \frac{f(x,y)}{f_{1}(x)}, \quad f_{1}(x) > 0. \tag{3.11}

给定 X=xX = x 下随机变量 YY 的条件密度函数也常常表为 YX=xfYX(yx)Y|X = x \sim f_{Y|X}(y|x) , 或 YxfYX(yx)Y|x \sim f_{Y|X}(y|x) .

由条件密度函数的定义, 我们有

f(x,y)=fYX(yx)f1(x)=fXY(xy)f2(y).(3.12) f(x,y) = f_{Y|X}(y|x)f_{1}(x) = f_{X|Y}(x|y)f_{2}(y). \tag{3.12}

由此得到连续型随机变量的贝叶斯公式的密度函数形式:

fYX(yx)=f(x,y)f1(x)=fXY(xy)f2(y)f1(x),(3.13) f_{Y|X}(y|x) = \frac{f(x,y)}{f_{1}(x)} = \frac{f_{X|Y}(x|y)f_{2}(y)}{f_{1}(x)}, \tag{3.13}

fXY(xy)=f(x,y)f2(y)=fYX(yx)f1(x)f2(y).(3.14) f_{X|Y}(x|y) = \frac{f(x,y)}{f_{2}(y)} = \frac{f_{Y|X}(y|x)f_{1}(x)}{f_{2}(y)}. \tag{3.14}

注 (条件分布的物理直观意义) 从物理观点看, 设平面上在格点 (i,j)(i,j) 上有质量 pij,i,j=1,2,,pjp_{ij}, i,j = 1,2, \dots , p_{\cdot j} 就是直线 y=jy = j 的质量. pijp_{i|j} 就是格点 (i,j)(i,j) 上质量与直线 y=jy = j 质量的比值. 如果平面质量有面密度 f(x,y)f(x,y) , fXY(xy)f_{X|Y}(x|y) 就是当 Δx0,Δy0\Delta x \rightarrow 0, \Delta y \rightarrow 0 时矩形 [x,x+Δx]×[y,y+Δy][x,x + \Delta x] \times [y,y + \Delta y] 与条形 (,)×(y,y+Δy](- \infty , \infty) \times (y,y + \Delta y] 质量比值的极限. 而条件分布函数 FXY(xy)F_{X|Y}(x|y) 就是当 Δy0\Delta y \rightarrow 0 时, 条形 (,x]×(y,y+Δy](- \infty , x] \times (y,y + \Delta y] 与条形 (,)×(y,y+Δy](- \infty , \infty) \times (y,y + \Delta y] 质量比值的极限.

例 3.12 从 (0,1) 中任取一点 XX , 再从 (0,X)(0,X) 中任取一点 YY , 求 YY 的密度函数以及 FXY(0.50.25)F_{X|Y}(0.5|0.25) .

解 由题意, XU(0,1)X \sim U(0,1) , YX=xU(0,x)Y|X = x \sim U(0,x) , 所以由公式 (3.10), (X,Y)(X,Y) 的联合密度为

f(x,y)=f1(x)fYX(yx)=I(0,1)(x)1xI(0,x)(y), f(x,y) = f_{1}(x)f_{Y|X}(y|x) = I_{(0,1)}(x) \cdot \frac{1}{x} I_{(0,x)}(y),

0<y<10 < y < 1 时,

f2(y)=f(x,y)dx=011xI(y<x)dx=y11xdx=ln(y)I(0,1)(y), \begin{array}{l}{{f_{2}(y)=\int_{-\infty}^{\infty}f(x,y)\mathrm{d}x=\int_{0}^{1}\frac{1}{x}I_{(y< x)}\mathrm{d}x}}\\ {{=\int_{y}^{1}\frac{1}{x}\mathrm{d}x=-\ln(y)I_{(0,1)}(y),}}\end{array}

由条件密度函数定义知

fXY(x0.25)=f(x,0.25)f2(0.25)=1xln4I(0.25,1)(x), f_{X|Y}(x|0.25) = \frac{f(x,0.25)}{f_{2}(0.25)} = \frac{1}{x \ln 4} I_{(0.25,1)}(x),

因此

FXY(0.50.25)=0.5fXY(x0.25)dx=0.5. F_{X|Y}(0.5|0.25) = \int_{-\infty}^{0.5} f_{X|Y}(x|0.25) \mathrm{d}x = 0.5.

例 3.13 设某地区成年男子的身高 H(cm)H(\mathrm{cm}) 服从正态分布 N(172,36)N(172,36) , 当身高 H=hH = h 时, 体重 WW (单位: kg\mathrm{kg} ) 服从正态分布 N(h105,49)N(h - 105,49) . 求体重 WW 的分布.

解 由题意,

fH(h)=12π×6exp{(h172)22×36}, f_{H}(h) = \frac{1}{\sqrt{2\pi}\times6}\exp \Big\{-\frac{(h - 172)^{2}}{2\times36}\Big\} ,

fWH(wh)=12π×7exp{(w(h105))22×49}. f_{W|H}(w|h) = \frac{1}{\sqrt{2\pi}\times7}\exp \Big\{-\frac{(w - (h - 105))^{2}}{2\times49}\Big\} .

所以

f(h,w)=fH(h)fWH(wh) =12π×42exp{12((h172)236+(w(h105))249)}. \begin{array}{l}{{f(h,w)=f_{H}(h)f_{W|H}(w|h)}}\\ {{\mathrm{~}=\frac{1}{2\pi\times42}\exp\Big\{-\frac{1}{2}\Big(\frac{(h-172)^{2}}{36}+\frac{(w-(h-105))^{2}}{49}\Big)\Big\}.}}\end{array}

f(h,w)f(h,w) 的指数中, 对变量 hh 配平方, 然后对 hh 积分, 得

fW(w)=f(h,w)dh=12π×85exp{(w67)22×85}, f_{W}(w) = \int_{-\infty}^{\infty}f(h,w)\mathrm{d}h = \frac{1}{\sqrt{2\pi\times85}}\exp \Big\{-\frac{(w - 67)^{2}}{2\times85}\Big\} ,

WN(67,85)W\sim N(67,85)

例 3.14 设 (X,Y)N(μ1,μ2,σ12,σ22;ρ)(X,Y)\sim N(\mu_{1},\mu_{2},\sigma_{1}^{2},\sigma_{2}^{2};\rho) ,求 YxY|x 的分布.

解 由二元正态分布随机变量密度函数的定义, XN(μ1,σ12)X\sim N(\mu_{1},\sigma_{1}^{2}) ,密度函数记为 f1(x)f_{1}(x) ,记

x1=xμ1σ1,y1=yμ2σ2, x_{1} = \frac{x - \mu_{1}}{\sigma_{1}},\quad y_{1} = \frac{y - \mu_{2}}{\sigma_{2}},

fYX(yx)=f(x,y)f1(x)=12π(1ρ2)σ1σ2exp{12(1ρ2)(x122ρx1y1+y12)}=12πσ1exp{12x12}=12π(1ρ2)σ2exp{12(1ρ2)(y1ρx1)2}=12π(1ρ2)σ2exp{12(1ρ2)σ22(y(μ2+ρσ2σ11(xμ1)))2}, \begin{array}{r l} & {f_{Y|X}(y|x) = \frac{f(x,y)}{f_{1}(x)}}\\ & {\qquad = \frac{1}{2\pi\sqrt{(1 - \rho^{2})\sigma_{1}\sigma_{2}}}\exp \Big\{-\frac{1}{2(1 - \rho^{2})} (x_{1}^{2} - 2\rho x_{1}y_{1} + y_{1}^{2})\Big\}}\\ & {\qquad = \frac{1}{\sqrt{2\pi\sigma_{1}}}\exp \Big\{-\frac{1}{2} x_{1}^{2}\Big\}}\\ & {\qquad = \frac{1}{\sqrt{2\pi(1 - \rho^{2})\sigma_{2}}}\exp \Big\{-\frac{1}{2(1 - \rho^{2})} (y_{1} - \rho x_{1})^{2}\Big\}}\\ & {\qquad = \frac{1}{\sqrt{2\pi(1 - \rho^{2})\sigma_{2}}}\exp \Big\{-\frac{1}{2(1 - \rho^{2})\sigma_{2}^{2}} (y - (\mu_{2} + \rho \sigma_{2}\sigma_{1}^{-1}(x - \mu_{1})))^{2}\Big\} ,} \end{array}

YxN(μ2+ρσ2σ11(xμ1),(1ρ2)σ22)Y|x\sim N(\mu_{2} + \rho \sigma_{2}\sigma_{1}^{- 1}(x - \mu_{1}),(1 - \rho^{2})\sigma_{2}^{2})

注 ( nn 维随机变量的条件密度函数) 把随机变量 X,YX,Y 都换成随机向量 X,YX,Y ,我们可以把两个随机变量的条件密度函数推广到 nn 维随机变量的条件密度函数. 设

x=(x1,x2,,xk),y=(y1,y2,,ynk),f(x,y)=f(x1,x2,,xk,y1,y2,,ynk). \begin{array}{c}{{x=(x_{1},x_{2},\cdots,x_{k}),y=(y_{1},y_{2},\cdots,y_{n-k}),}}\\ {{f(x,y)=f(x_{1},x_{2},\cdots,x_{k},y_{1},y_{2},\cdots,y_{n-k}).}}\end{array}

记随机向量 X,YX,Y 的边缘密度函数分别为 fX(x)f_{X}(x)fY(y)f_{Y}(y) ,则给定随机向量 Y=yY = y 下随机

向量 XX 的条件密度 fXY(xy)f_{X|Y}(x|y) 定义为

fXY(xy)=f(x,y)fY(y),fY(y)>0. f_{X|Y}(x|y) = \frac{f(x,y)}{f_{Y}(y)}, \quad f_{Y}(y) > 0.

同理, 给定随机向量 X=xX = x 下随机向量 YY 的条件密度 fYX(yx)f_{Y|X}(y|x) 定义为

fYX(yx)=f(x,y)fX(x),fX(x)>0. f_{Y|X}(y|x) = \frac{f(x,y)}{f_{X}(x)}, \quad f_{X}(x) > 0.

类似于二维随机变量的贝叶斯公式的密度函数形式, 对 nn 维随机变量也成立.

相互独立的随机变量

在上一小节中, 我们知道由 (X,Y)(X,Y) 的联合分布可以唯一确定边缘分布, 反之不必成立. 什么时候边缘分布可以唯一确定联合分布? 在研究事件独立性时, 我们知道两个事件同时发生的概率等于每个事件发生概率乘积的充要条件是这两个事件相互独立. (X,Y)(X,Y) 的联合分布

F(x,y)=P({Xx}{Yy}) F(x,y) = P(\{X\leqslant x\} \cap \{Y\leqslant y\})

也是两个事件同时发生的概率, 要上式等于 F1(x)F_{1}(x)F2(y)F_{2}(y) 的乘积, 就需要事件 {Xx}\{X\leqslant x\}{Yy}\{Y\leqslant y\} 相互独立. 不过由于 (x,y)(x,y) 可以在平面上变化, 所以这不是两个事件了. 为此我们需要引入随机变量相互独立的概念.

定义 3.9 随机变量相互独立

设随机变量 X,YX,Y 的联合分布为 F(x,y)F(x,y) , 边缘分布为 F1(x),F2(y)F_{1}(x),F_{2}(y) . 若 (x,y)R2\forall (x,y)\in \mathbb{R}^{2} , 都有

F(x,y)=F1(x)F2(y),(3.15) F(x,y) = F_{1}(x)F_{2}(y), \tag{3.15}

则称随机变量 X,YX,Y 相互独立.

视频扫描视频 10 的二维码观看关于随机变量的独立性的讲解

直观来看, 称随机变量 X,YX,Y 相互独立是指: 若 AA 是与随机变量 XX 相关的任意事件, BB 是与随机变量 YY 相关的任意事件, 则事件 A,BA,B 相互独立. 所以随机变量独立的定义也等价于: B1R,B2R\forall B_{1}\in \mathbb{R},B_{2}\in \mathbb{R} , 都有

P(XB1,YB2)=P(XB1)P(YB2).(3.16) P(X\in B_{1},Y\in B_{2}) = P(X\in B_{1})P(Y\in B_{2}). \tag{3.16}

(X,Y)(X,Y) 是离散型随机变量, 分布律为 P(X=xi,Y=yj)=pij,i,j=1,2,P(X = x_{i},Y = y_{j}) = p_{ij},i,j = 1,2,\dots , 则 X,YX,Y 相互独立等价于

pij=pi.p.ji,j=1,2,.(3.17) p_{ij} = p_{i}.p_{.j} \quad \forall i,j = 1,2,\dots . \tag{3.17}

事实上, 充分性显然, 下证必要性. 因为 X,YX,Y 相互独立, 所以有

F(x,y)=F1(x)F2(y), F(x,y) = F_{1}(x)F_{2}(y),

因此, 对任意的取值对 (xi,yj)(x_{i}, y_{j}) , 有

P(X=xi,Y=yj)=F(xi,yj)F(xi1,yi)F(xi,yj1)+F(xi1,yj1)=[F1(xi)F1(xi1)]F2(yj)[F1(xi)F1(xi1)]F2(yj1)=P(X=xi)P(Y=yj). \begin{array}{r l} & {P(X = x_{i},Y = y_{j}) = F(x_{i},y_{j}) - F(x_{i - 1},y_{i}) - F(x_{i},y_{j - 1}) + F(x_{i - 1},y_{j - 1})}\\ & {\qquad = [F_{1}(x_{i}) - F_{1}(x_{i - 1})]F_{2}(y_{j}) - [F_{1}(x_{i}) - F_{1}(x_{i - 1})]F_{2}(y_{j - 1})}\\ & {\qquad = P(X = x_{i})P(Y = y_{j}).} \end{array}

从而得证.

(X,Y)(X, Y) 是连续型随机变量, 有联合概率密度函数 f(x,y)f (x, y) 和边缘概率密度函数 f1(x)f_{1}(x) f2(y)f_{2}(y) ,则不难证明 X,YX, Y 相互独立等价于

f(x,y)=f1(x)f2(y),(x,y)R2.(3.18) f(x,y) = f_{1}(x)f_{2}(y),\quad \forall (x,y)\in \mathbb{R}^{2}. \tag{3.18}

上式等价于密度函数 f(x,y)f (x, y) 可以分离变量, 即若有

f(x,y)=g1(x)g2(y),(x,y)R2,(3.19) f(x,y) = g_{1}(x)g_{2}(y),\quad \forall (x,y)\in \mathbb{R}^{2}, \tag{3.19}

其中 g1(x),g2(y)g_{1}(x), g_{2}(y) 不必是概率密度函数

在实际问题中, 随机变量的独立性是可以知道的, 如在掷骰子的游戏中, 令 Xi={X_{i} = \left\{ \begin{array}{ll} \end{array} \right.ii 次掷出的点数 }\} i=1,2i = 1,2 .则第 2 次掷得点数与第 1 次掷得点数没有任何关系, X1,X2X_{1}, X_{2} 是相互独立的. 在购买彩票中, 这次开出什么号码与下次开出什么号码没有任何关系, 也是独立的. 我们可以利用随机变量的独立性来计算有关随机事件发生的概率.

例 3.15 (会面问题) 两人约定上午 9:0010:009:00\sim 10:00 在公园东大门会面, 先到者等候 20min20 \mathrm{min} , 如果另一人还没到就可以离开. 求两人能会面的概率.

解设 X,YX, Y 分别表示两人到达的时间, 由题意, XX\sim U(9,10),YU(9,10)U (9,10), Y\sim U (9,10)X,YX, Y 相互独立. 两人能会面: XY1/3|X - Y|\leqslant 1 / 3 (图 3.5). 所以两人能会面的概率为

P(XY1/3)=xy1/3f(x,y)dxdy=xy1/3dxdy=1xy>1/3dxdy=12×12(23)2=59. \begin{array}{l}{P\left(|X - Y|\leqslant 1 / 3\right) = \iint_{|x - y|\leqslant 1 / 3}f(x,y)\mathrm{d}x\mathrm{d}y}\\ {= \iint_{|x - y|\leqslant 1 / 3}\mathrm{d}x\mathrm{d}y = 1 - \iint_{|x - y| > 1 / 3}\mathrm{d}x\mathrm{d}y}\\ {= 1 - 2\times \frac{1}{2}\left(\frac{2}{3}\right)^{2} = \frac{5}{9}.} \end{array}

图 3.5 会面问题

例 3.16 (不独立的随机变量) 设 (X,Y)(X, Y) 的联合密度函数为

f(x,y)=1πI(x2+y21)(x,y), f(x,y) = \frac{1}{\pi} I_{(x^{2} + y^{2}\leqslant 1)}(x,y),

求证 X,YX, Y 不相互独立.

证 用反证法, 若 X,YX, Y 相互独立, 则 (x,y)\forall (x, y) , 有 f(x,y)=f1(x)f2(y)f (x, y) = f_{1}(x) f_{2}(y) . 如图 3.6, 在单位圆和外接正方形之间任取一点 (x,y)(x, y) , 则 f(x,y)=0f (x, y) = 0 , 而

f2(y)=11f(x,y)dx=1π1y21y2dx>0. f_{2}(y) = \int_{-1}^{1}f(x,y)\mathrm{d}x = \frac{1}{\pi}\int_{-\sqrt{1 - y^{2}}}^{\sqrt{1 - y^{2}}}\mathrm{d}x > 0.

同理, f1(x)>0f_{1}(x) > 0 , 所以在该点 0=f(x,y)f1(x)f2(y)0 = f (x, y)\neq f_{1}(x) f_{2}(y) >0>0 , 矛盾. 因为单位圆和外接正方形之间的面积大于 0, 所以 X,YX, Y 不相互独立.

例 3.17 (两个正态分布随机变量独立的充要条件) 设 (X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y)\sim N (\mu_{1},\mu_{2},\sigma_{1}^{2},\sigma_{2}^{2},\rho) , 证明: X,YX, Y 相互独立 \Leftrightarrow ρ=0\rho = 0

证充分性. 若 ρ=0\rho = 0 , 因为 f(x,y)=g1(x)g2(y)f (x, y) = g_{1}(x) g_{2}(y) , 即联合密度函数可分离, 所以 (X,Y)(X, Y) 相互独立.

图 3.6 单位圆和外接正方形

必要性. 若 (X,Y)(X, Y) 相互独立, 则 f(x,y)=f1(x)f2(y)f (x, y) = f_{1}(x) f_{2}(y) (x,y)R2\forall (x, y)\in \mathbb{R}^{2} , 特别取 (x,y)=(μ1,μ2)(x, y) = (\mu_{1},\mu_{2}) , 有

f(μ1,μ2)=12πσ1σ21ρ2=f1(μ1)f2(μ2)=12πσ1×12πσ2, f(\mu_{1},\mu_{2}) = \frac{1}{2\pi\sigma_{1}\sigma_{2}\sqrt{1 - \rho^{2}}} = f_{1}(\mu_{1})f_{2}(\mu_{2}) = \frac{1}{\sqrt{2\pi}\sigma_{1}}\times \frac{1}{\sqrt{2\pi}\sigma_{2}},

从而 ρ=0\rho = 0

两个随机变量相互独立可以推广到 nn 个随机变量相互独立

定义 3.10 多维随机向量的相互独立性

nn 维随机变量 (X1,X2,,Xn)F(x1,x2,,xn)(X_{1}, X_{2},\dots ,X_{n})\sim F (x_{1}, x_{2},\dots ,x_{n}) , 记 XiFi(xi)X_{i}\sim F_{i}(x_{i}) , i=1,2,,i = 1,2,\dots , nn . 若对任意 (x1,x2,,xn)TRn(x_{1}, x_{2},\dots ,x_{n})^{\mathrm{T}}\in \mathbb{R}^{n} 都成立

F(x1,x2,,xn)=F1(x1)F2(x2)Fn(xn), F(x_{1},x_{2},\dots ,x_{n}) = F_{1}(x_{1})F_{2}(x_{2})\dots F_{n}(x_{n}),

则称随机变量 X1,X2,,XnX_{1}, X_{2},\dots ,X_{n} 相互独立.

性质利用分布函数与分布律或概率密度函数之间的关系, 容易得到

(1) 若随机向量 (X1,X2,,Xn)(X_{1}, X_{2},\dots ,X_{n})nn 维离散型随机向量, 若对所有可能取值 (x1k1,x2k2,,xnkn)(x_{1k_{1}}, x_{2k_{2}},\dots ,x_{nk_{n}}) 都成立

P(X1=x1k1,X2=x2k2,,Xn=xnkn)=i=1nP(Xi=xiki), P(X_{1} = x_{1k_{1}},X_{2} = x_{2k_{2}},\dots ,X_{n} = x_{nk_{n}}) = \prod_{i = 1}^{n}P(X_{i} = x_{ik_{i}}),

则称随机变量 X1,X2,,XnX_{1}, X_{2},\dots ,X_{n} 相互独立.

(2) 设连续型随机向量 (X1,X2,,Xn)f(x1,x2,,xn)(X_{1}, X_{2},\dots ,X_{n})\sim f (x_{1}, x_{2},\dots ,x_{n}) , Xifi(xi)X_{i}\sim f_{i}(x_{i}) , i=1,2,,ni = 1,2,\dots ,n , 若对任意 (x1,x2,,xn)TRn(x_{1}, x_{2},\dots ,x_{n})^{\mathrm{T}}\in \mathbb{R}^{n} 都成立

f(x1,x2,,xn)=i=1nfi(xi), f(x_{1},x_{2},\dots ,x_{n}) = \prod_{i = 1}^{n}f_{i}(x_{i}),

则称随机变量 X1,X2,,XnX_{1}, X_{2}, \dots , X_{n} 相互独立.

(3) 若 nn 个随机变量 X1,X2,,XnX_{1}, X_{2}, \dots , X_{n} 相互独立, 则随机向量 (X1,X2,,Xk)(X_{1}, X_{2}, \dots , X_{k}) 和随机向量 (Xk+1,Xk+2,,Xn)(X_{k + 1}, X_{k + 2}, \dots , X_{n}) 相互独立. 当然, 随机向量的函数 Y1=g1(X1,X2,,Xk)Y_{1} = g_{1}(X_{1}, X_{2}, \dots , X_{k})Y2=g2(Xk+1,Xk+2,,Xn)Y_{2} = g_{2}(X_{k + 1}, X_{k + 2}, \dots , X_{n}) 也是相互独立的.

然而一般来说, 仅由某一部分独立无法推出 X1,X2,,XnX_{1}, X_{2}, \dots , X_{n} 相互独立. 见下例.

例 3.18 若 X,YX, Y 相互独立, 都服从 1- 1 和 1 这两点上的等可能分布. Z=XYZ = XY ,证明: Z,X,YZ, X, Y 两两独立但不相互独立.

证 由题设知 X,Y,ZX, Y, Z 均服从 1- 1 和 1 这两点上的等可能分布, 注意到

P(Z=1,X=1)=P(X=1,Y=1)=P(X=1)P(Y=1)=14=P(Z=1)P(X=1), \begin{array}{c}P(Z = 1, X = 1) = P(X = 1, Y = 1) = P(X = 1)P(Y = 1) \\ = \frac{1}{4} = P(Z = 1)P(X = 1), \end{array}

P(Z=1,X=1)=P(X=1,Y=1)=P(X=1)P(Y=1)=14=P(Z=1)P(X=1), \begin{array}{c}P(Z = 1, X = -1) = P(X = -1, Y = -1) = P(X = -1)P(Y = -1) \\ = \frac{1}{4} = P(Z = 1)P(X = -1), \end{array}

P(Z=1,X=1)=P(X=1,Y=1)=P(X=1)P(Y=1)=14=P(Z=1)P(X=1), \begin{array}{c}P(Z = -1, X = 1) = P(X = 1, Y = -1) = P(X = 1)P(Y = -1) \\ = \frac{1}{4} = P(Z = -1)P(X = 1), \end{array}

P(Z=1,X=1)=P(X=1,Y=1)=P(X=1)P(Y=1)=14=P(Z=1)P(X=1), \begin{array}{c}P(Z = -1, X = -1) = P(X = -1, Y = 1) = P(X = -1)P(Y = 1) \\ = \frac{1}{4} = P(Z = -1)P(X = -1), \end{array}

因此, ZZXX 相互独立. 类似可证 ZZYY 相互独立. 即 Z,X,YZ, X, Y 两两独立. 但是

P(Z=1,X=1,Y=1)=0P(Z=1)P(X=1)P(Y=1)=18. P(Z = 1, X = 1, Y = -1) = 0 \neq P(Z = 1)P(X = 1)P(Y = -1) = \frac{1}{8}.

Z,X,YZ, X, Y 不相互独立. 从而得证.

随机向量函数的分布

我们已经知道若随机变量 YY 是随机变量 XX 的函数时, YY 的分布可以由 XX 的分布表达. 把随机变量 X,YX, Y 推广到随机向量时, 也有相应的表达. 我们仅仅讨论二维连续型随机向量的函数, 离散情况和多维情况没有实质性的区别, 仅仅是表达式复杂点.

(X,Y)f(x,y)(X, Y) \sim f (x, y) , Z=g(X,Y)Z = g (X, Y) 为一维随机变量, ARA \subset \mathbb{R} ,则

P(ZA)=g(x,y)Af(x,y)dxdy, P(Z \in A) = \iint \limits_{g(x, y) \in A} f(x, y) \mathrm{d}x \mathrm{d}y,

特别当 A=(,z]A = (- \infty , z] 时, ZZ 的分布函数 FZF_{Z}

FZ(z)=P(Zz)=g(x,y)zf(x,y)dxdy,(3.20) F_{Z}(z) = P(Z \leqslant z) = \iint \limits_{g(x, y) \leqslant z} f(x, y) \mathrm{d}x \mathrm{d}y, \tag{3.20}

Z1=g1(X,Y),Z2=g2(X,Y)Z_{1} = g_{1}(X, Y), Z_{2} = g_{2}(X, Y) 分别为一维随机变量, AR2A \subset \mathbb{R}^{2} , 则 Z1,Z2Z_{1}, Z_{2} 的联合分布为

P((Z1,Z2)A)=(g1(x,y),g2(x,y))Af(x,y)dxdy, P((Z_{1}, Z_{2}) \in A) = \iint \limits_{(g_{1}(x,y), g_{2}(x,y)) \in A} f(x,y) \mathrm{d}x \mathrm{d}y,

特别当 A=(,z1]×(,z2]A = (- \infty , z_{1}] \times (- \infty , z_{2}] 时, (Z1,Z2)(Z_{1}, Z_{2}) 的联合分布函数 FZ(z1,z2)F_{\mathbf{Z}}(z_{1}, z_{2})

FZ(z1,z2)=P(Z1z1,Z2z2)=g1(x,y)z1g2(x,y)z2f(x,y)dxdy.(3.21) F_{\mathbf{Z}}(z_{1}, z_{2}) = P(Z_{1} \leqslant z_{1}, Z_{2} \leqslant z_{2}) = \iint \limits_{\substack{g_{1}(x,y) \leqslant z_{1} \\ g_{2}(x,y) \leqslant z_{2} }} f(x,y) \mathrm{d}x \mathrm{d}y. \tag{3.21}

有了分布函数, 对它求导即可得密度函数. 为计算 (3.21) 式, 有时要用到二元函数的变换. 令 u=g1(x,y),v=g2(x,y),(u,v)u = g_{1}(x, y), v = g_{2}(x, y), (u, v)(x,y)(x, y) 一一对应. 反函数记为 x=ϕ1(u,v),y=ϕ2(u,v)x = \phi_{1}(u, v), y = \phi_{2}(u, v) 且都有一阶连续偏导数, 记 (x,y)(x, y)(u,v)(u, v)(u,v)(u, v)(x,y)(x, y) 的雅可比 (Jacobi) 行列式分别为

(ϕ1(u,v),ϕ2(u,v))(u,v)0,(u,v)(x,y)(x=ϕ1(u,v),y=ϕ2(u,v)). \frac{\partial(\phi_{1}(u,v), \phi_{2}(u,v))}{\partial(u,v)} \neq 0, \quad \frac{\partial(u,v)}{\partial(x,y)} \bigg|_{(x = \phi_{1}(u,v), y = \phi_{2}(u,v))}.

注意到

(x,y)(u,v)=((u,v)(x,y))1,(3.22) \frac{\partial(x,y)}{\partial(u,v)} = \left(\frac{\partial(u,v)}{\partial(x,y)}\right)^{-1}, \tag{3.22}

则作变换后

FZ(z1,z2)=g1(x,y)z1g2(x,y)z2f(x,y)dxdy=uz1vz2f(ϕ1(u,v),ϕ2(u,v))(x,y)(u,v)dudv,(3.23) F_{\mathbf{Z}}(z_{1}, z_{2}) = \iint \limits_{\substack{g_{1}(x,y) \leqslant z_{1} \\ g_{2}(x,y) \leqslant z_{2} }} f(x,y) \mathrm{d}x \mathrm{d}y = \iint \limits_{\substack{u \leqslant z_{1} \\ v \leqslant z_{2} }} f(\phi_{1}(u,v), \phi_{2}(u,v)) \left| \frac{\partial(x,y)}{\partial(u,v)} \right| \mathrm{d}u \mathrm{d}v, \tag{3.23}

在 (3.23) 式中对 z1,z2z_{1}, z_{2} 求混合偏导, 得

fZ(z1,z2)=f(ϕ1(z1,z2),ϕ2(z1,z2))(ϕ1(u,v),ϕ2(u,v))(u,v)(u,v)=(z1,z2).(3.24) f_{\mathbf{Z}}(z_{1}, z_{2}) = f(\phi_{1}(z_{1}, z_{2}), \phi_{2}(z_{1}, z_{2})) \left| \frac{\partial(\phi_{1}(u,v), \phi_{2}(u,v))}{\partial(u,v)} \right|_{(u,v) = (z_{1}, z_{2})}. \tag{3.24}

特别地, 当随机变量 X,YX, Y 相互独立时, 有 f(x,y)=f1(x)f2(y)f (x, y) = f_{1}(x) f_{2}(y) , 计算会方便进行.

视频扫描视频 11 的二维码观看关于两个随机变量的函数的分布讲解.

在多维随机变量场合, 更一般地有, 如果 X=(X1,X2,,Xn)X = (X_{1}, X_{2},\dots ,X_{n})nn 维连续型随机向量, 具有联合概率密度函数 f(x)=f(x1,x2,,xn)f (\pmb {x}) = f (x_{1}, x_{2},\dots ,x_{n}) .假设存在 Rn\mathbb{R}^{n}Rn\mathbb{R}^{n} 的一一映射 gg ,其逆映射 g1g^{- 1} 存在一阶连续偏导数, 那么 nn 维随机变量 Y=g(X)Y = g (X) 是连续型的, 且具有联合密度函数

p(y)=f(g1(y))JID(y),(3.25) p(\pmb {y}) = f\left(\pmb{g}^{-1}(\pmb {y})\right) \big| J \big|_{I_{D}}(\pmb {y}), \tag{3.25}

其中 DRnD \subset \mathbb{R}^{n} 是随机向量 y\pmb{y} 的密度非零的所有可能值的集合, JJ 是变换的雅可比行列式, 这里 J|J| 为行列式 JJ 的绝对值, 即

J=g1(y1,y2,,yn). J = \left| \frac{\partial g^{-1}}{\partial(y_{1}, y_{2}, \cdots, y_{n})} \right|.

例 3.19 设随机变量 X,YX, Y 相互独立, 分别具有概率密度函数 f1(x)f_{1}(x)f2(y)f_{2}(y) , 求 X+YX + Y 的概率密度函数.

解 由 X,YX, Y 相互独立及公式 (3.20)

FX+Y(z)=x+yzxf1(x)f2(y)dxdy=f1(x)zxf2(y)dydx, F_{X + Y}(z) = \int_{x + y\leqslant z}^{x}f_{1}(x)f_{2}(y)\mathrm{d}x\mathrm{d}y = \int_{-\infty}^{\infty}f_{1}(x)\int_{-\infty}^{z - x}f_{2}(y)\mathrm{d}y\mathrm{d}x,

在积分号下对 zz 求导, 得

fX+Y(z)=f1(x)f2(zx)dx,=f2(y)f1(zy)dyf1f2(z). \begin{array}{l}{f_{X + Y}(z) = \int_{-\infty}^{\infty}f_{1}(x)f_{2}(z - x)\mathrm{d}x,}\\ {= \int_{-\infty}^{\infty}f_{2}(y)f_{1}(z - y)\mathrm{d}y\equiv f_{1}*f_{2}(z).} \end{array}

这里 f1f2(z)f_{1}*f_{2}(z) 称为 f1f_{1}f2f_{2} 的卷积 (convolution).

也可以从变量代换角度来得到随机变量和的密度函数. 令 U=X,V=X+YU = X, V = X + Y , 函数 u,vu, vx,yx, y 的雅可比行列式为 1, 故 (积分区域如图 3.7)

P(X+Yz)=x+yzf(x,y)dxdy=vzf(u,vu)dudv=zdvf(u,vu)du. \begin{array}{l}{P(X + Y\leqslant z) = \iint_{x + y\leqslant z}f(x,y)\mathrm{d}x\mathrm{d}y}\\ {= \iint_{v\leqslant z}f(u,v - u)\mathrm{d}u\mathrm{d}v}\\ {= \int_{-\infty}^{z}\mathrm{d}v\int_{-\infty}^{\infty}f(u,v - u)\mathrm{d}u.} \end{array}

图 3.7 积分区域

由密度函数的定义

fX+Y(z)=f(u,zu)du. f_{X + Y}(z) = \int_{-\infty}^{\infty}f(u,z - u)\mathrm{d}u.

X,YX, Y 相互独立时, f(u,zu)=f1(u)f2(zu)f (u, z - u) = f_{1}(u) f_{2}(z - u) . 这里不需要在积分号下求导.

例 3.20 (指数分布随机变量的和与差) 设 XXYY 独立, 均服从指数分布 Exp(λ)E x p (\lambda) ,求 Z=Z = X+YX + Y 的概率密度函数.

解 由于

fZ(z)=λ2exp{λx}exp{λ(zx)}I[0,)(x)I[0,)(zx)dx=λ2exp{λz}I[0,)(x)I[0,)(zx)dx=λ2zexp{λz}I[0,)(z). \begin{array}{l}{f_{Z}(z) = \lambda^{2}\int_{-\infty}^{\infty}\exp \{-\lambda x\} \exp \{-\lambda (z - x)\} I_{[0,\infty)}(x)I_{[0,\infty)}(z - x)\mathrm{d}x}\\ {= \lambda^{2}\exp \{-\lambda z\} \int_{-\infty}^{\infty}I_{[0,\infty)}(x)I_{[0,\infty)}(z - x)\mathrm{d}x}\\ {= \lambda^{2}z\exp \{-\lambda z\} I_{[0,\infty)}(z).} \end{array}

进一步容易得出, 如果 X1,X2,,XnX_{1}, X_{2},\dots ,X_{n} 相互独立且服从相同的指数分布 Exp(λ)E x p (\lambda) ,那么 Z=Z = X1+X2++XnX_{1} + X_{2} + \dots +X_{n} 的概率密度函数为

fn(z)=λnn!zn1exp{λz}I[0,)(z). f_{n}(z) = \frac{\lambda^{n}}{n!} z^{n - 1}\exp \{-\lambda z\} I_{[0,\infty)}(z).

该分布称为参数是 n,λn, \lambdaΓ\Gamma 分布, 记为 ZGa(n,λ)Z \sim Ga (n, \lambda) . 如果相互独立的两个同类型随机变量之和仍服从同一类型的分布, 那么称此分布类型具有再生性. 因此, Γ\Gamma 分布对参数 nn 具有再生性.

类似地, Z=XYZ = X - Y 的概率密度函数为

fZ(z)=λ2exp{λx}exp{λ(z+x)}I[0,)(x)I[0,)(z+x)dx=λ2exp{λz}exp{2λx}I[0,)(x)I[0,)(z+x)dx={λ2exp{λz}zexp{2λx}dx,z0,λ2exp{λz}0exp{2λx}dx,z>0={(λ/2)exp{λz},z0,(λ/2)exp{λz},z>0={(λ/2)exp{λz},z>0 \begin{array}{r l} & {f_{Z}(z) = \lambda^{2}\int_{-\infty}^{\infty}\exp \{-\lambda x\} \exp \{-\lambda (z + x)\} I_{[0,\infty)}(x)I_{[0,\infty)}(z + x)\mathrm{d}x}\\ & {\qquad = \lambda^{2}\exp \{-\lambda z\} \int_{-\infty}^{\infty}\exp \{-2\lambda x\} I_{[0,\infty)}(x)I_{[0,\infty)}(z + x)\mathrm{d}x}\\ & {\qquad = \left\{ \begin{array}{l l}{\lambda^{2}\exp \{-\lambda z\} \int_{-z}^{\infty}\exp \{-2\lambda x\} \mathrm{d}x,} & {z\leqslant 0,}\\ {\lambda^{2}\exp \{-\lambda z\} \int_{0}^{\infty}\exp \{-2\lambda x\} \mathrm{d}x,} & {z > 0} \end{array} \right.}\\ & {\qquad = \left\{ \begin{array}{l l}{(\lambda /2)\exp \{\lambda z\} ,} & {z\leqslant 0,}\\ {(\lambda /2)\exp \{-\lambda z\} ,} & {z > 0} \end{array} \right.}\\ & {\qquad = \left\{ \begin{array}{l l}{(\lambda /2)\exp \{-\lambda z\} ,} & {z > 0} \end{array} \right.} \end{array}

该分布称为拉普拉斯分布, 即独立指数分布的差是拉普拉斯分布.

例 3.21 设 X,YX, Y 相互独立, 且 XU(0,2),YU(1,1)X \sim U (0,2), Y \sim U (- 1,1) , 求 X+YX + Y 的概率密度函数.

解令 U=X+Y,V=YU = X + Y, V = Y , 由于 (u,v)(x,y)=1\frac{\partial (u, v)}{\partial (x, y)} = 1 , 故 (U,V)(U, V) 的联合密度函数为

g(u,v)=14I(0,2)(uv)I(1,1)(v), g(u, v) = \frac{1}{4} I_{(0,2)}(u - v)I_{(-1,1)}(v),

(联合密度函数的非零区域见图 3.8), 对另一个变量求积分得到 fX+Y(u)f_{X + Y}(u) 的密度函数为

fX+Y(u)=g(u,v)dv=14I(0,2)(uv)I(1,1)(v)dv=1411I(0,2)(uv)dv=14[1udvI(1,1)(u)+u21dvI(1,3)(u)]=14[(u+1)I(1,1)(u)+(3u)I(1,3)(u)]. \begin{array}{l}{f_{X + Y}(u) = \int g(u,v)\mathrm{d}v = \frac{1}{4}\int I_{(0,2)}(u - v)I_{(-1,1)}(v)\mathrm{d}v}\\ {= \frac{1}{4}\int_{-1}^{1}I_{(0,2)}(u - v)\mathrm{d}v}\\ {= \frac{1}{4}\Big[\int_{-1}^{u}\mathrm{d}v I_{(-1,1)}(u) + \int_{u - 2}^{1}\mathrm{d}v I_{(1,3)}(u)\Big]}\\ {= \frac{1}{4}\Big[(u + 1)I_{(-1,1)}(u) + (3 - u)I_{(1,3)}(u)\Big].} \end{array}

例 3.22 (正态分布随机变量的和)设 XXYY 相互独立, 分别服从 N(μ1,σ12)N\left (\mu_{1},\sigma_{1}^{2}\right)N(μ2,σ22)N\left (\mu_{2},\sigma_{2}^{2}\right) ,求 Z=X+YZ = X + Y 的分布.

解由于

fZ(z)=12πσ1σ2exp{(xμ1)22σ12}exp{(zxμ2)22σ22}dx=12πσ1σ2exp{12(1σ12+1σ22)[x(1σ12+1σ22)(μ1σ12+zμ2σ22)]2}dx×exp{12(1σ12+1σ22)1(μ1σ12+zμ2σ22)212(μ12σ12+(zμ2)2σ22)}=12πσ12+σ22exp{12(σ12+σ22)[μ12(zμ2)2+2μ1(zμ2)]}=12πσ12+σ22exp{[z(μ1+μ2)]22(σ12+σ22)}. \begin{array}{r l} & {f_{Z}(z) = \frac{1}{2\pi\sigma_{1}\sigma_{2}}\int_{-\infty}^{\infty}\exp \left\{-\frac{(x - \mu_{1})^{2}}{2\sigma_{1}^{2}}\right\} \exp \left\{-\frac{(z - x - \mu_{2})^{2}}{2\sigma_{2}^{2}}\right\} \mathrm{d}x}\\ & {\qquad = \frac{1}{2\pi\sigma_{1}\sigma_{2}}\int_{-\infty}^{\infty}\exp \left\{-\frac{1}{2}\left(\frac{1}{\sigma_{1}^{2}} +\frac{1}{\sigma_{2}^{2}}\right)\left[x - \left(\frac{1}{\sigma_{1}^{2}} +\frac{1}{\sigma_{2}^{2}}\right)\left(\frac{\mu_{1}}{\sigma_{1}^{2}} +\frac{z - \mu_{2}}{\sigma_{2}^{2}}\right)\right]^{2}\right\} \mathrm{d}x\times}\\ & {\qquad \exp \left\{\frac{1}{2}\left(\frac{1}{\sigma_{1}^{2}} +\frac{1}{\sigma_{2}^{2}}\right)^{-1}\left(\frac{\mu_{1}}{\sigma_{1}^{2}} +\frac{z - \mu_{2}}{\sigma_{2}^{2}}\right)^{2} - \frac{1}{2}\left(\frac{\mu_{1}^{2}}{\sigma_{1}^{2}} +\frac{(z - \mu_{2})^{2}}{\sigma_{2}^{2}}\right)\right\}}\\ & {\qquad = \frac{1}{\sqrt{2\pi}\sqrt{\sigma_{1}^{2} + \sigma_{2}^{2}}}\exp \left\{\frac{1}{2\left(\sigma_{1}^{2} + \sigma_{2}^{2}\right)}\left[-\mu_{1}^{2} - (z - \mu_{2})^{2} + 2\mu_{1}(z - \mu_{2})\right]\right\}}\\ & {\qquad = \frac{1}{\sqrt{2\pi}\sqrt{\sigma_{1}^{2} + \sigma_{2}^{2}}}\exp \left\{-\frac{\left[z - (\mu_{1} + \mu_{2})\right]^{2}}{2\left(\sigma_{1}^{2} + \sigma_{2}^{2}\right)}\right\} .} \end{array}

ZN(μ1+μ2,σ12+σ22)Z\sim N (\mu_{1} + \mu_{2},\sigma_{1}^{2} + \sigma_{2}^{2}) ,即正态分布 N(μ,σ2)N (\mu ,\sigma^{2}) 对参数 μ,σ2\mu ,\sigma^{2} 具有再生性.

值得注意的是,这里“ XXYY 相互独立”这一条件不能少.事实上,容易验证(读者练习.)

f(x,y)=ϕ(x)ϕ(y)[1+12(2ϕ(x)1)(2ϕ(y)1)] f(x,y) = \phi (x)\phi (y)\left[1 + \frac{1}{2} (2\phi (x) - 1)(2\phi (y) - 1)\right]

为一个二元概率密度函数, 且满足 XXYY 的边缘分布均为标准正态分布, 但是 X+YX + Y 的分布不是正态分布.

例 3.23 (独立随机变量商的分布) 设 XXYY 相互独立, Xf1(x),Yf2(y)X\sim f_{1}(x), Y\sim f_{2}(y) ,求 Z=XYZ = \frac{X}{Y} 的分布.

解令 U=XY,V=YU = \frac{X}{Y}, V = Y ,则当 y0y\neq 0 时, 函数 (u,v)(u, v)(x,y)(x, y) 的雅可比行列式的绝对值为

(u,v)(x,y)=1yxy201=1y, \left|\frac{\partial(u,v)}{\partial(x,y)}\right| = \left| \begin{array}{cc}\frac{1}{y} & -\frac{x}{y^2} \\ 0 & 1 \end{array} \right| = \frac{1}{|y|},

所以 (x,y)(x, y)(u,v)(u, v) 的雅可比行列式的绝对值为 y=v|y| = |v| ,由此得

FZ(z)=x/yzf1(x)f2(y)dxdy=zdu+vf1(uv)f2(v)dv. F_{Z}(z) = \iint_{x / y\leqslant z}f_{1}(x)f_{2}(y)\mathrm{d}x\mathrm{d}y = \int_{-\infty}^{z}\mathrm{d}u\int_{-\infty}^{+\infty}|v|f_{1}(uv)f_{2}(v)\mathrm{d}v.

由密度函数的定义知

fZ(z)=+vf1(zv)f2(v)dv. f_{Z}(z) = \int_{-\infty}^{+\infty}|v|f_{1}(zv)f_{2}(v)\mathrm{d}v.

例如, 设 XXYY 是独立的随机变量, 均服从 N(0,σ2),Z=XYN\left (0,\sigma^{2}\right), Z = \frac{X}{Y} 。则

fZ(z)=12πσ2yexp{(1+z2)y22σ2}dy=1πσ20yexp{(1+z2)y22σ2}dy=1π(1+z2). \begin{array}{l}{{f_{Z}(z)=\frac{1}{2\pi\sigma^{2}}\int_{-\infty}^{\infty}|y|\exp\Big\{-\frac{\left(1+z^{2}\right)y^{2}}{2\sigma^{2}}\Big\}\mathrm{d}y}}\\ {{\quad=\frac{1}{\pi\sigma^{2}}\int_{0}^{\infty}y\exp\Big\{-\frac{\left(1+z^{2}\right)y^{2}}{2\sigma^{2}}\Big\}\mathrm{d}y}}\\ {{\quad=\frac{1}{\pi\left(1+z^{2}\right)}}.}\end{array}

该分布称为柯西 (Cauchy) 分布, 即独立正态分布随机变量的商服从柯西分布。

例 3.24 设 XXYY 相互独立, XN(0,1),YN(0,1)X\sim N (0,1), Y\sim N (0,1) ,求 (X,Y)(X, Y) 的极坐标变换后极轴和极角 (R,θ)(R,\theta) 的分布。

解由定义, 作极坐标变换 X=Rcosθ,Y=RsinθX = R\cos \theta ,Y = R\sin \theta ,其中 R>0,θ[0,2π)R > 0,\theta \in [0,2\pi) 。则 (x,y)(x, y)(r,θ)(r,\theta) 的雅可比行列式的绝对值为 rr ,由于

f(x,y)=12πexp{12(x2+y2)}, f(x,y) = \frac{1}{2\pi}\exp \Big\{-\frac{1}{2} (x^{2} + y^{2})\Big\} ,

作极坐标变换后由 (3.24) 式得

fR,θ(r,θ)=12πexp{r22}rI(0,)×[0,2π)(r,θ). f_{R,\theta}(r,\theta) = \frac{1}{2\pi}\exp \Big\{-\frac{r^{2}}{2}\Big\} rI_{(0,\infty)\times [0,2\pi)}(r,\theta).

由上式知, 极坐标变换后的 (R,θ)(R,\theta) 是相互独立的。其中 Rrexp{x22}I(0,)(r),θU[0,2π)R\sim r\exp \Big\{- \frac{x^{2}}{2}\Big\} I_{(0,\infty)}(r),\theta \sim U[0,2\pi)

例 3.25 设随机变量 X1,X2,X3X_{1}, X_{2}, X_{3} 相互独立且都服从区间 (0,1)(0,1) 上的均匀分布。

(1) 若随机变量 Y=alnX1Y = -a\ln X_{1} ,其中 a>0a > 0 为一给定常数, 试求 YY 的概率密度函数。

(2) 试求随机变量 Z=X2X1Z = \frac{X_{2}}{X_{1}} 的分布函数。

(3) 试求随机变量 U=1X1X2X3U = \frac{1}{X_{1}X_{2}X_{3}} 的概率密度函数。

解 (1) 对任意 y>0y > 0 , 由于

P(Yy)=P(alnX1y)=P(X1eya)=1eya, P(Y \leqslant y) = P(-a \ln X_1 \leqslant y) = P\left(X_1 \geqslant \mathrm{e}^{-\frac{y}{a}}\right) = 1 - \mathrm{e}^{-\frac{y}{a}},

YY 服从参数为 1a\frac{1}{a} 的指数分布, 从而其概率密度函数为 fY(y)=1aeyaI(y>0)f_Y (y) = \frac{1}{a} \mathrm{e}^{- \frac{y}{a}} I (y > 0) .

(2) 当 0z<10 \leqslant z < 1 时,

P(Zz)=P(X2zX1)=010zydxdy=z2; P(Z \leqslant z) = P\left(X_2 \leqslant z X_1\right) = \int_0^1 \int_0^{zy} \mathrm{d}x \mathrm{d}y = \frac{z}{2};

而当 z1z \geqslant 1 时,

P(Zz)=P(X2zX1)=01z0zydxdy+1z101dxdy=112z, \begin{array}{l}{P(Z\leqslant z) = P\left(X_{2}\leqslant z X_{1}\right)}\\ {= \int_{0}^{\frac{1}{z}}\int_{0}^{z y}\mathrm{d}x\mathrm{d}y + \int_{\frac{1}{z}}^{1}\int_{0}^{1}\mathrm{d}x\mathrm{d}y}\\ {= 1 - \frac{1}{2z},} \end{array}

ZZ 的分布函数为

FZ(z)={0,z<0,z2,0z<1,112z,z1. F_Z(z) = \left\{ \begin{array}{ll} 0, & z < 0, \\ \frac{z}{2}, & 0 \leqslant z < 1, \\ 1 - \frac{1}{2z}, & z \geqslant 1. \end{array} \right.

(3) 由 VlnU=i=13lnXiV \equiv \ln U = -\sum_{i = 1}^{3} \ln X_i

(1) 可知, VV 为 3 个独立的服从 Exp(1)Exp (1) 的随机变量之和, 故 VV 服从 Ga(1,3)Ga (1,3) 分布, 即其概率密度函数为

fV(v)=12v2evI(0,)(v). f_V(v) = \frac{1}{2} v^2 \mathrm{e}^{-v} I_{(0,\infty)}(v).

再由 U=eVU = \mathrm{e}^{V} 及密度函数变换公式可知, UU 的概率密度函数为

fU(u)=ln2u2u2I(1,)(u). f_U(u) = \frac{\ln^2 u}{2u^2} I_{(1,\infty)}(u).

例 3.26 (最大值和最小值的分布) 设 XXYY 相互独立, XF1(x),YF2(y)X \sim F_1 (x), Y \sim F_2 (y) , 求 max{X,Y}\max \{X, Y\}min{X,Y}\min \{X, Y\} 的分布.

解 首先注意 max{X,Y}\max \{X, Y\}min{X,Y}\min \{X, Y\} 均为随机变量. 由于 XXYY 相互独立, 故

Fmax(z)=P(max{X,Y}z)=P(Xz,Yz) F_{\max}(z) = P(\max \{X,Y\} \leqslant z) = P(X\leqslant z,Y\leqslant z)

=P(Xz)P(Yz)=F1(z)F2(z), = P(X \leqslant z) P(Y \leqslant z) = F_1(z) F_2(z),

Fmin(z)=P(min{X,Y}z)=P({Xz}{Yz})=1P({X>z}{Y>z})=1(1F1(z))(1F2(z)). \begin{array}{r l} & {F_{\min}(z) = P(\min \{X,Y\} \leqslant z) = P(\{X\leqslant z\} \cup \{Y\leqslant z\})}\\ & {\qquad = 1 - P(\{X > z\} \cap \{Y > z\}) = 1 - (1 - F_{1}(z))(1 - F_{2}(z)).} \end{array}

如果 Xf1(x),Yf2(y)X \sim f_{1}(x), Y \sim f_{2}(y) , 那么

fmax(z)=f1(z)F2(z)+F1(z)f2(z),(3.26) f_{\max}(z) = f_{1}(z)F_{2}(z) + F_{1}(z)f_{2}(z), \tag{3.26}

fmin(z)=f1(z)(1F2(z))+(1F1(z))f2(z).(3.27) f_{\min}(z) = f_{1}(z)(1 - F_{2}(z)) + (1 - F_{1}(z))f_{2}(z). \tag{3.27}

此例可以毫无困难地推广到 nn 个相互独立随机变量的最大值和最小值的分布.

例 3.27 掷两颗骰子, 设 XXYY 分别表示第一和第二次掷出的点数, 求 P(max{X,Y}=5)P (\max \{X, Y\} = 5)P(min{X,Y}=3)P (\min \{X, Y\} = 3) .

解注意到 XXYY 相互独立, 有

P(max{X,Y}=5)=P(max{X,Y}5)P(max{X,Y}4)=(56)2(46)2=14,P(min{X,Y}=3)=P(min{X,Y}3)P(min{X,Y}4)=(46)2(36)2=736. \begin{array}{r l} & {P(\max \{X,Y\} = 5) = P(\max \{X,Y\} \leqslant 5) - P(\max \{X,Y\} \leqslant 4)}\\ & {\qquad = \left(\frac{5}{6}\right)^{2} - \left(\frac{4}{6}\right)^{2} = \frac{1}{4},}\\ & {P(\min \{X,Y\} = 3) = P(\min \{X,Y\} \geqslant 3) - P(\min \{X,Y\} \geqslant 4)}\\ & {\qquad = \left(\frac{4}{6}\right)^{2} - \left(\frac{3}{6}\right)^{2} = \frac{7}{36}.} \end{array}

例 3.28 (系统可靠性研究) 设系统 LL 由两个独立的子系统 L1,L2L_{1}, L_{2} 连接而成, 连接的方式分别为 (1) 串联, (2) 并联, (3) 备用, 如图 3.9. 设 L1,L2L_{1}, L_{2} 的寿命分别为 X,YX, Y ,其密度函数分别为

f1(x)=αeαxI(0,)(x),α>0,f2(y)=βeβyI(0,)(y),β>0. \begin{array}{r l} & {f_{1}(x) = \alpha \mathrm{e}^{-\alpha x}I_{(0,\infty)}(x),\quad \alpha >0,}\\ & {f_{2}(y) = \beta \mathrm{e}^{-\beta y}I_{(0,\infty)}(y),\quad \beta >0.} \end{array}

其中 αβ\alpha \neq \beta .求系统 LL 的寿命 ZZ 的分布

图 3.9 系统连接方式

解 (1) 串联, 只要 L1,L2L_{1}, L_{2} 中有一个损坏, 系统 LL 停止工作, 故 Z=min{X,Y}Z = \min \{X, Y\} ,由 (3.27) 式得

fmin(z)=(αeαzeβz+βeβzeαz)I(0,)(z)=(α+β)e(α+β)zI(0,)(z). \begin{array}{r l} & {f_{\min}(z) = (\alpha \mathrm{e}^{-\alpha z}\mathrm{e}^{-\beta z} + \beta \mathrm{e}^{-\beta z}\mathrm{e}^{-\alpha z})I_{(0,\infty)}(z)}\\ & {\qquad = (\alpha +\beta)\mathrm{e}^{-(\alpha +\beta)z}I_{(0,\infty)}(z).} \end{array}

(2) 并联, 只有 L1,L2L_{1}, L_{2} 两个都损坏时, 系统 LL 才停止工作, 故 Z=max{X,Y}Z = \max \{X, Y\} ,由 (3.26) 式得

fmax(z)=[αeαz(1eβz)+βeβz(1eαz)]I(0,)(z)=[αeαz+βeβz(α+β)e(α+β)z]I(0,)(z). \begin{array}{r l} & {f_{\max}(z) = [\alpha \mathrm{e}^{-\alpha z}(1 - \mathrm{e}^{-\beta z}) + \beta \mathrm{e}^{-\beta z}(1 - \mathrm{e}^{-\alpha z})]I_{(0,\infty)}(z)}\\ & {\qquad = [\alpha \mathrm{e}^{-\alpha z} + \beta \mathrm{e}^{-\beta z} - (\alpha +\beta)\mathrm{e}^{-(\alpha +\beta)z}]I_{(0,\infty)}(z).} \end{array}

(3) 备用, 系统 L1L_{1}L2L_{2} 寿命之和. 即 Z=X+YZ = X + Y ,故 z>0z > 0 时, 由独立随机变量密度函

数卷积公式,

fX+Y(z)=0zαeα(zy)βeβydy=αββα(eαzeβz), f_{X + Y}(z) = \int_{0}^{z}\alpha \mathrm{e}^{-\alpha (z - y)}\beta \mathrm{e}^{-\beta y}\mathrm{d}y = \frac{\alpha\beta}{\beta - \alpha} (\mathrm{e}^{-\alpha z} - \mathrm{e}^{-\beta z}),

α=β\alpha = \beta ,容易得到

fX+Y(z)=α2zeαzI(0,)(z). f_{X + Y}(z) = \alpha^{2}z\mathrm{e}^{-\alpha z}I_{(0,\infty)}(z).

扩展阅读:辛普森情论

有人说统计会撒谎. “世界上有三种谎言, 即谎言、弥天大谎和统计 (There are three kinds of lies: lies, damned lies and statistics)”. 美国作家马克·吐温 (Mark Twain, 1835—1910) 在其作品《我的自传》中的曾引用此话. 将统计和谎言相提并论显然有失公允. 如今人们理解这句话, 大多指向的是对统计数据的人为操纵和恶意利用. 其实, 数字本身不会说谎, 数字只是一个信息载体, 说谎的其实是使用数字的人. 数字既可以拿来解释客观世界, 也可以用来曲解事实真相. 这也恰好说明, 如果没有一定的统计学知识, 人们就有可能从接收到的信息里得出错误的结论. 美国统计学家哈夫 (Darrell Huff, 1913—2001) 还为此出版了一本名为《统计数字会撒谎》(How to Lie with Statistics) 的科普读本. 该书用大量生动有趣的实例, 揭露了当时美国社会中一些利用数字和数据造假的现象, 引起了极大反响. 书中提出的统计陷阱的例子, 比如样本选择偏差、平均数的选择以及相关性的滥用等, 在现今的生活中仍然十分常见. 该书自 1954 年出版至今, 多次重印, 被译为多种文字, 影响深远, 光在国内出版的中译名就有《统计陷阱》《统计数字会撒谎》《怎能利用统计撒谎》和《别让统计数字骗了你》等. 在日常的经济生活中, 我们将接触到越来越多的统计数据和资料, 例如各种证券信息、投资可行性研究报告、公司财务报告等, 这些资料和数据如何去伪存真, 如何进行鉴别? 没有很好的统计思维, 就很有可能陷入那些精心炮制的数据陷阱之中, 从而得出有失偏颇的结论.

下面我们将通过统计学里一个有名的辛普森情论来说明统计是如何“撒谎”的.

什么是辛普森情论

当人们尝试探究两种变量是否具有相关性的时候, 比如新生录取率与性别, 报酬与性别等, 会分别对之进行分组研究. 辛普森悖论是在这种研究中, 在某些前提下有时会产生的一种现象, 即在分组比较中都占优势的一方, 在总评中反而会是失势的一方. 该现象于 20 世纪初就有人讨论, 但一直到 1951 年英国统计学家辛普森 (Edward H. Simpson, 1922— ) 在他发表的论文中该现象才算正式被描述和解释. 后来就以他的名字命名该悖论.

我们通过一个虚构的简单例子来说明什么是辛普森悖论. 一所高校的两个学院, 分别是法学院和商学院. 人们怀疑这两个学院在新生招生中有性别歧视.

如表 3.1 所示, 无论在法学院还是在商学院, 女生的录取比例都高于男生, 由此可以推断

学校在招生时更倾向于招女生吗?但是,如果将两个学院的数据汇总,结果如表 3.2 所示,却发现女生的总体录取率实际上比男生要低.

表 3.1 各学院录取率

法学院男生法学院女生商学院男生商学院女生
录取人数85120192
未录取人数45101509
录取率/%15.133.680.191.1

表 3.2 总体录取率

男生女生
录取人数209143
未录取人数95110
录取率/%68.856.5

上面的例子说明简单地将分组数据相加汇总有时并不能反映真实的整体情况.这种看起来“自相矛盾”的情况是怎么发生的呢?就这个例子来说,导致辛普森论发生一般有两个前提.

第一,两个分组的录取率相差很大,即法学院录取率很低,而商学院却很高.另一方面,两种性别的申请者分布比率相反,即法学院大部分申请者为女性,而商学院大部分申请者为男性.结果在数量上来说,拒收率高的法学院拒收了很多的女生,男生虽然有更高的拒收率,但被拒收的数量却相对不算多.而录取率很高的商学院虽然有较高的录取比例,但是被拒收的男生数量相对法学院来说则明显较多.

第二,有潜在因素影响着录取情况,即性别并非是影响录取率高低的唯一因素,甚至可能是毫无影响的.至于在学院中出现的比率差,可能只是随机因素造成的,又或者是其他因素作用 (如入学成绩). 刚好出现这种录取比例,使人牵强地误认为这是由性别差异而造成的.

辛普森论也可以从数学上解释,即若有

a1b1>a2b2,c1d1>c2d2, \frac{a_{1}}{b_{1}} >\frac{a_{2}}{b_{2}},\quad \frac{c_{1}}{d_{1}} >\frac{c_{2}}{d_{2}},

但并不能保证

a1+c1b1+d1>a2+c2b2+d2. \frac{a_{1} + c_{1}}{b_{1} + d_{1}} >\frac{a_{2} + c_{2}}{b_{2} + d_{2}}.

这个结论很初等,我们相信很多同学能给出适当的例子以验证,只是对很多人来说比较“反常识”而已.

辛普森论的重要性在于它揭示了:我们看到的数据并非全貌.我们不能满足于展示的数字或图表,需要考虑整个数据生成过程,将所有可能的因素或变量考虑进来以通过它们的联合分布来研究.一种更深刻的解释是统计学中的因果推断.一旦我们理解了数据产生的机制,

我们就能从图表之外的角度来考虑问题, 找到其他影响因素. 如果两个统计变量 XXYY 之间存在因果关系, 那么这种因果关系存在三个可能, 要么是 XX 导致 YY , 要么是 YY 导致 XX , 或者存在一个共同的原因 ZZ , 同时导致了 XXYY .

本章总结

图 3.10 第三章知识点结构图

重点概念总结

取有限个值的二维离散型随机变量的分布律一般用矩形表格来表示, 由此可以方便获得边缘分布和条件分布.

如果 (X,Y)(X, Y) 服从二元正态分布, 那么唯一确定的两个边缘分布都是正态分布, 反之, 边缘分布不能唯一确定联合分布.

计算有关事件概率的难点是计算二重积分, 计算二维随机变量的函数分布的关键之一是二重积分中的变量代换.

为了求出 g(X,Y)g (X, Y) 的密度函数, 可以令 U=g(x,y),V=h(x,y)U = g (x, y), V = h (x, y) , 先求出 U(X,Y),V(X,Y)U (X, Y), V (X, Y) 的联合密度函数, 然后对其中一个变量积分获得另一个变量的密度函数.

利用条件密度函数、边缘密度函数和联合密度函数三者之间的关系计算联合密度函数或边缘密度函数.

两个随机变量相互独立是指: 任取与 XX 有关的事件 AA 以及与 YY 有关的事件 BB , 则事件 A,BA, B 相互独立, 由此来理解随机变量独立的定义以及计算有关的概率.

习题

  1. 箱中装有 6 个球, 其中红、白、黑球的个数分别为 1,2,3. 现从箱中随机地取出 2 个球, 记 XX 为取出的红球个数, YY 为取出的白球个数. 求随机变量 (X,Y)(X, Y) 的联合分布函数.

  2. 袋中有一个红球, 两个黑球, 三个白球, 现有放回地从袋中取两次, 每次取一球, 以 X,YX, Y , ZZ 分别表示两次取球的红、黑、白球的个数.

(1) 求 P(X=1Z=0)P (X = 1|Z = 0) ;

(2) 求二维随机变量 (X,Y)(X, Y) 的联合分布函数.

  1. 将同一硬币连续掷三次, 以 XX 表示在三次中出现正面的次数, 以 YY 表示三次中出现的正面次数和出现的反面次数之差的绝对值. 试写出 XXYY 的联合分布律.

  2. 现有某种产品 100 个, 其中一、二、三等品分别为 80,10,10 个, 现从中随机抽取一个产品, 记

    X1={1,HHHHH,0,HH,X2={1,HHHH,0,HH, X_{1}=\left\{\begin{array}{l l}{{1,}}&{{\hbar\mathbb{H}\mathbb{H}\mathbb{H}\mathbb{H}\mathbb{H},}}\\ {{0,}}&{{\mathbb{H}\mathbb{H},}}\end{array}\right.\qquad X_{2}=\left\{\begin{array}{l l}{{1,}}&{{\hbar\mathbb{H}\mathbb{H}\mathbb{H}\mathbb{H},}}\\ {{0,}}&{{\mathbb{H}\mathbb{H},}}\end{array}\right.

    (X1,X2)(X_{1}, X_{2}) 的联合分布律

  3. 设二维随机向量的联合分布律为

YX
-11
-10.2b
1a0.3

已知事件 {X=1}\{X = - 1\}{X+Y=0}\{X + Y = 0\} 相互独立, 求 a,ba, b

  1. 设某射手每次射中目标的概率为 p(0<p<1)p (0< p< 1) , 射击进行到第二次射中目标为止, XX 表示第一次射中目标所进行的射击次数, YY 表示第二次射中目标所进行的射击次数.

(1) 求二维随机变量 (X,Y)(X, Y) 的联合分布律;

(2) 求 XXYY 的边缘分布.

  1. 从 1,2,3,4 四个数中任取一个数, 记为 XX , 再从 1 到 XX 中任取一个数, 记为 YY , 求事件 {Y=2}\{Y = 2\} 发生的概率.

  2. 设二维随机变量 (X,Y)(X, Y) 服从正态分布 N(1,0,1,1,0)N (1,0,1,1,0) , 求 P(XYY<0)P (XY - Y< 0) .

  3. 设二维随机变量 (X,Y)(X, Y) 的联合分布函数为

    F(x,y)=a(b+arctanx)(c+arctany),x,yR. F(x,y) = a(b + \arctan x)(c + \arctan y), \quad x,y \in \mathbb{R}.

    (1) 确定常数 a,b,ca, b, c

(2) 求 P(X>0,Y>0)P (X > 0, Y > 0) ;

(3) 求 XXYY 的边缘密度函数.

  1. 设二维随机变量 (X,Y)(X, Y) 的密度函数为 f(x,y)={cosxcosy,0<x<π/2,0<y<π/2,0,其他. f(x,y) = \left\{ \begin{array}{cl}\cos x\cos y, & 0< x< \pi /2,0< y< \pi /2,\\ 0, & \text{其他}. \end{array} \right. (1) 试求 (X,Y)(X, Y) 的分布函数;

(2) 试求概率 P(0<X<π/4,π/4<Y<π/2)P (0< X< \pi /4,\pi /4< Y< \pi /2)

  1. 设二维随机变量 (X,Y)(X, Y) 的密度函数为 f(x,y)={ex,0<y<x,0,其他. f(x,y) = \left\{ \begin{array}{cl}\mathrm{e}^{-x}, & 0< y< x,\\ 0, & \text{其他}. \end{array} \right. (1) 求条件密度函数 fYX(yx)f_{Y\mid X}(y|x)

(2) 求条件概率 P(X1Y1)P (X\leqslant 1|Y\leqslant 1)

  1. 设二维随机变量 (X,Y)(X, Y) 的密度函数为

    f(x,y)=Ae2x2+2xyy2,(x,y)R2. f(x,y) = A\mathrm{e}^{-2x^2 +2xy - y^2},\quad (x,y)\in \mathbb{R}^2.

    求常数 AA 及条件密度函数 fYX(yx)f_{Y\mid X}(y|x)

  2. 设二维随机变量 (X,Y)(X, Y) 的密度函数为

    f(x,y)={Ax2,0<x<y<1,0,其他. f(x,y) = \left\{ \begin{array}{cl}A x^2, & 0< |x|< y< 1,\\ 0, & \text{其他}. \end{array} \right.

    求常数 AA 及条件概率 P(X0.25Y=0.5)P (X\leqslant 0.25|Y = 0.5)

  3. 设随机变量 XXYY 相互独立, 且 XX 服从标准正态分布 N(0,1)N (0,1) , YY 的分布律为 P(Y=0)=P(Y=1)=12P (Y = 0) = P (Y = 1) = \frac{1}{2} , 求随机变量 Z=XYZ = XY 的分布函数.

  4. XXYY 是相互独立的随机变量, XN(0,σ12)X\sim N (0,\sigma_1^2) , YN(0,σ22)Y\sim N (0,\sigma_2^2) , 其中 σ1,σ2>0\sigma_1,\sigma_2 > 0 为常数. 引入随机变量

    Z={1,XY,0,X>Y. Z = \left\{ \begin{array}{ll}1, & X\leqslant Y,\\ 0, & X > Y. \end{array} \right.

    ZZ 的分布律.

  5. 设二维随机变量 (X,Y)(X, Y) 的密度函数为

    f(x,y)={c(Rx2+y2),x2+y2<R2,0,x2+y2R2. f(x,y) = \left\{ \begin{array}{cl}c(R - \sqrt{x^2 + y^2}), & x^2 +y^2 < R^2,\\ 0, & x^2 +y^2\geqslant R^2. \end{array} \right.

    (1) 求 cˉ\bar{c} 的值;

(2) 求 (X,Y)(X, Y) 落在圆 {(x,y):x2+y2r2}(r<R)\{(x, y):x^{2} + y^{2}\leqslant r^{2}\} (r< R) 内的概率.

  1. (X,Y)(X, Y) 是二维随机变量, XX 的边缘密度函数为 fX(x)={3x2,0<x<1,0,其他, f_{X}(x) = \left\{ \begin{array}{ll}3x^{2}, & 0< x< 1, \\ 0, & \text{其他}, \end{array} \right. 在给定 X=x(0<x<1)X = x (0< x< 1) 的条件下, YY 的条件密度函数为 fYX(yx)={3y2x3,0<y<x,0,其他. f_{Y|X}(y|x) = \left\{ \begin{array}{ll} \frac{3y^{2}}{x^{3}}, & 0< y< x, \\ 0, & \text{其他}. \end{array} \right. (1) 求 (X,Y)(X, Y) 的联合密度函数 f(x,y)f (x, y)

(2) 求 YY 的边缘密度函数 fY(y)f_{Y}(y)

  1. 设随机变量 XX 的密度函数为 fX(x)=xexI(0,)(x)f_{X}(x) = x\mathrm{e}^{-x}I_{(0,\infty)}(x) , 而随机变量 YY 服从 (0,X)(0, X) 上的均匀分布, 求

(1) (X,Y)(X, Y) 的联合分布函数;

(2) 随机变量 YY 的分布函数.

  1. 设在 X=xX = x 的条件下, YY 服从参数为 xx 的泊松分布, 已知 XX 服从参数为 1 的指数分布, 求 YY 的分布律.

  2. (X,Y)(X, Y) 是矩形 {(x,y):0x2,0y2}\{(x, y): 0\leqslant x\leqslant 2,0\leqslant y\leqslant 2\} 上的均匀分布, 求随机变量 Z=XYZ = |X - Y| 的密度函数.

  3. (X,Y)(X, Y) 在区域 GG 上服从均匀分布, GGxy=0,x+y=2x - y = 0, x + y = 2y=0y = 0 围成. 试求

(1) 边缘密度函数 fX(x)f_{X}(x)

(2) 条件密度函数 fXY(xy)f_{X|Y}(x|y)

  1. 设随机向量 (X,Y)(X, Y) 服从区域 DD 内的均匀分布, 其中 DD 是由直线 y=x,x=0,y=1y = x, x = 0, y = 1 所围成的区域, 试求

(1) (X,Y)(X, Y) 的联合密度函数 f(x,y)f (x, y)

(2) (X,Y)(X, Y) 的边缘密度函数 f1(x)f_{1}(x)f2(y)f_{2}(y)

(3) 条件密度函数 fXY(xy)f_{X|Y}(x|y)

(4) P(X0.5Y=y)P (X\leqslant 0.5|Y = y)

  1. (X,Y)(X, Y) 服从矩形 {(x,y):0x2,0y1}\{(x, y): 0\leqslant x\leqslant 2,0\leqslant y\leqslant 1\} 内的均匀分布, 记

    U={0,XY,1,X>Y,V={0,X2Y,1,X>2Y, U=\left\{\begin{array}{l l}{0,}&{X\leqslant Y,}\\ {1,}&{X>Y,}\end{array}\right.\qquad V=\left\{\begin{array}{l l}{0,}&{X\leqslant2Y,}\\ {1,}&{X>2Y,}\end{array}\right.

    (U,V)(U, V) 的联合分布函数.

  2. 从一副扑克牌 (共 52 张) 中任取 13 张, 以 XXYY 分别记其中的黑桃和红桃张数. 试求:

(1) (X,Y)(X, Y) 的联合概率质量函数;

(2) 已知取出的只有一张黑桃, 求此时 YY 的条件概率分布.

  1. 假设有 nn (n3)(n\geqslant 3) 个不同的盒子与 mm 个相同的小球,每个小球独立地以概率 pkp_k 落入第 kk 个盒子 (k=1,2,,n)(k = 1,2,\dots ,n) .分别以 X1,X2,,XnX_{1}, X_{2},\dots ,X_{n} 表示落入各个盒子的球数. 试求

(1) (X1,X2,,Xn)(X_{1}, X_{2},\dots ,X_{n}) 的联合分布函数;(2) XkX_{k} 的边缘分布函数,其中 k=1,2,,nk = 1,2,\dots ,n

(3) (X1,X2)(X_{1}, X_{2}) 的边缘分布函数;(4) 在 X1=m1X_{1} = m_{1} 的条件下, (X2,X3,,Xn)(X_{2}, X_{3},\dots ,X_{n}) 的条件分布函数.

  1. 设随机变量 XXYY 相互独立, XX 的概率分布为 P(X=i)=13,i=1,0,1, P(X = i) = \frac{1}{3},\quad i = -1,0,1, YY 的密度函数为 fY(y)={1,0y1,0,其他,f_{Y}(y) = \left\{ \begin{array}{ll}1, & 0\leqslant y\leqslant 1,\\ 0, & \text{其他}, \end{array} \right.Z=X+Y.Z = X + Y.

(1) 求 P(Z12X=0)P\left (Z\leqslant \frac{1}{2} |X = 0\right)

(2) 求 ZZ 的密度函数.

29, 34, 35, 40, 43

  1. 设随机变量 XXYY 相互独立, XX 服从参数为 1 的指数分布, YY 服从标准正态分布,求 (X,Y)(X,|Y|) 的联合密度函数.

  2. 设某班车起点站上客人数 XX 服从参数为 λ(λ>0)\lambda (\lambda >0) 的泊松分布,每位乘客在中途下车的概率为 pp (0<p<1)(0< p< 1) ,且中途下车与否相互独立,以 YY 表示中途下车的人数,求

(1) 在发车时,有 nn 个乘客的条件下,中途有 mm 个人下车的概率;(2) 二维随机变量 (X,Y)(X, Y) 的概率分布.

  1. XN(μ,σ2)X\sim N (\mu ,\sigma^2) YB(1,p)Y\sim B (1, p) ,且随机变量 X,YX, Y 相互独立. 求 XYXY 的分布.

  2. X,YX, Y 是两个相互独立的随机变量, XX(0,1)(0,1) 上服从均匀分布, YY 的密度函数为

    fY(y)={12ey/2,y>0,0,y0. f_{Y}(y) = \left\{ \begin{array}{ll}\frac{1}{2}\mathrm{e}^{-y / 2}, & y > 0,\\ \displaystyle 0, & y\leqslant 0. \end{array} \right.

    (1) 求 (X,Y)(X, Y) 的联合密度函数;(2) 求二次方程 a2+2Xa+Y=0a^2 +2Xa + Y = 0 有实根的概率.

  3. (X,Y,Z)(X, Y, Z) 服从单位球 {(x,y,z):x2+y2+z21}\{(x, y, z):x^{2} + y^{2} + z^{2}\leqslant 1\} 内的均匀分布,试求 XX 的边缘分布.

  4. 设随机变量 X,YX, Y 的分布律分别为

X01
P1/21/2
Y-101
P1/41/21/4

P(XY=0)=1P (XY = 0) = 1

(1) 求 (X,Y)(X, Y) 的联合分布;(2) 问 X,YX, Y 是否独立.

  1. 连续地掷一颗均匀的骰子,直到出现点数大于 2 为止,以 XX 表示掷骰子的次数,以 YY 表示最后一次掷出的点数.

(1) 求二维随机变量 (X,Y)(X, Y) 的联合分布以及 X,YX, Y 的边缘分布;(2) 问 XXYY 是否相互独立.

  1. XXYY 为独立的离散型随机变量,且在 {0,1,,K1}\{0,1,\dots ,K - 1\} 上均匀分布,考虑

    ZnX+nY(modK), Z_{n}\equiv X + nY(\mathrm{mod} K),

    研究 ZnZ_{n} 的独立性和两两独立性

  2. (X,Y)(X, Y) 的联合密度函数为

    f(x,y)={Ae(3x+4y),x>0,y>0,0,H\H. f(x,y) = \left\{ \begin{array}{c c}{A\mathrm{e}^{-(3x + 4y)},} & {x > 0,y > 0,}\\ {0,} & {\mathbb{H}\backslash \mathbb{H}.} \end{array} \right.

    (1) 求系数 AA

(2) XXYY 是否独立;(3) 求 Z=X+YZ = X + Y 的密度函数 fZ(z)f_{Z}(z)

(4) 试求 P(X>0.5X+Y=1)P (X > 0.5|X + Y = 1)

  1. 设随机向量 (X,Y)(X, Y) 服从 {(x,y):x+y1,xy1}\{(x, y):|x + y|\leqslant 1,|x - y|\leqslant 1\} 内的均匀分布,

(1) 试求出 XXYY 的边缘分布;(2) XXYY 是否相互独立?(3) 求在 X=xX = x (0<x<1)(0< x< 1) 时, YY 的条件密度函数.

  1. (X,Y)(X, Y) 的联合密度函数为

    f(x,y)={0.25(1+xy),x<1,y<1,0,H\H. f(x,y) = \left\{ \begin{array}{c c}{0.25(1 + x y),} & {|x|< 1, |y|< 1,}\\ {0,} & {\mathbb{H}\backslash \mathbb{H}.} \end{array} \right.

    (1) 求给定 X=12X = \frac{1}{2} 时, YY 的条件密度函数;(2) 证明 X2X^{2}Y2Y^{2} 相互独立.

  2. 设随机变量 X,YX, Y 的分布律分别为

X01
P1/32/3
Y-101
P1/31/31/3

P(X2=Y2)=1P (X^{2} = Y^{2}) = 1 .求

(1) (X,Y)(X, Y) 的联合分布;(2) Z=XYZ = X Y 的概率分布.

  1. (X,Y)(X, Y) 服从正方形 {(x,y):x+y1}\{(x, y):|x| + |y|\leqslant 1\} 内的均匀分布,

(1) 求 XXYY 的边缘分布;(2) 问 X,YX, Y 是否相互独立?

  1. 设随机向量 (X,Y)(X, Y) 的密度函数为

    f(x,y)={3x,0<x<1,0<y<z,0,其他. f(x,y) = \left\{ \begin{array}{ll}3x, & 0< x< 1,0< y< z,\\ 0, & \text{其他}. \end{array} \right.

    (1) 求 XXYY 的边缘密度函数;(2) 问 XXYY 是否相互独立?(3) 计算 P(X+Y1)P (X + Y\leqslant 1)

  2. (X,Y)(X, Y) 的联合分布函数为

    F(x,y)={[1(x+1)ex]y1+y,x>0,y>0,0,其他. F(x,y) = \left\{ \begin{array}{ll}\frac{[1 - (x + 1)\mathrm{e}^{-x}]y}{1 + y}, & x > 0,y > 0,\\ 0, & \text{其他}. \end{array} \right.

    (1) 求 X,YX, Y 的边缘分布函数 FX(x)F_{X}(x)FY(y)F_{Y}(y)

(2) 求 (X,Y)(X, Y) 的联合密度函数 f(x,y)f (x, y) 以及边缘密度函数 fX(x),fY(y)f_{X}(x), f_{Y}(y)

(3) 验证 X,YX, Y 是否相互独立.

  1. 设随机向量 (X,Y,Z)(X, Y, Z) 的联合密度函数为

    f(x,y,z)={(8π3)1(1sinxsinysinz),0x,y,z2π,0,其他. f(x,y,z) = \left\{ \begin{array}{ll}(8\pi^{3})^{-1}(1 - \sin x\sin y\sin z), & 0\leqslant x,y,z\leqslant 2\pi ,\\ 0, & \text{其他}. \end{array} \right.

    证明: X,Y,ZX, Y, Z 两两独立但不相互独立

  2. 设随机向量 (X,Y)(X, Y) 的密度函数为

    f(x,y)={1+xy4,x<1,y<1,0,其他. f(x,y) = \left\{ \begin{array}{ll}\frac{1 + xy}{4}, & |x|< 1,|y|< 1,\\ 0, & \text{其他}. \end{array} \right.

    证明: X,YX, Y 不独立但是 X2,Y2X^{2}, Y^{2} 是相互独立的

  3. 设连续型随机变量 Xf(x),YX\sim f (x), Y 为取有限值的离散型随机变量,且 X,YX, Y 相互独立.

(1) 求 Z=X+YZ = X + Y 的分布. 由此回答随机变量 ZZ 是否为连续型的?(2) 求 W=XYW = XY 的分布,问 WW 是不是连续型随机变量?以 XN(μ,σ2),YB(1,p)X\sim N (\mu ,\sigma^2), Y\sim B (1, p) 为例求出 WW 具体的分布.

  1. 在长度为 1 的线段上任取两点,把线段分为 3 段,求这 3 条线段能组成三角形的概率.

    • 设随机变量 XX 的密度函数为 f(x)f (x) , 令 Y={a,X<a,X,aX<b,b,Xb. Y = \left\{ \begin{array}{ll}a, & X < a, \\ X, & a \leqslant X < b, \\ b, & X \geqslant b. \end{array} \right. (1) 求随机变量 YY 的分布函数;

(2) 随机变量 YY 的分布有什么特点?

    • (X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y) \sim N (\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho) , 证明: 存在常数 bb , 使 X+bY,XbYX + bY, X - bY 相互独立.
    • (X,Y)N(0,0,1,1,ρ)(X, Y) \sim N (0,0,1,1,\rho) , 证明

(1) 随机变量 XX 与随机变量 Z=YρX1ρ2Z = \frac{Y - \rho X}{\sqrt{1 - \rho^2}} 相互独立;

(2) 利用 (1) 的结论证明

P(XY<0)=12P(X>0,Y>0)=π1arccosρ.(3.28) P(XY< 0) = 1 - 2P(X > 0,Y > 0) = \pi^{-1}\arccos \rho . \tag{3.28}

49. * (多项分布) 设 A1,A2,,AnA_{1}, A_{2},\dots ,A_{n} 是样本空间上的一个完备事件群, 即 AiAj=ϕ,ijA_{i}A_{j} = \phi ,i\neq j , 其和为必然事件, 记 P(Ai)=pi>0,i=1,2,,nP (A_{i}) = p_{i} > 0, i = 1,2,\dots ,n , 则 p1+p2++pn=1p_1 + p_2 + \dots +p_n = 1 . 由上面知, 在一次试验中, 事件 A1,A2,,AnA_{1}, A_{2},\dots ,A_{n} 必然发生一个且仅发生一个. 现在把该试验独立重复 NN 次, 以 XiX_{i} 记事件 AiA_{i} 出现的次数, i=1,2,,ni = 1,2,\dots ,n , 则称 (X1,X2,,Xn)(X_{1}, X_{2},\dots ,X_{n}) 服从多项分布, 记为

(X1,X2,,Xn)M(N,p1,p2,,pn), (X_{1},X_{2},\dots ,X_{n})\sim M(N,p_{1},p_{2},\dots ,p_{n}),

其中 X1+X2++Xn=NX_{1} + X_{2} + \dots +X_{n} = N , 证明:

(1) (Xi,Xj,Z)(X_{i}, X_{j}, Z) 在给定 Xl=NlX_{l} = N_{l} 的条件下服从三项分布 M(NNl,pi1pl,pj1pl,1pi+pj1pl)M\Big (N - N_{l},\frac{p_{i}}{1 - p_{l}},\frac{p_{j}}{1 - p_{l}}, 1 - \frac{p_{i} + p_{j}}{1 - p_{l}}\Big) , 其中 1ijln1\leqslant i\neq j\neq l\leqslant n , Z=NNlXiXjZ = N - N_{l} - X_{i} - X_{j} ;

(2) 设 1j<n1\leqslant j< n , 则

(X1+X2++Xj)B(N,p1+p2++pj). (X_{1} + X_{2} + \dots +X_{j})\sim B(N,p_{1} + p_{2} + \dots +p_{j}).
© 话人间的笔记小屋 | 湘ICP备2025128660号-1