2 随机变量及其分布

2 随机变量及其分布

一些定义

概率密度函数

+f(x)dx=1 \int_{-\infty}^{+\infty}f(x)dx=1

f(x)dxf(x)dx 表示概率

累积分布函数

F(x)=xf(u)du,<x<+ F(x)=\int_{-\infty}^xf(u)du,\quad-\infty<x<+\infty

表示 X 的值≤x 的概率,且

f(x)=F(x) f(x)=F'(x)

适用于任何随机变量的定义

F(x)=P(Xx)<x<+ F(x)=P(X\leq x)\quad-\infty<x<+\infty

各种分布

Bernoulli 试验,0-1 分布

设一个随机试验只有两个可能结果 A,AˉA,\bar{A} ,则称此试验为 Bernoulli 试验.

P(X=1)=p,P(X=0)=1p P(X=1)=p\text{,}P(X=0)=1-p

1 二项分布

又称 n 重伯努利试验

A 发生的次数为 X, 共试验 n 次

XB(n,p) X\sim B(n,p) P(X=k)=(nk)pk(1p)nk,k=0,1,,n. P(X=k)={n\choose k}p^k(1-p)^{n-k},\quad k=0,1,\cdots,n. EX=np EX=np VarX=np(1p) VarX=np(1-p)

分布函数,以 XB(1,12)X\sim B(1,\frac{1}{2}) 为例,(0,1)内都可以是中位数

F(x)={0,x012,0<x<11,x1 F(x)=\begin{cases}&0,&x\leq0\\&\frac{1}{2},&0<x<1\\&1,&x\geq1\end{cases}

2 Poisson 分布

概率论与数理统计

大概是在均匀分布的样本空间中发现 X 个样本的概率

XP(λ) X\sim P(\lambda) P(X=k)=λkk!eλ,k=0,1,2,,λ>0, P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\cdots,\:\lambda>0, EX=VarX=λ EX=VarX=\lambda

Poisson 极限定理

n 重 Bernoulli 试验,用 pnp_n 代表 A 在试验中出现的概率,与实验总数 n 有关。如果 npnnp_nλ\lambda, 则当 nn \rightarrow \infty

(nk)pnk(1pn)nkλkk!eλ \binom nkp_n^k(1-p_n)^{n-k}\to\dfrac{\lambda^k}{k!}e^{-\lambda}

3 均匀分布

XU(a,b)X\sim U(a,b)XX 服从区间 (a,b)(a,b) 上的均匀分布

f(x)=1baI(a,b)(x) f(x)=\frac{1}{b-a}I_{(a,b)}(x) F(x)={0,xa,xaba,a<x<b,1,xb. \left.F(x)=\left\{\begin{array}{cc}0,&x\leqslant a,\\[1ex]\dfrac{x-a}{b-a},&a<x<b,\\[1ex]1,&x\geqslant b.\end{array}\right.\right. EX=a+b2VarX=(ba)212 \begin{aligned}EX&=\frac{a + b}{2} \\VarX&=\frac{(b - a)^2}{12} \end{aligned}

4 指数分布

XExp(λ)X\sim Exp(\lambda), X 服从参数为 λ\lambda 的指数分布

λ>0\lambda>0 为常数,λ\lambda 越大,密度函数下降得越快 1

f(x)={λeλxx>0,0x0, f(x)=\left\{\begin{array}{cc}\lambda e^{-\lambda x}&x>0,\\0&x\leq0,\end{array}\right. F(x)={1eλxx>0,0x0. F(x)=\left\{\begin{array}{cc}1-e^{-\lambda x}&x>0,\\0&x\leq0.\end{array}\right. EX=1λVarX=1λ2 \begin{aligned} EX = \frac{1}{\lambda} \\ VarX = \frac{1}{\lambda^2} \end{aligned}

无记忆性

P(X>s+tX>t)=P(X>s) P(X>s+t|X>t)=P(X>s)

证明

注意到 {X>s+t}{X>t}\{X>s+t\}\subset\{X>t\}

P(X>s+tX>t)=P(X>s+t,X>t)P(X>t)=P(X>s+t)P(X>t)=eλ(s+t)eλt=eλs=P(X>s). \begin{aligned}P(X>s+t|X>t)&=\frac{P(X>s+t,X>t)}{P(X>t)}\\&=\frac{P(X>s+t)}{P(X>t)}=\frac{\mathrm{e}^{-\lambda(s+t)}}{\mathrm{e}^{-\lambda t}}\\&=\mathrm{e}^{-\lambda s}=P(X>s).\end{aligned}

5 正态分布

XN(μ,σ2) X\sim N(\mu,\sigma ^2)

参数为 μ\muσ2\sigma ^2 的正态分布

f(x)=12πσexp{(xμ)22σ2},<x<+ f(x)=\frac1{\sqrt{2\pi}\sigma}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\},\quad-\infty<x<+\infty f(x)=12πσe(xμ)22σ2 f(x)=\frac1{\sqrt{2\pi}\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma^2}}

标准正态分布: μ=0\mu =0, σ=1\sigma = 1, Φ(x)\Phi(x)ϕ(x)\phi(x) 表示标准正态分布 N (0,1) 的分布函数和密度函数

位置参数 μ\mu:对称轴的位置

形状参数 σ\sigma:越小越陡 2

400

F(x)=Φ(xμσ) F(x)=\Phi(\frac{x-\mu}{\sigma})

这部分内容详细见 2_0 多维随机变量及其分布

多维分布(联合分布)

多维随机变量或者随机向量,其中变量之间可能相关可能无关

X=(X1,,Xn)X\:=\:(X_{1},\ldots,X_{n})

按照 XiX_i 的类型可分为离散型和连续型

n 维随机变量 XX 的概率函数

p(j1,,jn)=P(X1=a1j1,,Xn=anjn),j1,...,jn=1,2,... p(j_1,\cdots,j_n)=P(X_1=a_{1j_1},\ldots,X_n=a_{nj_n}),\:j_1,...,j_n=1,2,...

其中 XiX_i 可取 {ai1,ai2,},i=1,,n\{a_{i1},a_{i2},\cdots\},\:i=1,\ldots,n,显然

j1,,jnp(j1,,jn)=1 \sum_{j_1,\cdots,j_n}p(j_1,\ldots,j_n)=1

边缘分布

n 维随机变量中抽出任意 m 维组成变量的分布,为原来联合分布的边缘分布

以二维分布为例,其分布函数为:

f(x,y) f(x,y)

边缘分布

fX(u)=+f(u,v)dv. f_X(u)=\int_{-\infty}^{+\infty}f(u,v)dv. fY(u)=+f(u,v)du. f_Y(u)=\int_{-\infty}^{+\infty}f(u,v)du.

条件分布

给定条件下某个变量的分布,比如给定二维分布固定其中一维得到的分布

* 条件分布和边缘分布的区分

行和或列和是边缘分布

单独的行或列是条件分布



  1. 常用于无老化“寿命”的分布,即某种东西同样时间内死掉的概率是相同的,满足无记忆性 ↩︎

  2. 同样 x 的变化,参数作为分母越小,变化的量越大,所以越陡峭 ↩︎

© 话人间的笔记小屋 | 湘ICP备2025128660号-1