蓝光手游大师。:第二章第二节

来源:百度文库 编辑:九乡新闻网 时间:2024/04/28 23:09:43
第二节 分布函数与连续型随机变量
§2  分布函数与连续型随机变量
一、分布函数
二、连续型随机变量及密度函数
三、常见的连续型随机变量
一、分布函数
1.定义
离散型随机变量是用分布列来表示其概率分布。 但对其它随机变量来说,分布列不存在,例如随机变量可取的值为一连续区间的一切值时,就无法一一罗列这些值及其概率。为此要引入概率分布的新的表示法,我们希望它对一切随机变量都适用。
在第一节中,我们曾把概率分布定义为一切概率,其中是R上的任一波雷尔集。现在取,它是波雷尔集,从而事件={}有概率。如果我们对一切实数都定义了上面的概率,那么对于任意实数,事件{}的概率可立即求出:
P{}=。      (1)
进一步, 由于任意波雷尔集B是左开右闭区间的(有限或可列)并、(有限或可列)交、逆产生的集合,所以由(1)可以算出, 因此, 对任意实数,可以代表的概率分布。
定义1  称
,         -∞<<+∞         (2)
为随机变量的分布函数 (distribution function)。
对确定的随机变量,其分布函数是唯一确定的,它是实变量的函数,因此我们可以利用实变函数论这一有力工具来研究随机变量。
有了分布函数,则对任一波雷尔集,概率可以用分布函数来表示。事实上,由(1)式,
              (3)
再利用概率的运算,就可得到其它事件的概率。 例如






例1  设随机变量ξ服从伯努里分布:,写出它的分布函数,并计算
解  当<0时,=0, (不可能事件);
当0≤<1时,=
≥1时,

因此分布函数


= F(0.5-0)-F(-1) =
例2  在△ABC内任取一点P,P到BC的距离为,求的分布函数。
解  设BC边上的高为。当< 0时,显然 P() = 0;  当0≤<时,在
            A
△ABC内作平行BC的线段DE,使与BC的距离为x,则{}表示点P落在梯形DBCE内。由几何概率,
D
E
P
h
ξ
==1-(1-/)
B
C
时, {} 表示点P在△ABC内任意取,故P()=1;
综上所述,分布函数为
 。
2.性质
分布函数是事件{}的概率,自然有0≤≤1,除此以外,分布函数还有下面三个基本性质:
(1) 单调不减性:若,则
(2)=0,=1; ①
(3) 右连续性:=。②
证 (1)≥0。
(2) 由于F(x) 单调有界,存在极限
F(-∞) =F(-)。
但{-}{-(+1)}且=,故由概率的连续性定理(§3)
F(-)=P{-}=P()=0。
又{}{(+1)}及=Ω, 故
F()=P{}=P(Ω)=1。
(3) 由F()的单调性,只需证F(+1/) = F()。因
{ξ≤+1/ (-1)}{ξ≤+1/}

={ξ≤}

F(+1/) =P{ξ≤+1/}
= P{ξ≤} = F()。
分布函数有上述三性质,反之可证,有上述三性质的函数必可作为某随机变量的分布函数。
例3  设随机变量的分布函数如下,试确定常数a,b。

解 应满足上面三个性质。F(-∞)=0与 F(+∞) =1已成立;又在各段内是不减的 (如果>0),故只要0≤≤1, 就整体单调了;剩下的只需讨论右连续性,这只要考察=-1与=1两点,应满足F(-1+0)=F(-1)和F(1+0)=F(1),即
-π/ 2 = 0,     1=+π/2 ,
解之得=1/2, =1/π。
3.离散型随机变量的分布函数
分布函数作为随机变量概率分布的一种表达方式,对一切随机变量(包括离散型)都适用。在例1中已经写出伯努里分布的分布函数,这是分段函数,在=0和=1处各有一跳跃。
一般说来,设的分布列为,且<<…<<…, 则的分布函数为


它是间断的分段函数,在=1,2, …各有一跳跃,跃度为,在每一段 [)中都是常数,呈阶梯形。
二、连续型随机变量及密度函数
定义2  若随机变量可取某个区间 (有限或无限)中的一切值, 并且存在某个非负的可积函数,使分布函数满足
,                      (4)
则称为连续型(continuous)随机变量,称的概率密度函数,简称为密度函数(density function),具有上述性质的函数称为是绝对连续的。
由连续型随机变量的定义,使它的分布函数具有下列良好的数学性质。
(1) 在实变函数论中可以证明,若绝对连续,则必定处处连续;并且在的连续点,可导,且
。                         (5)
(2) (4)式表示的与密度函数的关系使得对一连续型随机变量,只要给出密度函数,就可以直接算得落在任意区间的概率:

=
=。                                (6)
由此对R上的一切波雷尔集都可通过来计算概率。
(3) 特别,对任一常数

== 0,                         (7)
因此对连续型随机变量,计算在一点的概率是没有意义的,这也是不能用分布列描写连续型随机变量的理由之一。 但是一个可能发生的事件,这又说明对连续型随机变量,一事件A的概率为0并不表明A =φ;同样若P(A) =1,也并不表明A =Ω。 这些都是与离散型随机变量的根本区别。
密度函数具有下列性质:
(1) 非负性:≥0;                                    (8)
(2)=1。                                          (9)
后者由F(+∞)=1得到。反之,对于定义在 (-∞,+∞)上的可积函数, 若它满足(8)和(9)式,则它就可作为某一随机变量的密度函数。
例4  例3中的是否可作为连续型随机变量的分布函数?
解  除=-1,1两点以外,处处可导,记其导数为
当-1<<1时,=;   其它情况=0;
满足(8) (9)两式,故为密度函数,表示连续型分布函数。
应该指出,除了离散型,连续型以外,随机变量还有其它类型,例如

是分布函数,它不是离散型的,也不是连续型的 ( 因为它不连续 ),它是=0处退化分布和[0,1]上均匀分布(见下一段) 的混合:
=(+)/2。
甚至还存在这样的分布,它是一个连续函数,却不是绝对连续的。不过常见的是离散型和连续型。 以后如果对一般的随机变量进行讨论,就用分布函数;如果对离散型情形,主要就用分布列;如果对连续型,则主要用密度函数,不另提其它类型了。
三、常见的连续型随机变量
1.均匀(Uniform)分布
,称随机变量服从上的均匀分布,如果它的密度函数为
。                (10)
简记作。 当<时, 显然()=0;当<时,
 =

时,
==1;
因此其分布函数为

上的均匀分布相当于样本空间为的几何概率。 在区间上投点,其落点位置就服从这个分布。又如考察一个数据,它在小数点n位后四舍五入,则其真值x与其近似值之间的误差一般假定服从[-0.5, 0.5]上的均匀分布。就可对经过大量运算后的数据进行误差分析。它在使用计算机解题时是很重要的,因为计算机的字长总是有限的。
2.正态分布
若随机变量的密度函数为
,                 (11)
就称服从正态(Normal)分布,记作。 其中>0。我们来证明(11)定义的确是密度函数。 显然>0,又

=
上述二重积分可用极坐标表示成

也即

正态分布是概率论中最重要的一种分布,与二项分布、泊松分布并称为三大分布,它在实际应用与理论上都有很大作用。 一方面,正态分布应用很广,一般说来,若影响某一数量指标的随机因素很多,而每一因素所起的作用又不很大,则这个数量指标服从正态分布。例如进行测量时,由于仪器精度、人的视力、心理因素、外界干扰等多种因素影响,测量结果大致服从正态分布,其中为真值;测量误差也服从正态分布。事实上,正态分布是19世纪初高斯(Gauss)在研究测量误差时首次引进的,故正态分布又称误差分布或高斯分布;另外,生物的生理尺寸如成人的身高、体重,某地区一类树木的胸径,炮弹落地点,某类产品的某个尺寸等等都近似服从正态分布。另一方面,正态分布具有良好的性质,一定条件下,很多分布可用正态分布来近似表达,另一些分布又可以通过正态分布来导出,因此,正态分布在理论研究中也相当重要。 我们先来观察它的密度函数的图形。
如果点关于直线对称,即,则, 因此关于直线对称。
时,单调递减;当时,单调递增;时,→0。时,有最大值,因此越大,最高点越低;但因为曲线与轴包围的面积等于常数=1,因此越大,p (x) 的图形越扁平,取值离开点远的概率也越大;越小,则的图形越陡峭,取值越集中在点附近。
=0,=1时,称为标准正态分布(standardized normal distribution),它的密度曲线关于纵轴对称,其密度及分布函数特别记为
,   -∞<<+∞。         (12)
利用(11)式计算正态分布的概率是不容易的。人们已经制作了专门的表格以供查阅,一般情况只需标准正态分布Φ()的数值表(见附录III)就够了。 下面介绍该表的使用方法。
1) 若~N(0,1)。
0时, 每隔一定数值 (附录中是间隔0。1) 可以查到对应的分布函数Φ()的值;在这些数值之间,可以用线性插值法求得相应的函数值。
< 0时,注意到标准正态密度函数()关于直线= 0对称,故令=-,则
==1-,
也即
Φ(-)=1-Φ(y)。              (13)
结合>0时的Φ() 表就可算出<0时Φ()的值。
2) 对一般的,记(称为的标准化随机变量),则它服从N(0,1)。 事实上的分布函数

==Φ(x)。
例5    设~N(0,1)。
(1) 计算P(-1<<3);
(2) 已知P(<λ) = 0.9755, 求λ。
解 (1)P(-1<<3)=Φ(3)-Φ(-1)=Φ(3)+Φ(1)-1= 0.9987+0.8413-1= 0.8400。
(2) Φ(λ) = 0.9755, 它在Φ(1.96) = 0.9750与Φ(1.98) = 0.9762之间, 由于Φ()是单调不减的,故λ在1.96与1.98之间, 由线性插值公式
λ1.96+·(1.98-1.96)≈1.968。
例6  设ξ~N (2,9), 求P (5 <ξ<20)。
解  令η= (ξ-2)/3,则η~N (0,1),从而
P(5<ξ<20)= P(<<)
= P(1<η<6)=Φ(6)-Φ(1)
≈1-0.8413=0.1587    。
例7  设, 求,以及
解 ~N (0,1), 故
≈0.6827,
同理,
≈0.9545,
≈0.9973。
说明正态随机变量的99.73 %的值落在之中, 落在该区间之外的概率几乎为零,这情况被实际工作者称为“原则”。
例8    从南郊某地乘车到北区火车站有两条路可走,第一条路较短,但交通拥挤,所需时间τ服从N (50, 100) 分布;第二条路线略长,但意外阻塞较少,所需时间ξ服从N (60,16)。
(1) 若有70分钟可用,问应走哪一条路?
(2) 若只有65分钟可用,又应走哪一条路?
解  应该走在允许时间内有较大概率赶到火车站的路线。
(1) 走第一条路线能及时赶到的概率为
P(τ≤70)=Φ()=Φ(2)=0.9772;
而走第二条路线能及时赶到的概率为
P(ξ≤70)=Φ()=Φ(2.5)=0.9938,
因此在这种场合,应走第二条路线。
(2) 走第一条路线能及时赶到的概率为
P(τ≤65)=Φ(1.5)=0.9332,
而走第二条路线能及时赶到的概率为
P(ξ≤65)=Φ(1.25)=0.8944。
此时以走第一条路线更为保险。
3.指数分布
密度函数为
     (λ>0)                (14)
的分布称为指数(Exponential)分布。 容易验证(14)式满足密度函数的两个条件。  现在求它的分布函数。
<0时,P(ξ≤) ==0;  当≥0时, P(ξ≤) ==1--e
即其分布函数为

指数分布具有类似几何分布的“无记忆性”。 事实上,设随机变量ξ服从参数为λ的指数分布,则对于任意的s >0, t > 0,

=/=
还可以证明,指数分布是具有上述性质的唯一的连续型分布。 (证明略)。
4.Γ-分布
它的密度函数为
    (> 0,> 0)        (15)
其中Γ() 是第一型欧拉积分。参数为,的Γ-分布简记为Γ(,),当为整数时也称爱尔兰(Erlang)分布,= 1时即为指数分布。