1.13 标准正态分布
从前面介绍我们知道,直截了当对p(x)计算某一区间内的面积相当麻烦。如果我们能将一般的正态分布X~N(μ, σ2)转化为标准的正态分布X~N(0,1),那么计算函数p(x)在某一区间内的概率就变得简单易行了,因为数理统计专家已经计算出了标准正态分布函数表[4]。
那么一般的正态分布X~N(μ, σ2)如何转变为标准正态分布呢?这就需要对随机变量X进行标准化。一般地,把随机变量X减去其均值,再除以其标准差,就可以把一般正态分布转换为标准正态分布,这一变换过程称为随机变量的标准化。
设随机变量X~N(μ, σ2),将随机变量X减去其均值,再除以其标准差,则随机变量也服从正态分布。因为根据数学期望和方差的性质,容易推得
这就是说,我们通过对一般正态分布的随机变量进行标准化,可以得到均值为0、标准差为1的正态分布,即随机变量U~N(0,1),正态分布N(0,1)称为标准正态分布,X为一般正态分布的随机变量,而称为标准正态分布的随机变量。
由于标准正态分布随机变量的特殊重要性,通常把标准正态分布随机变量的概率密度函数记作φ(x),则
其实,在一般正态分布X~N(μ, σ2)中,令μ=0且σ=1时,可立即得到标准正态分布。而所谓的标准化过程就是对函数p(x)积分时积分变量的变换过程,参见第1.11节。
一般正态分布比较广泛地存在于自然界和社会实践中,而标准正态分布N(0,1)是一种特殊的正态分布,实际上很少存在这样一个质量特性(随机变量)的均值为0,方差为1的情况,而现实生活中大量存在的是一般正态分布。理论和实践表明,一般正态分布总可以通过标准化转变为标准的正态分布,所以,研究和应用N(0,1)分布的性质显得极为重要。我国著名质量专家张公绪教授正是利用对随机变量的标准化,发明了通用控制图(已发布为国家标准[5])。
通过对标准正态分布概率密度函数φ(x)求积分,可计算出区间[ -∞, u]内的概率,即是标准正态分布的函数值,而Φ(u)则是对φ(x)从-∞到u的积分,是面积,其几何意义是φ(x)曲线在区间[ -∞, u]的面积,见图1-4。
图1-4 Φ(u)与φ(u)的区别
由于一般正态分布通过标准化可转变为标准的正态分布,所以一般正态分布曲线分布的概率计算变得简便易行。国家标准GB4086.1—83《统计分布数值表正态分布》中的正态分布函数表是针对标准正态分布N(0,1),并利用公式计算得到的。有了附表1,人们根据Φ(u)的数值表,可以查得事件“U≤u”发生的概率。例如,P(U≤1.99)=Φ(1.99)=0.9767。当然也可以反查,如Φ(u)=0.9904,查得u =2.34。
为加深理解,将一般正态分布和标准正态分布的性质特点列表1-6如下。
表1-6 一般正态分布与标准正态分布的区别