Chapter 5 大数定律及中心极限定理
5.1 大数定律
定义5.1 设Y1,
Y2,
…,Yn,
… 为一个随机变量序列,c为一常数,若对于 ∀ε>0 ,均有:
x→∞limP{∣Yn−c∣≥ε}=0
成立,则称随机变量序列{Yn,n≥1}依概率收敛于c,记为Yn⟶Pc, 当 n→∞ .
定理 (Chebyshev不等式) 设随机变量具有数学期望E(X)=μ, 方差D(X)=σ2,则对于任意ε>0, 都有:
P{∣X−μ∣≥ε}≤ε2σ2
定理的等价形式:
P{∣X−μ∣<ε}≥1−ε2σ2
适用范围:对于期望、存在的随机变量(范围广,但结果比较粗糙)
定理1 (Bernoulli大数定律) 设nA为n重Bernoulli试验中事件A发生的次数,p(0<p<1)为事件A在每次试验中发生的概率,则对于$ \varepsilon
> 0$,有
n→+∞limP(∣∣∣nnA−p∣∣∣⩾ε)=0
即事件A发生的频率nnA依概率收敛到A发生的概率p。
定理2 (切比雪夫大数定律的推论) X1,X2,…,Xn,…为相互独立的随机变量,且具有相同的期望μ, 相同的方差σ2,
那么
n1i=1∑nXi⟶Pμ,(n→∞)
定理3 (辛钦大数定理) X1,X2,…,Xn,…为相互独立的随机变量,且其期望存在,记为μ, 那么
n1i=1∑nXi⟶Pμ,(n→∞)
5.2 中心极限定理
定理1(独立同分布的中心极限定理) 设随机变量X1,X2,…,Xn,…,相互独立且同分布,E(Xi)=μ, D(Xi)=σ2,i=1,2,…,则对于充分大的n,有i=1∑nXi∼近似N(nμ,nσ2).此时
P(a<i=1∑nXi≤b)≈Φ(nσb−nμ)−Φ(nσa−nμ)
定理3 (De Moivre-Laplace定理) 设nA为n重Bernoulli试验中事件A发生的次数,p(0<p<1)为事件A在每次试验中发生的概率,则对于充分大的n有
nA∼N(np,np(1−p))
即对于二项分布B(n,p),当n充分大的时候,可用正态分布来近似。
Chapter 6
样本及抽样分布
6.1 总体与样本
- 在数理统计中,我们将所研究的对象的全体称为总体,而将总体中的每个成员称为个体。
- 总体中所包含的个体的数量称为样本的容量,如果一个总体所包含的个体数量是有限的,则称之为有限总体。如果总体所包含的个体数量是无限的,则称之为无限总体。
- 样本:被抽取的部分个体
- 简单随机样本
- 随机样本(X1,X2,…,Xn)中,每个Xi与Xn是相互独立的随机变量
- 这些样本和总体X同分布
- 获得简单随机样本
- 简单随机抽样
- 对于有限个体采用放回抽样
- 对于无限总体(或很大的总体)采用不放回抽样
6.2 统计量与抽样分布
一 、统计量
定义 设(X1,X2,…,Xn)为来自总体X的一个样本,g(x1,x2,…,xn)是X1,X2,…,Xn的函数,若g中不含位置参数,则称g(X1,X2,…,Xn)是一统计量。
常用统计量:
-
样本平均值:
X=n1i=1∑nXi
-
样本方差:
S2=n−11i=1∑n(Xi−X)
-
样本标准差:
S=n−11i=1∑n(Xi−X)
-
样本k阶原点矩:
Ak=n1i=1∑nXik,k=1,2,3,…
-
样本k阶中心矩:
Bk=n1i=1∑n(Xi−X)k,k=1,2,3,…
在一次具体的观察中,统计量是具体的数值;但脱离具体的观察或试验,统计量应看作随机变量。
统计量的分布称为抽样分布
二 、正态总体的常用统计量的分布
(一)χ2分布
定义 设X1,X2,…,Xn为独立同分布的随机变量,均服从N(0,1),则称随机变量
χ2=i=1∑nXi2
为服从自由度为n的χ2分布,记为χ2∼χ2(n).
自由度:独立变量的个数
概率密度(不重要)
f(y)=⎩⎨⎧22nΓ(2n)1y2n−1e−2y0y>0其他
其中,
Γ(α)=∫0+∞xα−1e−xdxΓ(n)=(n−1)!
性质:
-
χ2分布的可加性
若χ12∼χ2(n1),χ22∼χ2(n2),并且χ12与χ22相互独立,则有
χ12+χ22∼χ2(n1+n2)
-
χ2分布的期望和方差
若χ2∼χ2(n),则有
E(χ2)=n,D(χ2)=2n
χ2分布的上分位点
对于给定的正数α, 0<α<1, 满足条件
P{χ2>χα2(n)}=∫0∞f(y)dy=α
的点χα2(n)就是χ2(n)分布的上α分位点。
(二)t 分布
定义 设 X∼N(0,1),Y∼χ2(n),且X与Y相互独立,则称随机变量
T=Y/nX
为服从自由度n的 t 分布,记为T∼t(n).
概率密度函数 :
h(t)=πnΓ(n/2)Γ[(n+1)/2](1+nt2)−(n+1)/2
当n→+∞时,
n→+∞limh(1)=2π1e−t2/2
故当n足够大时,t 分布近似于N(0,1)分布。
t 分布的上分位点 对于给定的α, 0<α<1, 满足条件
P{t>tα(n)}=∫tα∞h(t)dt=α
的点tα(n)就是t(n)分布的上α分位点。
t1−α(n)=−tα(n)
(三)F 分布
定义 设U∼χ2(n1),V∼χ2(n2),且U与V相互独立,则称随机变量
F=V/n2U/n1
服从自由度为(n1,n2)的F分布,记为F∼F(n1,n2).
概率密度函数 :
ψ(y)=⎩⎨⎧Γ(n1/2)Γ(n2/2)[1+(n1y/n2)](n1+n2)/2Γ[(n1+n2)/2](n1/n2)n1/2y(n1/2)−10y>0其他
性质:
- 若F∼F(n1,n2),则F1∼F(n2,n1).
- 若T∼t(n),则T2∼F(1,n)
F 分布的上分位点 对于给定的α, 0<α<1, 满足条件
P{F>Fα(n1,n2)}=∫Fα(n1,n2)∞ψ(y)dy=α
的点Fα(n1,n2)就是F(n1,n2)分布的上α分位点。
三
、正态总体的样本均值与样本方差的分布
定理一二三 设X1,X2,…,Xn是来自正态总体N(μ,σ2)的样本,则
- Xˉ∼N(μ,nσ2);
- σ2(n−1)S2∼χ2(n−1);
- Xˉ
和 S2相互独立;
- $\dfrac{\bar{X} - \mu}{S/\sqrt n} \sim t(n-1) $
定理四 设X1,X2,…,Xn与Y1,Y2,…,Yn分别是来自正态总体N(μ1,σ12)和N(μ2,σ22)的样本,且两样本相互独立。记Xˉ=n11i=1∑n1和Yˉ=n21i=1∑n2分别为它们的样本均值;S12=n1−11i=1∑n1(Xi−Xˉ)2,S22=n2−11i=1∑n2(Yi−Yˉ)2分别为它们的样本方差,则有
-
σ12/σ22S12/S22=F(n1−1,n2−1)
-
当σ12=σ22=σ32时,
Swn11+n21(Xˉ−Yˉ)−(μ1−μ2)∼t(n1+n2−2)
其中,
Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,Sw=Sw2
Chapter 7 参数估计
参数:反应总体某方面特征的量(比如:合格率、均值、方差、中位数…
参数估计的形式:点估计和区间估计
7.1 点估计
借助于总体X的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。
设总体的分布函数为F(x;θ),其中θ为k维向量。根据样本X1,X2,…,Xn构造一个统计量θ^(X1,X2,…,Xn)作为θ的估计,则称θ^(X1,X2,…,Xn)为θ的估计量。如果x1,x2,…,xn是一个样本观察值,带入θ^后得到的具体值θ^(x1,x2,…,xn)称为θ的估计值。
常用的点估计方法:矩估计法、极大似然估计法。
一 、矩估计法
统计思想:以样本矩估计总体矩,以样本矩的函数估计总体矩的函数。
理论依据:辛钦大数定律和依概率收敛的性质。
设θ1,θ2,…,θk为待估参数,X1,X2,…,Xn是来自X的样本。矩估计的具体步骤:
-
建立(θ1,θ2,…,θk)与(μ1,μ2,…,μk)的联系:求总体前k阶矩关于k个参数的函数
μi=E(Xi)=hi(θ1,θ2,…,θk),i=1,2,…,k.
-
求各参数关于k阶矩的反函数
θi=gi(μ1,μ2,…,μk),i=1,2,…,k
-
以样本各阶矩A1,A2,…,Ak代替总体X各阶矩μ1,μ2,…,μk,
得到各参数的矩估计
θ^i=gi(A1,A2,…,Ak),i=1,2,…,k
【注】:方差σ2的矩估计并不是(修正)样本方差S2,而是样本二阶中心距
B2=n1i=1∑n(Xi−Xˉ)2=nn−1S2
矩估计的特点:
- 直观、简便
- 适用范围广,不需要知道总体分布的具体类型
- 没有充分利用总体分布的信息,精度不高
二 、最大似然估计法
离散型总体X∼p(x;θ),θ∈Θ, θ为待估参数,Θ为参数的取值范围。X1,X2,…,Xn是来自总体X的样本,则X1,X2,…,Xn的联合分布率为
i=1∏np(xi;θ)
又设(x1,x2,…,xn)是相应于样本的一组观察值,那么样本X1,X2,…,Xn取到观察值的概率为
L(θ)=L(x1,x2,…,xn;θ)=i=1∏np(xi;θ),θ∈Θ
L(θ)称为样本的似然函数。
最大似然估计法就是固定样本的观察值x1,x2,…,xn,在θ取值的可能范围Θ内挑选使得最大似然函数L(θ)=L(x1,x2,…,xn;θ)达到最大值的参数值θ^作为参数θ的估计值,即取θ^使
L(x1,x2,…,xn;θ^)=θ∈ΘmaxL(x1,x2,…,xn;θ)
这样得到的θ^值与x1,x2,…,xn有关,常记为θ^(x1,x2,…,xn) ,称为参数θ的最大似然估计值,相应的统计量θ^(X1,X2,…,Xn) 称为参数θ的最大似然估计量。
连续型总体的概率密度f(xi;θ),θ∈Θθ为待估参数,Θ为参数的取值范围。X1,X2,…,Xn是来自总体X的样本,则X1,X2,…,Xn的概率密度函数为
i=1∏np(xi;θ)
又设x1,x2,…,xn是样本的一组观察值,那么样本(X1,X2,…,Xn)落在x1,x2,…,xn的领域内的概率近似为
i=1∏np(xi;θ)dxi
因子i=1∏ndxi与参数θ无关,
所以似然函数:
L(θ)=L(x1,x2,…,xn;θ)=i=1∏nf(xi;n)
满足下式
L(x1,x2,…,xn;θ^)=θ∈ΘmaxL(x1,x2,…,xn;θ)
的θ^(x1,x2,…,xn)称为θ的最大似然_估计值,θ^(X1,X2,…,Xn)称为最大似然估计量。
【说明】:
-
很多情形下,p(xi;θ)和f(x;θ)关于θ可微,θ可从以下方程中解得
dθdL(θ)=0
-
对数似然函数 :lnL(θ)
-
对数似然方程组:
∂θ∂L(θ)=i=1∑n∂θ∂lnp(xi;θ)=0
7.3 估计量的评选标准
一 、无偏性
定义 若θ^=θ^(X1,X2,…,Xn)为参数θ的一个估计量,Θ为参数θ的取值范围,若对任意的θ∈Θ, 有
E(θ^)=θ
则称θ^是θ的无偏估计量。
若E(θ^)=0, 那么∣E(θ^)−θ∣称为估计量θ^的偏差,
若n→∞limE(θ)=θ,则称θ^是θ的
渐进无偏估计量。
例: 样本均值Xˉ是总体均值μ的无偏估计,样本方差S2=n−11i=1∑n(Xi−Xˉ)2是总体方差σ2的无偏估计,而样本二阶中心矩B2=n1i=1∑n(Xi−Xˉ)2=nn−1S2不是总体方差σ2的无偏估计,但有n→∞limE(B2)=n→∞limnn−1σ2=σ2,所以B2是σ2的渐进无偏估计。
纠偏方法:如果E(θ^)=aθ+b,θ∈Θ其中a,b是常数,且a=0,则a1(θ^−b)是θ的无偏估计。
二 、有效性
定义 设θ^1=θ^1(X1,X2,…,Xn)与θ^2=θ^2(X1,X2,…,Xn)都是θ的无偏估计量,若对于任意的θ∈Θ,有
D(θ^1)≤D(θ^2)
且至少对于某一个θ∈Θ上式中的不等号成立,则称θ^1较θ^2有效。
三 、均方误差准则
定义 称E(θ^−θ)2为均方误差,记为M(θ^,θ)。显然,均方误差越小越好,这一准则称为均方误差准则。
均方误差可以分为两部分:
M(θ^,θ)=D(θ^)+(E(θ^)−θ)2
如果估计量是无偏估计,那么第二部分为0,均方误差变为方差。
四 、相合性
定义 设θ^(X1,X2,…,Xn)为参数θ的一个估计量,Θ若对任意的θ∈Θ, 当n→∞时,θ^(X1,X2,…,Xn)依概率收敛于θ,则称θ^为θ的相合性估计量。
即,若对于任意θ∈Θ都满足:对于任意ε>0,有
n→∞lim{∣θ^−θ∣<ε}=1
则称θ^为θ的相合性估计量。