样本均值向量和样本离差阵的详细解释
一、样本均值向量
1.1 定义
设 X(1),X(2),…,X(n) 是来自 p 元总体的 n 个独立同分布样本,其中每个样本 X(α) 是 p 维列向量: X(α)=(xα1,xα2,…,xαp)′
样本均值向量定义为: Xˉp×1=n1∑α=1nX(α)=(xˉ1,xˉ2,…,xˉp)′
其中: xˉj=n1∑α=1nxαj,j=1,2,…,p
1.2 矩阵表示
将所有样本排列成 n×p 数据矩阵:
X=x11x21⋮xn1x12x22⋮xn2⋯⋯⋱⋯x1px2p⋮xnp=X(1)′X(2)′⋮X(n)′则样本均值向量可以表示为: Xˉ=n1X′1n
其中 1n=(1,1,…,1)′ 是 n 维列向量。
1.3 详细推导
Xˉ=n1X′1n=n1x11x12⋮x1px21x22⋮x2p⋯⋯⋱⋯xn1xn2⋮xnp11⋮1=n1∑α=1nxα1∑α=1nxα2⋮∑α=1nxαp=n1∑α=1nxα1n1∑α=1nxα2⋮n1∑α=1nxαp=(xˉ1,xˉ2,…,xˉp)′二、样本离差阵(交叉乘积阵)
2.1 定义
样本离差阵定义为: Ap×p=∑α=1n(X(α)−Xˉ)(X(α)−Xˉ)′
这是一个 p×p 的对称矩阵,其 (i,j) 元素为: aij=∑α=1n(xαi−xˉi)(xαj−xˉj)
2.2 矩阵表示的推导
第一步:展开定义
A=α=1∑n(X(α)−Xˉ)(X(α)−Xˉ)′=α=1∑n(X(α)X(α)′−X(α)Xˉ′−XˉX(α)′+XˉXˉ′)第二步:逐项求和
A=α=1∑nX(α)X(α)′−α=1∑nX(α)Xˉ′−α=1∑nXˉX(α)′+α=1∑nXˉXˉ′=α=1∑nX(α)X(α)′−(α=1∑nX(α))Xˉ′−Xˉ(α=1∑nX(α)′)+nXˉXˉ′第三步:利用样本均值的定义
由于 Xˉ=n1∑α=1nX(α),故 ∑α=1nX(α)=nXˉ,代入得:
A=α=1∑nX(α)X(α)′−(nXˉ)Xˉ′−Xˉ(nXˉ′)+nXˉXˉ′=α=1∑nX(α)X(α)′−nXˉXˉ′−nXˉXˉ′+nXˉXˉ′=α=1∑nX(α)X(α)′−nXˉXˉ′第四步:用数据矩阵表示
注意到: ∑α=1nX(α)X(α)′=X′X
因为:
X′X=x11x12⋮x1px21x22⋮x2p⋯⋯⋱⋯xn1xn2⋮xnpx11x21⋮xn1x12x22⋮xn2⋯⋯⋱⋯x1px2p⋮xnp=∑α=1nxα12∑α=1nxα2xα1⋮∑α=1nxαpxα1∑α=1nxα1xα2∑α=1nxα22⋮∑α=1nxαpxα2⋯⋯⋱⋯∑α=1nxα1xαp∑α=1nxα2xαp⋮∑α=1nxαp2=α=1∑nxα12xα2xα1⋮xαpxα1xα1xα2xα22⋮xαpxα2⋯⋯⋱⋯xα1xαpxα2xαp⋮xαp2=α=1∑nX(α)X(α)′因此: A=X′X−nXˉXˉ′
2.3 中心化矩阵表示
定义中心化矩阵
中心化矩阵(也称为投影矩阵)定义为: H=In−n11n1n′
其中 In 是 n×n 单位矩阵,1n 是 n 维列向量。
验证中心化矩阵的性质
- 对称性:H′=H
- 幂等性:H2=H
推导 A=X′HX
X′HX=X′(In−n11n1n′)X=X′InX−n1X′1n1n′X=X′X−n1(X′1n)(1n′X)注意到: X′1n=nXˉ
因为:
X′1n=x11x12⋮x1px21x22⋮x2p⋯⋯⋱⋯xn1xn2⋮xnp11⋮1=∑α=1nxα1∑α=1nxα2⋮∑α=1nxαp=nn1∑α=1nxα1n1∑α=1nxα2⋮n1∑α=1nxαp=nXˉ同理: 1n′X=(X′1n)′=(nXˉ)′=nXˉ′
因此:
X′HX=X′X−n1(nXˉ)(nXˉ′)=X′X−nXˉXˉ′=A2.4 元素表示
样本离差阵 A 的 (i,j) 元素为: aij=∑α=1n(xαi−xˉi)(xαj−xˉj)
详细推导:
aij=α=1∑n(xαi−xˉi)(xαj−xˉj)=α=1∑n(xαixαj−xαixˉj−xˉixαj+xˉixˉj)=α=1∑nxαixαj−xˉjα=1∑nxαi−xˉiα=1∑nxαj+nxˉixˉj=α=1∑nxαixαj−xˉj(nxˉi)−xˉi(nxˉj)+nxˉixˉj=α=1∑nxαixαj−nxˉixˉj这与 A=X′X−nXˉXˉ′ 的元素表示一致。
三、统计意义
3.1 样本均值向量
- 是总体均值向量 μ 的无偏估计:E[Xˉ]=μ
- 当样本来自正态总体时,Xˉ∼Np(μ,n1Σ)
3.2 样本离差阵
- 是总体协方差矩阵 Σ 的 n 倍估计:E[A]=(n−1)Σ(当总体均值未知时)
- 样本协方差矩阵定义为:S=n−11A
- 当样本来自正态总体时,A 服从 Wishart 分布:A∼Wp(n−1,Σ)
3.3 中心化矩阵的几何意义
中心化矩阵 H=In−n11n1n′ 将数据投影到与向量 1n 正交的子空间上,即去除数据的均值信息,保留离差信息。
四、总结
4.1 样本均值向量
Xˉ=n1∑α=1nX(α)=(xˉ1,xˉ2,…,xˉp)′=n1X′1n
4.2 样本离差阵
A=∑α=1n(X(α)−Xˉ)(X(α)−Xˉ)′=X′X−nXˉXˉ′=X′HX
其中 H=In−n11n1n′ 是中心化矩阵。
4.3 元素表示
aij=∑α=1n(xαi−xˉi)(xαj−xˉj)=∑α=1nxαixαj−nxˉixˉj
部分信息可能已经过时