样本的二重性
设
样本具有{随机变量}的性质,{数}的性质
Q:
为什么样本具有二重性 (随机变量与数的性质)?
A: 随机变量:
数: 在确定之后
简单随机样本的要求
统计量有{二重性}(与样本相同的性质)
统计量的本质是{函数
观测值本质是{函数值
常见的统计量
样本均值
样本方差
统计量之间的独立性
一般来说统计量之间{不是}相互独立
Q: 为什么样本方差
系数是
A: 设真实的均值为
这里使用了
例如如果有 3 个数据点, 我们知道了
显然自由度为 2, 而不是 3
需要修改参数, 放大结果, 更贴近实际, 这个系数恰好就是
统计量与数字特征的关系
样本的
样本的
| 分布 | 形式 | 自由度 | 特性 |
|---|---|---|---|
| {c1: | |||
| {c2: | 分布函数对称 | ||
| {c3: |
Q:
A:
自由度
Q: 什么时候使用卡方分布
A: 见到平方想卡方
三大分布, 概率密度函数的对称性
Q: 三大分布中,哪个分布的概率密度函数是对称的?
A: T分布
卡方分布的数字特征
卡方分布的可加性
随机变量
{
Q: 为什么
A:
分母
这里的
根据大数定律,当
当
因此
所以
{
Q: 为什么
A:
设
{
{
设
样本均值:
样本离差:
样本方差:
设
样本离差:{
设

Q: 对于来自正态总体的样本,
其样本均值
A: 相互独立
证明比较复杂按下不表
Q: 在什么情况下
统计量样本均值
A: 仅在原始数据来自正态分布时
哪些可以得到卡方分布
样本方差 相关统计量的分布推导
- 构造卡方分布:
我们知道 ,将其标准化得到 .
根据卡方分布的定义,这 个独立标准正态变量的平方和服从自由度为 的卡方分布:
- 对平方和进行代数分解:
这是最关键的一步,我们对求和项进行变换,引入样本均值 :
展开这个平方项:
我们来分析中间的交叉项:
而 .
所以,交叉项为 0.
分解结果为:
- 两边同除以
:
现在,我们用统计量的符号来重写这个等式:
- 分析等式中各项的分布:
- 等式左边:我们已经知道,
. - 等式右边第二项:我们刚在第一部分推导出
,所以 .因此,它的平方 .
- 等式左边:我们已经知道,
- 应用 Cochran 定理:
我们有了一个形如 的结构,其中 , .Cochran 定理告诉我们,等式右边的两项是相互独立的,并且自由度是可加的.
因此,第一项 必须服从卡方分布,其自由度为 .
即 .
T 统计量的分布推导
结论:
推导过程:
这个推导是 t 分布定义的一次完美应用.
-
回顾 t 分布的定义:
,其中 , ,且 独立. -
寻找 Z 和 U:
根据我们前面的推导:- 令
.我们知道 . - 令
.我们知道 .这里的自由度 .
- 令
-
检查独立性:
根据关键的 Cochran 定理,样本均值 和样本方差 是相互独立的.因此,由它们构造出的 和 也是相互独立的. -
代入 t 分布的定义公式:
-
化简表达式:
我们来化简分母:
(因为 S 和 都是标准差,为正数)现在,将化简后的分母代回原式:
-
得出结论:
我们构造的表达式完全符合 t 分布的定义,并且化简后得到了我们想要的目标统计量.其自由度为 的自由度,即 .
因此, .
这个结果的重大意义在于,构造出的统计量