《抽样误差和t分布》PPT课件.ppt_第1页
《抽样误差和t分布》PPT课件.ppt_第2页
《抽样误差和t分布》PPT课件.ppt_第3页
《抽样误差和t分布》PPT课件.ppt_第4页
《抽样误差和t分布》PPT课件.ppt_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样误差和 t 分布,荀鹏程,Sampling error and t distribution,抽样误差的概念,由抽样引起的样本统计量与总体参数间的差异 两种表现形式 样本统计量与总体参数间的差异 样本统计量间的差异,抽样研究 个体变异,抽样误差产生的条件,均数的抽样误差及标准误,表现一:样本均数与总体均数之差值 表现二:多个样本均数间的离散度,中心极限定理(central limit theorem),从均数为、标准差为的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为,标准差为 。,标准误(standard error,SE),,样本统计量的标准差称为标准误,用来衡量抽样误差的大小。 样本均数的标准差称为标准误。此标准误与个体变异 成正比,与样本含量n的平方根成反比。,实际工作中, 往往是未知的,一般可用样本标准差s代替 : 因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。,中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布 ,见图3.1 。,图3.1描述了来自不同总体的样本均数之抽样误差和抽样分布规律。事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。,标准差与标准误的联系和区别,联系 都是变异指标。S反映个体观察值的变异;反映统计量的变异。 当n不变时,标准差,标准误,标准差与均数结合,用于描述观察值的分布范围,如医学参考值范围的估计; 标准误与均数结合,用于估计总体均数可能出现的范围,如参数估计的置信区间。,t分布,设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: 则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在生物统计杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。,图3.2 自由度分别为1、5、时的t分布,t分布的特征,t分布为一簇单峰分布曲线 t分布以0为中心,左右对称 t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。,每一自由度下的t分布曲线都有其自身分布规律 t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。t0.05,102.228,表明,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。 P(t-2.228)+P(t2.228)0.05 或:P(-2.228t2.228)=1-0.05=0.95。,請問SD與SE的差別。多除了一個n有什麼差別。 我查過了課本,他說有時候SD會等於SE那是在什麼情況下阿。 感覺有一點點奇怪,除非n很小不然SE會比SD小,回答者: 統計老兵yhliu 回答時間: 2008-01-15 20:06:34 如果 SE = SD/n, 怎可能 SE=SD? 除非 n=1. 實際上 SD (標準差, standard deviation) 與 SE (standard error) 說起來頗複雜.複雜的原因是: 因為它們都代表了不只一 個量! 簡單地說, 每一個資料分布, 不管是群體或樣本, 基本上都可 以算出一個標準差 (當然, 就理論上的群體分布而言, 是有可 能不存在標準差.) 從群體抽樣, 可以計算樣本平均數, 樣本標準差等等. 但這些 由樣本算出的量, 所謂 “統計量“(statistic), 本身也有個機率分 布, 稱為這統計量的 “抽樣分布“(sampling distribution). 舉個簡單的例子, 群體數據是 1,2,3,4,5,6. 你可以計算這群 體的平均數, 標準差, 中位數, 四分位數等等一堆量. 現在從 這群體去抽樣, 假設 n=3. 如果不重複 (抽出後不放回, 或一次 抓3個), 可能抽到 (1,2,3), 也可能抽到 (1,3,6). 有 20 種不同組 合. 每一種組合就是一個可能的樣本. 以 (1,3,6) 這樣本來說, 樣本平均數是 10/3=3.33; 但以 (1,2,3) 這個樣本來說, 樣本平 均數是 2. 有 20 種不同樣本組合, 就有20個或相等或不等的 樣本平均數. 這20個樣本平均數當做資料, 它也構成一個分布, 就是 從 1,2,3,4,5,6 這群體隨機抽取 n=3 之樣本的樣本平 均數抽樣分布. (好長的名詞!) 這個分布本身也有個標準差.,現在問題來了! 名詞從這裡開始有點混亂. 還是簡單地說. 我說 “名詞混亂“, 是因為有新舊不同說法. 以前 如上述樣本平均數抽樣分布的標準差, 就稱為 “樣本平均數的標準誤“. 類似地, 我們可以有樣本比例的標準誤, 樣本標準差的標準誤. 現在 新的說法對上述樣本平均數等統計量之抽樣分布的標準差, 就只說是某統計量 (如樣本平均數) 的標準差! 而因這個理 論的標準差通常 “不知“; 因此會用樣本資料估計. 統計量的標準差, 只有利用樣本資料估計出來的結果, 才叫 標準誤 (the standard error of a statistic). 以樣本平均數為統計量之例. 設群體標準差是 , 一個樣本的標準差以 s 表示. 則樣本平均數抽樣分布的標準差 = /n; 以前稱 “樣本平均數的標準誤“. 而現在把 s/n 稱為 “樣本平均數的標準誤“, 以前稱為 “樣本平均數的標準誤的估計“ 或 “估計的標準誤“.,(3) 方差(VAR) 方差是描述个体值间的变异,即观察值的离散度,方差较小,表示观察值围绕均数的波动较小,反之亦然。方差计算公式是 (4) 标准差(SD) 描述个体值间的变异,即观察值的离散度,标准差较小,表示观察值围绕均数的波动较小,当观察值呈正态分布或近似正态分布时可将均数及标准差同时写出,如平均值SD,计算公式。 (5) 标准误(SE) 描述统计量的抽样误差,即样本统计量与总体参数的接近程度,标准误小,表示抽样误差小,则统计量较稳定并与参数较接近,可将统计量及其标准误同时写出,如样本均数及其标准误可写为平均值SE,计算公式 。 (6) 变异系数(CV) 又称离散系数,即标准差与均数之比用百分数表示,它反映计量资料的变异程度,变异系数无单位。,方差反映变量的变异程度,但由于取了平方值,使得与原始数据的单位不一样,因此将方差开平方,这个值就是标准差(standard deviation, Sd)标准差分为总体标准差()和样本标准差(s)实验中由于我们都是取样测量,所以一般用样本标准差(s) 当计算样本平均数的标准差时,结果叫:标准误(standard error)(这个不好理解) 举例说明一下什么时候该用标准差,什么时候该用标准误 一个小样方(同样的处理)有5 株幼苗,每株高度分别为(单位): 2 2.2 2.3 2.4 2.5 这五个数据用样本标准差(s)来计算 如果有五个这样的小样方(同样的处理),每个小样方的平均值是 2 2.2 2.3 2.4 2.5 那么

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论