社会研究的统计应用6_第1页
社会研究的统计应用6_第2页
社会研究的统计应用6_第3页
社会研究的统计应用6_第4页
社会研究的统计应用6_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、两大类统计推论:参数估计,假设检定,参数估计:从样本的统计值来估计总体之参数值:研究10000人的每月文娱平均支出1)随机抽取200人作为样本,2)从中计算出平均值为42.5元,3)则称10000人的平均每月文娱支出为42.5元)假设检定(假设检验):先假定总体的情况,然后抽样,计算统计值来检验这个假定是否正确1)先假定每月文娱平均支出为40元,2)随机抽取200人作为样本,3)从中计算出为42.5元,4)根据抽样分布理论作出接受或否定最初的假定的结论,参数估计是从局部情况推出总体情况假设检定是先假定全部情况,然后从局部情况决定是否接受最初的假定,第六章参数值的估计,以样本的统计值来估计总体的

2、参数值,分为两大类做法:点值估计(点估计)间距估计(区间估计),第一节点值估计与间距估计,点值估计:以一个最适当的样本统计值(由样本计算出的值)来估计总体的某个参数值意义:了解某地青年人有多少赞成一胎化政策,现随机抽取一个青年人的样本。发现有60%赞成,我们将这个值代替总体的赞成比率,这就是参数(赞成一胎化政策)的点值估计,即认为总体的赞成率也是60%,点值估计的实际意义不大。间距估计:先给出可信度(95%),利用样本计算,估计出一个区间a,b,使我们要估计的参数落在该区间的可信度为(95%),即100次抽样有95次落在这个的区间里可信度一般选为95%或99%,第二节间距估计(区间估计):均值

3、、百分率、积矩相关,1.均值的间距估计(样本:1,3,5)样本均值:X=x/n(1+3+5)/3=3样本标准差:S=(x-X)2/n1/2(1-3)2+(3-3)2+(5-3)2/31/2=(4/3)1/2分布的标准差SE=S/n=2/3数学理论证明:均值的抽样分布服从正态分布N(X,SE)由第五章的结论:所抽出的样本均值满足以下式子:,由抽样计算出来的均值有95%落在M1.96(Se)之间,用X代替M得出结论:抽样均值落在一个可由样本来计算的区间:X-1.96(SE),X+1.96(SE)的可信度为95%,间距估计的计算公式:,如果设可信度为95%,可用公式来计算可信间距X-1.96(SE)

4、=M=X+1.96(SE)如果设可信度为99%,可用公式来计算可信间距X2.58(SE)=M=X+2.58(SE)SE=S/n1/2,例:统计一个地区的家庭用于请客送礼的每月平均支出(M)抽取出的一个样本为n=225,通过抽样得到数据,计算出样本均值X=43,样本标准差S=10.5SE=S/151.96*SE=1.96*10.5/15=1.37则可信度为95%的可信间距为43-1.37,43+1.37=41.19,44.81有95%的信心,估计总体的均值在上述区间,课堂练习:要统计一个学校的学生平均每月生活费(M)抽取出的一个样本大小为n=256计算出样本均值X=550,样本标准差S=250.

5、5,则抽样分布的标准差SE?则可信度为95%的可信间距为?,答案,SE=S/n1/2=250.5/16=15.66550-1.96*15.66,550+1.96*15.66519.31,580.69,2.百分率(或比例)的间距估计,估计某个指标占总数的百分比(二项分布)己知样本大小n,样本比例p,计算样本标准差:S=p(1-p)1/2(由二项分布性质),分布的标准差SE=S/n=p(1-p)/n1/2,计算公式,要求95%的可信度,则可信间距公式为p-1.96(SE),p+1.96(SE)要求99%的可信度,则可信间距公式为p-2.58(SE),p+2.58(SE),例子:估计某城镇有多少家庭

6、是夫妻不和。从一个随机样本(n=100)知道有20.0%(p=0.200)的家庭不和,如果要求可信度是95%,则1.96*SE=1.96*p(1-p)/n1/2=1.96*0.2(1-0.2)/1001/2=0.0782可信间距为0.200-0.078,0.200+0.078=0.122,0.278结论:有95%的把握认为该城镇夫妻不和比率在12.2%到27.8%之间,3.估计积矩相关系数值(r),问题:如果在随机样本中发现X与Y的积距相关系数r=0.602,样本大小n=150,则在总体中的相关系数是多少?r系数的抽样分布不服从正态分布,但Z=1.151log(1+r)/(1-r)服从正态分布

7、Z的标准误差SE=1/(n-3)1/2,积矩系数r的间距估计r1,r2计算步骤:,抽样:n,r,SE=1/(n-3)1/2,查附录四:r转为Z,求Z的间距估计z1,z2,从z1,z2反查表求r1,r2,样本大小n=150,由样本计算出r=0.602Z=0.6963(查表,附录四)SE=1/(n-3)1/2=0.082要求可信度为95%,则Z在0.0963-1.96(0.0825),0.6963+1.96(0.0825)=0.5346,0.8580即Z在0.5346和0.8580之间,反查表知r的可信度为95%的可信间距为0.489,0.695,第三节决定样本的大小,决定样本大小的准则能够付出的研究代价的限度内,选取最大的样本,愿意容忍多少错误?个案之间的相互差异有多大?,推导过程:假设研究的是要知道某变项(X)在总体中的均值(M),现从一个随机样本(n待定)中计算出来的均值(X),已知总体的标准差S,e为可以接受的误差程e=|M-X|己知总体的标准差(S)则95%的可信间距应是:X-1.96(S/n1/2)=M=X+1.96(S/n1/2)即e=1.96(S/n1/2)推出n=(1.96S/e)2,例子:调查某地区工人的平均工资,应该随机抽取多少个工人来研究?己知:1)愿意容忍的错误?(e=3,样本均值与总体均值不超过3元);

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论