应用1_随机抽样与数据显示_第1页
应用1_随机抽样与数据显示_第2页
应用1_随机抽样与数据显示_第3页
应用1_随机抽样与数据显示_第4页
应用1_随机抽样与数据显示_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语言研究中的统计学()2009年4月,山西大学数学科学学院,1,第三章数理统计基础,统计学的分类,2,统计以其功能可以分为两类:1、描述统计目的:对数据进行整理、归纳和总结,便于研究者把握期一般的特征和全貌。内容:特征数和统计图表2、推断统计目的:以概率论为基础通过样本对总体做出更科学的判断。内容:一方面根据样本特征值对总体进行推断或估计;另一方面估计或假设进行检验。,山西大学数学科学学院,第三章数理统计基础,数据的基本分类,3,1、简单随机抽样2、分层随机抽样3、多级抽样,山西大学数学科学学院,第三章数理统计基础,单机抽样,1、简单随机抽样,4,(1)抽签(2)随机数表法Step1根据总体规模确定随机数表中的实际分组大小Step2从随机数表中任意一个地方开始,从左到右或从上到下顺序寻找,将有效数字记下来(重复的不再记),直到满足所需的样本容量为此。Step3将所记的有效数字和实物(研究对象)对应,从而选取出样本。,山西大学数学科学学院,第三章数理统计基础,随机数表,5,随机数表是由0-9十个数随机排列的若干组数字组成。,山西大学数学科学学院,第三章数理统计基础,有效数字自然是不超过总体规模的数字。,随机数表,6,例如:我们要从450人(总体规模)中抽取一个20人(样本容量)的样本,我们将随机数表中每3个数(分组规模)分为一组。假如从第3行第2组的数字(26)开始,从左到右选取,每3个数字为一个号,选取20个不重复的有效数字即可。结果如下:269,370,(602),235,(851),(513),(920),山西大学数学科学学院,第三章数理统计基础,1、简单随机抽样,7,(3)系统随机抽样只要求所抽取样本的第一个单位按真正的随机方法进行选取,余后单位则按等距抽取(抽取间距的大小视样本的大小而定)。例如,从1000个英语句子中抽取50个作为样本加以研究,抽取间距为1000/50=20。首先从随机数表中选取一个不超过20的数字作为第一个单位,如18,则以后应抽取的句子数依次为38,58,78,98,998。由于第二个及其以后的单位并不独立于第一个单位,所以严格来说,并不是真正的随机样本。,山西大学数学科学学院,第三章数理统计基础,2、分层随机抽样,8,Step1根据所研究的自变量把总体分成若干组或层,所分成的组或层(stratum)也称为次总体;Step2在各个部分(层)中分别进行简单随机抽样;Step3将所抽取的分样本合并起来,就得到一个总样本。如果从各层中抽取得分样本在总样本中所占的比例与各层在总体中所占的比例相同,那么这种抽样就称为比例分层随机抽样。否则称为非比例分层抽样。,山西大学数学科学学院,第三章数理统计基础,分层随机抽样实例,9,例如:要从一个年级(男女不等)中抽取一个样本,考虑到男女比例,进行比例分层随机抽样。,山西大学数学科学学院,第三章数理统计基础,3、多级抽样,10,多级抽样就是逐级进行抽样,把每一级所抽取的样本看成下一级抽样的总体。例如:要从某个作家的作品(小说)中抽取10000个词加以研究,山西大学数学科学学院,第三章数理统计基础,数据的基本分类,11,1、范畴型数据又称属质型数据,即按变量的性质或类别来区分的数据2、数值型数据数值型数据的基本处理方法1、排序2、分组,山西大学数学科学学院,第三章数理统计基础,频数分布表,12,包括:每个样本值出现的次数、频数(次数)、相对频数(频率)、百分比频率、累积频数和累计百分比频率等。【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。,山西大学数学科学学院,第三章数理统计基础,频数分布表,13,山西大学数学科学学院,第三章数理统计基础,分组频数分布表,14,包括:分组区间、组中值、组频数、组频率,累积频数、累计频率(百分数),山西大学数学科学学院,第三章数理统计基础,分组频数分布表,15,说明:明端点归属的问题,不能重复统计也不能遗漏;组中值是每组两端点的平均值;从小到大的累积(百分比)频率就是样本分布函数,其对应的数值即为分位数(点)。,山西大学数学科学学院,第三章数理统计基础,分组频数分布图,16,一、直方图,山西大学数学科学学院,第三章数理统计基础,分组频数分布图,17,二、茎叶图,山西大学数学科学学院,第三章数理统计基础,StemandLeafdisplay:21,24,24,26,27,27,30,32,38,41,分组频数分布图,18,山西大学数学科学学院,第三章数理统计基础,频数多边形图,19,又称折线图,山西大学数学科学学院,第三章数理统计基础,140,150,210,190,200,180,160,170,220,230,240,分组频数分布图,20,经验结论:1、如果总体是正态分布的,分组数K由下式计算:其中N为样本容量。2、如果20N300,茎叶图最大行数不超过:,山西大学数学科学学院,第三章数理统计基础,作图指导,第三章数理统计基础,21,山西大学数学科学学院,SPSS作图指导,山西大学数学科学学院,22,第三章数理统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论