




已阅读5页,还剩137页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育测量与评价 2011.0211.06 教材:华东师范大学 王孝玲编著 课时数:6472课时,3-4 学分。 章节数:共十五章,三大部分 描述统计,推断统计,抽样设计 教育统计学 695013 两个理论基础 n“凡物的存在必有其数量” (美国心理学家桑代克18751949) n“凡有数量的东西都可以测量” (美国测量学者麦柯尔) 复杂的因果关系:随机现象 n在因果关系复杂的条件下 n无法根据已知的有限原因精确地预测结果 n因为即使在已知条件相同的情况下,每一 次预测也都是有偏差的 n随机现象 n学生成绩 n心理测验得分 n候车人数 n作物产量 n产品质量 n收入支出 n等等 随机现象 n在一定的条件下,可能出现也可能不出现,可 能这样出现,也可能那样出现的一类现象。 n特征:条件不能完全决定结果。 n研究内容:出现的可能性有多大,不出现的可 能性有多大, n或者这样出现的可能性有多大,那样出现的可 能性有多大。 数量差异性与数量规律性 n数量差异性:一定条件下,出现可能 不一样; n数量规律性:通过大量试验和观察, 总结出随机现象的规律。 n数量规律性:平均数;方差、标准差 ;比率、百分比;相关系数等。 n非数量规律性:数量分布 二、统计学和教育统计学 n统计学就是研究随机现象的数量规律性的一门 数学分支。 1、统计学含义:Statistics 原意是国力、国势 定义1:统计学是研究统计原理和方法的科学。 P1 定义2:统计学是研究如何搜集、整理、分析反映事 物总体信息的数字资料,并以此为依据,对总体特 征进行推断的原理和方法。 研究什么(对象)、怎么做?干什么(目的) “研究 搜集、整理、分析 数字资料 推断 “总体特征”原理和方法 部分推断全体 2、教育统计学的含义: 教育统计学是运用数理统计的原理和方式研究 教育问题的一门应用科学。 它的主要任务是研究如何搜集、整理、分析由 教育调查和教育实验所获得的数字资料,并以此为 依据,进行科学推断,从而揭示蕴含在教育现象中 的客观规律。 (教育与心理统计学) 三、统计学与教育统计学的内容 数理统计学 1.统计学 教育统计学 应用统计学 农业统计学 人口统计学 2.统计学或教育统计学具体内容: 三、统计学与教育统计学的内容 统教 计育 学统 或计 学 描述统计 推断统计 实验设计 统计图表 集中量数 差异量数 相关分析 统计估计 假设检验 参数估计 非参数估计 点估计 区间估计 参数检验 非参数检验 样本选择与分配 实验误差分析 因子分析 方差分析 回归分析 抽样设计 三、统计学与教育统计学的内容 1、描述统计(descriptive statistics):对已获 得的数据进行整理、概括,显现其分布特征的统计 方法。P2 (主要是对样本数据的处理) 2、推断统计(inferential statistics ):根据样本 所提供的信息,运用概率的理论进行分析、论证, 在一定可靠程度上对总体分布特征进行估计、推测 的统计方法。(在一定风险下,部分推断全体) 3、实验设计(experimental statistics ):为提 示实验中自变量与因变量的关系,在实验之前所制 订的实验计划。 1.确定现象 2.随机现象,随机事件,随机变量。 统计处理的变量都是随机变量。 五、统计学中几个基本概念 3.个体(Case )、总体(Population)与样本(Sample) 总体无限总体与有限总体;表示数目 样本大样本(n30)与小样本(n30) 总体与样本是相对的 4.统计量( Statistic )与参数(Parameter) 统计量:样本上的数字特征; 参数:总体上的各种数字特征。 总体 样 本 统计量 描述统计 作出推断 随机抽样 描述 总总体 Population. 样样本 Sample 个体 Case 变变量 Vari. XNxnxi 容量SizeNni 结结果 Value 参数 Parameter 统计量 Statistic 数据 Data 统计统计 方 法Stat. 推断统计 Inf.Stat. 描述统计 Des.Stat. 计数 Count 总体、样本与个体 一、统计数据 来源 数据 种类 特性: 统计分类 经常性资料 专题性资料 :报表 教育调查 教育实验 :二分法和四分法 变异性、规律性 1、按数据观测方法和来源: 数据种类(数据的水平)二分法 点计数据(计数数据) 度量数据(测量数据) 2、按数学属性: 间断数据(离散、不连续) 连续数据(连续型随机变量) (百分制的分数理论上讲是间断的,但由于 数据密度大较多,实际处理时归入连续型数据 处理,连续型数据处理较方便,类似以后也有 ,总体比率用正态分布处理。) 间断型随机变量 n取值个数有限的数据 n人数 n个数 n名次 n五分制得分 连续型随机变量 n取值个数无限的数据 n身高 n体重 n智商 n时间长短 n百分制得分 问题:为什么要进行数据分类? 数据有不同属性(可分); 不同类型数据用不同统计方法处理。 1、按数据观测方法和来源:点计数据(计数数据) 与度量数据(测量数据)。 2、按数学属性:间断(离散)数据与连续数据。 数据种类(数据的水平)四分法 3、按数据测量水平 称名数据 等级(顺序)数据 等距数据 等比数据(比率数据) (标题、表号、标目、线条、数字、表注)六部分; (标题、图号、标目、图形、图注)五个方面。 简单表、分组表(1个标志)、复合表(2个及以上标志 直条图(条形图)、圆形图、线形图、频数分布图 多变量图:散点图、雷达图、脸谱图等 二、统计表、统计图 n例1.小教本011(30名)教育统计学单元考 试成绩58、61、88、74、81、66、70、 93、72、91、66、99、89、98、90、98 、90、64、93、89、100、91、92、97、 90、94、99、92、92、90。 频数分布表制作步骤 58、61、88、74、81、66、70、93、72、91、66、99 、89、98、90、98、90、64、93、89、100、91、92、 97、90、94、99、92、92、90。 n一般不少于5组,也不要超过15组。 n组距指的是每一个组内包含的距离(用i表示) n斯特奇斯(H.A. Sturges)根据经验公式: 本例为i=7.11,将组距调节为10,即每10分为一个组。 组数:42/10=4.2,应该分5组。 1)求全距 R: 全距指的是全部观察值中最大值与最 小值之差。 R=xmax- xmin=10058=42。 2)决定组数k和组距i。KR/i 频数分布表制作步骤 3)决定组限 n组限就是每一组的起点值和终点值。 4)登记频数 小教本011教育统计学单元考试学生成绩频数、累积频数分布表 分数5060708090 合计 组中值5565758595 频数14551530 累积频数15101530 小教本011教育统计学单元考试学生成绩频数分布直方图 第三章 常用的特征量 1.集中量:平均数、中位数、众数;百分位数 2.差异量:全距、四分位距、平均差、方差 和标准差、差异系数;百分位距。 3.地位量: 4.相关量: 5.分布形态量:偏态量、峰态量。 集中量 集中量是代表一组数据典型水平或集中趋 势的量。它能反映频数分布中大量数据向某一 点集中的情况。 集中量包括算术平均数、加权平均数、几 何平均数、调和平均数、中位数、众数等。 算术平均数 算术平均数是所有观察值的总和除以总 频数所得之商,简称为平均数或均数。 样本平均数 总体平均数 算术平均数的优点 n反应灵敏; n严密确定,简明易懂,计算方便; n适合代数运算; n受抽样变动的影响较小; n样本算术平均数是总体平均数的最好估 计值 算术平均数的缺点 n易受两极端数值(极大或极小)的影响; n一组数据中某个数值的大小不够确切时 就无法计算其算术平均数。 这种“两极端数值”存在的问题,可用什么 办法解决? 中位数(Md) 中位数是位于依一定顺序排列的一 组数据中央位置的数值,在这一数值上 、下各有一半频数分布着。 中位数的原始数值计算方法: 单数:12 14 15 15 17 18 20 23 24: 17 双数:12 14 15 15 17 18 20 23 24 25: 17.5 中位数的应用及其优缺点 中位数虽然也具备一个良好的集中 量所应具备的某些条件,例如比较严格 确定、简明易懂,计算简便,受抽样变 动影响较小,但是它不适合进一步的代 数运算。它适用于以下几种情况: (1)一组数据中有特大或特小两极端数值时; (2)一组数据中有个别数据不确切时; (3)资料属于等级性质时。 众数(Mo) n众数是集中量的一种指标。 n对众数有理论众数及粗略众数两种定义 方法 n理论众数是指与频数分布曲线最高点相对应 的横坐标上的一点。 n粗略众数是指一组数据中频数出现最多的那 个数。 众数的优缺点 众数虽然简明易懂,但是它并不具 备一个良好的集中量的基本条件。它主 要在以下情况下使用: n当需要快速而粗略地找出一组数据的代 表值时; n当需要利用算术平均数、中位数和众数 三者关系来粗略判断频数分布的形态时 ; n利用众数帮助分析解释一组频数分布是 否确实具有两个频数最多的集中点时。 正态 正偏态 负偏态 P34 加权平均数 加权平均数是不同比重数据(或平 均数)的平均数。计算公式为: 二、差异量 1.差异量:表示一组数据变异程度或离散程度的量。 2.类型:全距、四分位距、平均差、方差和标准差、 差异系数;百分位距。 注:差异量越大表明数据越参差不齐,分布范围越广。 二、差异量 1、全距(Range):R=xmax- xmin 例1 10、50、58、61、63、69、71、71、71、78、81、 83、86、86、88、99。 (16) 3、百分位距PD:P93 P7 P90 P10 4、平均差: 5、方差和标准差: 2、四分位距QD(Q3 Q1)/2 =99-10=89 二、差异量 例1 10、50、58、61、63、69、71、71、71、78、81、 83、86、86、88、99。 5、方差和标准差: 计算方法:1)原始数据法;2)计算工具法;3)其他 1)原始数据法: 3)计算工具法: 4)数学软件:spss等 2)频数分布表计算法: 问题讨论:一组数据的标准差,大好呢?还是小好? 二、差异量 6、相对差异量:差异系数 用途:1)比较不同单位资料的差异程度(单位不同) 2)比较单位相同而平均数相差较大(对象不同) 3)判断特殊差异情况 正常范围:5%CV35% 不 正 常:CV35% 平均数无意义 CV5% 数值计算正确性 应用 1)非零点; 条件:2)等比量表。 三、分布形态量 偏态量与峰态量 1、偏态量 SK0:分布对称 SK0:偏 态 SK0:正偏 SK0:负偏 2、峰态量 Ku0.263:正态峰 Ku 0.263:非正态 Ku 0.263 :低阔峰 Ku 0.263 :高狭峰 偏态量 负偏 正偏 第五章 概率及概率分布 n概率的一般概念 n概率分布:离散分布与连续分布 二项分布与正态分布 n正态曲线的面积与纵线 n正态分布在测量上的应用 5.1 概率(probability)的一般概念 一、概率的定义 二、概率的性质 0P(A)1 P(A)0:不可能事件 P(A)1:必然事件 三、概率的加法和乘法 小概率事件A:p(A) 0.05 小概率原理:小概率事件在一次试验中,几乎不可 能发生。 5.2 二项分布(bionimal distribution) 二、二项分布函数 2.二项分布函数在n次试验中成功事件P 恰好出现x次的概率 例 在男生占2/5的学校中随机抽取10个学生,问正好抽 到4个男生的概率是多少?至多抽到2个男生的概率是多少 ? 1)是否是二项试验? 2)共试验次数? 3)所求随机事件出现次数? 例 在男生占2/5的学校中随机抽取10个学生,问 正好抽到4个男生的概率是多少?至多抽到2个男生的 概率是多少? 解: 随机抽取一个学生即随机试验一次,因为试验结 果只有两个:“男生”与“女生”,而且抽到男生 与抽到女生是没有关系的,故此试验是贝努利试 验。 正好抽到4个男生的概率: 至多抽到2个男生的概率是: 二项分布(bionimal distribution) 5.2 二项分布(bionimal distribution) 三、二项分布图 二项分布的形态: Pq:对称 pq:偏态 1)当n时,二项分布正态分布; 2)当np5且nq 5时,二项分布开始接近正态分布。 5.2 二项分布(bionimal distribution) 四、二项分布的平均数和标准差 当二项分布开始接近正态分布时,在n次二项试 验中成功事件出现的平均数和标准差是: 例 从我们班中随机抽取10名同学,从理论上讲, 平均应抽到男生多少个?标准差是多少? 五、二项分布的应用 1.求n次二项试验中成功事件出现的概率; 2.判断试验结果的机遇性与真实性的界限(1的反向)。 正态分布 的图形特点 正态分布的密度曲线是一条关于 对 称的钟形曲线. 特点是“两头小,中间大,左右对称”. 即,取x=附近值的可能性大, 取偏离x=越远的值的可能性越小。 5.3 正态分布(normal distribution) 二、正态曲线的面积与纵线 2.标准正态曲线下的面积及Z值计算: 2)查表法 A、已知Z值求面积P: a)求P(0z1)或P(z1)、 P(z30: B.小样本 n30: 例.从某小学三年级随机抽取17名学生,其阅读能力 的平均得分为29.92,标准差为4.1。试估计该校三年级 阅读能力总体平均数95%和99%置信区间。 问题:在1908年t分布理论提出前,怎 样解决 未知的估计问题? 6.2 总体平均数的估计 二、正态总体均值的区间估计 一)总体标准差 已知:Z估计 二)总体标准差 未知:t估计 总体平均数区间估计 一、正态总体标准差 已知: Z估计 三、正态总体标准差 未知: t估计 1.小样本 2.大样本 t估计或近似Z估计 6.3 假设检验(本章节内容) n假设检验的有关概念 n假设检验基本思路 n假设检验基本步骤及二类错误 n总体平均数假设检验(某总体平均水平 有无显著变化?) 6.3 假设检验 一、假设检验有关概念 1.假设与假设检验 2.小概率事件及小概率原理 3.假设检验基本思路 4.假设检验的一般步骤: 1)提出假设: 2)选择检验统计量并计算其值:Z检验或t检验 3)选择检验的形式:双侧检验或单侧检验 4)规定显著性水平: 5)统计决断: 拒绝 区域 接受 区域 6.3 假设检验 例1 某班进行比奈智力测验,结果 ,已知比 奈测验的常模 ,问该班智力水平(不是 这一次的测验结果)是否确实与常模水平有差异?n=100 1)提出假设: 2)选择检验统计量并计算其值: 因为总体标准差已知,故采用Z检验。所以, 3)选择检验的形式:因为没有资料表明,该班智力水 平是否高于或低于常模水平,所以采用双侧检验。 4)统计决断: 因为 Z2 即该班智力水平与常模水平,有显著性差异。 所以0.01p0.05, 0.05, 所以接受H0 ,而拒绝H1 。 即该校初三英语平均成绩与全区水平没有显著差异。 1- 0.05 t=1.47 6.3 假设检验 一、假设检验有关概念 1.假设与假设检验 2.小概率事件及小概率原理 3.假设检验基本思路 4.假设检验的一般步骤: 5.假设检验的二类错误: 1)第一类错误: “以真为假” 弃真错误 2)第二类错误: “以假为真” 取伪错误 假设检验是概率条件下的反证法 在假设检验中,一般都首先控制第一类错误。 6.3 假设检验 二、平均数的显著性检验小结 1)提出假设: 2)选择检验统计量并计算其值:Z检验或t检验 3)选择检验的形式:双侧检验或单侧检验 4)规定显著性水平: 5)统计决断: 正态 总体 第七章平均数差异的显著性检验 1.需要考虑的问题? 2.需要知道什么? 3.共同点:显著性差异检验 4.不同点:两个样本 n需考虑的问题: n两总体是否正态分布; n两样本是否相关 n两总体方差12和22是否已知;如果未知, 则是否12 = 22 ; n两样本为大样本还是小样本。 平均数差异的抽样分布 一、正态总体 相关样本 r已知 平均数差异的抽样分布 一、正态总体 相关样本 r已知 1)提出假设: 2)选择检验统计量并计算其值:Z检验或t检验或 3)选择检验的形式:双侧检验或单侧检验 4)规定显著性水平: 5)统计决断: 平均数差异显著性检验步骤 n差异显著性检验的主要过程: 1、确定两总体(样本)是否相关; 2、根据问题要求,确定检验形式(双侧或单侧); 3、看总体标准差是否已知;(已知Z检验) 4、独立且未知,方差是否齐性;(齐性t、不齐性t) 5、看是大样本还是小样本; 6、判断样本Z、t或t值是否落入小概率区域; 7、若落入小概率区域,还需确定差异的显著性级别。 7.2 相关样本平均数差异的显著性检验 一、配对组的情况(等组实验) 例1:为了揭示小学二年级的两种识字教学法是否有 显著性差异,根据学生的智力水平、努力程度、识字 量多少、家庭辅导力量等条件基本相同的原则,将学 生配成10对,然后把每对学生随机地分入实验组和对 照组。实验组施以分散识字法,而对照组施以集中识 字法,后期统一测验如下表。 (79.571) (3.459) 1)提出假设: 2)选择检验统计量并计算其值: 因为相关样本且总体标准差未知, 故采用t检验。所以, 3)选择检验的形式:因为没有资料可以说明,两种教 学方法哪一种效果好,所以采用双侧检验。 79.5、71和9.12、9.94 r=0. 704样本均值和标准差: 3.46 4)统计决断: 因为n=10,所以df=n-1=9,查t表 得 因为t=3.46 3.25=t(9)0.01/2 , 所以p2.262=t(9)0.05/2 , 需进一步查t(9)0.01/2 , * 平均数差异的抽样分布 二、正态总体 独立样本 r= 0 贝赫兰斯费舍(Fisher)问题, 直至1957年柯克兰与柯克斯解决方案最佳。 7.4 方差齐性检验 一、F分布 由例1、2可知,独立样本,总体标准差未知 条件下,进行差异显著性检验,首先 首先 要进行总体方差齐性检验。 用总体标准差估计值S 总体标准差未知下,怎样判断 ? 即只要检验 无显著性差异即可 F检验, 英国统计学家费舍R.A.Fisher首创 第十章 2 检验 10.1 2分布及2检验 一、 2检验的特点 2检验是根据样本频数分布,对总体分布进行推断 的假设检验。 2检验与测量数据假设检验的区别: 测量数据 假设检验 数据属性 总体分布 检验对象 2检验 连续型间断型 正态分布未 知 总体参数 非总体参数 10.1 2 分布及2检验 一、 2检验的特点 二、 2检验的统计量 三、 2的抽样分布 四、 2检验应用 例1 从某大学随机抽取54位老年教师,其中健康状况属 于好的有15人,中等的有23人,差的有16人,问该校老 年教师健康状况好、中、差的人数比率是否是1:2:1? 解: 1、提出假设 H0:健康状况好、中、差的人数比率是1:2:1 H1:健康状况好、中、差的人数比率不是1:2:1 2、选择统计量并计算 实际频数: 理论频数: ft1 =541/4=13.5, ft2 =542/4 =27,ft3 =541/4=13.5。 根据零假设, =1.22 3、统计决断 df=k-1=2 ,查 2 值表, 2=1.22 0.05, 根据2 检验统计决断规则, 所以在0.05显著水平上保留零假设,拒绝备择假设。 即该校老年教师的健康状况,好、中、差人数的比率 是1:2:1。 2检验能解决的问题 n调查人们对于某社会现象的看法,结果 如下。问三种态度人数有无显著差异? n同质性检验 赞赞成不置可否反对对 110090110 22005050 310009001100 2检验能解决的问题 n表中314名学生的考试成绩是否服从正 态分布? n数据正态性的检验 组组 别别 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 70 - 74 75 - 79 80 - 84 85 - 89 90 - 94 95 - 99 次 数 10 18 22 40 46 72 44 28 18 124 2检验能解决的问题 n对3627名中小学生的心理测验得到如下 结果(部分),问性格类型与智力水平 之间有无关联? n相关性(或独立性)检验 外倾倾中间间内倾倾 智力优优秀364012 智力落后469288 第二节 单向表的2检验 n把实得的点计数据按一种分类标准编制 成表就是单向表(单因素) 赞赞成不置可否反对对 10090110 二、一个自由度的2检验 n当df=1,其中只要有一个组的理论值 ft0.05) ft1 =20 0.8=16ft2 =200 .2=4 实际频数: 理论频数: 5 且df=2-1=1, 团员 非团员 三、次数分布正态性的2检验 P177 自由度为K - 3 第三节 双向表的2检验 n在双向表的2检验中,如果要判断两种 分类特征,即两个因素之间是否有依从 关系,这种检验称为独立性2检验。 愿意不愿意未定总总和nr 上18271055 中20192059 下1871136 总总和nc565341150 例1 家庭经济情况属于上、中、下的高三毕业生,对 于是否报考师范大学有三种不同态度(愿意、不愿意 、未定),其人数如下表。问学生是否愿意报告师范 大学与家庭经济情况是否有关系? 解:1、提出假设 H0:学生是否愿意报考师范的态度与家庭经济状况无关系 H1:学生是否愿意报考师范的态度与家庭经济状况有关系 例1 家庭经济情况属于上、中、下的高三毕业生, 对于是否报考师范大学有三种不同态度(愿意、不愿 意、未定),其人数如下表。问学生是否愿意报告师 范大学与家庭经济情况是否有关系? 2、选择统计量并计算 i=1,2,3 j=1,2,3 根据零假设及学生对报考师范大学的态度与家庭经 济状况之间关系的双向表,可计算出相应理论频数。 愿意不愿意未定总总和nr 上 18 (20.53 ) 27 (19.43 ) 10 (15.03 ) 55 中 20 (22.03 ) 19 (20.85 ) 20 (16.13 ) 59 下 18 (13.44 ) 7 (12.72 ) 11 (9.84) 36 总总和nc565341150 =10.48 3、统计决断 df=(r-1)(c-1) 查 2值表, , 0.01P0.05, 根据2检验统计决断规则, 所以在0.05显著水平上保留 H1 ,拒绝 H0 。 即学生是否愿意报考师范大学的态度与家庭经济状况 有关系。 =(3-1)(3-1) =4 , r=3,c=3 * 第十一章 相关分析 n相关意义 n积差相关 n等级相关 n质与量的相关 n品质相关 相关关系 1.变量间关系不能用函数关 系精确表达 2.一个变量的取值不能由另 一个变量唯一确定 3.当变量 x 取某个值时,变 量 y 的取值可能有几个 4.各观测点分布在直线周围 x x y y n相关的概念 n两个变量之间不精确、不稳定的变化关系称 为相关关系。 第一节 相关的意义 n相关的概念 n两个变量之间不精确、不稳定的变化关系称 为相关关系。 分类: 正相关、负相关、零相关 n相关系数 n用来描述两个变量相互之间变化方向及密切 程度的数字特征量称为相关系数。一般用 r 表示。1r 1 相关系数 (取值及其意义) 1. r 的取值范围是 -1,1 1r 1 2. |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 1. r = 0,不存在相关关系 2. -1r0,为负相关 3. 0r1,为正相关 4. |r|越趋于1表示关系越密切;|r|越趋于0表示关 系越不密切 相关及相关系数的几点说明 n相关系数的值,仅仅是一个比值,不等 距,也不是百分比,因此,不能直接作 加、减、乘、除。 r=0.2,r0.4,r=0.8 n如果两个变量之间存在因果关系,则这 种关系可以用相关关系体现出来。 n相关不等于因果:相关系数只能描述两 个变量之间的变化方向及密切程度,并 不能揭示二者之间的内在本质联系。 样本、总体相关系数 (correlation coefficient) 1.若相关系数是根据总体全部数据计算的, 称为总体相关系数,记为 2.若是根据样本数据计算的,则称为样本相 关系数,记为 r 第十二章 回归分析 主要内容: n一元线性回归 n一元线性回归方程的检验 n一元线性回归方程的应用 n多元线性回归简介 变量间的关系: n相关系数双向关系 n回归方程单向关系 什么是回归分析? 从一组样本数据出发,确定变量之 间的数学关系式; 利用所求的关系式,由一个变量( 自变量)来预测或控制另一个特定变量 的取值,并给出这种预测或控制的精确 程度。 一元线性回归模型 一元线性回归方程 n回归线拟合的常用原则,就是使各点与 该线纵向距离的平方和为最小。 x x y y 回归线 回归线拟合的常用原则,就是使各点与该线 纵向距离的平方和为最小 回归方程 n确定回归线的方程称回归方程。 由x估计Y 由Y估计x 由Y估计X 估计方程的求法 (例题分析) 【例2】根据第十一章例子的数据男青年前男青年前 臂长臂长y y对对对对身高身高x x的线性回归方程的线性回归方程 回归方程为:回归方程为:y = y = 4 4.897.897 + + 0.23480.2348 x x 第十四章 抽样设计(技术) n统计的质量取决于数据的质量 n推断统计学各种方法运用的前提 n就是要先获得对总体有足够代表性的样本资 料或实验数据 推断可靠性三因素:数据的质量、统计方法及 数据处理的准确性、样本对总体的代表性 怎样抽?抽多少? 第一节 抽样调查与抽样方法 n从总体中抽取部分个体组成样本,对该 样本进行观察,进而推断未知总体情况 ,称为抽样调查。 n抽样调查分为非概率抽样调查和概率抽 样调查两大类。 常用的抽样方法 n简单随机抽样 n分层随机抽样 n机械抽样(系统抽样) n整群抽样和多阶段抽样 简单随机抽样 n从总体的N个个体中,完全以随机形式( 不加人为干扰地)抽取n个个体组成一个 样本。在抽取的过程中,总体中每个个 体被抽到的概率是均等的,并且在任何 一个个体被抽取之后总体内成分不变( 抽样的独立性)。 分层随机抽样 n一种有人为干预的限制性随机抽样。 n按有关的因素或指标将总体划分为互不 重叠的几个部分(层),再从各部分( 层)中随机地(独立地)抽取一定数量 的个体,最后将各个部分(层)中抽取 的个体合在一起,组成一个样本。 分层抽样的抽样比例 n等比例分层抽样 n最优配置法 n内曼配置法 nh :各层要抽取人数 nnh ; Nh :h层的总人数 h: h层的标准差 机械抽样 n又称为系统抽样、等距抽样,其做法是 ,先将总体中的所有个体按顺序编号, 然后每隔一定的间隔k抽取个体,组成样 本。 整群抽样 n以整群为单位的抽样方法,即从总体中 抽出来的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年下一代互联网建设行业当前市场规模及未来五到十年发展趋势报告
- 2025年半导体硅片、外延片行业当前发展趋势与投资机遇洞察报告
- 2025年丽水市遂昌县中考冲刺卷数学试题含解析
- 操作规程制定流程课件
- 2025年3月时事政治试题及答案
- (2025)义务教育语文新课程标准考试测试题库及参考答案
- 2025年四川省攀枝花市医疗三严三基理论考试试题及答案
- 2025医师合理用药考核试题及答案
- 2025年桥梁隧道工岗位职业技能资格知识考试题与答案
- 项目技术管理试题及答案
- 学校安全管理制度大全
- 《思想道德与法治》(23版):第四章 明确价值要求 践行价值准则
- 道路建设三级安全教育培训
- 工抵房协议书范本
- 建筑机电安装工程质量通病与防治
- 病历的书写规范讲课幻灯课件
- 中国航天建筑某厂房施工组织设计
- 2024年国网山东省电力公司招聘考试真题
- 全国高校辅导员素质能力大赛试题(谈心谈话、案例分析)
- 心功能不全病人的护理查房
- 地理与生活密切相关
评论
0/150
提交评论