版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、社社 会会 统统 计计 学学 ( Social Statistics ) 引子:在学统计学之前,我们需要了解引子:在学统计学之前,我们需要了解 为什么要学统计学?为什么要学统计学? 统计学是什么?统计学是什么? 如何学习统计学?如何学习统计学? 科学只有当它利用了数学的时候,它才科学只有当它利用了数学的时候,它才 达到了完善的程度。达到了完善的程度。 马克思马克思 对于追求效率的公民而言,统计思维总对于追求效率的公民而言,统计思维总 有一天会和读写能力一样必要。有一天会和读写能力一样必要。 H.G.WellsH.G.Wells 社会统计学是社会学十门必修课中的一门,它与社会统计学是社会学十门必
2、修课中的一门,它与 “社会学调查研究方法社会学调查研究方法”结合起来,完整的介绍结合起来,完整的介绍 了当代社会调查研究的科学方法与资料处理技术了当代社会调查研究的科学方法与资料处理技术 。社会统计学侧重于介绍资料的收集、整理、分。社会统计学侧重于介绍资料的收集、整理、分 析和推论的处理技术。析和推论的处理技术。 社会统计学的发展社会统计学的发展 统计学的两大流派:数理统计学派和社会统计学派统计学的两大流派:数理统计学派和社会统计学派 数理统计学派的原创始人是比利时的A 凯特靳, 其最大的贡献就是将法国的古典概率引入统计 学,用纯数学的方法对社会现象进行研究; 社会统计学派的首倡者是德国的K克
3、尼斯,他 认为统计研究的对象是社会现象,研究方法为 大量观察法。 社会统计学的两大流派社会统计学的两大流派 社会指标学派 描述统计学派 统计学是什么?统计学是什么?概念与内涵概念与内涵 统计学是描述一系列可用于描述、整理和解释资料或数据的统计工具统计学是描述一系列可用于描述、整理和解释资料或数据的统计工具 和技术。和技术。 社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势 进行定量描述或推断的一种专门方法与技术。进行定量描述或推断的一种专门方法与技术。 统计学的基本分类:描述统计与推断统计统计学的基本分类:描述统计与推断统
4、计 描述统计(描述统计(Descriptive Statistics):用于整理、描述所收集的数):用于整理、描述所收集的数 据的特征据的特征 推论统计(推论统计(Inferential Statistics):利用较小群体的数据(样本)来):利用较小群体的数据(样本)来 推论可能的较大群体(总体),推论可能的较大群体(总体), 通过推论统计,我们可以解释数据。通过推论统计,我们可以解释数据。 社会统计的方法社会统计的方法 1.1.大量观察法大量观察法 所谓大量观察,即是就总体中所谓大量观察,即是就总体中 足够多的单位进行调查和足够多的单位进行调查和 综合分析,用以反映社会总体综合分析,用以反
5、映社会总体 的数量特征。的数量特征。 2.2.大数规律大数规律 随机现象出现的基本规律,其随机现象出现的基本规律,其 一般意义是:观察过程中每一般意义是:观察过程中每 次取得的结果可能不同次取得的结果可能不同( (因为因为 具有偶然性具有偶然性) ),但大量重复观,但大量重复观 察结果的平均值却几乎接近察结果的平均值却几乎接近 某个确定的数值。某个确定的数值。 所谓描述统计就是讨论所谓描述统计就是讨论 范围仅以搜集资料本身为范围仅以搜集资料本身为 限,而不予以扩大。限,而不予以扩大。 所谓推论统计,主要是所谓推论统计,主要是 依据概率论,研究如何依据概率论,研究如何 依据有限资料对总体性依据有
6、限资料对总体性 质作推断,从而使统计质作推断,从而使统计 的功能大为扩充。的功能大为扩充。 假设检验假设检验 参数估计参数估计 社会统计工作的程序社会统计工作的程序 制制 定定 计计 划划 统统 计计 调调 查查 统统 计计 整整 理理 统统 计计 分分 析析 统统 计计 报报 告告 如何学习统计学?如何学习统计学? 树立信心树立信心 培养兴趣培养兴趣 由浅入深,逐步推进。由浅入深,逐步推进。 仔细阅读你的教材仔细阅读你的教材 按时完成练习。按时完成练习。 多多留意报刊、杂志甚至学术期刊上的统计实例。多多留意报刊、杂志甚至学术期刊上的统计实例。 多多使用统计软件练习数据分析。多多使用统计软件练
7、习数据分析。 第一章第一章 社会学研究与统计分析社会学研究与统计分析 第一节 社会学研究的科学性 科学的研究逻辑科学的研究逻辑 操作化操作化 通过对理论的演绎建立研究假设通过对理论的演绎建立研究假设 科学实验科学实验 得出结论得出结论 社会科学研究的一般过程社会科学研究的一般过程 确定课题、了解情况确定课题、了解情况 建立研究假设建立研究假设 概念的操作化概念的操作化 设计问卷、抽样调查设计问卷、抽样调查 统计分析统计分析 假设检验、得出结论假设检验、得出结论 案例:在校大学生的恋爱行为是否存在性别差异?案例:在校大学生的恋爱行为是否存在性别差异? 谁更需要爱情?男生还是女生?谁更需要爱情?男
8、生还是女生? 事实上,社会调查与统计推论是大多数事实上,社会调查与统计推论是大多数“社会科学社会科学”之所以称之为之所以称之为 “ “科学科学” ” 的基石!的基石! u概念(概念(Concept):人们对事物本质的认识,是研究的基):人们对事物本质的认识,是研究的基 本单位,具有抽象性。本单位,具有抽象性。 u定义(定义(Definition):将概念呈现、描述出来,从而明确):将概念呈现、描述出来,从而明确 认识对象。认识对象。 u操作化定义(操作化定义(Operational definition):用一系列可以观):用一系列可以观 察、可以测量的指标来模拟或表述定义,使得非量化的概念得
9、察、可以测量的指标来模拟或表述定义,使得非量化的概念得 以运算并得以操作测量。以运算并得以操作测量。 概念概念抽象定义抽象定义操作化定义操作化定义 都市化都市化现代都市的生活形现代都市的生活形 态态 妇女就业人数、子女数、交妇女就业人数、子女数、交 通;通讯手段等通;通讯手段等 个人现代化个人现代化一个人由于经济、一个人由于经济、 工业等现代因素所工业等现代因素所 产生的内部变化产生的内部变化 对时间、效率、家庭、亲属对时间、效率、家庭、亲属 、消费、自信等具体问题的、消费、自信等具体问题的 看法看法 子代偏重子代偏重经济上、感情上和经济上、感情上和 生活上对子代过分生活上对子代过分 的偏重的
10、偏重 子代抚育费与家庭平均消费子代抚育费与家庭平均消费 的比较、子代过生日的花费的比较、子代过生日的花费 与长辈生日花费的比较、花与长辈生日花费的比较、花 在子代闲暇时间的多少等在子代闲暇时间的多少等 开始学习社会统计学之前的知识储备开始学习社会统计学之前的知识储备 什么是变量?什么是变量? 变量有哪些层次?变量有哪些层次? 不同类型变量的统计表制作方法?不同类型变量的统计表制作方法? 总体与单位总体与单位 所谓总体,就是作为统计研究对象的、由许多具有共性的单位所谓总体,就是作为统计研究对象的、由许多具有共性的单位 构成的整体。总体也有人称之为母体。构成的整体。总体也有人称之为母体。 构成总体
11、的每一个个体构成总体的每一个个体 称为总体单位,简称单位,也称为个体。称为总体单位,简称单位,也称为个体。 有限总体与无限总体有限总体与无限总体 可加总体与不可加总体可加总体与不可加总体 总体在抽样调查及推论统计中,还引出了它与样本总体这个概念总体在抽样调查及推论统计中,还引出了它与样本总体这个概念 的联系与区别。推论统计有的联系与区别。推论统计有“部分推断总体部分推断总体”的特征。通过抽样得到的特征。通过抽样得到 的用以推断总体特征的那个的用以推断总体特征的那个“部分部分”,在统计学上称为样本或样本总,在统计学上称为样本或样本总 体。样本中所含的单位数,在统计学上称为样本大小,也叫做样本容体
12、。样本中所含的单位数,在统计学上称为样本大小,也叫做样本容 量。从总体抽选出样本的过程叫抽样,也有叫取样的。量。从总体抽选出样本的过程叫抽样,也有叫取样的。 二者是互为存在条件地联结在一起的,二者的地位在某种意义上不是二者是互为存在条件地联结在一起的,二者的地位在某种意义上不是 固定不变的。固定不变的。 1 1、相互依存关系。、相互依存关系。 2 2、当研究目的和研究范围变动,总体和个体可以相互转化、当研究目的和研究范围变动,总体和个体可以相互转化。 总体的特征:总体的特征: 大量性、同质性和差异性。总体的这三个特征是缺一不可的。大量性、同质性和差异性。总体的这三个特征是缺一不可的。 大量性是
13、条件、同质性是基础,差异性是前提。大量性是条件、同质性是基础,差异性是前提。 样本 样本是从总体中抽取的一部分个体所组成的集合,也称子样。样本是从总体中抽取的一部分个体所组成的集合,也称子样。 样本容量是指样本所包含的个体数。当样本容量大于样本容量是指样本所包含的个体数。当样本容量大于30时,为大样本。时,为大样本。 样本个数是指从总体中最多可以抽取的不同样本的套数。样本个数是指从总体中最多可以抽取的不同样本的套数。样本样本容量用 n表示。样本个数用m表示。 总体与样本的关系总体与样本的关系 1 1、总体是所要研究的对象,而样本则是所要观测的对象。、总体是所要研究的对象,而样本则是所要观测的对
14、象。 2 2、样本是用来推断总体的。、样本是用来推断总体的。 3 3、总体和样本的角色是可以改变的。、总体和样本的角色是可以改变的。 4 4、总体与样本都有大量性,同质性和差异性的特征。样本容量用、总体与样本都有大量性,同质性和差异性的特征。样本容量用n n表示。样本个表示。样本个 数用数用m m表示。表示。 变量(变量(VariablesVariables)在统计学中表示研究对象的特征,变量下的在统计学中表示研究对象的特征,变量下的 各种表现形式或不同取值,就是变量值。各种表现形式或不同取值,就是变量值。 变量变量 变量变量变量值变量值 性别性别 家庭子女数家庭子女数 重要性重要性 文化程度
15、文化程度 男;女男;女 1 1个;个;2 2个;个;3 3个;个; 非常重要;一般;不重要非常重要;一般;不重要 大学;中学;小学;文盲大学;中学;小学;文盲 变量取值时注意的问题:变量取值时注意的问题: 完备性完备性 互斥性互斥性 单变量分析单变量分析变量的分布(变量的分布(frequency distributionfrequency distribution) 分布分布某个变量的变量值出现的次数或频次,也称频次分布某个变量的变量值出现的次数或频次,也称频次分布。 例:家庭结构(变量例:家庭结构(变量X X)可能的取值包括:)可能的取值包括: X X1 1由父母和未婚子女组成的核心家庭由父
16、母和未婚子女组成的核心家庭 X X2 2由父母和单一已婚子女组成的三代人家庭,即主由父母和单一已婚子女组成的三代人家庭,即主 干家庭干家庭 X X3 3由父母和多对已婚子女所组成的三代人家庭,即由父母和多对已婚子女所组成的三代人家庭,即 联合家庭联合家庭 如果我们将调查结果按照被访人的回答,分别如果我们将调查结果按照被访人的回答,分别 归入上述三类,于是有以下三对数据:归入上述三类,于是有以下三对数据: (X1 ,n1) (X2,n2) (X3,n3) (Xk,nk) 其中其中Xi表示变量表示变量X的第的第i个取个取 值;值; ni表示该取值所对应的次数表示该取值所对应的次数 所谓分布,实际上
17、就是这些所谓分布,实际上就是这些 对数据的集合。对数据的集合。 当当n n代表不同的含义时,表示不同的分布代表不同的含义时,表示不同的分布 如:如: 当当n n表示概率时,称作概率分布表示概率时,称作概率分布 当当n n表示频次时,称作频次分布表示频次时,称作频次分布 当当n n表示百分比时,称作频率或相对频次分布表示百分比时,称作频率或相对频次分布 家庭结构家庭结构频次频次 核心家庭核心家庭10501050 主干家庭主干家庭720720 联合家庭联合家庭110110 其其 他他250250 总总 数数21302130 家庭结构的频次分布 (XX地,XX年XX月) 家庭结构家庭结构百分比百分比
18、 核心家庭核心家庭49.349.3 主干家庭主干家庭33.833.8 联合家庭联合家庭5.25.2 其其 他他11.711.7 总和百分比总和百分比100100 家庭结构的百分比分布 (XX地,XX年XX月,N=2130) 正面次数概率 0 1 2 3 4 5 6 7 8 9 10 0.00 0.01 0.04 0.12 0.21 0.25 0.21 0.12 0.04 0.01 0.00 抛10次硬币正面出现次数的概率分布 第二节 社会调查资料的特点和统计学的运用 一、社会调查资料的特点:一、社会调查资料的特点: (一)随机性(一)随机性 确定性现象:确定性现象:“若若A,则必有则必有B”,
19、A与与B之间,存在确定性的函数关系。之间,存在确定性的函数关系。 非确定性现象:若非确定性现象:若A,则可能有则可能有B,或者,或者C;D;E。 f(A) B A B A ( (二二) )统计规律性统计规律性 表面杂乱无章的随机现象,实际上是有内在规律性的。统计规律性表表面杂乱无章的随机现象,实际上是有内在规律性的。统计规律性表 现为大量观察或试验中随机事件发生的频率的稳定性,即一个随机事现为大量观察或试验中随机事件发生的频率的稳定性,即一个随机事 件发生的频率经常在某个定值附近摆动,而且,试验次数越多,一般件发生的频率经常在某个定值附近摆动,而且,试验次数越多,一般 摆动越少。摆动越少。 二
20、、统计学的运用二、统计学的运用 介绍有关社会调查资料收集、整理、分析和介绍有关社会调查资料收集、整理、分析和 推论的统计方法。推论的统计方法。 社会统计学的特点:社会统计学的特点: 抽象概念向操作化定义,设计好调查问卷;抽象概念向操作化定义,设计好调查问卷; 被测量对象是人,主观意识影响资料收集;被测量对象是人,主观意识影响资料收集; 低层次变量占较大比重。低层次变量占较大比重。 三、统计分析的作用及主要内容三、统计分析的作用及主要内容 统计分析在社会调查研究中的功用,统计分析在社会调查研究中的功用, 主要表现在经验层次的大面积数据处理方面主要表现在经验层次的大面积数据处理方面 。 统计结果不
21、能轻率的作出因果的结论。统计结果不能轻率的作出因果的结论。 例:(例:(P15-表表1-10和表和表1-11) 社会科学研究的一般过程社会科学研究的一般过程 确定课题、了解情况确定课题、了解情况 建立研究假设建立研究假设 概念的操作化概念的操作化 设计问卷、抽样调查设计问卷、抽样调查 统计分析统计分析 假设检验、得出结论假设检验、得出结论 统计分析内容主要分为:统计分析内容主要分为: 统计描述和统计推论统计描述和统计推论 第三节 怎样选用统计分析方法 一、全面调查和非全面调查一、全面调查和非全面调查 全面调查全面调查是对所研究全部对象进行观察与调查,从而掌握整个单位的全是对所研究全部对象进行观
22、察与调查,从而掌握整个单位的全 部资料。对全面调查,一般可用统计描述。统计描述是将所观察的数部资料。对全面调查,一般可用统计描述。统计描述是将所观察的数 据、资料,进行整理、归纳和分析,以期找到某种规律。据、资料,进行整理、归纳和分析,以期找到某种规律。 非全面调查非全面调查是在全部研究对象中只调查其中的一部分。在非全面调查中是在全部研究对象中只调查其中的一部分。在非全面调查中 ,以概率抽样法最重要。,以概率抽样法最重要。 抽样调查是在一定条件下,科学、客观的抽取总体中一部分单位来加以抽样调查是在一定条件下,科学、客观的抽取总体中一部分单位来加以 研究,其目的是获得对于总体性质的正确叙述。研究
23、,其目的是获得对于总体性质的正确叙述。 二、单变量和多变量二、单变量和多变量 单变量单变量主要调查的内容是一个或多个相互独立的概念,需要对每个独立主要调查的内容是一个或多个相互独立的概念,需要对每个独立 的变量研究其变动情况和频次,及集中和分散的特征。的变量研究其变动情况和频次,及集中和分散的特征。 二变量二变量研究两个变量之间是否存在关系及关系密切程度,及研究结论是研究两个变量之间是否存在关系及关系密切程度,及研究结论是 否可以推断整体。否可以推断整体。 多变量多变量研究多种关系,一因多果和一果多因。研究多种关系,一因多果和一果多因。 单变量分析单变量分析变量的分布(变量的分布(freque
24、ncy distributionfrequency distribution) 分布分布某个变量的变量值出现的次数或频次,也称频次分布某个变量的变量值出现的次数或频次,也称频次分布。 例:家庭结构(变量例:家庭结构(变量X X)可能的取值包括:)可能的取值包括: X X1 1由父母和未婚子女组成的核心家庭由父母和未婚子女组成的核心家庭 X X2 2由父母和单一已婚子女组成的三代人家庭,即主由父母和单一已婚子女组成的三代人家庭,即主 干家庭干家庭 X X3 3由父母和多对已婚子女所组成的三代人家庭,即由父母和多对已婚子女所组成的三代人家庭,即 联合家庭联合家庭 两变量关系两变量关系命题的研究命题
25、的研究 两个变量之间是否存在关系?关系的密切程度(强度)如两个变量之间是否存在关系?关系的密切程度(强度)如 何?何? 自变量(自变量(independent variableindependent variable):也叫独立变量,由研):也叫独立变量,由研 究者主动操纵,或被研究者界定为不受其他变量影响,独立究者主动操纵,或被研究者界定为不受其他变量影响,独立 变化的变量。变化的变量。 因变量(因变量(dependent variabledependent variable):也叫依变量,指受其他):也叫依变量,指受其他 变量影响,随其他变量变化的变量。变量影响,随其他变量变化的变量。 自
26、变量与因变量是就因果关系而言的,判断自变量与因变自变量与因变量是就因果关系而言的,判断自变量与因变 量的标准:量的标准: (1)时间的先后。由于后发生者无法影响先发生者,所以)时间的先后。由于后发生者无法影响先发生者,所以 先发生者是自变量;先发生者是自变量; (2)变量的不变性与可变性。在社会研究中常将一些具有)变量的不变性与可变性。在社会研究中常将一些具有 固定性、持久性的变量作为自变量。固定性、持久性的变量作为自变量。 对于多变量的研究,情况更为复杂,它们除了两两之间可对于多变量的研究,情况更为复杂,它们除了两两之间可 能存在联系,而且还可能存在网状、链状、一因多果或一能存在联系,而且还
27、可能存在网状、链状、一因多果或一 果多因等多种联系,这些都属于更高层次的统计技巧。果多因等多种联系,这些都属于更高层次的统计技巧。 1 1、定类层次变量(、定类层次变量(Nominal VariableNominal Variable):): 变量取值只有类别属性之分,根据变量值,只能知道研究对象是相变量取值只有类别属性之分,根据变量值,只能知道研究对象是相 同或是不同。从数学运算特征来看,只具有等于或不等于(同或是不同。从数学运算特征来看,只具有等于或不等于(= =、 )的性质。例如:性别。)的性质。例如:性别。 变量层次变量层次 2 2、定序层次变量(、定序层次变量(Ordinal Var
28、iableOrdinal Variable):): 变量取值除了有类别属性之外,还有等级,次序的差别,其数学特性变量取值除了有类别属性之外,还有等级,次序的差别,其数学特性 除了(除了(= =、)之外,还有大于或小于()之分。例如文化程度、)之外,还有大于或小于()之分。例如文化程度、 社会经济地位等。社会经济地位等。 20112011中国大学排行榜中国大学排行榜 10中山大学中山大学广东广东综合综合33.7734.4729.6042.61 28华南理工大学华南理工大学广东广东理工理工16.7315.3614.1033.21 63暨南大学暨南大学广东广东综合综合8.206.947.0318.7
29、9 71华南师范大学华南师范大学广东广东师范师范6.644.037.7413.34 74华南农业大学华南农业大学广东广东农林农林6.156.175.856.03 102南方医科大学南方医科大学广东广东医药医药4.363.784.545.46 108深圳大学深圳大学广东广东综合综合3.944.212.807.26 128广州中医药大学广州中医药大学广东广东医药医药3.162.831.6411.76 173广州大学广州大学广东广东综合综合1.842.061.213.40 名次名次学校名称学校名称 所在省所在省 市市 类型类型总分总分科学研究科学研究 人才培人才培 养养 综合声综合声 誉誉 3 3、
30、定距层次变量(、定距层次变量(Interval VariableInterval Variable):变量取值除了有类别、):变量取值除了有类别、 次序属性之外,取值之间的距离还可以用标准化的距离去量度。次序属性之外,取值之间的距离还可以用标准化的距离去量度。 其数学特性除了(其数学特性除了(= =、;)之外,还可以进行加或减(;)之外,还可以进行加或减(+ +,- - )。例如智商。)。例如智商。 4 4、定比层次变量(、定比层次变量(Ratio VariableRatio Variable):变量取值除了有上述三种):变量取值除了有上述三种 属性之外,其取值还可以构成一个有意义的比率,其数
31、学特性除了属性之外,其取值还可以构成一个有意义的比率,其数学特性除了 (= =、;+ +,- -)之外,还可以进行除法运算。例如年龄。)之外,还可以进行除法运算。例如年龄。 定比变量和定距变量的差别在于前者有一个真正有意义的零点。定比变量和定距变量的差别在于前者有一个真正有意义的零点。 1 1、高层次的变量包含低层次变量的数学特征。、高层次的变量包含低层次变量的数学特征。 变量层次的比较变量层次的比较 2 2、在社会学研究中,一般不区分定距和定比变量,而是当作一类,称、在社会学研究中,一般不区分定距和定比变量,而是当作一类,称 作定距变量。作定距变量。 4 4、变量的层次与社会实际衡量之间有可
32、能存在着差距或不一致性、变量的层次与社会实际衡量之间有可能存在着差距或不一致性。 5 5、根据研究内容不同,变量的层次也可能不同、根据研究内容不同,变量的层次也可能不同 3 3、一个变量的层次并不是唯一的。高层次的变量可以作为低层次变量、一个变量的层次并不是唯一的。高层次的变量可以作为低层次变量 来使用,但是会使资料的信息使用不完全。来使用,但是会使资料的信息使用不完全。 层 次 数学运 算特征 定类定序定距定比 =, , +,- , 统计分析统计分析 全面调查全面调查 多变量单变量 定 距 定 序 定 类 定 距 定 序 定 类 抽样调查抽样调查 其他非概其他非概 率抽样率抽样 多变量 定
33、距 定 序 定 类 单变量 定 距 定 序 定 类 统计描述 统计推论 应用应用如何制作不同类型的单变量统计表?如何制作不同类型的单变量统计表? 1 1、定类单变量统计表、定类单变量统计表 性别性别 频次频次 百分比百分比 男男 女女 2747 1559 63.8 36.2 总计总计 4306 100 表表1:微博用户的性别统计表:微博用户的性别统计表 (N=4306) (资料来源:(资料来源:SSI在线样本库,调查地包括北京、在线样本库,调查地包括北京、 上海、广州、深圳、成都、沈阳、西安、杭州上海、广州、深圳、成都、沈阳、西安、杭州 八市)八市) 表头表头 表号表号 标识行标识行 主体行主
34、体行 表尾表尾 2 2、定序单变量统计表、定序单变量统计表 表表2:微博用户的教育程度统计:微博用户的教育程度统计 (N=4306) 受教育程度受教育程度频数频数百分比百分比 初中及以下初中及以下 高中、职高、技校高中、职高、技校 大专大专 大学本科大学本科 研究生及以上研究生及以上 17 237 866 2752 434 0.4 5.5 20.1 63.9 10.1 总计总计4306100 (资料来源:(资料来源:SSI在线样本库,调查地包括北京、上海、广州、在线样本库,调查地包括北京、上海、广州、 深圳、成都、沈阳、西安、杭州八市)深圳、成都、沈阳、西安、杭州八市) 3 3、定距和定比单变
35、量统计表、定距和定比单变量统计表 定距和定比变量的两种类型:定距和定比变量的两种类型: 离散型变量离散型变量取值为有限个或列为有限个,如子女数取值为有限个或列为有限个,如子女数 连续型变量连续型变量取值为有限或无限区间内的任意实数,即变量的取值取值为有限或无限区间内的任意实数,即变量的取值 连续,如身高连续,如身高 若变量为离散型变量,且取值相对较少,可以按照定类或定序统计表方若变量为离散型变量,且取值相对较少,可以按照定类或定序统计表方 式统计频次或百分比。式统计频次或百分比。 若变量为连续型变量,则需要将变量值分为若干个区间或组,统计每一若变量为连续型变量,则需要将变量值分为若干个区间或组,统计每一 个组内的频次或百分比。个组内的频次或百分比。 数据分组时需要考虑的几个问题:数据分组时需要考虑的几个问题: A 组数组数 B 组距组距 C 组限组限 如何制作分组统计表如何制作分组统计表 1、确定组数:一般调查总数、确定组数:一般调查总数N与分组数有如下经验关系与分组数有如下经验关系 调查总数调查总数N分组数分组数K 50100610 100250712 250以上以上1020 2、确定组距:分为等距分组与非等距分组,一般来说为等距分组、确定组距:分为等距分组与非等距分组,一般来说为等距分组 等距分组组距计算公式:组距(等距分组组距计算公式:组距(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吸痰护理的跨学科合作模式
- 护理病历书写的基本格式与要求
- 护理诊断方法
- 旅游公司市场部负责人的岗位职责与要求
- 快消品行业市场部主管的求职攻略
- 基于自然环境特征的现代社区规划案例
- 基于分布式架构的数据快速高效迁徙方法研究
- 快递行业市场推广岗位面试技巧
- 智能仓储自动化作业系统集成建设方案
- 联想集团销售经理面试要点详解
- 历年中职高考《畜禽营养与饲料》考试真题题库(含答案)
- 初中英语阅读-篇章结构强化练习(附答案)
- 律师事务所投标书(文档)
- 产钳助产护理查房范文
- 公司规章制度及公司规章制度汇编
- ISO22000-2018全套程序文件模板
- 芯片提取基础知识课件
- 《预防血管内导管相关血流感染过程质控工具包》解读
- JJF 1033-2023计量标准考核规范
- 《中国饮食文化》第1章 中国饮食文化的历史发展
- 回顺炮掘工程施工组织设计
评论
0/150
提交评论