社会统计学(第一讲)_第1页
社会统计学(第一讲)_第2页
社会统计学(第一讲)_第3页
社会统计学(第一讲)_第4页
社会统计学(第一讲)_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学

(SocialStatistics)引子:在学统计学之前,我们需要了解……为什么要学统计学?统计学是什么?如何学习统计学?科学只有当它利用了数学的时候,它才达到了完善的程度。——马克思

对于追求效率的公民而言,统计思维总有一天会和读写能力一样必要。

——H.G.Wells社会统计学是社会学十门必修课中的一门,它与“社会学调查研究方法”结合起来,完整的介绍了当代社会调查研究的科学方法与资料处理技术。社会统计学侧重于介绍资料的收集、整理、分析和推论的处理技术。社会统计学的发展统计学的两大流派:数理统计学派和社会统计学派数理统计学派的原创始人是比利时的A·凯特靳,其最大的贡献就是将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究;社会统计学派的首倡者是德国的K·克尼斯,他认为统计研究的对象是社会现象,研究方法为大量观察法。社会统计学的两大流派社会指标学派描述统计学派统计学是什么?——概念与内涵

统计学是描述一系列可用于描述、整理和解释资料或数据的统计工具和技术。社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法与技术。

统计学的基本分类:描述统计与推断统计

描述统计(DescriptiveStatistics):用于整理、描述所收集的数据的特征推论统计(InferentialStatistics):利用较小群体的数据(样本)来推论可能的较大群体(总体),通过推论统计,我们可以解释数据。社会统计的方法1.大量观察法所谓大量观察,即是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。

2.大数规律随机现象出现的基本规律,其一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。所谓描述统计就是讨论范围仅以搜集资料本身为限,而不予以扩大。

所谓推论统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。

假设检验

参数估计

社会统计工作的程序制定计划

统计调查统计整理统计分析统计报告如何学习统计学?树立信心培养兴趣由浅入深,逐步推进。仔细阅读你的教材按时完成练习。多多留意报刊、杂志甚至学术期刊上的统计实例。多多使用统计软件练习数据分析。第一章社会学研究与统计分析第一节社会学研究的科学性

科学的研究逻辑操作化通过对理论的演绎建立研究假设科学实验得出结论社会科学研究的一般过程确定课题、了解情况建立研究假设概念的操作化设计问卷、抽样调查统计分析假设检验、得出结论案例:在校大学生的恋爱行为是否存在性别差异?——谁更需要爱情?男生还是女生?事实上,社会调查与统计推论是大多数“社会科学”之所以称之为“科学”的基石!概念(Concept):人们对事物本质的认识,是研究的基本单位,具有抽象性。定义(Definition):将概念呈现、描述出来,从而明确认识对象。操作化定义(Operationaldefinition):用一系列可以观察、可以测量的指标来模拟或表述定义,使得非量化的概念得以运算并得以操作测量。概念抽象定义操作化定义都市化现代都市的生活形态妇女就业人数、子女数、交通;通讯手段等个人现代化一个人由于经济、工业等现代因素所产生的内部变化对时间、效率、家庭、亲属、消费、自信等具体问题的看法子代偏重经济上、感情上和生活上对子代过分的偏重子代抚育费与家庭平均消费的比较、子代过生日的花费与长辈生日花费的比较、花在子代闲暇时间的多少等开始学习社会统计学之前的知识储备什么是变量?变量有哪些层次?不同类型变量的统计表制作方法?总体与单位所谓总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。总体也有人称之为母体。构成总体的每一个个体称为总体单位,简称单位,也称为个体。

有限总体与无限总体可加总体与不可加总体

总体在抽样调查及推论统计中,还引出了它与样本总体这个概念的联系与区别。推论统计有“部分推断总体”的特征。通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为样本或样本总体。样本中所含的单位数,在统计学上称为样本大小,也叫做样本容量。从总体抽选出样本的过程叫抽样,也有叫取样的。二者是互为存在条件地联结在一起的,二者的地位在某种意义上不是固定不变的。

1、相互依存关系。

2、当研究目的和研究范围变动,总体和个体可以相互转化。总体的特征:大量性、同质性和差异性。总体的这三个特征是缺一不可的。大量性是条件、同质性是基础,差异性是前提。样本

样本是从总体中抽取的一部分个体所组成的集合,也称子样。样本容量是指样本所包含的个体数。当样本容量大于30时,为大样本。样本个数是指从总体中最多可以抽取的不同样本的套数。样本容量用n表示。样本个数用m表示。

总体与样本的关系1、总体是所要研究的对象,而样本则是所要观测的对象。2、样本是用来推断总体的。3、总体和样本的角色是可以改变的。4、总体与样本都有大量性,同质性和差异性的特征。样本容量用n表示。样本个数用m表示。

变量(Variables)——在统计学中表示研究对象的特征,变量下的各种表现形式或不同取值,就是变量值。变量变量变量值性别家庭子女数重要性文化程度男;女1个;2个;3个;…非常重要;一般;不重要大学;中学;小学;文盲变量取值时注意的问题:完备性互斥性单变量分析——变量的分布(frequencydistribution)分布——某个变量的变量值出现的次数或频次,也称频次分布。例:家庭结构(变量X)可能的取值包括:X1——由父母和未婚子女组成的核心家庭X2——由父母和单一已婚子女组成的三代人家庭,即主干家庭X3——由父母和多对已婚子女所组成的三代人家庭,即联合家庭

如果我们将调查结果按照被访人的回答,分别归入上述三类,于是有以下三对数据:(X1,n1)(X2,n2)(X3,n3)

(Xk,nk)

其中Xi表示变量X的第i个取值;ni表示该取值所对应的次数所谓分布,实际上就是这些对数据的集合。当n代表不同的含义时,表示不同的分布如:当n表示概率时,称作概率分布当n表示频次时,称作频次分布当n表示百分比时,称作频率或相对频次分布家庭结构频次核心家庭1050主干家庭720联合家庭110其他250总数2130家庭结构的频次分布(XX地,XX年XX月)家庭结构百分比核心家庭49.3主干家庭33.8联合家庭5.2其他11.7总和百分比100家庭结构的百分比分布(XX地,XX年XX月,N=2130)正面次数概率0123456789100.000.010.040.120.210.250.210.120.040.010.00抛10次硬币正面出现次数的概率分布第二节社会调查资料的特点和统计学的运用一、社会调查资料的特点:(一)随机性确定性现象:“若A,则必有B”,A与B之间,存在确定性的函数关系。非确定性现象:若A,则可能有B,或者C;D;E。f(A)BA●●●●●●●●●●●●●●●●●●●●●BA(二)统计规律性表面杂乱无章的随机现象,实际上是有内在规律性的。统计规律性表现为大量观察或试验中随机事件发生的频率的稳定性,即一个随机事件发生的频率经常在某个定值附近摆动,而且,试验次数越多,一般摆动越少。二、统计学的运用介绍有关社会调查资料收集、整理、分析和推论的统计方法。社会统计学的特点:抽象概念向操作化定义,设计好调查问卷;被测量对象是人,主观意识影响资料收集;低层次变量占较大比重。三、统计分析的作用及主要内容统计分析在社会调查研究中的功用,主要表现在经验层次的大面积数据处理方面。统计结果不能轻率的作出因果的结论。例:(P15-表1-10和表1-11)社会科学研究的一般过程确定课题、了解情况建立研究假设概念的操作化设计问卷、抽样调查统计分析假设检验、得出结论统计分析内容主要分为:统计描述和统计推论第三节怎样选用统计分析方法

一、全面调查和非全面调查全面调查是对所研究全部对象进行观察与调查,从而掌握整个单位的全部资料。对全面调查,一般可用统计描述。统计描述是将所观察的数据、资料,进行整理、归纳和分析,以期找到某种规律。非全面调查是在全部研究对象中只调查其中的一部分。在非全面调查中,以概率抽样法最重要。抽样调查是在一定条件下,科学、客观的抽取总体中一部分单位来加以研究,其目的是获得对于总体性质的正确叙述。二、单变量和多变量单变量主要调查的内容是一个或多个相互独立的概念,需要对每个独立的变量研究其变动情况和频次,及集中和分散的特征。二变量研究两个变量之间是否存在关系及关系密切程度,及研究结论是否可以推断整体。多变量研究多种关系,一因多果和一果多因。单变量分析——变量的分布(frequencydistribution)分布——某个变量的变量值出现的次数或频次,也称频次分布。例:家庭结构(变量X)可能的取值包括:X1——由父母和未婚子女组成的核心家庭X2——由父母和单一已婚子女组成的三代人家庭,即主干家庭X3——由父母和多对已婚子女所组成的三代人家庭,即联合家庭

两变量关系——命题的研究两个变量之间是否存在关系?关系的密切程度(强度)如何?自变量(independentvariable):也叫独立变量,由研究者主动操纵,或被研究者界定为不受其他变量影响,独立变化的变量。因变量(dependentvariable):也叫依变量,指受其他变量影响,随其他变量变化的变量。

自变量与因变量是就因果关系而言的,判断自变量与因变量的标准:(1)时间的先后。由于后发生者无法影响先发生者,所以先发生者是自变量;(2)变量的不变性与可变性。在社会研究中常将一些具有固定性、持久性的变量作为自变量。对于多变量的研究,情况更为复杂,它们除了两两之间可能存在联系,而且还可能存在网状、链状、一因多果或一果多因等多种联系,这些都属于更高层次的统计技巧。1、定类层次变量(NominalVariable):变量取值只有类别属性之分,根据变量值,只能知道研究对象是相同或是不同。从数学运算特征来看,只具有等于或不等于(=、≠)的性质。例如:性别。变量层次2、定序层次变量(OrdinalVariable):变量取值除了有类别属性之外,还有等级,次序的差别,其数学特性除了(=、≠)之外,还有大于或小于(><)之分。例如文化程度、社会经济地位等。2011中国大学排行榜10中山大学广东综合33.7734.4729.6042.6128华南理工大学广东理工16.7315.3614.1033.2163暨南大学广东综合8.206.947.0318.7971华南师范大学广东师范6.644.037.7413.3474华南农业大学广东农林6.156.175.856.03102南方医科大学广东医药4.363.784.545.46108深圳大学广东综合3.944.212.807.26128广州中医药大学广东医药3.162.831.6411.76173广州大学广东综合1.842.061.213.40名次学校名称所在省市类型总分科学研究人才培养综合声誉3、定距层次变量(IntervalVariable):变量取值除了有类别、次序属性之外,取值之间的距离还可以用标准化的距离去量度。其数学特性除了(=、≠;><)之外,还可以进行加或减(+,-)。例如智商。4、定比层次变量(RatioVariable):变量取值除了有上述三种属性之外,其取值还可以构成一个有意义的比率,其数学特性除了(=、≠;><;+,-)之外,还可以进行除法运算。例如年龄。定比变量和定距变量的差别在于前者有一个真正有意义的零点。1、高层次的变量包含低层次变量的数学特征。

变量层次的比较2、在社会学研究中,一般不区分定距和定比变量,而是当作一类,称作定距变量。4、变量的层次与社会实际衡量之间有可能存在着差距或不一致性。5、根据研究内容不同,变量的层次也可能不同3、一个变量的层次并不是唯一的。高层次的变量可以作为低层次变量来使用,但是会使资料的信息使用不完全。层次数学运算特征定类定序定距定比=,≠√√√√<,>√√√+,-√√×,÷√统计分析全面调查多变量单变量定距定序定类定距定序定类抽样调查其他非概率抽样多变量定距定序定类单变量定距定序定类统计描述统计推论应用——如何制作不同类型的单变量统计表?1、定类单变量统计表性别频次百分比男女2747155963.836.2总计4306100表1:微博用户的性别统计表(N=4306)(资料来源:SSI在线样本库,调查地包括北京、上海、广州、深圳、成都、沈阳、西安、杭州八市)

表头

表号标识行

主体行表尾2、定序单变量统计表表2:微博用户的教育程度统计(N=4306)受教育程度频数百分比初中及以下高中、职高、技校大专大学本科研究生及以上1723786627524340.45.520.163.910.1总计4306100(资料来源:SSI在线样本库,调查地包括北京、上海、广州、深圳、成都、沈阳、西安、杭州八市)3、定距和定比单变量统计表定距和定比变量的两种类型:离散型变量——取值为有限个或列为有限个,如子女数连续型变量——取值为有限或无限区间内的任意实数,即变量的取值连续,如身高若变量为离散型变量,且取值相对较少,可以按照定类或定序统计表方式统计频次或百分比。若变量为连续型变量,则需要将变量值分为若干个区间或组,统计每一个组内的频次或百分比。数据分组时需要考虑的几个问题:

A组数B组距C组限如何制作分组统计表1、确定组数:一般调查总数N与分组数有如下经验关系调查总数N分组数K50~1006~10100~2507~12250以上10~202、确定组距:分为等距分组与非等距分组,一般来说为等距分组等距分组组距计算公式:组距(h)=(最大值-最小值)/组数斯特格斯(Sturges)经验公式确定组数:K=1+3.322lgN3、确定组限:一个组的最小值叫下限,最大值叫上限各组中心值bi计算公式4、分组原则:不重复、不遗漏,组上限不在内5、中心值计算缺上限开口组组中值bi=下限+邻组组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论