社会调查原理与方法(授课版)_第1页
社会调查原理与方法(授课版)_第2页
社会调查原理与方法(授课版)_第3页
社会调查原理与方法(授课版)_第4页
社会调查原理与方法(授课版)_第5页
已阅读5页,还剩234页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、社会调查原理与方法,尚艳春,主要内容,导论选题和文献回顾研究设计测量和操作化调查问卷的设计及资料收集抽样定量资料分析其他几种研究类型调查报告的撰写,第一章导论,第一节社会调查的含义与特征第二节社会调查研究的方法论体系第三节定量研究和定性研究第四节研究过程,第一节社会调查的含义与特征,一、社会调查的含义社会调查的定义:我们学习社会调查的目的和意义:(1)提高社会调查的自觉性(2)提高社会调查的科学性如何学习社会调查方法:(1)理论基础的积累(2)实践经验的获取,研究主题是社会的,而非自然的研究方式是经验的,而非思辨的研究问题是科学的,而非判断的,二、社会调查的特征,三、社会调查中的困难,人的特殊

2、性研究的干扰性社会现象的复杂性特定因素的制约价值中立面临挑战,第二节社会调查研究的方法论体系,一、方法论方法论体系的内容方法论体系的分类(1)实证主义方法论倾向(2)人文主义方法论倾向,研究方式的分类:调查研究实验研究实地研究文献研究,二、研究方式,社会研究的基本方式简介,具体方法和技术,1、具体方法和技术的含义:2、具体方法和技术的特点:专门性技术性操作性,3、方法论体系的总结,社会研究方法论体系,基本方式,方法论,具体方法技术,哲学基础逻辑范式价值客观性,调查研究实验研究文献研究实地研究,问卷法访问法观察法量表法抽样方法测量方法统计分析方法定性资料分析方法计算机应用技术,社会研究方法体系中

3、各部分之间的关系,方法论,研究方式,具体的方法和技术,第三节定量研究和定性研究,一、方法论背景定量研究的方法论背景:实证主义方法论定性研究的方法论背景:人文主义方法论,二、定量研究与定性研究的比较,侧重点不同研究范式不同逻辑过程不同研究者的价值要求不同理论与研究者的关系不同研究方式不同,三、对定量研究和定性研究的总结,第四节研究过程,二、研究设计阶段三、研究实施阶段四、资料的分析阶段五、得出结果阶段,确立所要研究的内容,选择一个主题(chooseasubjectoratopic)。不断缩小范围,明确研究问题(focusquestion)。,一、问题的选择阶段,第二章选题和文献回顾,第一节研究问

4、题及其来源第二节选题的标准第三节研究问题的明确化,第一节研究问题及其来源,一、研究问题的概念(一)研究问题的概念(二)几个相近概念的区分,“下岗”,研究问题与社会问题和社会现象,社会问题来源于社会现象社会问题比社会现象或社会问题更明确具体集中结论:社会研究只能研究社会现象的某个点,即社会问题。,研究主题是社会现象所涉及的问题领域或现象领域研究主题比研究问题更为宽泛研究主题比研究问题更具一般性结论:一个研究主题可以包含很多个不同的研究问题研究问题的选择常常从比较宽泛的研究主题开始,逐步缩小到更为集中的研究问题,研究问题与研究主题,专业理论知识的掌握一定的研究方法知识比较开阔的视野、比较敏锐的洞察

5、力、比较强的判断力具有一定的社会生活经验,(三)与选题相关的能力要求,来源于现实生活来源于个人经历来源于相关文献对相关文献的阅读和关注擅于联想,二、研究问题的来源,第二节选题的标准,对一个全新问题的研究。研究思路、研究角度、依据的理论、研究对象、采用的方法及研究内容等方面的创新。,一、重要性二、创造性,客观条件研究者自身条件,三、可行性,四、合适性,第三节研究问题的明确化,一、缩小问题的内容范围二、清楚明确地陈述研究问题一个好的问题陈述应该具备两个基本特征:所陈述的问题必须在研究者能力范围内所陈述的问题不能太宽泛,问题陈述的注意事项:问题的陈述必须清楚明白,最好能用变量的语言,采用提问的方式。

6、除了描述研究以外,问题的陈述必须包括两个变量。问题的陈述必须是可检验的,即所研究的问题必须不止有一种回答。,第三章研究设计,第一节理论及其构成要素第二节研究目的第三节社会研究的其他分类标准第四节社会研究的分析单位及研究方式的选择第五节具体方案,第一节理论及其构成要素,一、什么是理论1美国哈珀柯林斯社会学词典的定义2美国社会学家默顿的观点3美国华裔社会学家林南的看法4美国社会学家巴比的解释5美国社会学家乔纳森特纳的总结,理论的特征:理论来自于经验的实践理论是一种抽象的、系统地认识理论的目标是对经验现实做出解释,理论,一种以系统化的方式将经验世界中某些被挑选的方面概念化组织起来的一组内在相关的命题

7、。,1宏观理论/一般性理论2中观理论/中层理论3微观理论三个重要特征:它是由一组命题组成这些命题在逻辑上相互联系的这些命题中的一部分可以通过经验检验,二、理论的层次:宏观、中观、微观,(一)概念1含义例:“电脑”2特征概念的抽象层次越高,越难以进行直接的观察和描述,它的涵盖面就越大,表达的意思也就越含糊。,三、理论的构成要素,例:,概念可以分为两种类型:仅仅标识某类现象例:“太阳”、“月亮”;包括若干个子范畴、属性或亚概念例:“性别:男女”,(二)变量1什么是“变量”(variable)?例:“性别”、“职业”、“文化水平”、“收入”2什么是常量?例:“太阳”、“房子”、“男人”,(三)命题和

8、假设1什么是命题(proposition)?例:“工业化水平很高”“工业化使得人际关系疏远”,2什么是假设(hypothesis)?例:“天才往往不幸福”“人们的智商与他们在幸福量表上的得分相关”,3.假设与命题的关系:假设是命题的特殊形式,假设的三种陈述方式:1条件式陈述:“如果A,则B”。2差异式陈述:“A不同,B也不同”,或者“A不同,B相同”。3函数式陈述:“A是B的函数:A=f(B)”。,第二节研究目的,一、探索性研究1探索性研究(explorationresearch)的含义2适用条件:(1)研究对象比较特殊,很少有人涉及;(2)研究者对所要研究的对象不太熟悉,或了解很少。,3探索

9、性研究的直接成果:(1)形成关于所研究现象或问题的初始命题或假设;(2)发展和尝试可用于更为深入地研究中的方法;(3)探讨进行更为系统、更为周密的研究的可能性。,4收集资料方法(1)参与观察(2)无结构访谈,1描述性研究(descriptiveresearch)的含义2特点:(1)系统性、结构性和全面性(2)样本规模较大,采取严格的随机抽样方法来选择研究对象(3)以问卷方式收集资料,以统计分析方式分析资料(4)结论可以推论总体,二、描述性研究,3注意事项:(1)描述的准确性(2)描述的概括性,1解释性研究(explanatoryresearch)的含义2特点:(1)系统性、周密性、适用性、针对

10、性(2)采用双变量或多变量的统计方式分析资料,三、解释性研究,3研究过程:,四、对三种不同目的研究类型的总结,第三节社会研究的其他分类标准,一、依据研究性质的不同进行分类1理论研究2应用性研究,1横向研究(cross-sectionalstudies)2纵向研究(longitudinalstudies)(1)趋势研究(trendstudies)(2)同期群研究(cohortstudies)(3)同组研究(panelstudies),二、从时间维度上进行分类,第四节社会研究的分析单位及研究方式的选择,一、分析单位的概念1定义2特点3分析单位与调查对象和研究内容或研究主题的区别,1个人2群体3组织

11、4社区5社会产品,二、分析单位的主要类型,三、与分析单位有关的两种错误,1区群谬误(ecologicalfallacy)2简化论(reductionism),研究现象的性质研究对象的规模研究所采用的分析单位研究所要达到的目标等,四、如何选择研究方式,第五节具体方案,一、说明研究课题的目的和意义二、说明研究的内容三、说明研究的理论假设四、说明研究的分析单位和抽样方案五、说明研究资料的收集方法与分析方法六、说明研究人员的组成、组织结构及培训安排七、确定研究的时间进度和经费使用计划,第四章测量和操作化,第一节测量的概念与层次第二节指数和量表第三节概念的操作化第四节测量的信度与效度,第一节测量的概念与

12、层次,一、什么是测量(measurement)二、测量的四个要素1测量的客体2测量内容3测量法则4数字和符号,1人既是测量的客体和对象,又是测量过程的主体。2存在“测不准”现象。3测量对象复杂,无法重复。,三、社会现象测量的特殊性,1定类测量(nominalmeasurement)又称为类别测量或定名测量实质上是一种分类体系,这种类别体系既有穷尽性,又有互斥性对称性和传递性和,四、测量层次,2.定序测量(ordinalmeasurement)又称为等级测量或顺序测量能够反映事物或现象的高低、大小、先后、强弱等序列上的差异可以转化为定类变量对称性、传递性、不对称性和,3定距测量(interval

13、measurement)又称为等距测量或区间测量除了可以比较大小,还可以计算相互之间的差异水平和差异值和,4定比测量(ratiomeasurement)又称为等比测量或比例测量和,5测量层次小结,第二节指数和量表,一、指数和量表的概念1指数(index):由多个不同的回答所构成的一个简单累加的分数,因而又将指数称作总加量表。,例:贝利生育意愿指数,2量表(scale):一种具有结构强度顺序的复合测量,全部陈述或项目都是按一定的结构顺序来安排,以反映出所测量的概念或态度所具有的各种程度。,例:政治参与程度量表,在每一行你选定的方框内打“”,请你对下面的看法发表意见,二、李克特量表,表格赋值规则:

14、赞成婚事大操大办,则非常同意=5,同意=4,无所谓=3,不同意=2,很不同意=1赞成节俭,则按非常同意=1,同意=2,无所谓=3,不同意=4,很不同意=5,将四种看法赋值,则上表转换为:,得分越高,越赞成大操大办,(1)围绕所要测量的内容以赞成和反对的方式写出与之相关的看法或陈述若干条,每个项目都有五个答案,并根据它们的方向分别赋以1、2、3、4、5分;(2)从所要测量的总体种选择一部分对象进行测试;(3)统计每位受测者在每条陈述上的得分,并将它们的总分计算出来;(4)计算每一条陈述的有效性,删除有效性不高的陈述,保留有效性高的陈述形成正式量表。,李克特量表的具体制作程序为:,社会距离量表:定

15、量地测量人们相互间交往的程度、相互关系的程度或者对某一群体所持的态度及所保持的距离。,三、鲍格达斯社会距离量表,例:鲍格达斯社会距离量表,1语义差异量表(semanticdifferential)定义:又称为语义分化量表,它主要是用来研究概念对于不同的人所具有的不同含义。,四、语义差异量表,2原理:,(1)语义差异量表处于两端的两组意义相反的形容词构成;(2)每一组反义形容词中间分为七级;(3)每一等级的分数从左到右分别为7、6、5、4、3、2、1,也可以是+1、+2、+3、0、-1、-2、-3;(4)将被测量的概念或事物放在量表的顶端,要求被调查者根据自己的感觉在每一对反义形容词构成的量尺中

16、的适当位置划记号;(5)研究者可以根据这些记号所代表的分数计算出人们对他的态度或看法。,评价,力量,行动,例:语义差异量表实例,第三节概念的操作化,一、概念、变量和指标概念是对现象的抽象,是一类事物属性在人们主观上的反应。变量是具有二个或两个以上取值(子属性)的概念。指标是表示一个概念或变量含义的一组可观察到的事物。,二、操作化的含义与作用,1含义2作用,(一)概念的澄清与界定1概念澄清和界定的作用2概念澄清和界定的步骤:要弄清概念的定义范围决定一个定义,三、操作化的方法,(二)发展测量指标1列出概念的维度2建立测量指标寻找利用前人已有的指标发展自己的研究指标,(三)操作化的注意问题指标选择的

17、这种多样性,尽可能在准确性、涵盖性方面做到充分、具体、详实,四、操作化的例子,剥夺,肉体剥夺,经济剥夺,社会剥夺,精神剥夺,政治剥夺,社会歧视,社会技能丧失,社会孤立,朋友数目社会地位家庭关系参与社会活动程度,性别种族职业政治,社会交往教育专业技术思想,第四节测量的信度与效度,一、信度(reliability)1概念:采取同样的方法对同一对象重复测量时所得的结果的一致程度。,2测量信度的检验(1)再测信度(2)复本信度(3)折半信度,1概念:测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度。,二、效度(validity),2测量效度的检验(1)表面效

18、度(2)准则效度(3)构造效度,信度高,效度未必高效度高,信度必然高,三、信度和效度的关系,第五章调查问卷的设计及资料收集,第一节社会调查的分类第二节问卷设计第三节调查资料的收集方法,第一节社会调查的分类,一、按调查对象的范围分类(一)普遍调查1定义2特点,1定义2特点,(二)抽样调查,1典型调查(1)定义(2)特点2重点调查(1)定义(2)特点,(三)典型调查和重点调查,1定义2特点,(四)个案调查,(一)统计调查1定义2特点,二、按调查的基本方式分类,1定义2特点,(二)实地研究,地区性调查、全国性调查、国际性调查农村调查、小城镇调查、大中城市调查山区调查、平原调查、湖区调查、农业区域调查

19、、牧业区域调查等,三、按调查的地域进行分类,四、按调查内容分类,综合性调查专题性调查,五、按调查的方式分类,直接调查间接调查,第二节问卷设计,一、问卷的类型和结构(一)问卷的类型1分类:(1)自填式问卷邮寄问卷发送问卷(2)访问问卷,2异同:(1)区别:面对的对象不同(2)共同点:问卷结构相同,1封面信2指导语3问题及答案4编码及其他资料,(二)问卷的基本结构,3问题及答案(1)按问题内容分类:背景性问题客观性问题主观性问题检验性问题(2)按问题形式分类:开放式问题封闭式问题,4编码及其他资料例:,(一)问卷设计的原则1明确问卷设计的出发点2明确阻碍问卷调查的各种因素(1)主观上的障碍(2)客

20、观上的障碍3明确与问卷设计紧密相关的各种因素(1)调查的目的(2)调查的内容(3)样本性质,二、问卷设计的原则和步骤,1探索性工作2设计问卷初稿3试用4修改定稿并印刷,(二)问卷设计的步骤,方法:交谈、观察目的:形成初步认识,1探索性工作,2设计问卷初稿,(1)卡片法根据探索性工作所得到的印象和认识,把每一个问题写在一张卡片上。根据卡片上问题的主要内容将卡片分成若干队,也就是把询问相同事物问题的卡片放在一起。在每一队中按照合适的询问顺序将卡片前后排序。根据问卷整体的逻辑结构排出各队的前后顺序,将卡片连成一个整体。从回答者的角度考虑阅读和填答问题是否方便、是否会造成心理压力等,反复检查问题前后顺

21、序及连贯性,对不当之处逐一调整和补充。将调整好的问题卡片依次写到纸上,形成问卷初稿。,(2)框图法根据研究假设和所需资料的内容在纸上画出整个问卷的各个部分及前后顺序的框图。具体写出每一部分的问题及答案,并安排好这些问题相互间的顺序。根据回答者阅读和填写问卷是否方便等对所有问题进行检查、调整和补充。将调整后的结果打印成问卷初稿。,(1)客观检验法回收率有效回收率填写错误填答不完全(2)主观评价法,3试用,4修改定稿并印刷,版面文字符号,1填空式例:请问您家有几口人?口请问您今年多大年龄?周岁请问您有几个孩子?个,三、题型及答案设计,2是否式例:您是共青团员吗?是不是您居住在本市吗?是不是您家里有

22、电视吗?有没有,3多项选择式例:您的文化程度是()小学及以下初中高中或中专大学专科大学本科硕士研究生及以上您的婚姻状况是()未婚已婚离婚丧偶,4矩阵式例:你觉得下列现象在你们学校是否严重?很严重比较严重不太严重不严重不知道迟到早退旷课,5表格式例:,你觉得你所在的城市下列污染是否严重?,1问题的语言要尽量简单2问题的陈述要尽可能简短3问题要避免带有双重或多重含义4问题不能带有倾向性5不要用否定形式提问6不要问回答者不知道的问题7不要直接询问敏感性问题,(二)问题的语言及提问方式,1如何确定问题的数量?2如何安排问题的顺序?3一种特殊的问题形式,(三)问题的数量与顺序,相倚问题定义:在前后两个或

23、多个相连的问题中被调查者是否应当回答后一个或后几个问题要由它对前一个问题的回答结果来决定,也就是说前一个问题作为“过滤性问题”。实例:,例:,1答案要做到具有穷尽性和互斥性。2要根据研究的需要来确定变量的测量层次。3答案的设计要求与问题的提问方式要求一致。4答案要根据问题而采用相应的形式。,(四)答案设计原则,例:,您最喜欢看哪类节目?()新闻节目体育节目电视剧教学节目您的最喜欢的业余活动是()唱歌旅游跑步健身,第三节调查资料的收集方法,一、资料的收集(一)自填问卷法1定义2主要优缺点3分类,(二)结构访问法1.定义2.分类:(1)当面访问法(2)电话访问法,1调查员的挑选2调查员的培训3联系

24、被调查者4调查质量的监控和补充调查,二、调查的组织与实施,第六章抽样,第一节抽样的意义和作用第二节非概率抽样第三节概率抽样的原理与程序第四节概率抽样的方法第五节样本规模和抽样误差,第一节抽样的意义和作用,一、与抽样有关的概念1总体2样本3抽样4抽样单位5抽样筐6参数值7统计值,1非概率抽样2概率抽样,二、抽样的类型,第二节非概率抽样,一、偶遇抽样1概念2应用,二、判断抽样,1概念2特点,1概念2实例,三、定额抽样,例:某校学生,男女比例是3:1大一到大四人数的比例是3:4:4:4成绩优秀、良好和及格的比例是2:7:1抽取600样本,男:450女:150大一:160大二:160大三:160大四:

25、120优秀:120良好:420及格:60,600样本,1概念2适用条件,四、滚雪球抽样,第三节概率抽样的原理与程序,一、概率抽样的基本原理1什么是随机抽取?2放回抽样和不放回抽样,二、抽样分布,例:10个人,参加工作的年限分别是6、7、8、9、10、11、12、13、14、15年抽取不同数量样本样本均值的分布情况,抽取1个样本,抽取2个样本,抽取n个样本,样本正态分布图,1界定总体2制定抽样筐3决定抽样方案4实际抽取样本5评估样本质量,三、抽样的一般程序,四、抽样设计的原则,1目的性原则2可测性原则3可行性原则4经济性原则,第四节概率抽样的方法,一、简单随机抽样1概念2工具纸条随机数码表,3随

26、机数码表抽样的具体步骤:(1)先取得一份总体所有元素的名单(即抽样框);(2)将总体中所有元素一一按顺序编号;(3)根据总体规模是几位数来确定从随机数表中选几位数码;(4)以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5)根据样本规模的要求选择出足够的数码个数;(6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。,1概念:等距抽样又称系统抽样或机械抽样,它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。,二、等距抽样,2等距抽样的具体步骤:(1)给总体中的每一个个体按顺序编号,即制定出抽样框。(2)计算出抽样间

27、距K。抽样间距K就由下列公式求得;(3)在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称做随机的起点。(4)在抽样框中,自A开始,每隔K个个体抽取一个个体,那么所抽取个体的编号分别为A,A十K,A十2K,A十(n一1)K。(5)将这n个个体合起来,构成该总体的样本。,3.等距抽样的实例:假如某大学共有3000名学生,要从中抽取一个容量为100的样本。编号计算抽样间距:30在前30个总体编号中抽取一个:8样本编号组成:8、38、68、,2968从总体名单中一一对应地找出以上编号的100名学生,构成样本。4等距抽样的应用条件:总体

28、名单中个体的排列顺序应该是随机的,1概念2分层抽样的优点3分层抽样的运用(1)分层的标准(2)分层方法:按比例分层和不按比例分层,三、分层抽样,1概念2整群抽样的优缺点3整群抽样的应用条件群内异质性强,群间同质性强4实例:假设某大学共有100个班级,每个班级都是30人,总共有3000名学生,先要抽300名学生作为样本进行研究。,四、整群抽样,1概念2影响多阶段抽样运用的因素3实例:假如为了调查模式青年工人的状况,需要从全市青年工人这一总体中抽取样本。,五、多阶段抽样,非概率抽样与概率抽样的比较,偶遇抽样与简单随机抽样配额抽样与分层抽样多阶段抽样与分层抽样分层抽样与整群抽样,第五节样本规模和抽样

29、误差,一、样本规模1概念2简单随机抽样中样本规模的计算公式一:,t为置信度所对应的临界值;s为总体的标准差;e为抽样误差。,公式二:推论总体成数或百分比样本规模的公式:,90%10095%40099%10000,p为总体的成数或百分比,t、e含义同上。当P=0.5时,以上公式变为:,1总体规模,二、影响样本规模确定的因素,2抽样的精确性3总体的异质性程度4研究者所拥有的经费、人力和时间,1概念2抽样误差产生的原因:(1)登记性误差(2)代表性误差:违反随机原则抽取样本受样本规模等因素的影响而形成的偶然的误差,三、抽样误差,3抽样平均误差:又称为样本平均数的标准差,或抽样成数的标准差,它反映的是

30、抽样平均数或抽样成数与总体平均数或总体成数之间平均误差程度。(1)在样本重置抽样条件下的抽样误差:,SE为全部样本平均数的标准差,为总体平均数,为总体标准差,n为样本容量。其中:,(2)在不重置的条件下:,2为总体方差,N为总体单位数,n为样本容量。在总体单位数N很大的情况下,可以近似地表示为:,3抽样误差与总体标准差或总体成数之间的关系:抽样误差与总体标准差或总体成数成正比抽样误差与样本单位数成反比,第七章定量资料分析,第一节资料的整理与录入第二节单变量统计分析第三节双变量统计分析,第一节资料的整理与录入,一、资料审核1含义2审核目的3审核内容:检查问卷资料中的问题重新向被调查者核实4审核方

31、法:边收集边审核全部问卷收回后集中审核,二、资料的编码三、数据录入问卷计算机问卷登录表或编码单计算机四、数据清理有效范围清理逻辑一致性清理数据质量抽查,第二节单变量统计分析,一、统计分析的层次(一)按照统计分析的性质分类1描述统计2推断统计(二)按照统计分析变量的多少分类1单变量统计分析2双变量统计分析3多变量统计分析,(一)单变量描述统计1集中量数分析(1)算术平均数根据原始数据求均值公式,二、单变量统计分析,例1五户干部家庭人数为7;3;11;10;4,六户工人家庭人数为6;5;5;8;10;8,用均值方式比较干部和工人家庭人口数目。,根据频次分布求均值计算公式为:,例2求以下550人的年

32、龄平均数,分组数据求均值公式:,例3调查某企业100名职工的收入,得到下表中的资料,计算他们的平均收入。,(2)众数M0众数:用频数最多的变量值来表示变量的集中值例125362348251423253125,例2,(3)中位数Md资料不分组的情况下求中位数根据原始资料求中位数,当原始资料总数N为奇数时,当原始资料总数N为偶数时,根据频次来取中位数,分组数据求中位数,例7以下为某工厂职工的收入数,求出中位数,51.5,解:,例8某校三个系各选5名同学参加智力竞赛,他们的成绩分别如下:中文系:7879808182数学系:6572808895英语系:35788998100,(二)离散量数分析,常见的

33、离散量数统计量,方差和标准差全距异众比率离散系数,1方差和标准差方差2是将观察值与其均值之差的平方和除以全部观察总数N,方差的平方根就是标准差。公式:,例9根据原始资料,如下表所示求标准差。,未分组数据根据原始资料求标准差,公式:,分组数据的方差和标准差,例10以下为某工厂职工的收入数,求出方差和标准差,2全距(R)全距又称极差,是一组数据中最大值与最小值之差,常用R表示,是对定序以上变量分散程度的度量。全距(R)=观察的最大值-观察的最小值,3异众比率()异众比率是非众值在总数N中所占的比例,越趋近于0,数据越集中,众值越有代表性越趋近于1,数据越分散,众值越没有代表性,例11一组原始数据为

34、6,8,4,7,5,8,4,8,求异众比率。,4离散系数(CV)离散系数(CV)是标准差与算术平均数的百分比值,公式为:,离散系数越大,表示数据越分散,反之则越集中。,例12比较青少年身高与体重分布的差异程度。假如通过调查得到如下数据:,由此可知,青少年在体重方面的差异明显大于在身高方面的差异。,(一)参数估计1概念2参数估计的方法:(1)点值估计(2)区间估计,三、单变量统计推论,置信区间和置信水平:置信区间(confidenceinterval)的含义区间得上、下限(端点)称为临界值所确定的概率水平称为置信水平(levelofconfidence)或置信度,用1-表示称为显著性水平,表示该

35、区间估计的不可靠程度,例:从一个工厂抽取出100名职工,样本的平均年龄是42.8岁,用这个值来估计总体的平均年龄,那么总体平均值有95%的可能性处于41.743.83(42.81.96个标准差)岁之间。41.743.83为置信区间临界值为41.77和43.83置信水平1-为95%显著性水平为0.05,区间估计的原理:总体的平均数不知道,我们用样本平均数来代替总体的标准差也不知道,我们用样本标准差S与样本容量n组成的公式来计算总体的标准差由此得到:,置信水平越低,置信区间越小;置信水平越高,置信区间越大。,区间估计的公式,例13调查某厂职工的工资状况,随机抽取900名工人做样本,调查得到他们的月

36、平均工资为186元,标准差位42元。求95%置信度下,全厂职工的月平均工资的置信区间是多少?解:将调查资料带入总体均值的区间估计公式得到:,例:某单位职工上月平均收入为210元,据此,我们认为该厂职工这个月的平均收入仍是210元。为了验证这一假设是否可靠,我们抽取了100人作调查,结果得出月平均收入为220元,标准差为15元。(与上个月不一样,哪里出问题了?)抽样误差:这个月与上个月相同假设错误:这个月与上个月不同,原假设/虚无假设H0,研究假设H1,(二)假设检验,假设检验的步骤是:(1)建立虚无假设和研究假设,通常是将原假设作为虚无假设;(2)根据需要选择适当的显著性水平,通常=0.05,

37、=0.01等;(3)根据样本数据计算出统计值,并根据显著性水平查出对应的临界值;(4)将临界值与统计值进行比较,如果临界值大于统计值的绝对值,则接受虚无假设,反之则接受研究假设。,例14某单位上月平均收入210元,本月调查了100名职工,平均月收入为220元,标准差为15元。问该单位职工本月平均收入与上月相比是否有变化?解:建立虚无假设,用H0来表示,和研究假设用H1来表示,即H0:=210H1:210选择显著性水平=0.05,有标准正态分布表查得Z(0.05)=1.96,然后根据样本数据计算统计值,公式为:,因为Z=6.67Z(0.05)=1.96,所以总体上说该单位职工平均月收入与上月相比

38、有变化。,第三节双变量统计分析,一、不同变量层次间的相关分析与检验(一)定类定类、定类定序变量分析1测量方法:系数,2什么是交互分类表定义作用:例:,例1根据下表计算系数,解:由表中可知:,被调查者性别与择偶意愿交互分类表,3检验方法:X2检验(1)公式:,(2)X2检验的步骤:建立两个变量不存在相关关系的虚无假设H0和与之对立的备择假设H1;根据X2公式计算出X2值;根据公式df=(r-1)(c-1)计算出的自由度和选定的显著性水平,查X2值表得到临界值;把公式计算所得的X2值与临界值比较。若X2值大于临界值则拒绝虚无假设H0,接受备择假设H1,表示两个变量有显著的相关关系;若X2值小于临界

39、值则接受虚无假设H0,拒绝备择假设H1,表示两个变量不存在显著的相关关系。,(3)X2检验的作用:对两个变量的相关关系是否存在进行检查对较小规模的样本资料进行差异的显著性检验,1G(Gamma)系数的计算公式:,(二)定序定序变量的统计分析,同序对数(Ns):变量大小顺序相同的两个样本点异序对数(Nd):变量大小顺序不同的两个样本点,2检验方法:t检验:适用条件:样本量比较小(通常小于100)时t检验的计算公式:Z检验:适用条件:样本量比较大(通常大于或等于100)时Z检验的计算公式:,1相关比率E2公式为:,(三)定类变量(或定序变量)与定距变量,例2根据下表计算职业类型与休闲活动间的相关系

40、数。,2检验方法:F检验F检验的计算公式为:上题k=3,n=26,E2=0.56,根据F检验公式可得:因为F=5.253.42=F0.05,所以拒绝虚无假设H0,接受备择假设H1,即职业类型与休闲活动之间有显著性相关关系。,df1=3-1=2df2=26-3=23(=0.05),1皮尔逊积差相关系数r,又称皮尔逊相关系数的公式:,r2叫决定系数,表示消减误差的比例。,(四)定距变量与定距变量的相关分析,例3100名调查者自我评价得分与拥有知心朋友个数相关分析计算表,2检验方法:F检验F值的计算公式:,将上面表格中的数据带入F值的计算公式中则有:因为计算结果F=48027.08=F0.01,因此,我们认为自我评价与拥有知心朋友数量之间存在显著性的相关关系。,df1=2-1=1df2=100-2=98(=0.01),(五)对两个变量之间关系测量与检验方法的总结,1与相关分析的区别2适用条件:定距及以上层次的变量3中心问题:建立回归方程4应用基础:最小二乘法,二、二元变量的回归分析,1二元回归方程的标准形式:y=bx+a回归系数b的计算公式为:,例3100名调查者自我评价得分与拥有知心朋友个数相关分析计算表,请根据所给数据建立回归方程。,第八章其他几种研究类型,第一节文献研究第二节实地研究第三节实验研究,第一节文献研究,一、文献研究及其类型1概念2文献研究的类型(1)内容分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论