教育统计学 课件全套 胡咏梅 第1-16次课程简介及统计学基本概念-判别分析及其应用_第1页
教育统计学 课件全套 胡咏梅 第1-16次课程简介及统计学基本概念-判别分析及其应用_第2页
教育统计学 课件全套 胡咏梅 第1-16次课程简介及统计学基本概念-判别分析及其应用_第3页
教育统计学 课件全套 胡咏梅 第1-16次课程简介及统计学基本概念-判别分析及其应用_第4页
教育统计学 课件全套 胡咏梅 第1-16次课程简介及统计学基本概念-判别分析及其应用_第5页
已阅读5页,还剩972页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课堂简介及统计学基本知识教育统计学

p

课程简介教学安排教学目的学习要求教学方式与考核教材及参考资料

p

统计学基本知识什么是统计学什么是教育统计学统计学中的基本概念描述统计与推断统计数据来源数据类型随机变量数据测度水平自我介绍你对统计学知识有多少了解?在生活中有没有运用统计学知识的经历?随机投掷三个骰子(质地均匀的6面体,1-6个数字),三个骰子数字之和出现以下数字的概率哪些最大?□ 4,5,6,7,8,9,10,11,12,13,14,15,16,174567891011121314151617123446667642212628唐驳虎:世界上有多少国家比中国人富?说的是人均名义GDP与实际GDP的区别p 名义GDP(Nominal

GDP)也称货币GDP,是用生产物品和劳务的当年价格计算的全部最终产品的市场价值。p 实际GDP是指按基年价格计算的最终产品的价值。由于相同产品的价格在不同的年份会有所不同,因此,如果用名义GDP就无法对国民收入进行历史的比较。为了使一个国家或地区不同年份的GDP具有可比性,就需要以某一年的价格水平为基准,各年的GDP都按照这一价格水平来计算。这个特定的年份就是基年,基年的价格水平就是所谓的不变价格,按基年的不变价格计算出来的各年最终产品的价值就是实际GDP。名义GDP和实际GDP的关系可以表示为:名义GDP=实际GDP×GDP平减指数例如,2005年的名义GDP是用2005年的价格水平算出的,而实际GDP则是用2000的价格水平得出的(如果选2000年作基年)。2016年人均GDP排行榜(176个经济体)中国以8250美元排在第65位,排在中国前面的有64个国家,排在中国后面的有111个国家。按国家数量,占世界人口18.3%的中国,排在前1/3的位置。全球所有人均GDP排在中国前面的国家,全部人口加起来也才17亿,占世界人口的23%不到。1960-2015年间美国、中国、日本、德国、巴西、俄罗斯、印度的GDP变化趋势2000-2015这15年间,中国的人均GDP,从1000美元到9000美元,翻了9倍以上。“国内生产总值”GDP是反映一个国家最终生产成果的总量指标,而“国民可支配收入”NDI是衡量一个国家最终国民所得收入的总量指标,GDP代表的是生产总量;NDI代表的是收入总量。简单地说,收入总量肯定要小于生产总量,NDI肯定小于GDP。因为,一国的GDP要经过收入的初次分配和再分配,最终才能形成一国的NDI,GDP数据中除了国民薪资收入,还包括企业的利润和再投资,国家的税收开支与基础设施投资建设,也就是为未来积累的部分,以及税收调节的社会福利再分配。【“为什么我那么穷”】8000美元?我这么穷,哪来的8000美元?根据国家统计局前几天公布的2017年国民经济和社会发展统计公报:2017年全国人均NDI为25974元,比2016年增长9.0%,扣除通胀因素,实际增长7.3%。这占到人均GDP(59660元)的43.5%。统计和反映民生状况,“算术平均数”容易掩盖不同人群之间存在的差距,还会引发“被平均”的抱怨。但国际通行的“50%中位数值”就较好地反映了总体的状况。2017年,全国人均NDI的中位数为22408元,增长7.3%。按常住地分,城镇居民人均可支配收入36396元,中位数为33834元,折合月收入为2820元。农村居民人均可支配收入13432元,中位数为11969元。农民工的人均月收入997元。把全国居民人均年收入的中位数22408元,折合为月收入1867元。这是把成年劳动力和无个人收入需要供养的老人小孩都平均进来之后的最终结果。公报除了50%中位数,还专门分门别类统计了不同层次人群的收入状况。在全体国民中,收入最低的20%低收入组2.8亿人,人均可支配收入5958元,月均不到500元。收入位于20%~40%的中等偏下收入组2.8亿人,人均可支配收入13843元,月均1153元。收入位于40%~60%的中等收入组2.8亿人,人均可支配收入22495元,月均1875元。收入位于60%~80%中等偏上收入组2.8亿人,人均可支配收入34547元,月均2879元。收入位于头部20%的高收入组2.8亿人,人均可支配收入64934元,月均5412元。2017年收入分层□ 笔者再估测一下,这其中又位于最头部10%的1.4亿人——他们大多分布在一二三线城市,人均月可支配收入应达到7500元左右。按照人均2010年不变价2300元(目前一般按3300元掌握)的农村贫困标准计算,2017年年底,农村依然有最贫困人口3046万人,占人口比例为3%。按现行标准,当他们月均综合收入(还不是现金收入)超过275元,就算脱贫了。如果按照世界银行的国际标准(每天生活费1.9美元,每天12元,每月360元),中国则还有约6000万人生活在贫困线以下。下面这张图就代表着北上广深顶尖群体“眼中的世界”□ 你对这门课有什么样的期待?华东师范大学教育学部、北京师范大学教育学部、全国教育科学规划办公室、光明日报教育研究中心于2015年10月17-18日在上海召开了全国首届教育实证研究论坛,与会代表一致认为,加强实证研究是提高教育科学研究水平、更好地发挥教育研究探索真理、咨政育人作用的迫切要求,大力开发教育数据是加强实证研究的必要前提。“用数据说话、用数据决策、用数据管理、用数据创新”。通过基于证据的科学决策,提高政府教育治理能力现代化水平。大数据时代教育研究的趋势:用数据来描述现象,用模型解释变化,用理论分析原因,用实证建言政策。 —岳昌君2023-3-5实证研究已逐渐成为中国教育科学研究的趋势大数据告诉你:状元都是来自这些家庭!2016-06-26“澎湃新闻”发布了一份2015高考状元调查报告,对全国21个省和直辖市的29名省级高考状元进行了全方位分析,包括了他们的学习、生活、思想状况。家庭篇:什么样的家庭最容易培养出高考状元?1.父母职业都是什么呢?2.状元们平时做家务吗?3.父母是否会干预学习? 4.与父母沟通顺畅吗?(是否权威型-自由民主型家长)课外班篇:谁说状元就要拼学区房、课外班?1.

状元们都是择校狂人么? 2.状元们都上什么课外班?学习习惯篇:状元也非金刚人,照样爱拼才会赢1.六成以上晚上11点后入睡学习习惯篇:状元也非金刚人,照样爱拼才会赢2.七成以上状元考前每天学习6小时以上 3.

平时学习也很拼学习习惯篇:状元也非金刚人,照样爱拼才会赢4.状元高考

也会感到紧张学习习惯篇:状元也非金刚人,照样爱拼才会赢5.遇到学习瓶颈怎么办?学习习惯篇:状元也非金刚人,照样爱拼才会赢6.倾向于独立完成作业方式学习习惯篇:状元也非金刚人,照样爱拼才会赢7.什么让你取得了好成绩?(单选题)多数状元学习特征:七成以上状元平时每天课外学习时间都在4小时以上、六成每天11点以后睡觉、遇到学习瓶颈先自己思考、良好的心态类似的调查研究需要学习哪些方法?调查问卷的设计数据的收集方法(抽样方法与调查实施)数据的整理与统计分析(数据文件的编辑、统计方法)一、教学安排第1次

课程简介及统计学基本知识第2、3次

调查问卷和设计与评价第4、5次

数据文件的建立、编辑与初步分析第6、7次

数据的统计描述与数据的表示第8次

概率与概率分布第9次

抽样与抽样分布第10次

参数估计第11次

推断统计的基本概念与参数假设检验第12次

相关分析及其应用第13次

方差分析及其应用第14次

探索性因子分析及其应用第15次

聚类分析及其应用第16次

判别分析及其应用一、教学安排35p 通过对常用的教育统计方法的介绍,使学生了解和掌握这些方法的用途、原理、条件、软件操作,并借助教育管理、教育评价、教育经济以及教育心理学研究中的实例帮助他们进一步加深对方法应用方面的思考,以提高他们从事实证研究与分析的能力。p

通过对教育调查和测量的基本方法、技术的介绍,使学生掌握问卷和量表的编制与评价方法,提高其对教育现状、教育效果、学业成就、能力、品格等方面进行科学测定的水平。p 对社会科学统计分析软件包SPSS的操作进行细致的介绍,使学生可以独立进行教育调查、教育测量、教育实验中数据资料的统计分析工作。二、教学目的□ 本课程是一门应用性、操作性很强的课程,要求学生投入大量的时间上机练习,并查阅有关杂志中的文章以获得对统计方法的深刻理解。因此,要求:(1)投入充分的上机时间,完成课后作业。(2)查阅《教育与经济》、《教育经济评论》、《高等教育研究》、《北大教育评论》、《教育学报》、《心理学报》等杂志中涉及统计分析方法的文章。(3)完成课后材料的阅读。(4)缺课三次原则上取消选课资格。三、学习要求课上以讲授为主,同时,结合上机操作。课下阅读相关文献(教材、参考书以及期刊中采用统计分析方法的文章),完成平时作业(占40%)。期末考试(占60%):开卷笔试四、教学方式与考核[1]胡咏梅编著,《教育统计学》,中国人民大学出版社,2023年第二版。[2]辛涛等编著.《心理与教育统计学》,中国人民大学出版社,2010年版。[3]刘红云编著,《高级心理统计》,中国人民大学出版社,2019年版。[4]郭志刚主编,《社会统计分析方法—SPSS软件应用》,中国人民大学出版社,2001年2月版。[5]吴明隆编著,《SPSS统计应用实务》,中国铁道出版社,2000年版。[6]卢纹岱主编,《SPSS

for

Windows

统计分析》,电子工业出版社,2000年版。[7]梅雷迪斯.D.高尔等著,《教育研究方法导论》(第6版),江苏教育出版社,2002年版。五、教材及参考资料1.收集数据CollectingData例如,问卷调查Survey2.演示数据PresentingData例如,图表Charts

&

Tables3.刻画数据

(特征)CharacterizingData例如,平均值Average统计学基本知识一、什么是统计学?What

is

Statistics为什么?4、数据分析DataAnalysis做出决策Decision-Making?1984-1994T/Maker

Co.?1984-1994T/Maker

Co.p

数理统计学是以随机现象为研究对象的数学学科。随机现象是指在一定条件下可能产生多种结果,但是究竟产生哪种结果,事先不能确定的现象。p

数理统计学就是通过对大量表征随机现象的数据的收集、整理、分析和推断,来发现随机现象的统计规律的一门数学学科。p 简言之,统计学是关于数据资料的收集、整理、分析和推理的一门科学。40统计学基本知识一、什么是(数理)统计学?p

教育统计学是数理统计学与教育学的一门交叉学科,它是运用数理统计的原理和方法对教育现象进行数量化研究的一门学科。p

它将数理统计学的理论和方法应用于教育实际工作和各种教育调查、教育实验等研究中,通过对所获得的数据的分析和处理,达到更为准确地掌握情况、探索规律、制定方案、做出决策和预测等目的,从而为教育研究提供科学的定量分析方法。p (胡咏梅编著.《教育统计学与SPSS软件应用》,北京师范大学出版社,2002年,

绪论,P1.)统计学基本知识二、什么是教育统计学?总体(population)是指研究中研究者感兴趣的个体、对象或分数的全体。构成总体的每个基本单元称为个体(individual)。从总体中抽取的一部分个体,称为总体的一个样本(sample)。样本是总体的一个子集。样本容量(samplesize):组成样本的个体数量。三、基本概念:总体、个体、样本统计学基本知识变量(variable):具有不确定性取值的事物属性。如性别、成绩等。变量在每个个体上的取值称为该变量的观测值(observation)。自变量(independent

variable):在心理学实验中,由研究者选择和控制的变量,又称刺激变量,它决定着行为或心理的变化。因变量(dependent

variable):被试的反应变量,它是自变量造成的结果,是研究者观察或测量的行为变量。三、基本概念:变量、自变量、因变量统计学基本知识反映总体数据特征的量数统称为总体参数,简称为参数。例如,总体平均数、总体方差、总体标准差、总体相关系数等。统计量是指不依赖于任何未知参数的样本的函数,即它是直接从样本数据计算出的各种量数。例如,样本平均数、样本方差、样本标准差、样本相关系数等。三、基本概念:参数与统计量统计学基本知识描述统计:对观测数据的简缩、汇总,以概括观测数据反映的特征。对数据“分布”的描述;

对数据集中趋势的描述;对数据离散程度的描述;对数据之间相互关系的描述。45四、描述统计和推断统计统计学基本知识包括:呈现数据

Presenting

Data

(统计表、图)刻画数据特征

Characterizing Data(集中量数、离散量数、相关系数)目标(Purpose)描述数据

Describe

Data描述统计统计学基本知识推断统计:利用从总体中的一个样本获得的信息来推断总体的特征时使用的方法。包括:参数估计

Parameter

Estimation假设检验

Hypothesis

Testing预测

Prediction目标

(Purpose)确定总体的特征

MakeDecisions

AboutPopulationCharacteristics推断统计统计学基本知识五、数据来源直接来源间接来源数据来源实验问卷调查 观察出版物或网上统计学基本知识统计学基本知识《教育事业统计公报》、《教育经费执行情况统计公报》、《人力资源和社会保障事业发展公报》、《中国教育年鉴》、《中国教育统计年鉴》、《中国教育经费统计年鉴》、《中国劳动统计年鉴》等等中国调查与数据中心:/5051六、数据类型数值数据属性数据数据离散数据连续数据统计学基本知识数值数据

(定量的)离散的(数出来的)本月内买过几本书?

连续的

(测出来的)从家到学校的距离?

(公里)属性数据

(定性的)你喜欢参与式教学吗?

喜欢

不喜欢数据类型举例统计学基本知识表示随机现象各种结果的变量叫做随机变量。一般用X,Y,Z等英文字母来表示。用“X=0”表示“未考上大学”,“X=1”表示“考上大学”。按照随机变量取值的测量水平,分为:定类变量、定序变量、定距变量、定比变量七、随机变量统计学基本知识定类变量(Nominal

variable,又称称名变量):无等级次序排列的数据,用来划分事物的不同类别。男-女;汉族-少数民族;工作单位类型定序变量(Ordinal

variable,又称顺序变量):可作等级次序排列的数据。学校职称;班级排名55八、数据测度水平统计学基本知识定距变量(Interval

variable,又称等距变量):具有相对参照点、相等单位的数据。没有真正的零点;例如,摄氏度C°;各种能力分数定比变量(Ratio

variable,又称比率变量):存在真正的零点,有相等单位,倍数有意义的数据。身高、体重八、数据测度水平统计学基本知识数据测度水平的信息含量由弱到强排列:定类变量→定序变量→定距变量→定比变量定类变量和定序变量用于属性数据□

信息量相对较低;不能进行加减乘除运算定距变量和定比变量用于数值数据□

信息量相对较高;定距变量可以进行加减运算;定比变量还可以进行乘除运算。数据度量与信息含量统计学基本知识思考题以下数据是属性数据还是数值数据?是离散的还是连续的?属于哪一种测度变量?1. 汽车速度(km/h) 120,60,

302. 温度

78,64,853. 兄弟姐妹个数 0,1,2,3,

44. 成绩 A,B,C

,D统计学基本知识请珍惜当下请珍惜他人请珍惜自己,珍惜健康请珍惜你内心的渴望请珍惜我们这个伟大的时代北大经济学院院长孙祁祥教授2017年开学典礼的演讲-珍惜请珍惜当下做好每天的事情,而不要给自己太多懈怠、拖延的理由。“明日复明日,明日何其多,我生待明日,万事成蹉跎”。人生真的就是一场马拉松,每一个到达终点的人,都是从第一步开始、从每一步积累的。我希望你们能珍惜当下、认真做好手头的每一件事情,并且,在自己的能力范围内尽量做到极致和卓越。养成这样的习惯,将会让你终身受益。北大经济学院院长孙祁祥教授的开学演讲-珍惜请珍惜他人在大千世界里,在芸芸众生中,我们能走到一起,真的就是一种缘分。因此,要学会珍惜彼此:珍惜师生情;珍惜同学情;珍惜朋友情,不要把从别人,甚至你的父母那里得到的一切看做“理所当然”,而要心存感激,常思回报。北大经济学院院长孙祁祥教授的开学演讲-珍惜我特别赞同瑞士心理学家亚美路对健康的洞见:健康是一种自由——在一切自由中首屈一指。你可以像“潇洒走一回”那首歌中唱到的那样“我用青春赌明天”,但同学们,千万不要“用健康赌明天”。请珍惜自己,特别是你的健康不要因为年轻就肆意透支你的身体。有一句格言说:“有两种东西丧失之后才会发现它的价值——青春和健康”。但青春逝去,未见得活力不在、睿智不在、优雅不在;而失去健康,即使青春犹在,年轻于你何用?财富于你何用?时间于你何用?北大经济学院院长孙祁祥教授的开学演讲-珍惜请珍惜你内心的渴望请珍惜你内心的渴望,而不要忽视它、压抑它、甚至掐灭它。做自己喜欢的、擅长的事情,而不要人云亦云、心浮气躁;不要去跟别人攀比,做最好的自己足矣。当然,选择自己心之所属并坚守,有时可能并不是一件容易的事,但如果你能做到这一点,你将会有更多的淡定和从容,更多的积淀和突破,更多的喜悦和快乐。北大经济学院院长孙祁祥教授的开学演讲-珍惜最后,请珍惜我们这个伟大的时代40多年前,当我还是一名上山下乡知青的时候,我绝对想不到,有一天自己能够进入大学读书,更别说攻读博士学位、出国学习、当上北京大学的教授。我常常想,我是幸运的,因为,我赶上了改革开放的伟大时代,这个时代给予了我们每个人以机会。同学们,我们一定要珍惜这个伟大的时代,而最好的珍惜,就是为这个时代做出我们应有的贡献!北大经济学院院长孙祁祥教授的开学演讲-珍惜谢谢!祝同学们新学期学业精进,收获多多!调查问卷的设计与评价教育统计学问卷的概念、作用、类型问卷的构成问卷设计的基本步骤问卷设计须知问卷示例(高校毕业生择业行为与意愿调查问卷)问卷质量评价问卷(questionnaire)问卷是指对所有的抽样调查对象提出若干个同样问题的书面调查材料。3一、问卷的概念、作用和类型问卷调查:是调查者运用事先设计好了的问卷向被调查者了解情况或征询意见,这是一种书面调查方法。现代问卷调查:开始于1936年美国新闻学博士盖洛普(George

Gallup)进行的美国总统选举预测调查。什么是问卷调查?5什么是好的问卷调查?候选人实际得票率文摘杂志预测盖洛普预测罗斯福60.24354兰登39.85746合计1001001001936年美国总统选举预测得票率(%)文摘杂志调查:发出1000万张模拟选票,回收237万张。盖洛普调查:只调查了3000张,但是运用了比较科学的“分层配额”的抽样技术,力求使调查对象在州,市,镇,村的大小,年龄,性别,社会阶层,人种等方面准确地代表美国的所有选民。例如,20几岁的人占全体选民的比例是27%,那么在3000个调查对象中20几岁的人也应占27%,即810人。什么是好的问卷调查?7了解研究对象的基本情况:(例如:性别、受教育程度)了解人们的行为方式:(例如对某项活动的参加程度:每天、经常、偶尔、从不)了解人们的态度倾向:(例如对某个观点:同意、不同意、说不清)其他:(例如测试被调查者的心理特质,以便确定其属于哪种类型;测试被调查者在某个领域的常识、能力等)问卷的作用-调查研究的重要工具8调查方式划分:自填式问卷与访问式问卷结构划分:无结构型问卷与结构型问卷回答问题的形式划分:开放式问卷与封闭式问卷发放方式划分:报刊式问卷(随报刊的传递发放问卷)、邮寄式问卷、送发式问卷、访问式问卷(由专人送并收,往往回复率高)、电话式问卷、网络在线问卷(如问卷星)等。问卷的类型开头-标题、导语、填写说明正文—问题及答案结尾—联系方式和再次致谢9二、问卷的构成10导语(自我介绍、调查目的、内容、填写态度与所需时间、被调查者合作与帮助的重要性、保密、致谢等)填写规则问卷的开头1112基本信息调查主题(一般是封闭型问题)开放型问题问卷的正文131415联系方式再次致谢问卷的结尾为了进一步求得您对此项研究工作的帮助与指导,在您同意的情况下,我们希望有机会与您继续联系:姓

Email:

话:

对您的支持与合作再次表示衷心的感谢!16问卷的结尾17确定调查研究目的确定抽样方法与选择调查对象(样本)设计问卷预测问卷并根据数据分析结果修缮问卷同调查对象联系并寄发正式问卷分析问卷数据资料撰写调查研究报告采用问卷调查研究的主要步骤□ 优点:1.统一性2.便于作定量分析3.匿名性4.简便易行,节省人力物力问卷调查的特点缺点:只有书面信息调查项目固定问卷长度不大不适于文盲明确所需的信息,确定问卷的结构↓规定调查方法的类型↓确定每个问答题的内容↓确定问答题的形式19三、问卷设计的基本步骤确定问题的表述方式↓选择题项的措词↓安排问答题的顺序↓确定格式和排版↓测试问卷并消除缺陷20三、问卷设计的基本步骤

首先要确定调查目的:列出通过问卷要达到的特殊目的或者要检验的假设。基于已有的理论或事实提出研究假设。例如:基于我国存在性别工资差异的事实,提出研究假设:中国劳动力市场存在性别歧视。211、明确所需的信息,确定问卷的结构□ 其次,根据研究目的,分解研究主题,并基于访谈和查阅相关资料确定问卷结构。221、明确所需的信息,确定问卷的结构23案例:高等教育规模扩展和劳动力市场分解研究主题/从不同视角考察研究主题—确定问卷的结构从毕业生的角度:

就业率的影响因素/就业信息和指导的效果/工作找寻成本/毕业生就业意愿……从用人单位的角度:

对毕业生的实际需求/对已有毕业生的评价……根据研究目的及相关因素设计问卷24案例:高等教育规模扩展和劳动力市场确定研究方法:一般性的描述/比较不同的组?(描述性研究/比较研究)

影响搜集的信息(比较不同类型高校的就业率:高校的类型、高校的就业率)根据研究目的及相关因素设计问卷25案例:高等教育规模扩展和劳动力市场设计数据分析方法—影响问卷搜集信息□

探讨就业落实的影响因素(利用逻辑斯蒂克回归或通径分析方法建立变量间的关系)

被解释变量:是否已经落实工作

解释变量:

学生背景(家庭,地源,教育……)

就业期望

……根据研究目的及相关因素设计问卷依据研究目的分解主题,根据主题确定问卷结构,按照主题设置项目,依据项目编写题项,以及该项目需要回答的研究问题或假设。问卷初稿编写好后需要核查各项目下面的题项是否能够回答所设立的研究问题或假设。示例:寄宿制学校学生调查问卷寄宿制项目研究内容设计寄宿制学校学生调查问卷设计表26问卷设计表面谈—对话、各种类型问题电话访问—对话、简捷明确、时间短邮寄问卷—书面语言、详细指导语网络调查—书面语言、随机跳答272、规定调查方法的类型根据所需调查的信息确定问题内容。考虑到被调查者的特征(社会背景、知识储备、心理特征等),防止“不能答”或“不愿意作答”的情况发生。283、确定问答题的内容30封闭式(提供一系列答案供受访者选择)选择式排序式等级式

(态度量表)条件式开放式(受访者提供自己的答案)混合式

(半封闭型,是指在采用封闭型回答方式的同时,最后加上一项“其他”)4、确定问答题的形式封闭式问题优点:缺点:答案固定,容易进行统计分析容易回答调查的深度和广度受到限制选择的答案不一定是答题者的真实想法31选择式32高等教育属于非义务教育,你认为高等教育的成本主要应该由谁来承担(请选出一个最恰当的答案)?1 学生 2 父母 3 政府Q1:农村税费改革后,村集体收入:1 减少了 2 增加了 3 没有明显变化Q2:农村税费改革后,本村小学的教师工资:1 更有保障 2 以前一样 3 不如以前有保障Q3:农村税费改革对本村农民增收:1 有明显好处 23 没有什么好处 4有好处,但不显著有负面作用Q4:农村税费后,您认为干群关系:1 彻底改善了 24 没有什么变化 5明显改善 3 有好转反而恶化了等级式34排序式Q:你认为税费改革对义务教育有哪些负面影响?答:

。Q:

你认为“好学生”应具备哪些品质?答:

。开放式优点:缺点:灵活性大,适应性强有助于问卷的简化标准化低,不易做统计分析回答难度大Q2:农村税费改革后,村里要修路、校建怎么办?再向农民收费靠上级拨款没钱就不修了4 其他(注明)——————36混合式举例375、确定问题的表述方式直接表述法简单询问简单陈述释疑法假定法转移法间接表述法6.情景法简单询问法是最为常见的一种表述方式,是将调查内容用一句简短的疑问句直接表述出来。Q:你认为影响学习成绩的最重要的因素是什么?1.个人智力3.家庭环境2.教师水平4.个人学习习惯和努力程度简单询问法简单陈述法也是一种常见的表述方式,是将调查内容用一句简短的陈述句表述出来。Q:

请你阅读下列陈述句,依你的真实感受做出判断(划“ ”)。1.非常同意 2.同意 3.无所谓 4.不同意 5.很不同意(1)税费改革使得村里的工作比以前好做了(2)信息化手段对提高学生学习兴趣有很大的帮助(3)教科书循环使用应该在全国普及(4)素质教育势在必行简单陈述法12345123451234512345释疑法,即在问题的主题之前加上一段解释性的文字,以便对问题中某些词句(如专业术语)进行解释,或为了消除应答者的顾虑。Q:

宪法规定:“中华人民共和国公民对于任何国家机关和国家工作人员,有提出批评和建议的权利。”您对您所在地方的政府机关主要负责人有何评价和看法?释疑法假定法,即用一个假言判断作为问题的前提,然后再询问被调查的看法。Q1:如果有以下几项工作,您将会选择哪一种?1.月薪4000元,每天工作12小时;2.月薪2500元,每天工作8小时;3.月薪800元,每天工作5小时。假定法转移法,即由他人直接回答问题,然后再请被调查者对他人的回答作出评价,这样可以降低问题的敏感性和威胁性。Q1:

对于中学生谈恋爱,有些同学认为不应该,有些同学认为无所谓,你同意哪种看法?1.同意前一种看法 2.同意后一种看法Q2:

对于农村税费改革,有人认为有利于教师工资的保障,有的人认为教师收入不如以前,你同意哪种看法?1.同意前一种看法 2.同意后一种看法转移法情景法,即设计一个情景,让应答者设身处地地表露自己的看法或意向。例如,我们想了解社会上是否存在性别歧视,在多大程度上歧视?可以采取情景法。Q:

某女教师在单位实行的优化组合中失去了工作。您能否猜测是什么原因使她失去了工作?1.人际关系不好2.工作不努力3.教学水平不高 4.身体不好,常请病假5.没有什么特殊原因,只是因为她是女性情景法1)使用明确的词汇您经常浏览网页吗?1从不浏览 2偶尔浏览 3

有时浏览4经常浏览 5

几乎天天浏览您经常浏览网页吗?1从不浏览

2每周少于2天 3

每周2—3天4每周4—5天 5

每周6—7天446、选择题项的措词452)避免隐含的假定隐含的假定指的是问答题中没有表述清楚的假定。例如:您赞成在我国采取高收入的政策吗?如果提高工资和提高物价是同步的话,您赞成在我国采取高收入的政策吗?6、选择题项的措词463)避免诱导性的或倾向性的表述诱导性的问题表述暗示被调查者应当选择什么样的答案。例如:您认为在竞争日益激烈的社会中,一个大学本科毕业生应该考研吗?1

应当考研 2

不应当考研 3不知道6、选择题项的措词板式设计的一般要求:问题和答案:字号差别,字体差别答案标记:英文字母,阿拉伯数字,各种括号,如()

[]

□等。“ ”的位置问题与问题之间的间距477、问卷的板式设计PISA学生问卷(英国)选择式,即有两种或两种以上的答案供自由选择。单选题:Q:高等教育属于非义务教育,你认为高等教育的成本主要应该由谁来承担(请勾选出一个最恰当的答案)?1 学生 2 父母 3 政府封闭型回答方式的板式设计之一:选择式你对下列说法怎么看?(在同意的题号前打勾)1□

要举办一些必要的公益事业,没钱办不成,所以还得收钱。2□

有些生产服务是农民愿意接受的,但一家一户没法办,需要村里统一收费或统一协调。3□

上级有各种“任务”要完成(如报刊征订),不能不完成,所以得收钱。4□

有些“服务”是上级部门提供的,即使价格不合理,也不得不接受,所以得收钱。选择式:多选题排序式,即列出若干答案,由被调查者填写答案的先后顺序,又分为全排序和选择排序两种。Q:请将以下因素在决定你选择高等教育上的重要程度进行排序(最重要的请赋值1;第二重要的请赋值2;……,以此类推)(

)a.喜欢城市生活(

)b.喜欢学习,过更丰富的精神生活(

)c.获得更好的就业机会与工作(

)d.获得更多的收入(

)e.在社会上有更高的地位(

)f.更好地服务社会(

)g.父母的鼓励封闭型回答方式的板式设计之二:排序式等级式,即将答案按照强度或程度分成若干等级依次排列,由被调查者选择其中一种。常用的等级词汇有“同意”

、“赞成”

、“喜欢”

、“经常”

等。Q:你对下列说法的看法如何?封闭型回答方式的板式设计之三:等级式很赞成赞成一般不赞成很不赞成高分复读按男女生分班高考日期改在六月份条件式,即对问题的回答以某种条件为前提。条件式问题只能由一部分被调查者回答。例1:用文字说明。Q26:最近,国家对农村义务教育财政进行了税费改革,你知道具体内容吗?1.知道

2.不知道若你的答案是1,请回答下列问题,否则从Q28题答起。你对税费改革的态度:a.很赞成

b.赞成

c.无所谓

d.不赞成

e.很不赞成封闭型回答方式的板式设计之四:条件式例2:分层次排列Q18:您的性别?1.男生,你认为女生应具备哪些品质?

。2.女生,你认为男生应具备哪些品质?

。条件式例3:用方框表示Q18:税费改革后,农民负担是否明显减轻?1.是 2.否比税费改革前减轻了多少

%条件式56尽量使填写人认识到填写的意义和重要性以增加返回率。尽可能使问卷简短。给问卷编上页码,题目按主题分类编号。把问卷返还人的姓名、地址写在问卷的开头或末尾,并且事先考虑好邮资的问题。导语要简洁明了,填写规则用醒目的字体或彩色凸现。使问卷富于吸引力,排版,空间以及印刷等都会产生效果。(例如采用彩色和适宜的图片使你的问卷更具吸引力。)四、问卷设计须知57问卷题项的安排具有逻辑顺序。用一些有趣和被调查对象感兴趣的问题放在正文的开始部分。把威胁性或涉及隐私的题目放在正文的后半部分。尽量避免令人生气或者令人尴尬的问题。重要的问题不要放在较长问卷的末尾。对于被调查者难以填答的题目要给予填答示例。四、问卷设计须知不要使用调查对象有可能不理解的术语、行话或复杂的措词。避免使用“几个”、“大多”、“通常”、“很少”这样意思不明确的词语。以尽可能简洁的形式说明每一个题目。避免在问题中带有偏见或诱导性的表述。避免没有根据的假设

。避免“双管问答题”(要被调查者用一个答案回答两个观点)。58四、问卷设计须知避免出现“双管问答题”□ “您认为职务晋升和住房困难是影响您的工作积极性的主要因素吗?”59四、问卷设计须知五、问卷示例1.上海高校毕业生职业发展教育及就业、创业状况调查(用人单位问卷)2.高校毕业生择业行为与意愿调查问卷高校毕业生择业行为与意愿调查问卷亲爱的同学:您好!首先祝贺您顺利毕业,并祝愿您找到理想的工作。为更好地研究高等教育改革发展及毕业生求职状况,我们组织了这次调查。本调查只用于汇总统计分析,不会对您个人及所在学校带来任何不利影响。为便于及时向您反馈本调查的有关统计结果,如相关专业同学的就业率、起薪状况、工作适应状况等,也请您能留下您的Email地址。谢谢!教育部“十五”课题“高等教育规模扩展与劳动力市场”课题组填答方式:请在相应序号上打“√”,或在“

”中填答简要文字和数字。第一部分:基本信息1、您将长期使用的Email地址是:

。2、毕业学校名称:

。3、学校所在地:

省(直辖市、自治区)

市(县)。4、学校性质:(1)公办高校 (2)国有民办二级学院 (3)民办高校5、在各种招生类型中您属于:(1)国家计划统招生

(2)计划外自费生 (3)定向、委培生(4)自学助考招生 (3)学历文凭考试试点招生

(6)其他(3)硕士生

(4)博士生6、您的学历是: (1)专科生

(2)本科生7、您所学专业的名称:

。8、您的出生年份:19

年;b)女;9、您的性别和民族:(1)性别:

a)男(2)民族:

a)汉族

b)少数民族;10、您入学时的来源:(1)来自 a)大中城市 b)县城 c)乡镇 d)农村(2)来自

省(自治区、直辖市)

市(区、县)。11、您参加高考的年份为

年;您的高考成绩为

分 该成绩为:

a)原始分;

b)标准分12、您父母目前的工作状况:

父亲

,母亲(1)行政管理人员(处级或县乡科级以上干部); (2)各类经理人员(3)机关、企业、事业单位办事人员(5)个体工商人员(4)专业技术人员(6)商业服务人员(7)私营企业主(9)离退休、无业、失业、半失业(8)产业工人(10)农(林、牧、渔)民13、您父母的最高学历:

父亲

,母亲

(1)研究生

(2)大学本科(4)高中或中专

(5)初中(3)专科(6)小学(7)文盲或半文盲14、您现在的就业状况是:(1)已经签约 (2)已确定单位,等待签约(3)准备从事自由职业或自主创业 (4)等待接受单位的最后答复(6)虽有愿意接受的单位,但自己不想去(8)申请不就业(5)尚未找到接收单位(7)准备升学或出国(9)其他(请说明)第二部分:学业状况(4)没有担任过15、您在学习期间担任学生干部的情况(可多选)(1)学校级干部

(2)院、系级干部

(3)班级干部16、您是否为中共党员:(1)否 (2)是 入党时间为:19

年17、您的英语考级情况:(1)大学英语4级

(2)大学英语6级

(3)没有考级(4)其他(5)不知道18、您是否获得过英语之外的其他等级证书或资格证书?(1)否 (2)是 具体名称为19、您所学专业与您的兴趣的吻合状况:(1)非常吻合

(2)基本吻合

(3)不太吻合

(4)相去甚远20、您对所在学校的教育、教学水平、办学条件的总体评价是:(1)非常满意

(2)基本满意21、关于转专业,您的情况是:(1)从来没有过这方面想法(3)申请过,但没有被批准(3)一般 (4)不太满意

(5)很不满意(2)有过这种想法,但没有行动(4)已经有过转专业的经历22、您是否辅修过其他专业或第二学位?(1)否 (2)是 辅修或第二学位专业名称是23、您的学习成绩在班里属于:(1)前25% (2)中上25% (3)中下25% (4)后25%24、您的工作经历(可选多项):(1)入学前曾经工作过共

年(2)课余兼职半年以上与所学专业:

a)关系密切b)有联系c)无关(3)课余兼职半年以下与所学专业:

a)关系密切b)有联系c)无关(4)做过家教等临时工作(5)参加了学校组织的实习(6)没有工作经历25、在本阶段(如本科四年)学习期间,您是否获得过各种奖、助学金:(1)没有 (2)有 整个学习期间(如本科为四年)合计为

元。26、在本学习阶段(如本科四年),家庭和亲友给您的无需偿还的资助合计约元。27、您是否申请过各类助学贷款:(1)没有 (2)有 本学习阶段(如本科四年)合计为

元。28、请估计您在本阶段学习期间(如本科为四年)的各种花费状况:(1)学费几年合计

元(3)住宿费几年合计

元(2)辅修及课外学习班费用

元(4)伙食费几年合计

元(5)其他各种费用(如交通、娱乐、通讯、文具等)几年合计约

元。第三部分:已有的求职经历29、在择业过程中,您一共向

个单位求过职,其中曾表示愿意接受您的单位为:(1)没有 (2)1-2个 (3)3-4个 (4)5个或更多30、您主要是通过下列哪种途径求职的(双选):第一位

;第二位(1)学校举办的供需见面会;(3)有关部门的毕业分配安排;(5)本人的毛遂自荐、自我推销;(7)社会上的人才招聘会;(2)主管部门举办的供需见面会;(4)学校方面的推荐;(6)亲友的介绍;(8)其他

。31、求职过程中以下哪类信息对您的帮助较大(双选):最重要

,其次

。(1)学校发布的需求信息;(3)新闻媒介的零散招聘广告;(5)学校就业指导机构提供的信息(7)从职业介绍机构获得的信息;(2)专门性的人才招聘信息刊物;(4)从企业得到的书面招聘广告;(6)在人才洽谈会获得的信息;(8)亲戚、朋友或熟人介绍的信息;(9)与用人单位的直接谈话中获得的信息;

(10)其他

。32、您觉得目前各方面的就业信息能否满足择业需求?(1)完全能满足; (2)基本能满足; (3)

不能满足影响很大影响较大有一定影响没有影响学习成绩33、您认为下列因素对您的就业结果的影响程度如何?(在各题相应栏内画√)工作能力工作经历性别状况所学专业学历层次应聘技巧党员、干部学校名气、地位往届毕业生的声誉学校或教师的评价家庭背景社会关系送礼买人情就业信息和机会户口和用人指标“非典”疫情非常重要比较重视不太重要不重要34、在您选择工作单位(对没有确定工作者而言)或确定目前工作单位(对已经确定工作单位者而言)时,下列因素的重要程度如何?(在相应栏内画√)。工作单位的地理位置工作单位的所有制性质工作单位的规模工作单位的声誉工作稳定工作自由经济收入、福利待遇发展前景符合自己兴趣爱好利于施展个人的才干工作舒适、劳动强度低可兼顾亲友关系能获得权力和社会资源其他(请说明)35、到目前为止,您为求职而花费的相关费用估计共约为

元,其中:(1)求职简历的制作

元(3)招聘会门票等

元(5)人情、礼品费用

元(2)交通费

元(4)通讯费用

元(6)其他有关费用

元36、您是否参加过学校开设的就业指导课和讲座?(1)否 (2)是 共

次第四部分:工作状况(已经签约和基本确定工作去向者回答,其他同学跳到第五部分)37、您对已确定的工作单位的了解程度如何?(4)很不了解(1)非常了解 (2)大致了解 (3)不太了解38、您已经确定的就业单位在哪个地区?(1)

省(自治区、直辖市)

县(市、区)(2)该单位在:

a)大中城市;

b)县城;

c)乡镇

d)农村39、您确定工作单位的时间是在

月;40、根据您已知的信息,在您已确定的工作单位,您的月收入大约是

元/月;如果加上各种补贴、福利,您的年收入总计大约为

元/年。(5)很不满意41、您对自己所找到的工作的满意程度:(1)非常满意

(2)满意 (3)一般 (4)不太满意42、按您现在的想法,您准备在目前确定的单位工作多久?(1)一年左右

(2)三年左右

(3)五年左右 (4)更长时间

(5)看情况43、根据现有的了解,您将从事的工作与您所学专业的相关程度如何?(1)非常对口 (2)基本对口 (3)有一些关联

(4)毫不相关

(5)不清楚44、如果要胜任您即将从事的工作,您估计实际上需要哪个层次的知识和能力?(1)初中 (2)高中或中专 (3)专科 (4)本科 (5)硕士 (6)博士45、您已确定的工作单位的性质是:(1)国家机关 (2)国有企业 (3)学校 (4)科研单位 (5)三资企业(6)城市集体企业

(7)乡镇企业 (8)私营企业

(9)其他46、您已经确定的工作单位(主要指与您签约的那一级单位)的规模大约为

人。47、您将从事的是以下哪类工作:各类行政管理工作(包括党政机关、事业单位、群众团体行政管理工作)各类企业管理工作(如经理、部门经理等)(3)各类专业技术工作(如工程师、会计师、教师、医生、律师、编辑、记者等)(4)各类技术辅助工作(如技术员、教辅人员、护士、秘书、会计、出纳、文秘等)(5)各类服务工作(如保安、餐饮服务、销售服务、市场营销等)(6)

各类一线生产工人(7)各类一线农(林、渔、牧)民(8)其他(请说明)第五部分:下一步的求职打算(目前没有确定工作、正在寻找工作者填答)48、如果有单位愿意向您提供解决户口、档案的相对稳定的工作,您能接受的最低工资是

元/月;49、在求职过程中,如果遇到不解决户口、档案问题的临时性工作,您是否会接受:(1)不会(2)会 能接受的最低工资是

元/月。50、对于今后的工作与您所学专业的关系,您的态度是:(1)一定要专业对口(2)要与专业有一定联系(2)要求专业基本对口(4)与专业无关也没关系51、您目前和将来求职时对工作地区要求是:(1)大中城市

(2)县城

(3)乡镇 (4)农村 (5)不限地点52、您将主要向以下哪两类单位求职? 第一位

;第二位(1)国家机关(6)城市集体企业(2)国有企业 (3)学校 (4)科研单位

(5)三资企业(7)乡镇企业 (8)私营企业

(9)其他53、在今后的求职过程中,您将主要找寻哪类工作? 第一位

;第二位各类行政管理工作(包括党政机关、事业单位、群众团体行政管理工作)各类企业管理工作(如经理、部门经理等)(3)各类专业技术工作(如工程师、会计师、教师、医生、律师、编辑、记者等)(4)各类技术辅助工作(如技术员、教辅人员、护士、秘书、会计、出纳、文秘等)(5)各类服务工作(如保安、餐饮服务、销售服务、市场营销等)(6)

各类一线生产工人(7)各类一线农(林、渔、牧)民(8)其他(请说明)54、在求职过程中,您遇到的最大困难是什么?最需要的帮助是什么?谢谢合作!格式规范结构合理(与研究目的切合)符合被试特征问题措词恰当信度、效度(一般针对量表型问卷需要评估内在一致性信度、结构效度)六、问卷质量评价□ 测量电脑利用率_某一时段内服务器中每台电脑的登录及退出记录_电脑的维修次数指标的选择-考虑指标的信度\效度测量电脑的使用效益_学生计算机等级考试合格率测量家庭的社会经济状况(SES)_英国:邮政编码_中国西部:彩色电视、电话、自来水、厕所指标的选择-考虑指标的信度\效度\区分度□ 中国的城市化与房地产市场作者:安信证券高善文、郭雪松(2017-11-1)在衡量城镇化,特别是描绘城市的房地产市场需求时,经常使用的一个指标是城市常住人口数量。但在技术上,使用常住人口这一指标存在一些不足。统计制度中,常住人口定义为“居住在本乡镇街道且户口在本乡镇街道或户口待定的人;居住在本乡镇街道且离开户口登记地所在的乡镇街道半年以上的人;户口在本乡镇街道且外出不满半年或在境外工作学习的人”。在实际统计操作过程中,确定人口在城市中是否连续居住6个月以上存在一定困难,使得常住人口数据存在一定遗漏。更重要的是,居住在城市中6个月以上的人口还包括农民工、快递员等低收入人群,他们虽然创造了很大的经济价值,是城市生活不可或缺的一部分,但是与所在城市的房地产市场未必有非常紧密的联系。指标的选择-考虑指标的信度\效度\区分度□

用水量、用电量、移动电话数量会受到生活习惯改变、科技迅猛发展、人口流动等影响,使得这些指标均存在很多不足。□

小学生在校生质量可靠,与2016年33个一月到2016年9人数作为描述城市化的代理指标,优点城市房地产市场的需求联系紧密。图4中二线城市的小学在校生的增速,纵轴是月(新的一轮房地产严格调控政策出台之在于数据易于获取,横轴是2009年到这些城市2009年1前)房价的涨幅。指标的选择-考虑指标的信度\效度\区分度以小组

为单位角色分工 (每组带一台笔记本电脑)任务:讨论问卷设计时间:40分钟反馈方式:汇报员发言,其他成员补充。82小组讨论:思考-合作-分享83小组汇报时间:15分钟/组汇报文件:ppt/doc小组依次报告——倾听、学习小组报告分组讨论、设计、汇报以下问卷教师对学校领导力的评价问卷教师对课堂教学水平的评价问卷教师工作满意度调查问卷学生对学校满意度问卷(对学校提供的教育教学服务和学校内部环境的满意度)学生对班主任工作满意度问卷家长满意度调查问卷学生自主学习情况调查问卷学生同伴关系调查问卷数据文件的建立、编辑与初步统计分析北京师范大学教育学部 胡咏梅教育统计学SPSS简介问卷数据的编码数据的录入缺失值的分析与处理统计预处理数据文件的编辑制定数据分析方案对数据文件进行统计分析一、SPSS简介1.SPSS软件SPSS是“社会科学统计软件包”(Statistical

Package

for

the

SocialScience)的简称。1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,

并于1975年在芝加哥成立了SPSS公司,已有40多年的成长历史。伴随SPSS服务领域的扩大和深度的增加,SPSS公司已决定将其全称更改为StatisticalProductandServiceSolutions(统计产品与服务解决方案)。SPSS与SAS目前,世界上最著名的数据统计分析软件是SAS和SPSS。SAS

(Statistical

Analysis

System)

统计分析系统由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发,因而更适合应用于教育科学研究,是国外教育科研人员必备的科研工具。1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的工具。52、SPSS的安装□ SPSS软件的安装3、SPSS的启动与退出SPSS的启动(见演示)注意,软件安装后,启动SPSS,点击“编辑”最下方的“选项”,在打开界面中将右侧的语言(上下两处)改为“英语”,再点击“应用”、“确定”,将中文界面换成英文界面。SPSS的退出(见演示)4、SPSS的窗口介绍编辑器包括:SPSS的数据编辑窗口:用来建立、读取、编辑数据文件,开展预想的统计分析。数据标题栏主菜单栏工具栏状态栏数据输入栏数据显示区8SPSS的其他窗口介绍4.2

语法窗口4.3

输出窗口SPSS的其他窗口介绍94.2

语法窗口4.3

输出窗口5、数据文件打开数据文件扩展名:*.SAV可以打开Excel、SAS等数据文件行、列、单元6、SPSS变量SPSS变量名变量名的字符通常不超过8个首字符不能是数字或其他符号保留字:ALL、AND、BY、EQ、GE、LE、LT、NE、NOT、OR、TO、WITH不区分大小写6、SPSS变量:

变量为8种:默认总很/dd/值,科学定义—变量类型;默认数据总长度为8.认总长度为8,小数位数为2.如:2300.57长度为8,如:001,010,男,女多格式,yyyy,mm/dd/yy,…型变量,默认总长度为8,小数位数为2.如:默认总长度为8,小数位数为2.如:2.300.000,57记数法变量,默认总长度为8,小数位数为2.如:SPSS变量类型:细分数值型(Numeric)字符型(string):默日期型(date):有如:dd-mm-yyyy,mmComma:

带逗点的数2,300,000.57Dot:圆点数值型变量ScientificNotation:1.23E2,123E-2,1236、SPSS变量:变量定义变量标签与值标签变量标签

(variabl对变量名的附加例如:GDPPC可值标签(value

labe对变量可能取值例如:EDU可以本科;3表示大专示初中;7表示小—e

labels)说明以加注“人均国内生产总值”ls)的附加说明可以加注值标签,1表示研究生;2表示;4表示中专或中职;5表示高中;6表学;8表示文盲或半文盲6、SPSS变量:变量定义—格式宽度、单元格对齐及缺失值变量格式宽度

(width)“变量值宽度”(width,decimals)“变量名宽度”(通常不超过8个字符)单元格对齐(alignment,默认为右对齐)缺失值(missingvalue)系统默认数值型变量的缺失值为“.”(即跳过此单元格不填任何数据);字符型变量的缺失值为空格。特殊值可以定义为缺失值,例如身高3.65米,年龄99。6、SPSS变量:变量定义—测度类型测度类型(measurement)定比变量(scale)(包括等距、等比尺度变量),如成绩、经费定序变量(ordinal)(等级尺度变量),如排名、职称定类变量(nominal)(名义尺度变量),如性别、区域类型7、观测量19观测量(case)表示总体中的个体单位具有的特征。例如,学生的姓名、性别、成绩、专业等;一个case对应着一个横行208、定义变量练习1:建立一个某校某年级学生期末考试成绩表文件,变量包括学生ID、班级、性别、数学成绩、英语成绩、物理成绩。文件名:某年级学生成绩表.sav定义变量名(name);定义变量类型(type)及长度(width);定义变量标签(label);定义值标签(values);定义缺失值(missing);定义列宽度(columns);定义对齐格式(align);定义测度水平(measure)9、数据文件的保存□ 与word、excel等相似二、问卷数据的编码□ 编码就是对应每个问题中的每种可能答案,都规定一个相应的数字来表示。即制定数据编码方案。2526数据的编码SPSS数据文件是一种有结构的数据文件。年级 性别问题1 ……问题n11……….422………23…………………...1 ………… 1文件结构数据个案case变量名变量调查问卷中的单选择题,一道问题对应一个SPSS变量。多项选择题:多项选择题不能在SPSS中直接存储。多项选择题的处理方法思路:将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。编码方式:多选项二分法(multiple

dichotomize

method)多选项分类法(multiplecategorymethod)数据的编码选项二分法(适用于可多选的题目)将每个答案作为一个变量,每个变量只有两个取值(0/1)例如:你认为哪些大学可以称得上是高质量的大学?(可多选)(1)北京大学(2)清华大学 (3)人民大学(4)北京理工大学

(5)北京师范大学

(6)北京外国语大学数据的编码变量名变量名标签编码方案X11北京大学1-选中;0-未选中X12清华大学1-选中;0-未选中X13人民大学1-选中;0-未选中X14北京理工大学1-选中;0-未选中X15北京师范大学1-选中;0-未选中X16北京外国语大学1-选中;0-未选中多选项分类法(适用于非全排序题):从备选答案中按重要程度排序,排在第一、二、三,分列三个变量(第一选项变量、第二选项变量、第三选项变量)。这些变量的取值为这些备选答案的类别。例如:数据的编码变量名变量名标签编码方案A1第一选项1-北京大学;2-清华大学;3-人民大学;4-北京理工大学;5-北京师范大学;6-北京外国语大学A2第二选项1-北京大学;2-清华大学;3-人民大学;4-北京理工大学;5-北京师范大学;6-北京外国语大学A3第三选项1-北京大学;2-清华大学;3-人民大学;4-北京理工大学;5-北京师范大学;6-北京外国语大学多选项分类法(适用于全排序题):从m个备选答案中按重要程度排序,排在第1、2、3,…,m.分列m个变量(每个备选答案为一个变量)。这些变量的取值为这些备选答案被排列的重要次序。例如:数据的编码变量名变量名标签编码方案北京大学北京大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-第六清华大学清华大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-第六人民大学人民大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-第六北京理工大学北京理工大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-第六北京师范大学北京师范大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-第六北京外国语大学北京外国语大学名次1-第一;2-第二;3-第三;4-第四;5-第五;6-第六问卷数据的编码-课堂教学意见调查表编码方案(部分)变量名变量名标签编码方案性别1-男生;2-女生工作类型1-教师;2-学校行政人员;3-校长或副校长;4-地方教育部门行政人员达到期望1-完全达到;2-大部分达到;3-达到一半;4-达到小部分;5-完全没有达到基本理论教育评价的基本理论1-有用;0-没有用指标体系评价指标体系的设计1-有用;0-没有用量表设计量表的设计与评价1-有用;0-没有用………………练习□ 对居民储蓄调查问卷进行编码.38三、数据的录入□ 根据数据编码方案进行数据录入。39练习□ 各小组同学将所编制的问卷进行编码,并试录入20个cases.四、缺失值分析与处理缺失值指的是未知的变量值,可能是由于被调查者没有给出明确的答案(如量表题中“不知道”或“不确定”)或调查员没有记录下或记错他们的答案。缺失值通常有以下三种类型:完全随机缺失(Missing

completely

at

random,MCAR):即缺失完全是随机发生的,和自身或其他变量的取值没有关系。通常可以直接剔除或用均值替代。MCAR较为少见。随机缺失(Missing

at

random,MAR):即缺失与其他变量的取值有关(如血压数据的缺失多集中在高年龄段,这些人群可能由于行动不便而未到场接受测量)。此时,直接删除或者采用均值替代均不合适,可利用EM或回归算法对缺失数据进行估计。非随机缺失(Missing

at

non-random,MANR):即缺失不仅和其他变量的取值有关,也和自身取值有关(如收入调查时高收入者一般不愿意提供家庭收入

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论