




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、管理研究方法管理研究方法三、管理研究分析方法三、管理研究分析方法2研究流程研究流程观察:确观察:确认宽泛的认宽泛的研究范围研究范围初步资料搜初步资料搜集:访谈、集:访谈、文献调查文献调查问题界定:问题界定:描述研究描述研究理论框架:理论框架:清楚辩识和清楚辩识和归类变量归类变量衍生假设衍生假设科学科学研究研究设计设计资料搜集、资料搜集、分析与解分析与解释释推论:假设是否推论:假设是否被验证?研究问被验证?研究问题是否得到解答?题是否得到解答?否否是是撰写报告撰写报告提出报告提出报告做出管理决策做出管理决策3数据分析流程数据分析流程资料审核资料审核资料编码资料编码数据录入数据录入数据清理数据清理
2、资料的录入资料的录入与整理与整理变量集中变量集中和离散趋和离散趋势的描述势的描述描述统计描述统计信度分析信度分析效度分析效度分析信度和效信度和效度检验度检验实验控制检实验控制检验验实验实验调节效应检验调节效应检验中介效应检验中介效应检验调节、中介效调节、中介效应的检验应的检验T T检验检验方差分析方差分析相关分析相关分析回归分析回归分析假设检验常用的假设检验常用的统计方法统计方法实验?实验?否否是是4管理研究分析方法管理研究分析方法常用的统计方法常用的统计方法因子分析(效度分析)和信度分析因子分析(效度分析)和信度分析描述性统计分析描述性统计分析资料的录入与整理资料的录入与整理中介和调节效应的
3、检验中介和调节效应的检验研究报告研究报告5资料的录入与整理资料的录入与整理1.1. 资料的审核资料的审核2.2. 资料的编码资料的编码3.3. 数据录入数据录入4.4. 数据清理数据清理6资料的录入与整理资料的录入与整理1 1资料的审核资料的审核v 指研究者对问卷进行初步的审阅,剔除错填、乱填和严重指研究者对问卷进行初步的审阅,剔除错填、乱填和严重缺答的废卷。其目的是使得原始资料具有较好的准确性、缺答的废卷。其目的是使得原始资料具有较好的准确性、完整性和真实性,从而为后续资料录入与统计分析打下良完整性和真实性,从而为后续资料录入与统计分析打下良好的基础。好的基础。v 资料的审核工作包含两方面的
4、内容:一是检查问卷中的问资料的审核工作包含两方面的内容:一是检查问卷中的问题;二是重新向被试核实。题;二是重新向被试核实。 v 审核的方法审核的方法 实地审核:实地审核:指审核工作和收集工作同步进行,边收集边审核,也指审核工作和收集工作同步进行,边收集边审核,也叫收集审核。叫收集审核。 系统审核:系统审核:指在收集资料后集中时间审核。指在收集资料后集中时间审核。 多次审核:多次审核:指对重要资料进行反复的各种形式的审核。指对重要资料进行反复的各种形式的审核。7资料的录入与整理资料的录入与整理2 2资料的编码资料的编码v 编码编码:对问卷中的每一个问题、每一个答案编定一个唯一:对问卷中的每一个问
5、题、每一个答案编定一个唯一的数字,并以此为依据对问卷进行数据分析。的数字,并以此为依据对问卷进行数据分析。v 对于对于具有方向性的题项具有方向性的题项,编码时要特别注意它的方向性。,编码时要特别注意它的方向性。即:即:反向题在数据分析之前应该反向计分反向题在数据分析之前应该反向计分。v 无回答(漏填)题项的编码使用系统默认值,以无回答(漏填)题项的编码使用系统默认值,以“.”.”表示。表示。v “不知道不知道”答案的编码常为答案的编码常为9、99或或999。v 单选题的编码比较简单,应特别注意多选题(包括多项限单选题的编码比较简单,应特别注意多选题(包括多项限选题、多项排序题、多项任选题)的编
6、码。选题、多项排序题、多项任选题)的编码。8v例如:例如:工作动机工作动机的测量问卷:的测量问卷:基本信息:基本信息: 性别:性别:男男 女女 年龄年龄_岁岁 非常不同意非常不同意 不同意不同意 无所谓无所谓 同意同意 非常同意非常同意我的工作非常有趣:我的工作非常有趣: 我并非整天都全神贯注于我的工作我并非整天都全神贯注于我的工作: 生活中没有工作将是乏味的:生活中没有工作将是乏味的: 1 1男,男,0 0女女以填答的实际年以填答的实际年龄为准龄为准该问题应反向计分该问题应反向计分编号编号性别性别年龄年龄工作动机工作动机1 1工作动机工作动机2 2工作动机工作动机3 31 11 136365
7、 52 24 42 2.45452 24 41 11 2 3 4 51 2 3 4 5例:单选题的编码例:单选题的编码无回答无回答9例:多项限选、多项排序题项的编码例:多项限选、多项排序题项的编码6 6、以下哪些为您的择偶条件(、以下哪些为您的择偶条件(限选限选3 3项项):):(1 1)相貌)相貌 (2 2)文化水准)文化水准 (3 3)气质风度)气质风度 (4 4)志同道合)志同道合(5 5)人品)人品 (6 6)家庭条件)家庭条件 (7 7)个人收入)个人收入 (8 8)其他)其他被试编号被试编号择偶条件择偶条件1 1择偶条件择偶条件2 2择偶条件择偶条件3 31 11 13 35 52
8、 22 24 47 73 32 25 56 6v多项限选多项限选和和多项排序多项排序式的编码:式的编码:要求被试选几项或排序要求被试选几项或排序几项,就编几个码,在几项,就编几个码,在SPSSSPSS录入时就有多少列录入时就有多少列。10例:多选任选题项的编码例:多选任选题项的编码v多项任选题可采用多重二分法进行编码。多项任选题可采用多重二分法进行编码。每个答案都编每个答案都编一个码,故一个码,故有多少个选项,在有多少个选项,在SPSSSPSS中就有多少列。中就有多少列。如果被如果被试选择该答案则编码为试选择该答案则编码为1 1,被试未选择该答案则编码为,被试未选择该答案则编码为0 0。 被试
9、被试编号编号交通条件交通条件促销活动促销活动购物环境购物环境服务质量服务质量其它其它1 11 11 10 00 00 02 21 10 01 11 10 03 31 11 11 11 11 1 8 8、 你在选择商场购物时,关注以下哪些因素你在选择商场购物时,关注以下哪些因素: (可任选)(可任选) (1 1)交通条件)交通条件 (2 2)促销活动)促销活动 (3 3)购物环境)购物环境 (4 4)服务质量)服务质量 (5 5)其它)其它11资料的录入与整理资料的录入与整理3 3数据录入数据录入v 安装安装SPSS软件:软件:v 用户信息中输入自己的名字,在用户信息中输入自己的名字,在seri
10、al中输入中输入“12345”v 选择个人安装选择个人安装v 在在license codes中输入中输入“30001359390”,点击,点击update,再输入再输入“30001374190”,再点击,再点击updatev 程序安装完毕后,将安装盘中程序安装完毕后,将安装盘中crack目录下的目录下的lservrc文件文件复制到安装目录下复制到安装目录下12Name变量名变量名输入每个变量的名称,可以是字母,也可以是汉字输入每个变量的名称,可以是字母,也可以是汉字Type变量类型变量类型数字型、逗号型、句点型、科学计数法、日期型、美数字型、逗号型、句点型、科学计数法、日期型、美元型、自定义货
11、币型、字符型元型、自定义货币型、字符型Width变量长度变量长度默认默认8 8位英文字符或数字位英文字符或数字Decimals小数位数小数位数默认默认2 2位。整数变量可定义为位。整数变量可定义为0 0Label标签标签对变量名称的详细说明对变量名称的详细说明Values变量值变量值赋予变量中每个变量值的具体含义,适用于定类测量赋予变量中每个变量值的具体含义,适用于定类测量的数据的数据Missing定义缺失值定义缺失值不愿回答或其他原因导致缺失的数据,在分析时系统不愿回答或其他原因导致缺失的数据,在分析时系统默认为自动剔除包含缺失值的样本默认为自动剔除包含缺失值的样本Columns列宽列宽数据
12、所占字符宽度,默认数据所占字符宽度,默认8 8位位Align对齐格式对齐格式默认向右对齐默认向右对齐Measure变量类型变量类型默认默认Scale:定距变量和定比变量:定距变量和定比变量Ordinal:定序变量:定序变量Nominal:定类变量:定类变量资料的录入与整理资料的录入与整理3 3数据录入数据录入先在先在SPSS中定义好变量,中定义好变量,再录入数据!再录入数据!13v例如:例如:工作动机工作动机的测量问卷:的测量问卷:基本信息:基本信息: 性别:性别:男男 女女 年龄年龄_36_岁岁 非常不同意非常不同意 不同意不同意 无所谓无所谓 同意同意 非常同意非常同意我的工作非常有趣:我
13、的工作非常有趣: 我并非整天都全神贯注于我的工作我并非整天都全神贯注于我的工作: 生活中没有工作将是乏味的:生活中没有工作将是乏味的: 1 1男,男,0 0女女以填答的实际年以填答的实际年龄为准龄为准1 2 3 4 51 2 3 4 5例:数据录入例:数据录入 14例:反向计分例:反向计分v 操作方法:操作方法:Transform Record into same variablesv 在在variables框中选入要反向计分的题项框中选入要反向计分的题项v 点点“old and new values”。v 上例的转化方法为:在上例的转化方法为:在old value里输入里输入1,new va
14、lue里输里输入入5,点,点Add;然后在在;然后在在old value里输入里输入2,new value里里输入输入4,点,点Add.依此类推,直到所有的分值都在依此类推,直到所有的分值都在old new框里出现。框里出现。15例:反向计分例:反向计分v 操作方法:操作方法:Transform Record into same variablesv 在在variables框中选入要反向计分的题项框中选入要反向计分的题项v 点点“old and new values”。v 上例的转化方法为:在上例的转化方法为:在old value里输入里输入1,new value里输入里输入5,点,点Add;
15、然后在在;然后在在old value里输入里输入2,new value里输入里输入4,点,点Add.依依此类推,直到所有的分值都在此类推,直到所有的分值都在old new框里出现。框里出现。反向计分后,原反向计分后,原来的来的2 2变成了变成了4 416资料的录入与整理资料的录入与整理4 4数据清理数据清理v 有效范围清理:有效范围清理:当数据中的数字超出了数据编码范围时,当数据中的数字超出了数据编码范围时,则这个数字一定是错误的。则这个数字一定是错误的。v 逻辑一致性清理:逻辑一致性清理:依据问卷中的题项相互之间内在的逻辑依据问卷中的题项相互之间内在的逻辑联系,来检查前后数据之间的合理性。联
16、系,来检查前后数据之间的合理性。v 数据质量抽查:数据质量抽查:尽管采取了上述两种方法对数据进行清理,尽管采取了上述两种方法对数据进行清理,但仍会有一些错误的数据无法查出来。采用随机抽样的方但仍会有一些错误的数据无法查出来。采用随机抽样的方法,从全部样本的中抽取一部分样本与原始问卷进行比对。法,从全部样本的中抽取一部分样本与原始问卷进行比对。这就要求我们必须对原始问卷进行编号,通过问卷编号与这就要求我们必须对原始问卷进行编号,通过问卷编号与数据样本的一一对应关系,找到原始问卷。数据样本的一一对应关系,找到原始问卷。用比对结果,用比对结果,来估计和评价全部数据的质量。来估计和评价全部数据的质量。
17、17例:有效范围、逻辑一致性清理例:有效范围、逻辑一致性清理例:例:1.1.您是否为独生子女?您是否为独生子女? 是是 否否 (1=1=是;是;0=0=否)否)如果:在如果:在SPSSSPSS文件中出现了数字文件中出现了数字2 2 超出了有效范围超出了有效范围 2. 2.您有几个兄弟姐妹?您有几个兄弟姐妹? 0 0个个 1-21-2个个 3 3个及以上个及以上逻辑矛盾逻辑矛盾v用用SPSS软件进行频数分析软件进行频数分析(frequencies) ) ,可以很快查,可以很快查到哪个题项超过有效范围。到哪个题项超过有效范围。v 如果一份问卷中错答的题项不止一两处,则可考虑将这个如果一份问卷中错答
18、的题项不止一两处,则可考虑将这个样本的全部数据删除,作为废卷处理。样本的全部数据删除,作为废卷处理。18SPSSSPSS数据管理数据管理v 频数分析频数分析 Analyze Descriptive Statistics Frequenciesv Compute:通过数学计算生成新变量:通过数学计算生成新变量 例:计算两个班语文和数学的平均成绩例:计算两个班语文和数学的平均成绩 Transform Compute 在在Target Variable中输入中输入“平均成绩平均成绩”,在,在Numeric Expression中输入数学表达式:中输入数学表达式:语文成绩数学成绩语文成绩数学成绩/2。
19、 数学表达式的输入可以利用窗口左边列出的变量名称与窗口中间列数学表达式的输入可以利用窗口左边列出的变量名称与窗口中间列出的软键盘输入。出的软键盘输入。学生成绩学生成绩.sav19SPSSSPSS数据管理数据管理学生成绩学生成绩.sav计算平均数:计算平均数: Transform Compute20SPSSSPSS数据管理数据管理vRecode: 对已有变量值重新编码对已有变量值重新编码 Transform Recode Into Different Variables 例:成绩变为成绩段例:成绩变为成绩段 平均成绩平均成绩 成绩段,点成绩段,点Change 定义定义Old and New Va
20、lues: 左边窗口选左边窗口选6070,在右边窗口输入在右边窗口输入“及格及格”,并选,并选“output variables are strings”,点,点Add; 以此类推,输入:以此类推,输入:70.185良好;良好;85.1分以上优秀分以上优秀 Continue OK学生成绩学生成绩.sav21SPSSSPSS数据管理数据管理vRecode: 对已有变量值重新编码对已有变量值重新编码 Transform Recode Into Different Variables 例:成绩变为成绩段例:成绩变为成绩段 平均成绩平均成绩 成绩段,点成绩段,点Change 定义定义Old and N
21、ew Values: 左边窗口选左边窗口选6070,在右边窗口输入在右边窗口输入“及格及格”,并选,并选“output variables are strings”,点,点Add; 以此类推,输入:以此类推,输入:70.185良好;良好;85.1分以上优秀分以上优秀 Continue OK学生成绩学生成绩.sav22数据分析流程数据分析流程资料审核资料审核资料编码资料编码数据录入数据录入数据清理数据清理资料的录入资料的录入与整理与整理变量集中变量集中和离散趋和离散趋势的描述势的描述描述统计描述统计信度分析信度分析效度分析效度分析信度和效信度和效度检验度检验实验控制检实验控制检验验实验实验调节效
22、应检验调节效应检验中介效应检验中介效应检验调节、中介效调节、中介效应的检验应的检验T T检验检验方差分析方差分析相关分析相关分析回归分析回归分析假设检验常用的假设检验常用的统计方法统计方法实验?实验?否否是是23管理研究分析方法管理研究分析方法常用的统计方法常用的统计方法因子分析(效度分析)和信度分析因子分析(效度分析)和信度分析描述性统计分析描述性统计分析资料的录入与整理资料的录入与整理中介和调节效应的检验中介和调节效应的检验研究报告研究报告24描述性统计分析描述性统计分析v 对样本数据的分析通常是从变量的描述统计分析入手的。通过变量对样本数据的分析通常是从变量的描述统计分析入手的。通过变量
23、的描述统计分析,能够掌握和了解样本数据的统计特征和总体分布形的描述统计分析,能够掌握和了解样本数据的统计特征和总体分布形态,对于进一步数据分析,将起到重要的指导和参考作用。态,对于进一步数据分析,将起到重要的指导和参考作用。数值计算数值计算n 计算常见的描述统计量的值,通过数值来准确反映样本数计算常见的描述统计量的值,通过数值来准确反映样本数据的统计特征。据的统计特征。图形绘制图形绘制n 绘制常见的统计图形,通过图形来直观展现数据的分布特绘制常见的统计图形,通过图形来直观展现数据的分布特点,比较数据分布的异同。点,比较数据分布的异同。通常数值计算和图形绘制是混合使用的,两者相辅相成。通常数值计
24、算和图形绘制是混合使用的,两者相辅相成。25v Frequencies:频数分析,描述统计数据的总体分布特征;频数分析,描述统计数据的总体分布特征;v Descriptive:描述统计量,对单变量计算基本的描述统计量;描述统计量,对单变量计算基本的描述统计量;v Explore:探索性分析,考察数据中远离总体分布的边缘样本取值;考察变量探索性分析,考察数据中远离总体分布的边缘样本取值;考察变量与变量之间分布的差异性是否显著;与变量之间分布的差异性是否显著;v Crosstabs:交叉列联表,讨论变量之间的频度关系以及各种测度的变量与交叉列联表,讨论变量之间的频度关系以及各种测度的变量与变量之间
25、的相对关系;变量之间的相对关系;v Ratio:比率比率分析,对两变量间变量值比率变化的描述分析。分析,对两变量间变量值比率变化的描述分析。261. 1. 频数分析(频数分析( Frequencies )v 频数分析统计的是每一组中观测点的个数,而不考虑其实际取值。频数分析统计的是每一组中观测点的个数,而不考虑其实际取值。v 当某个变量的自然取值是局限在有限的几个数值中,频数分析统计当某个变量的自然取值是局限在有限的几个数值中,频数分析统计该变量在各个取值点的个数分布情况;该变量在各个取值点的个数分布情况;v 如果某变量的取值在某范围内的连续值,则需要将其取值区域划分如果某变量的取值在某范围内
26、的连续值,则需要将其取值区域划分为几个取值区间,频数分析统计的是该变量在各个取值区间中观测为几个取值区间,频数分析统计的是该变量在各个取值区间中观测点个数的分布情况。点个数的分布情况。v 频数分析的一个基本功能就是编制频数分布表频数分析的一个基本功能就是编制频数分布表271. 1. 频数分析频数分析基本概念基本概念v 频数(频数(Frequency):):变量值落在某个区间或某个取值点的个数。变量值落在某个区间或某个取值点的个数。v 百分比(百分比(Percent):):各频数占总样本的百分比。各频数占总样本的百分比。v 有效百分比(有效百分比(Valid Percent):):各频数占有效样
27、本数的百分比。各频数占有效样本数的百分比。v 累积百分比(累积百分比(Cumulative Percent):):各百分比值逐渐累加起来的各百分比值逐渐累加起来的结果,最终取值是结果,最终取值是100100。281. 1. 频数分析频数分析常用图形常用图形条形图条形图Bar ChartBar Chartn 用宽度相同的条形的高度表示频数分布变化的图形。用宽度相同的条形的高度表示频数分布变化的图形。n 适用于定序和定类变量分析。适用于定序和定类变量分析。饼图饼图Pie ChartPie Chartn 用扇形的面积来表示频数分布变化的图形。用扇形的面积来表示频数分布变化的图形。n 有利于研究事物内
28、在结构组成等问题,适用与定序或有利于研究事物内在结构组成等问题,适用与定序或定类变量。定类变量。直方图直方图HistogramsHistogramsn 用矩形的面积来表示频数分布变化的图形。用矩形的面积来表示频数分布变化的图形。n 适用于定距或定比变量的分析。可以在直方图上附加适用于定距或定比变量的分析。可以在直方图上附加正态分布曲线,以便于与正态分布进行比较。正态分布曲线,以便于与正态分布进行比较。29频数分析频数分析SPSSSPSS操作操作v Analyze Descriptive Statistics Frequencies 将将“成绩段成绩段”或或“平均成绩平均成绩”选入右边窗口,点击
29、选入右边窗口,点击 Charts 选择需要的选择需要的Bar Chart(条形图)(条形图), Pie Chart(饼图)(饼图), Histograms(直方图)(直方图) Chart Values,可以选择,可以选择Frequencies或或Percentages 点点Continue,点,点OK学生成绩学生成绩.sav30频数分析频数分析SPSSSPSS操作操作v 条形图条形图31频数分析频数分析SPSSSPSS操作操作v 饼图饼图32频数分析频数分析SPSSSPSS操作操作v 直方图直方图332. 2. 描述统计(描述统计( Descriptive )v 通过频数分析把握数据的总体分布
30、状况后,通常还需要对定距或定通过频数分析把握数据的总体分布状况后,通常还需要对定距或定比测量的变量的分布特征进行更精确的刻画,需要通过描述统计来实比测量的变量的分布特征进行更精确的刻画,需要通过描述统计来实现。现。描述集中趋势的统计量描述集中趋势的统计量描述离散趋势的统计量描述离散趋势的统计量描述分布形态的统计量描述分布形态的统计量34描述统计量描述统计量集中趋势统计量集中趋势统计量v 用一个具体的统计量来反映一组数据的一般水平,或者说反映这组数用一个具体的统计量来反映一组数据的一般水平,或者说反映这组数据向该统计量集中的情况。据向该统计量集中的情况。v 平均数平均数(Mean):总体各单位数
31、值之和除以总体单位数目之商。总体各单位数值之和除以总体单位数目之商。v 中位数中位数(Median):把一组数据按值的大小顺序排列起来:把一组数据按值的大小顺序排列起来,处于中央位处于中央位置的那个数值就叫中位数。置的那个数值就叫中位数。v 众数众数(Mode):指在一组数据中出现次数最多的那个数的数值。:指在一组数据中出现次数最多的那个数的数值。v 求和(求和(Sum):所有变量之和,反映变量总体水平。:所有变量之和,反映变量总体水平。35描述统计量描述统计量离散趋势统计量离散趋势统计量v 离散量数,是表示一组数据变异程度或分散程度的量数。离散量数越离散量数,是表示一组数据变异程度或分散程度
32、的量数。离散量数越大,表示数据分布范围越广,越不集中;反之,离散量数越小,表示大,表示数据分布范围越广,越不集中;反之,离散量数越小,表示数据分布范围越集中,变动程度越小。数据分布范围越集中,变动程度越小。v 方差方差(Variance)与与标准差(标准差(Standard Deviation)v 全距全距(Range):一组数据中最大值与最小值之差。:一组数据中最大值与最小值之差。v 四分位差四分位差(Interquartile Range):将一组数据按大小排列成序,然后:将一组数据按大小排列成序,然后将其四等分,去掉序列中最高的四分之一和最低的四分之一,仅就中将其四等分,去掉序列中最高的
33、四分之一和最低的四分之一,仅就中间的一半数值来测定序列的全距。间的一半数值来测定序列的全距。v 异众比率异众比率(Variation Ratio):非众数的频数与全部样本数的比值:非众数的频数与全部样本数的比值v 离散系数离散系数(Coefficient of Variation):标准差与算术平均数的百分比:标准差与算术平均数的百分比值。值。36描述统计量描述统计量分布形态统计量分布形态统计量v 偏度偏度(Skewness):反映数据分布形态对称性的统计量。计算偏度:反映数据分布形态对称性的统计量。计算偏度系统能说明数据总体是否或近似于正态分布,从而确定能否进行统系统能说明数据总体是否或近似
34、于正态分布,从而确定能否进行统计推断或如何进行统计推断。计推断或如何进行统计推断。00ppXMSkSSkXMS表示偏度系数表示样本数据的平均数表示众数值表示标准差SkSkp p= = 0 0 时,数据呈严格的正态时,数据呈严格的正态分布。分布。SkSkp p 0 0 时,分布呈正偏态。时,分布呈正偏态。SkSkp p 00,说明数据的分布比标准正态分布更为陡峭,为尖峰(高狭峰)分,说明数据的分布比标准正态分布更为陡峭,为尖峰(高狭峰)分布;布;峰度值峰度值00.05),则应接受假设),则应接受假设H0,认为,认为样本的分布与指定的分布没有显著的差异。样本的分布与指定的分布没有显著的差异。42利
35、用利用SPSSSPSS进行定量的正态分布检验进行定量的正态分布检验v Analyze Nonparametric Tests 1-Sample K-S ,把变量把变量“语文语文成绩成绩”选入选入“Test Variable List”框。在框。在 “Test Distribution”框中使用框中使用默认选项正态分布。默认选项正态分布。 Nominal,正态分布,系统默认选项;,正态分布,系统默认选项; Uniform,均匀分布;,均匀分布; Poisson,泊松分布;,泊松分布; Exponential,指数分布。,指数分布。v 点击点击OK。43利用利用SPSSSPSS进行定量的正态分布检
36、验进行定量的正态分布检验One-Sample Kolmogorov-Smirnov Test4079.307.673.138.082-.138.870.436NMeanStd. DeviationNormal Parametersa,bAbsolutePositiveNegativeMost ExtremeDifferencesKolmogorov-Smirnov ZAsymp. Sig. (2-tailed)语文成绩Test distribution is Normal.a. Calculated from data.b. v Sig.=0.4360.05,因此接受零假设,即变量,因此接受零
37、假设,即变量“语文成绩语文成绩”与正与正态分布不存在显著性差异,也就是说变量态分布不存在显著性差异,也就是说变量“语文成绩语文成绩”是呈正态分是呈正态分布的布的。443. 3. 探索性分析(探索性分析( Explore )v 在收集数据的过程中,由于测量工具产生的系统误差和由于人工操在收集数据的过程中,由于测量工具产生的系统误差和由于人工操作产生的偶然误差往往导致可能出现一些偏离正常值的数据。对数据作产生的偶然误差往往导致可能出现一些偏离正常值的数据。对数据进行探索性分析,主要是对数据进行三方面的考察:进行探索性分析,主要是对数据进行三方面的考察:考察数据考察数据的真实性的真实性n 偏离数据主
38、体分布太远的数据可能是有问题的数据。数据考察可偏离数据主体分布太远的数据可能是有问题的数据。数据考察可以找出这些非正常值和极端值,通过对这些数据的分析,判断其正以找出这些非正常值和极端值,通过对这些数据的分析,判断其正确性,以便决定在以后的统计分析过程中是否将其保留下来。确性,以便决定在以后的统计分析过程中是否将其保留下来。考察数据考察数据的分布特的分布特性性n 数据的分布是否满足标准分布,这在很多统计分析过程中都是数据的分布是否满足标准分布,这在很多统计分析过程中都是需要明确的。需要明确的。考察变量考察变量之间数据之间数据相互关系相互关系n 变量与变量之间的相关性考察、方差齐性的考察,都是一
39、些统变量与变量之间的相关性考察、方差齐性的考察,都是一些统计分析过程所必须实现了解的。计分析过程所必须实现了解的。45(1 1)通过茎叶图()通过茎叶图(Stem-Leaf PlotsStem-Leaf Plots)描述频度分布)描述频度分布语文成绩语文成绩 Stem-and-Leaf Plot Frequency Stem & Leaf 2.00 6 . 11 4.00 6 . 7799 4.00 7 . 2234 10.00 7 . 6677789999 8.00 8 . 22233444 9.00 8 . 556666778 3.00 9 . 000 Stem width: 10
40、 Each leaf: 1 case(s)v 第一列表示频数,表示样本的个数;第一列表示频数,表示样本的个数;v 第二列表示茎叶图的茎,表达整数部第二列表示茎叶图的茎,表达整数部分,其表达的具体值与茎宽有关;分,其表达的具体值与茎宽有关;v 第三列表示叶子,每片叶子代表小数第三列表示叶子,每片叶子代表小数部分,其代表的具体值也与茎宽有关。部分,其代表的具体值也与茎宽有关。v “ “10.00 7 . 6677789999”表示分数表示分数在在76的样本有的样本有2个,分数在个,分数在77的样本有的样本有3个,分数在个,分数在78的样本有的样本有1个,分数在个,分数在79的样本有的样本有4个。个
41、。学生成绩学生成绩.sav46(2 2)通过箱型图()通过箱型图(Boxplots)描述数据分布)描述数据分布v 显示了变量数据的中位数,显示了变量数据的中位数,25%25%百分位数和百分位数和75%75%百分位数,并给出偏百分位数,并给出偏离总体分布的奇异样本和极端样本。离总体分布的奇异样本和极端样本。l 箱图主体:由小于箱图主体:由小于75%75%百分位数到大于百分位数到大于25%25%百分位数的样本组成,显然主百分位数的样本组成,显然主体中样本数占体中样本数占50%50%。l 中位数:箱主体中有一条粗横线代表变量的中位数。中位数:箱主体中有一条粗横线代表变量的中位数。l 奇异值:如果某个
42、数据距离箱主体边缘的距离超过箱主体高度的奇异值:如果某个数据距离箱主体边缘的距离超过箱主体高度的1.51.5倍,倍,则称该数据为奇异值,在箱型图中,奇异值用则称该数据为奇异值,在箱型图中,奇异值用“”表示。表示。l 极端值:如果某个数据距离箱主体边缘的距极端值:如果某个数据距离箱主体边缘的距离超过箱主体高度的离超过箱主体高度的3 3倍,则称该数据为极端值,倍,则称该数据为极端值,在箱图中,极端值用在箱图中,极端值用“* *”表示。表示。学生成绩学生成绩.sav47数据分析流程数据分析流程资料审核资料审核资料编码资料编码数据录入数据录入数据清理数据清理资料的录入资料的录入与整理与整理变量集中变量
43、集中和离散趋和离散趋势的描述势的描述描述统计描述统计信度分析信度分析效度分析效度分析信度和效信度和效度检验度检验实验控制检实验控制检验验实验实验调节效应检验调节效应检验中介效应检验中介效应检验调节、中介效调节、中介效应的检验应的检验T T检验检验方差分析方差分析相关分析相关分析回归分析回归分析假设检验假设检验实验?实验?否否是是48管理研究分析方法管理研究分析方法常用的统计方法常用的统计方法因子分析(效度分析)和信度分析因子分析(效度分析)和信度分析描述性统计分析描述性统计分析资料的录入与整理资料的录入与整理中介和调节效应的检验中介和调节效应的检验研究报告研究报告49效度的类型效度的类型效度效
44、度叙述叙述内容效度内容效度量表所包含的题项是否全面,有没有遗漏的维度?量表所包含的题项是否全面,有没有遗漏的维度?表面效度表面效度请专家来评判量表是否测量了想要测量的变量请专家来评判量表是否测量了想要测量的变量建构效度建构效度包含聚敛效度和区别效度两类:包含聚敛效度和区别效度两类:聚敛效度聚敛效度一个变量的测量题项与提取的公因子之间的相关程度,一个变量的测量题项与提取的公因子之间的相关程度,相关性越高(应大于相关性越高(应大于0.50.5),表明题项与公因子之间的联),表明题项与公因子之间的联系越紧密,聚敛效度越高系越紧密,聚敛效度越高区别效度区别效度A变量的题项只能测量变量变量的题项只能测量
45、变量A,而不能测量变量,而不能测量变量B。若满。若满足这个条件,则表明通过区别效度检验。足这个条件,则表明通过区别效度检验。v 聚敛效度和区别效度可以通过聚敛效度和区别效度可以通过SPSS因子分析粗略地检验。因子分析粗略地检验。若要精确若要精确检验,需要使用结构方程模型的验证性因子分析过程。检验,需要使用结构方程模型的验证性因子分析过程。50因子分析因子分析v 因子分析的基本思想:根据相关性大小把原始题项分组,因子分析的基本思想:根据相关性大小把原始题项分组,使得同组内的题项之间相关性较高,不同组题项间的相关使得同组内的题项之间相关性较高,不同组题项间的相关性较低,从而以较少的公因子来表示原先
46、的资料结果,而性较低,从而以较少的公因子来表示原先的资料结果,而又能保留住原有资料所提供的大部分信息。又能保留住原有资料所提供的大部分信息。如:在调查师范生应具有的素质中,通过因子分析从如:在调查师范生应具有的素质中,通过因子分析从2020个题个题项中概括出:师德、专业知识、教学实践性知识、语言表达项中概括出:师德、专业知识、教学实践性知识、语言表达能力和心理素质能力和心理素质5 5个因子。个因子。51因子分析的基本步骤因子分析的基本步骤第一步确定因子分析的前提条件确定因子分析的前提条件n 因子分析就是从众多的原始题项中综合出少数几个具有代表性的因因子分析就是从众多的原始题项中综合出少数几个具
47、有代表性的因子,这就要求题项之间具有较强的相关性。如果原始题项之间不存在子,这就要求题项之间具有较强的相关性。如果原始题项之间不存在较强的相关关系,则无法找出其中的公因子。较强的相关关系,则无法找出其中的公因子。两个指标反映了因子分析的前提条件是否满足:两个指标反映了因子分析的前提条件是否满足:(1 1)Bartlett的球型检验的球型检验(Bartlett test of sphericity),检验题项间相关系,检验题项间相关系数是否显著(数是否显著(sig.是否小于是否小于0.05),显著则适合做因子分析。由于球型检),显著则适合做因子分析。由于球型检验容易受到样本数的影响,通常在样本增
48、加时很容易显示显著的结果。验容易受到样本数的影响,通常在样本增加时很容易显示显著的结果。(2) KMO(Kaiser-Meyer-0lkin), 用于比较题项间简单相关和偏相关系数。用于比较题项间简单相关和偏相关系数。KMO取值在取值在0与与1之间。按是否适合做因子分析,分别为:之间。按是否适合做因子分析,分别为:KMO0.9,非常非常适合;适合;0.8KMO0.9,适合;,适合; 0.7KMO0.8,比较适合;,比较适合; KMO0.5,越接近,越接近1越好;越好;n 累积方差解释率(累积方差解释率(cumlative %):提取的公因子解释原有题项提取的公因子解释原有题项总方差的比率,要求
49、至少总方差的比率,要求至少50%,越接近,越接近100%越好;越好;n 因子负荷矩阵(因子负荷矩阵(Component Matrix):当只提取:当只提取一个公因子一个公因子时时看此矩阵。要求每个题项在公因子的负荷量看此矩阵。要求每个题项在公因子的负荷量0.5 ,越接近,越接近1 1越好越好(聚敛效度);(聚敛效度);n 旋转后的因子负荷矩阵旋转后的因子负荷矩阵(Rotated Component Matrix):当提:当提取两个及以上公因子时,看此矩阵。要求:取两个及以上公因子时,看此矩阵。要求:1 1、每个题项在公因子、每个题项在公因子的负荷量的负荷量0.5(聚敛效度)(聚敛效度);2 2
50、、每个题项只在一个公因子上有负荷。、每个题项只在一个公因子上有负荷。如果一个题项在两个或两个以上的公因子上有负荷,则该变量应删如果一个题项在两个或两个以上的公因子上有负荷,则该变量应删除掉(区别效度)。除掉(区别效度)。56例:员工满意度(因子分析)例:员工满意度(因子分析)1/91/9v Analyze Data Reduction Factorv 将报酬将报酬1至至4 4、晋升、晋升1至至4、管理者、管理者1至至4、同事、同事1至至4、工作本身、工作本身1至至4、交际交际1至至4选入选入Variables窗口窗口v 点点Descriptives, , 在在Correlation matri
51、x框架中,选择框架中,选择KMO and Bartletts test of sphericity,单击,单击Continue回到主对话框。回到主对话框。v 点击点击Rotation,在,在Method框中点选框中点选Varimax(方差最大正交旋转(方差最大正交旋转法),点法),点Continue回到主对话框。回到主对话框。v 点点Options,在,在Coefficient Display Format中,勾选中,勾选Sorted by size和和Suppress absolute values less than,将值改为,将值改为0.5,表明在输出表明在输出的因子负荷矩阵中,小于的因
52、子负荷矩阵中,小于0.5的值不显示的值不显示。点。点Continue,点,点OK员工满意度员工满意度_ _因子分析因子分析. .savsav57例:员工满意度(因子分析)例:员工满意度(因子分析)2/92/9v 解读输出结果:解读输出结果:KMO0.8800.8,Bartlett球形检验值显著(球形检验值显著(p Z /2 时则接受研究假设时则接受研究假设(H1)。)。假设检验的统计原理假设检验的统计原理Z /2Z /2接受接受H0接受接受H1接受接受H178常用统计方法的零假设和研究假设常用统计方法的零假设和研究假设零假设(零假设(H0)与研究假设()与研究假设(H1)P值值正态分布正态分布
53、检验检验H0:符合正态分布:符合正态分布H1:不符合正态分布:不符合正态分布sig0.05时,接受时,接受H0sig0.05时,接受时,接受H1注:注:SPSS输出结果为输出结果为sig,即显著水平。在写,即显著水平。在写文章时,应使用术语文章时,应使用术语“P值值”。SPSS输出结果里输出结果里往往会用星号来形象地往往会用星号来形象地标出显著水平:标出显著水平:*代表:代表:p0.05*代表:代表:p0.01*代表:代表:p 15个)个) 方差齐性方差齐性 必须包括两个相互独立的样本,从总体中随机抽样获得必须包括两个相互独立的样本,从总体中随机抽样获得 自变量为定类变量,且为二分变量;因变量
54、为连续型变量自变量为定类变量,且为二分变量;因变量为连续型变量学生成绩学生成绩.sav83例:例: SPSSSPSS两个独立样本的两个独立样本的T T检验检验v 例:两个班的语文成绩是否有显著差异?例:两个班的语文成绩是否有显著差异?v H0:两者没有显著差异。:两者没有显著差异。 H1:两者有显著差异。:两者有显著差异。 Analyze Compare Means Independent-Samples T Test 将语文成绩选入将语文成绩选入 Test Variables框中框中 班级班级 Grouping Variables, Define GroupsGroup1:1 ; Group
55、2:2 点点Continue ,点,点OK学生成绩学生成绩.savGroup Statistics2076.958.2361.8422081.656.4341.439班级12语文成绩NMeanStd. DeviationStd. ErrorMean标准差标准差标准误标准误平均值平均值样本数样本数84例:例: SPSSSPSS两个独立样本的两个独立样本的T T检验检验v 显示两个显示两个T T检验的结果:方差齐和方差不齐检验的结果:方差齐和方差不齐v 方差齐性检验的结果方差齐性检验的结果( (Levenes Test for Equality of Variances) ) 显著性水平显著性水平
56、0.3510.05,表明方差齐,表明方差齐v 方差齐下显著性水平方差齐下显著性水平0.0510.05,但由于,但由于0.051和和0.05十分接近,所十分接近,所以在这种情况时,通常是作为差异显著来对待,可以报告统计检验以在这种情况时,通常是作为差异显著来对待,可以报告统计检验“接近显著接近显著”或或“边缘显著边缘显著”。v 再增加一些样本使检验结果更可靠。因为统计检验的显著水平与样再增加一些样本使检验结果更可靠。因为统计检验的显著水平与样本量有关,如果样本量较小,适当增加样本量可以使检验结果更明本量有关,如果样本量较小,适当增加样本量可以使检验结果更明确。确。Independent Samp
57、les Test.892.351-2.01138.051-4.702.337-9.431.031-2.01135.897.052-4.702.337-9.440.040Equal variances assumedEqual variances notassumed语文成绩FSig.Levenes Test forEquality of VariancestdfSig. (2-tailed)MeanDifferenceStd. ErrorDifferenceLowerUpper95% ConfidenceInterval of theDifferencet-test for Equality
58、of Means853.3.两个配对样本的两个配对样本的T T检验检验v 适用于配对样本(相关样本)设计,即只有两个处理水平的单因素随适用于配对样本(相关样本)设计,即只有两个处理水平的单因素随机区组设计,也适用于两个水平的重复测量设计。机区组设计,也适用于两个水平的重复测量设计。v 前提:前提: 正态性正态性 两个变量所属的总体为正态分布。但当样本量足够大,两个变量所属的总体为正态分布。但当样本量足够大,超过超过2020个时,允许总体为非正态。个时,允许总体为非正态。 随机样本随机样本 样本必须从总体中随机抽样获得。否则给样本必须从总体中随机抽样获得。否则给t t检验给出的检验给出的p p值
59、不可信。值不可信。v 每个被试必须有两个测量结果(前后测量设计),如果通过事前测试每个被试必须有两个测量结果(前后测量设计),如果通过事前测试对被试两两配对,则每对被试被视为一个样本。对被试两两配对,则每对被试被视为一个样本。86例:例: SPSSSPSS两个配对样本的两个配对样本的T T检验检验v 对两个班的学生进行了两两配对,形成对两个班的学生进行了两两配对,形成2020对,对学生的年龄、性别、对,对学生的年龄、性别、智力水平等相关因素进行了匹配。用两种不同的教学方式在两个班进智力水平等相关因素进行了匹配。用两种不同的教学方式在两个班进行教学,根据测试成绩判断两种教学方式的教学效果是否有差
60、异。行教学,根据测试成绩判断两种教学方式的教学效果是否有差异。v H0:两者没有差异。:两者没有差异。 H1:两者有显著差异。:两者有显著差异。v Analyze Compare Means Paired-Sample T Testv A组成绩、组成绩、B组成绩都选入组成绩都选入Paired Variables框中,单击框中,单击OK运行程序运行程序配对班配对班.savPaired Samples Statistics26.05207.3881.65223.30205.1411.150A组成绩B组成绩Pair 1MeanNStd. DeviationStd. ErrorMean样本统计量表格样本统计量表格8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 麦当劳运营督导面试题及答案
- 中级社会工作者考试基础训练试题及答案
- 人类观察部面试题及答案
- 与时俱进的系统集成试题及答案
- 2025年软件评测师考试的学习与备考策略试题及答案
- 决策树试题库及答案
- 高三适应性测试题及答案
- 初级社会工作者考试必考知识点试题及答案
- 初级社会工作者考试的精彩试题及答案
- 呼吸机培训试题及答案
- 2025年临床带教老师心得感想(7篇)
- 课题申报参考:数智时代大学生网络社会心态形成发展规律及引导策略研究
- 船舶与海洋工程原理(上)知到智慧树章节测试课后答案2024年秋哈尔滨工程大学
- 《核电厂实物保护系统定期试验规范》
- 江苏卷2024年高考语文第一次模拟考试一(原卷版+解析版)
- 甘肃开放大学2024年《信息技术与信息管理》形考作业1-4答案
- 【MOOC】应用光学实验-浙江大学 中国大学慕课MOOC答案
- 【MOOC】台湾历史与文化-福建师范大学 中国大学慕课MOOC答案
- 转体施工案例
- 深圳2020-2024年中考英语真题复习专题01 语法填空(解析版)
- JJF(津) 139-2024 电动汽车公用充电设施统计抽样计量性能评价技术规范
评论
0/150
提交评论