



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
. 1-1、SPSS运行方式:菜单操作方式、程序运行方式、Include运行方式、Production Facility方式。1-2、Spss界面窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。1-3、在数据预处理中应用最广泛的是计算变量。1-4、Spss基本模块不能直接实现的功能:统计分析、数据计划、数据收集。1-6、spss不能直接打开*.html文件。2-1、spss数据文件格式:每一行的数据成为一个记录;每一列为一个变量。2-2、Spss数据编辑器界面为数据视图界面和变量视图界面(定义数据集的数据字典)。2-3、变量名命名准则:必须以英文字母开口,其他部分可以含有字母、数字、下划线;变量名尽量避免和spss已有的关键字重复(sum、compute、anova);变量名最长为64个英文字符或者32个中文字符;spss变量名不区分大小写。2-4、变量的度量类型不是固定不变的,可以分局分析过程来改变变量的度量类型。2-5、spss中字符型数据值区分大小写;字符型数据可以设置值标签。2-6、对于数据的处理缺省值默认为”.”,字符串默认为空,若空字符串有意义,需在变量是同对缺省值进行定义。2-7、spss只读入数据(excel)。2-8、添加变量合并文件:一对一合并,一对多合并;合并相同个案数,不同属性的数据文件,为添加变量;合并数据之前,需按关键变量进行排序,合并的诗句恩见必须是.sav或已经在spss中打开的文件,并确保两个文件中需要合并的变量名称不同。3-1、可视化分段方法:直接输入分割点;根据条件自动生成分割点。3-2、填补缺失数据方法:序列均值、临近点均值、临近点的中位数、线性插值法、点处线性趋势。3-3、在做统计分析之前一般要做数据效验,如果是录入错误则重新录入;若数据确实错误,则可将这些数据设置成缺失值。3-4、“标记异常个案”过程基于个案偏离聚类组中心的大小来判断异常个案,一般用于探索性数据分析步骤中。3-5、可视化变量分段是对连续数据进行离散化。4-1、描述数据特征的统计量,一类表示数据的中心位置(均值、中位数、众数),一类表示数据的离散程度(方差、标准差、极差)。进行数据分析第一步往往是进行描述性统计分析。4-2、频率分析:对于给定的类,落入这个类的个案数成为频率,落入该类中的个案数和个案总数的比例成为相对频率直方图、条形图、集中趋势和离散趋势的统计量来描述数据的分布特征。4-3、饼图和条形图使用于分类变量类别个别数较少的情况,如果个别数较多,选择直方图。4-4、中心趋势的描述:均值、中位数、众数、5%截尾均值,指一组数据向某个中心值靠拢的倾向。对于连续变量(尺度变量)和定序变量,描述中心趋势的有均值、中位数、众数、5%截尾均值(升序排序,剔除最小和最大的5%后的算术均值);对于定性数据(名义数据),指标只有众数。(尺度变量连续变量;名义变量定性数据;名义变量和定序变量分类变量)4-5、离散趋势的描述:极差、方差、标准差、分位数、变异指标。4-6、总结五数:最小值、下四分位数、中位数、上四分位数、最大值。(箱图)4-7、偏度:(-3,3),0,左偏,在左拖尾。=0对称分布。峰度:3,高峰度,=0,正太峰。4-8、分析/描述统计/频率(条形图、饼图、直方图)/描述/探索(箱图、茎叶图、直方图、Q-Q图),输出统计量(均值、中值、众数、标准差、方差、偏度、峰度、全距、极值、百分位数)4-9、定性数据图形的描述:条形图、帕累托图(从高到低排序条形图)、饼图。(首先加权个案)4-10、定量数据图形的描述:直方图(用于连续型数据)、茎叶图、箱图。4-11、在探索图里面勾选带检验的正态图可以输出选定变量的QQ图、变量正态性的K-S检验和S-W检验。4-12、IQR(四分位距)=Q3-Q1,最下面的短线Q1-1.5IQR,最上面短线Q3+1.5IQR,离群值(圆圈表示)落入Q3+1.5IQR,Q3+3IQR)或者(Q1-3IQR,Q1-1.5IQR,极端值(表示)大于等于Q3+3IQR或Q1-3IQR。4-13、如果只有一个因变量,茎叶图或者箱图按因子各个水平输出,选择不分组的输出结果和选择“按因子水平分组”的输出结果只在标题的组织形式上略有不同,如果有两个因变量,则两种选项的结果差异较大。5-1、 因为假设检验有何能犯两类错误:拒真、受伪。5-2、假设检验的步骤:确定恰当的原假设和被择假设;选择检验统计量;计算检验统计量观测值发生个概率(P);给定显著性水平,并作出决策。5-3、分析/比较均值/均值,输出表格“案例处理摘要”(看缺失值)、“均值报告表”(看均值列,趋势与增加幅度,如随着工作年限增加,小时工资也增加,增加幅度不均匀,列举每阶段增加幅度)、“方差分析表(ANOVA表)”(线性显著性0.05,非线性关系成分不显著)、“相关性度量表”(R方值不大,线性关系不十分强)5-4、双因素分析:在均值对话框下一张,均值过程只对第一层的自变量进行方差分析和线性相关检验(只有描述性统计表,即均值分析报告不一样,均值列分析:同等经验下,病房护士小时工资比办公室高,随着工作经验增加,差距变小;标准差列分析:同等经验的办公室护士,小时工资差距大于同等经验的医院护士)。5-5、单样本T检验即检验某个变量的总体均值和某指定值之间是否存在显著性差异。T检验的稳健性好。数据准备:数据拆分文件分割文件比较组(完成分析之后要关闭文件分割)、单样本T检验:分析/比较均值/单样本T检验(输入检验值) “单个样本统计量”均值,偏离检验值、“单个样本检验”t为T统计量,df为自由度,sig(双侧)为P值,均值差值为各数据减去检验值,上限下限位该均值差95%的置信区间的上限和下限。sig值0.05,接受正态性假设)判定是够满足T检验前提条件,满足则进行T检验;分析/比较均值/独立样本T检验(定义分组变量) “组统计量”(显示均值、标准差及均值的标准误,均值的标准误即为标准差除以样本N的平方根)、“独立样本检验”(方差方程的Leven检验,即方差齐性检验,和均值方程的t检验,p0.05接受方差齐性假设,选择“假设方差相等”,sig(双峰)0.05,说明新促销方法消费金额显著不同于标准促销消费金额,再比较均值大小,说明新方案有效)。5-8 配对样本T检验配对设计方法:同一受试对象处理前后的数据/两个部位数据/两种方法测试数据/配对的两个收拾对象分别接受两种处理后的数据。5-9、配对样本T检验的前提条件:两个样本配对、两个样本所来自的总体服从正太分布;分析/比较均值/配对样本T检验“成对样本统计量”(均值、标准量、标准差、均值的标准误),“成对样本相关系数”(样本量N、相关系数、相关系数P值sig0.05,相关系数明显大于0,有强线性相关),“成对样本检验”(差值的均值、差值的标准差、差值均值的标准误,t统计量和相对应的显著性,t=差值的均值/均值的标准误,分析:对1的差值均值及为减轻量,由于对1均值及均值的标准误远远高于对2,所以对2的t值远远大于对1的t值,从显著性来看,对2的减轻是显著的,因此该计划最终的评估结果为可以减轻体重但不确定可以减轻脂肪)。注意:配对样本T检验之前需要检查两样本是否服从正态分布(直方图、QQ图、k-s检验,注意分析变量中的离群值,用箱图检验)。6-1、非参数检验的优点:稳健性、使用范围广。缺点:检验能效较差。适用场合:参数检验方法的条件不满足,研究定类变量和定序变量之间的关系。单样本非参检验方法:二项检验、卡方检验、k-s检验。6-2、卡方检验对总体分布进行检验(心脏病猝死人数与日期关系、人口结构、血型和性格等),原假设:样本来自的总体分布于假设的分布无显著性差异。卡方统计量服从自由度为k-1的卡方分布,如果卡方值较大,说明期望频数与观测频数分布差距较大,拒绝原假设。6-3、二项式检验(首先定义成功或失败的类别,默认第一类为成功类)7-1、相关关系分为线性相关和非线性相关,相关变量的研究根据变量的度量类型分为定类变量之间的相关,定序变量之间的相关,尺度变量之间的相关。7-2、相关分析在统计分析中的作用:判断变量之间有无联系、确定相关关系的表现形式及相关分析方法、把握相关关系的方向与密切程度、进一步采取其他统计方法进行分析提供依据、用来描述变量之间的关系状况和进行预测。7-3、相关分析的主要方法:图示法(散点图)、计算相关系数法。图形/散点图/简单散点图,偏离大部分的点为离群值。7-4、相关系数为0只能说明没有线性相关关系,相关系数适用于样本量大于30且两个变量的总体是正态分布的情况。7-5、相关系数检验,原假设为=0;分析/相关/双变量“相关性”(相关系数)0.05,线性相关不显著;剔除离群值:数据/选择个案/如果、分割文件:数据/拆分文件、分析/相关/双变量“相关性”(相关系数、显著性)(散点图相关系数检验回归)8-1、确定变量之间线性相关后,通过回归分析找出线性关系。线性回归是指回归系数为线性,不是非相关变量和预测变量之间的的关系。8-2、回归分析的步骤:写出研究的问题和分析的目的、选择潜在相关变量、收集数据、选择合适拟合优度、模型求解、模型验证和评价、应用模型解决研究问题。8-3、简单线性回归:Y=0+1X+(X为预测变量,可控,Y为因变量,随机,为随机误差,N(0, ),且假设与X无关)。8-4、决定系数R=SSR/SST=1-SSE/SST,残差平方和SSE,回归平方和SSR,总平方和SST=SSR+SSE,0=R=1。决定系数越大,回归方程的拟合程度越高,0.6以上即可以接受回归直线。8-5、分析/回归/线性“系数”(B列,写出方程Y=常量B+UnitsBX,注意Y的帽子)、“模型摘要(汇总)”(调整)R小于R,一元看R,多元看调整R,分析:R=0.978,说明该线性模型可以解释自变量97.8%的变差,拟合效果好、“模型拟合优度检验Anova”(F=回归平方和/残差均方,sig0.05,0.05说明方差不齐,分析:在比较各个组别样本量相差不大,且各组分别的分布形态类似的情况下,方差分析对方差不等具有稳健性,案例中内个组个案数相等,峰度和偏度相等,分布形态类似,可进行方差分析,建议方差分析后进行相应非参检验验证方差分析结果)“ANOVA表”(均方=相应平方和/自由度,F=组间均方/组内均方,一共三个组,组间自由度2,60个个案,3个组,组内自由度57。分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届浙江省台州市温岭市五校联考英语九年级第一学期期末联考试题含解析
- 浙江省金华、丽水市2026届九年级化学第一学期期中质量检测模拟试题含解析
- 贵州省黔南州名校2026届英语九上期末综合测试试题含解析
- 2026届辽宁省海城市第六中学化学九年级第一学期期末监测试题含解析
- 山西省太原市名校2026届化学九上期中检测模拟试题含解析
- 开发商原因退房合同5篇
- 离职补偿协议范本:针对离职员工职业发展培训及提升
- 研发机构劳务派遣个人合同范本(含知识产权归属)
- 砼工程施工进度控制与协调劳务分包合同范本
- 生态保护区物业管理股权收购与生态保护合作合同
- 加快构建新发展格局研讨发言稿
- GB/T 9115-2010对焊钢制管法兰
- GB/T 6208-1995钎料型号表示方法
- 45G互操作及信令流程
- 酿酒系统安全培训课件
- 2018年全国成人高考专升本政治试题答案
- 灭火器每月定期检查及记录表
- 卡西欧PRO-TREK-PRW-6000使用手册-基础操作
- 小学英语外研版5A Unit2 They sell many different things Module 2部优课件
- 档案职称考试培训练习题汇总(带答案)
- 完整版:美制螺纹尺寸对照表(牙数、牙高、螺距、小径、中径外径、钻孔)
评论
0/150
提交评论