《单变量描述统计》PPT课件.ppt_第1页
《单变量描述统计》PPT课件.ppt_第2页
《单变量描述统计》PPT课件.ppt_第3页
《单变量描述统计》PPT课件.ppt_第4页
《单变量描述统计》PPT课件.ppt_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

资料的统计与初步分析(之一),单变量描述统计,一、单变量统计类型,二、描述统计 (一)集中趋势分析 1、频数分布与频率分布 主要适用于定类尺度变量的描述,单变量分析,2、集中趋势分析的概念:是用一个典型值或代表值来反映数据的一般水平,或者说反映这组数据向这个典型值集中的情况。 3、常用集中量数,(二)离散趋势分析 1、含义 2、常用离中量数,(三)相关操作 如何利用SPSS生成频数/频率表 实例:对变量 “文化程度” 进行频数统计。 操作步骤:单击AnalyzeDescriptive StatisticsFrequencies,此时会出现Frequencies对话框:,将变量“文化程度”从对话框左边的变量列表选入右边的方框内点击OK,便可得到如下频数与频率表。,统计表中的英中文对译: Frequency:频次 Percent:百分比 Valid Percent:有效百分比 Cumulative Percent:累计百分比 Valid:有效值 Missing:缺失值 Total:合计,如何利用SPSS求集中量数 实例:求“年龄”这一变量的集中量数。操作步骤如下: 第一步:单击AnalyzeDescriptive StatisticsFrequencies,此时会出现Frequencies对话框,将变量“年龄”从对话框左边的变量列表选入右边的Variable(s):框内OK,如下图所示:,第二步:单击“Statistics”按钮,出现如下对话框:,第三步:根据需要选择集中趋势统计量 由于“年龄”是一个定距级以上的变量,所以从理论上讲刚才所介绍的集中量数都可以选择。不过实务操作中一般不选Mode和Sum(请同学们思考这是为什么)。 第四步:单击“Continue” “OK”即可。,统计表中的英中文对译: Percentile Values(百分位计算)框 Quartiles(四分位数) Cut points for:equal groups(若干等分位数,默认为10分位数) Percentile(s):不定分位数,如求第5%和95%位置上的值。 Central Tendency(集中趋势测量的统计量)框 Mean(均值) Median(中位数) Mode(众数) Sum(总和),如何利用SPSS求离中量数 实例:求“年龄”这一变量的离中量数。操作步骤如下: 第一步:操作与前面所讲的求“年龄”这一变量的集中量数完全相同。 第二步:操作与前面所讲的求“年龄”这一变量的集中量数完全相同。 统计表中的英中文对译: Dispersion(离散趋势测量的统计量)框 Std. deviation(标准差) Variance(方差) Range(全距) Minimum(最小值) Maximum(最大值) S.E.mean(均值的标准误) 第三步:根据需要选择离散趋势统计量 由于“年龄”是一个定距级以上的变量,所以从理论上讲刚才所介绍的离中量数都可以选择。不过实务操作中一般不选异众比率(请同学们思考这是为什么)。 第四步:单击“Continue” “OK”即可。,实训,单变量描述统计上机操作。,资料的统计与初步分析(之二) 单变量推论统计之区间估计,区间估计 1、含义 就是在一定的可信度(置信度)下,用样本统计值的某个范围(置信区间)来“框”住总体的参数值。 2、常用的置信度:90%,95%、99%,对应的允许误差分别为10%,5%,1%。 置信度P1,3、总体均值的区间估计 公式: 样本均值 置信度为 所的Z值 S 样本标准差 N 样本规模,例1:调查某厂职工的工资状况,随机抽取900名工人作样本,调查得到他们的月平均工资为186元,标准差为42元。求在95%的置信度下,全厂职工的月平均工资的置信区间是多少?,学生练习:,从某工厂随机抽取400名工人进行调查,结果表明女工的比例为20%,现在要求90%的置信度下,估计全厂工人中女工比例的置信区间。,4、总体百分比的区间估计 公式: P样本中的百分比,例:调查某厂职工的工资状况,随机抽取900名工人作样本,调查得到他们的月平均工资为186元,标准差为42元。求在95%的置信度下,全厂职工的月平均工资的置信区间是多少?,课堂练习,1、根据居民区100户抽样家计调查,居民用于食品费用占总收入的比例平均为75,比例的标准差为20,求食品费用占居民总收入比例的区间估计(置信度为95时)。,资料的统计与初步分析(之三) 单变量推论统计之假设检验,假设检验,1、假设含义:此是指和抽样手段联系在一起,并且依靠抽样调查的数据进行验证的经验层次的假设,即统计假设。(与理论假设不同) 2、假设检验:就是先对总体的某一参数作出假设,然后样本的统计量去进行验证,以决定假设是否为总体所接受。 3、基本思想依据:小概率原理(即“小概率事件在一次观察中不可能出现”原理),4、步骤 建立虚无假设(H :M= 或P = )与研究假设( : 或 P 、 ) 选择适当的显著性水平(即小概率的大小) =0.05、 =0.01等。 统计值的计算公式: Z Z= 根据样本数据计算统计值,并根据显著性水平查出对应的临界值。 比较统计值与临界值,若统计值的绝对值 或 ,则接受虚无假设:若 或 ,则接受研究假设。,例如:(1)总体均值的假设检验 某单位职工上月平均收入为210元,本月调查了100名职工,平均月收入为220元,标准差为15元。问职工总体的收入本月与上月相比有无变化? 解:设H :M = 210 : 210 选择显著性水平 =0.05,查Z检验表得Z 1.96 根据样本数据计算统计值,代入公式得 Z 样本均值 M 原值(总体原均值) s 样本标准差 n 样本规模 由于Z6.67Z 1.96,所以拒绝虚无假设,接受研究假设。即从总体上说,职工本月收入与上月收入有变化。,例如:(2)总体百分比的假设检验 某校全体学生中抽烟比例为35%,经过戒烟宣传后,随机抽取100名学生进行调查,结果发现抽烟比例为25%。问戒烟宣传有效吗? 解:设H :P =0.35 :P 0.35 选择 =0.05,查Z检验表得Z 1.65 统计值Z 由于 Z 1.65 所以,拒绝虚无假设,接受研究假设。即戒烟宣传有效。,实训,单变量推论统计假设检验上机操作。,资料的统计与初步分析(之四) 双变量相关分析,学习目标: 培养资料的统计与分析能力,函数关系:事物之间具有完全确定的关系,即一一对应的关系。 相关关系:一个变量发生变化时(或取不同值时),另外一个变量也随之发生变化(或取值也不同),反之也一样。 A、方向: 正相关:当两个变量的取值变化具有相同的变化的相关关系。 负相关:当两个变量的取值变化具有相反方向变化相关关系。 B、大小:利用相关系数 因果关系:当其中一个变量变化时,会引起或导致另外一个变量也随之发生变化,但是反过来,当后一个变量发生变化时,却不会引起前一个变量的变化。(是特殊的相关关系),一、变量关系类型,二、交互分类(Gross classification )【只适用于定类、定序变量】,交互分类表的形式要求: (1)规范简洁,最好不用竖线。(学术论文中常用三线表) (2)如果计算的是百分比,则要在表的下端用括号标出每一纵栏所对应的频数。 (3)常以自变量作纵栏标题,以因变量作横行标题,并取纵栏%,即自变量为基准计算%。 (4)两个变量的变量值应有所限制。不能同时具有多个变量值。 如果变量值都多,那么可采将某些变量值进行合并的方法减少变量值,以缩小交互分类的规模。,X检验的具体步骤:,建立两变量间无关系的假设,即两变量相互独立,互不相关。 计算出X值。 根据自由度df=(r-1)(c-1)和给出的显著性水平(值),查X分布表,得临界值。 将计算出的X值与查得的临界值对比: 若X值临界值,则进入否定域,称差异显著,并拒绝两变量独立的假设,即承认两变量间有关系; 若X值临界值,则称差异不显著,并接受两变量独立的假设,即两变量间无关系。 说明:X临界值,表明统计差异不在抽样误差允许的范围内,即总体实际上存在差异,相关,不独立;X临界值,表明统计差异是由抽样误差造成的,总体实际上无显著差异,不相关,无关系。,三、定序变量与定序变量之间的相关测量,1.Gamma系数(G或) 公式:G (N-同序对,N-异序对) N=左上角频数右下角频数 N=右上角频数左下角频数 2.Gamma系数的检验Z检验 Z检验的步骤: 先将G值标准化为Z值,公式为:Z选择不同的显著性水平,并查Z检验表,假定0.05,检Z表得,Z=1.96。 将计算所得的Z值与查得的Z进行对比。 若Z Z,则进入否定域,说明在总体中两变量之间存在相关关系; 若Z Z,则说明在总体中两变量之间不存在相关关系。,四、定类(序)变量与定距变量之间的相关测量,1.相关比率(Correlation Ratio )(记作E),又称Eta平方系数。,2. E的检验F检验法,五、定距变量与定距变量间的相关测量 1.皮尔逊相关系数(皮尔逊积差相关系数)(r),2r的检验F检验法和T检验法,相关操作,交互分析 打开SPSSAnalyzeDescriptive StatisticsCrosstabs 将待分析 的两个变 量分别选 入Row(s): 与Column(s): 框中, 点击OK键 即可得到 交互分析表。,例如:性别与文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论