统计基础知识_第1页
统计基础知识_第2页
统计基础知识_第3页
统计基础知识_第4页
统计基础知识_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计基础知识一、统计与测量概述1. 什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。(1) 数理统计:以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。(2) 应用统计:统计原理在某个行业的具体应用。如社会统计学、教育统计学等。2.统计学分类3. 社会统计 社会统计是运用数理统计原理和方法,研究社会问题的一门应用科学。主要包括: 描述统计;(例如:体育消费的现状) 推断统计;(例如:体育消费与家庭收入之间的关系)4. 测量 测量是根据法则给事物赋予数量。

2、测量的三要素:第一,事物的属性;第二,数字;第三,规则。5.变量的概念 科学研究中,用变量来描述概念。 变量,也称变项,变数,是说明总体各个案所具有的某正特征或者属性的名称,且被说明的特征或属性对于总体各个案来说是具有变异性的。 例如:在一个地区体育人口当中,每个人的性别、年龄等都是变量。 变量一般包含一个以上的亚概念或者取值。比如,性别,是一个概念,但包含男或女两个取值。年龄、态度等等都可以作为变量。 自变量和应变量 自变量:又称自变项、独立变项,通常用X表示。一般是指在社会关系中引起现象发生变化的因素。 自变量:又称因变项、依变量,通常用Y表示,一般是指在社会关系中随着一种因素发生作用而其

3、变化的结果。 举例:体育态度Y与哪些因素有关 X1: 年龄 X2:文化程度 X3:性别6. 变量的测度等级(变量分类) 在实际研究中,不同概念的变量能够被测量,即,量化的程度不同,所以,变量的类型有一定的层次:(1)定类变量(名义变量)Nominal Measurement 是指变量的值只能把研究对象进行分类,数学性质为=或者,等级最低。 例如:性别,要么=男性,要么男性=女性(2)定序变量(序次变量)Ordinal Measurement 是指研究的变项值具有大小之或高低之分。数学性质为或,包含了=或者,测量层次高于定类。 例如:文化程度:博士;硕士;学士,既体现了文化程度的分类,同时也是一

4、种层次的排列。(3)定距变量(间距变量)Interval Measurement 是指能确定取值得距离,即变项之值的距离可知。具有+或-的数学性质,包含了前两种测量的性质。 例如:甲、乙、丙三人的工资为380、950、2000。 思考:定类和定距变量的差别和转换。(4)定比变量(比率变量)Ratio Measurement 是指变量的取值之间有某种成比例的关系。据有或的数学性质,是最高测量层次的变量。 例如:甲、乙工资分别为600、900,则乙是甲的2倍。 思考:定距与定比变量的区别变量分类的实际意义测度等级关系到数据分析时采取何种方法。关系到信息使用的效率。 二、统计表构成:统计表一般由标题

5、、表号、标目、表注等构成。编制基本原则:结构简明,一目了然。 统计表基本格式横标目的总标目(亦可空白)纵标目(一般设谓语)横标目数字表的标题 ? ? ? 注脚:说明资料来源等 X X X (顶线)(底线)表1-2 研究样本分布区名编码镇(街)名编码居委名编码总编码海珠7南华西街13鳌洲257.13.25兆龙里267.13.26滨江街14海印277.14.27远安287.14.28越秀8洪桥街15张家里298.15.29法政 308.15.30东风街16德坭新村社区319.16.31嘉和苑社区329.16.32天河9石牌街17暨南大学339.17.33华南师大349.17.34棠下街18加拿大花

6、园359.18.35天安369.18.36东山10农林街19竹丝岗一路3710.19.37东园新村3810.19.38建设街20大马路3910.20.39麓湖路4010.20.40黄埔11荔联街21笔岗4111.21.41仓联4211.21.42南岗街22四航局4311.22.43黄埔电厂4411.22.44从化12街口镇23团星村4512.23.45城内居委4612.23.46桃园镇24桃园居委4712.24.47中田村4812.24.48表3广州市各区/县社会体育人口本区比例统计表区县 本区总人口 体育人口 比例% 区县 本区总人口 体育人口 比例%花都 618654 300047 48.

7、50 荔湾 521708 186511 35.75番禺 962395 481198 50.00 芳村 184723 81564 44.88增城 834156 350346 42.00 海珠 830436 432080 52.03白云 858526 343410 40.0 越秀 426698 168546 39.50天河 598353 246820 41.25 东山 627892 279412 44.50黄埔 209535 62861 30.0 从化 533153 129290 24.25 三. 统计图统计图由标题、图号标目、图注等项构成。1. 直条图 2. 圆形图3. 线条图4. 频数颁布直方

8、图图.4中考化学统计成绩直方图5. 累积频数图图.5 2004年中考化学抽样得分情况累积频数图 10 20 30 40 50 60 70 80 90 100图2.6:高一语文四、集中量1. 算术平均数( )所有观察值总和除以总频数之和所得商。四、集中量2. 加权平均数( )是不同比重数据(或平均数)的平均数或.N表示各组的频数;X 表示各组的平均数。例1:一个学生某门课期中考试成绩为72分,期末考试成绩为86分,而期考试占总成绩的40%,期末占60%,这个学生的学期总分是多少?例2 :某校初一共有3个班,某次语文测验中,一班50人均分为68,二班45人均分为75,三班40人均分为80,问全校初

9、一语文的平均成绩?不能用:(68+75+80)/3=74.33. 教育统计中几个名词频数:随机事件在n次试验中出现的次数,称这个随机事件的频数。频数分布:各种随机事件在n次试验中出现的次数分布,称为频数分布。离差:个体量和某一群体的平均量之差。教育统计中几个名词正态分布:是一种连续型随机变量的概率分布。二项式分布中当 p=q时,且n很大时,二项式分布接近于正态分布 表2:一个学生做题正误题做对不同题数的概率分布(做对每题的概率p=1/2;做错的概率为1/2)做对题数012345678910出现方式数1104512021025221012045101五、差异量1. 全距(R)一组数据中最大值和最

10、小值之差表示,又称极差。2. 标准差(或S)标准差概念:标准差是指离差平方和后平均的方根。 问题1: 某班甲乙两组在一次测验中的成绩分别为65,68,71,72,74(均分为70分)和 30,50,86,90,94(均分为70分)。如何评价两组的学习情况?方法一:根据定义式计算方法二:根据原始数据计算方法三:利用计算器计算方法四:利用计算机计算六、相关系数相关:是指两个或两个以上变量之间存在相互依存关系。如数学课成绩与数学竞赛成绩、数学与物理成绩等。正相关负相关零相关相关系数:用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。最常用的是积差相关系数。数学与物理、物理与英语相关

11、性比较数学物理英语物理170757675260636063382756575444605660552557055690978597780894889r0.91 0.26 相关系数与相关程度表一览表表| r | 00.30.3|r| 0.50.50.81.0 相关程度零相关微相关切实相关密切相关高度相关完全相关教师第一次成绩 教师第二次成绩教师第一次成绩 Pearson Correlation1.985*Sig. (2-tailed).000N1010教师第二次成绩Pearson Correlation.985*1Sig. (2-tailed).000N1010*. Correlation is significant at the 0.01 level (2-tailed). 七、差异显著性检验假设检验的基本原理 1.假设虚无假设(零假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)无区别的假设,一般H0表示。备择假设(研究假设):是关于当前样本所属的总体(指参数)与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论