生物统计01ppt课件_第1页
生物统计01ppt课件_第2页
生物统计01ppt课件_第3页
生物统计01ppt课件_第4页
生物统计01ppt课件_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 绪论 学习目标: 理解统计学的概念 了解统计学的应用领域 了解数据的类型 理解统计中的几个基本概念 1.1统计及其应用领域 111 什么是统计学statistics 1、统计学是收集、分析、表达和解释数 据的科学(不列颠百科全书) 2、统计是一门收集、分析、解释和提供 数据的科学(韦伯斯特国际词典第3版) 3、统计指的是一组方法,用来设计实验 、获得数据、然后在这些数据的基础上组 织、演示、分析、解释和得出结论( Marion F. T.,初级统计学) 统计定义:统计学是一门收集、整理和分 析数据的方法的科学,其目的是探索数据 的内在数量规律性,以达到对客观事物的 科学认识。 收集数据:调查或实验取得数据。 处理数据:数据的整理与图表展示。 分析数据:利用统计方法分析数据。 数据解释:结果的说明。 得到结论:从数据分析中得出客观结论。 生物统计学 生物统计是数理统计的原理和方法在生物 科学研究中的应用,是一门应用数学。 一、提供试验或调查设计的方法 二、提供整理、分析资料的方法 112 统计方法: 描述统计 研究数据收集、整理和描述的统计学分枝 内容: 收集数据 整理数据 展示数据 描述性分析 目的 描述数据特征 找出数据的基本规律 推断统计 研究如何利用样本数据来推断总体特征的 统计学分枝 内容: 参数估计 假设检验 目的: 对总体特征作出推断。 描述统计与推断统计的关系 113 统计应用领域 非常广泛: 举出一个统计没有用途的领域名称比举出 一个统计作为其组成部分的领域名称要困 难得多。 Robert Johnson 12 统计数据的类型 121统计数字按计量层次分类 1分类数据(categorical data) 只能归于某一类别的非数值字型数据 对事物进行分类的结果,数据表现为类别 ,常用文字表述。 例如:人口按性别分为男、女两类。 2.顺序数据(rank data) 只能归于某一有序类别的非数值字型数据 对事物类别顺序的测度,数据表现为类别 ,常用文字表述。 例如:产品分为一等品、二等品、三等品 、次品等。 3数值型数据(metric data) 按数值尺度测量的观察值 结果表现为具体的数值,对事物的精确测度。 例如:身高为175cm、168cm、183cm。 数值型数据又可分为连续变量和非连续变量( 离散变量) 连续变量:表示在变量范围内可抽出某一范围 的所有值,这种变量之间是连续的、无限的。 如小麦的株高在8090cm,在此范围内可取无 数个变量。 离散变量:表示在变量数列中,仅能取固定的 数值。如小白鼠每胎产仔数;某样点的人口数 等。 122 统计数据按收集方法分类 1观测的数据(observational data) 通过调查或观测而收集到的数据。 在没有对事物人为控制的条件下而得到得数据 。 有关社会经济现象得统计数据都是观测数据; 部分自然科学领域的数据也可以通过调查和观 测获得。 2试验数据(experimental data) 在试验中控制试验对象和试验条件而收集到的 数据。 比如对一种新药疗效的试验,对一种新的农作 物品种的试验等。 自然科学领域的数据大多数都为试验数据。 123 统计数据按时间分类 1截面数据(cross-sectional data) 在相同或近似(可以认为相同)的时间点 上收集的数据 描述现象在某一时刻的变化情况 比如2005年我国各地的国内生产总值数据 2时间序列数据 在不同时间上收集的数据 描述现象随时间变化的情况 比如2000年至2005年国内生产总值数据 13 统计中的几个基本概念 总体和样本 参数和统计量 变量 随机误差与系统误差 准确性与精确性 131 总体和样本 1总体(population) 所研究的全部个体(数据)的集合,其中的每 个个体称为元素。 总体分为有限总体和无限总体: 有限总体的范围能够明确确定,且元素的数目 是有限的 无限总体所包括的元素是无限的,不可数的。 2样本(sample) 从总体中抽出的一部分元素的集合。 构成样本的元素的数目称为样本容量或样本量 (sample size)。 132 参数和统计量 1参数(parameter) 描述总体特征的概括性数字度量,是研究者想 要了解的总体的某种特征值。 所关心的参数主要有总体均值()、标准差( )、总体比例( )等。 总体参数通常用希腊字母表示。 2统计量(statistic) 用来描述样本特征的概括性数字度量,它是根 据样本数据计算出来的一些量(值),是样本 的函数。 所关心的样本统计量有样本均值( )、样本标 准差(s)、样本比例(p)等。 样本统计量通常用小写英文字母表示。 133 变量 1说明现象某种特征的概念,相同性质 的事物间表现差异性或差异特征的数据称 为变量,它表示在一个界限内变动着的性 状的数值。 如商品销售额、受教育程度、产品的质 量等级等。 变量的具体表现称为变量值,即数据。 2变量可以分为以下几类: 分类变量(categorical variable): 说明 事物类别的名称 顺序变量(rank variable): 说明事物有 序类别的名称 数值型变量(metric variable): 说明事 物数字特征的名称 离散变量:取有限个值 连续变量:可以取无穷多个值 变量的其它分类: 随机变量和非随即变量 经验变量(empirical variables)和理论变 量(theoretical variables) 经验变量所描述的是我们可以观察或试 验探测到的事物 理论变量则是由统计学家用数学方法所 构建出来的一些变量,比如,z统计量、t 统计量、F统计量、X2统计量等。 134准确性与精确性 准确性(accuracy)也叫准确度,指在调查 或试验中某一试验指标或性状的观测值与 其真值接近的程度。设某一试验指标或性 状的真值为,观测值为 x,若 x与相差 的绝对值|x|小,则观测值x的准确性高 ;反之则低。 精确性(precision)也叫精确度,指调查或 试验中同一试验指标或性状的重复观测值 彼此接近的程度。若观测值彼此接近,即 任意二个观测值xi 、xj 相差的绝对值|xi xj |小,则观测值精确性高;反之则低。 准确性、精确性的意义图示如下: 图1-1 准确性与精确性示意图 图1-1(a)观测值密集于真值两侧,其准确 性高、精确性亦高;图1-1(b)观测值稀疏 地分布于真值两侧,其准确性高,精确 性却低;图1-1(c)观测值密集于远离真值 的一侧,准确性低,精确性高;图1-1(d) 观测值稀疏的分布于远离真值的一侧, 其准确性、精确性都低。 135 随机误差(random error) 与系统误差(systematic error) 随机误差也叫抽样误差(sampling error),这是 由于许多无法控制的内在和外在的偶然因素所 造成。随机误差带有偶然性质,在试验中,即 使十分小心也难以消除。随机误差影响试验的 精确性。统计上的试验误差指随机误差。这种 误差愈小,试验的精确性愈高。 系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论