




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 1 15 1 生物统计学 Biostatistics 姓名 徐向红办公电话 87836469手机Q号码 481435E mail tongji09 2011硕士研究生 2020 1 15 2 课程安排 理论课 30学时时间 周一 周五8 00 10 30 3学时 地点 科学讲堂100实验课 20学时 每次2学时 分四个班 每次两个班时间 星期一13 30 15 0015 10 16 40星期五13 30 15 0015 10 16 40地点 公共教学中心六楼数学实验室 一号机房 2020 1 15 3 授课方式 课堂讲授 实验操作考核方式 上机操作 将答案写在试卷上 开卷 参考教材 1 统计分析与SPSS的应用 薛薇编中国人民大学出版社2 生物医学研究的统计方法 方积乾编高等教育出版社3 SPSSFORWINDOWS统计分析 卢纹岱主编电子工业出版社 2020 1 15 4 如何学习统计学 理解基本统计概念和原理培养逻辑思维的能力掌握具体统计方法上好实验课多阅读文献 设计和资料处理方法 应用 分析数据 写论文 2020 1 15 5 授课内容 一 统计学基本概念 基本统计分析二 参数检验三 方差分析四 非参数检验五 相关分析六 线性回归分析七 聚类分析 2020 1 15 6 第一讲统计学基本概念 基本统计分析 2020 1 15 7 有一位同学 想做两种饲料对某品种肉鸡的增重效果的比较研究 问题 1 要达到什么目标 目的 2 采取什么方法 3 具备什么条件 4 可能的研究过程是什么 2020 1 15 8 研究工作的基本步骤 第一步研究设计 Design 第二步收集资料 Collectionofdata 第三步整理资料 Sortingdata 第四步分析资料 Analysisofdata 2020 1 15 9 生物统计学在生物学科学研究中不可或缺的重要性 已被越来越多的人所认识 例如在阅读专业科技书刊 文献等资料时 会经常遇到统计学中的名词 术语 概念 公式 符号和图表 如果不熟悉 就不能很好地理解相关的内容 又如 要想重复或验证他人的研究结果 就离不开对其中所用统计设计和统计分析方法的了解 特别 在开展一项科学研究工作时 从开始科研设计 到数据资料的搜集 整理 再到数据资料的统计分析处理 做出结论 以至科研论文的撰写 各个环节都与统计学有关 统计学方法的正确运用 已成为保证科研工作以较少的人力 物力 时间 获取较丰富而可靠的数据 做出科学的结论 进而为出高质量的科研成果和论文 提供有力的统计学支持的重要条件 2020 1 15 10 生物统计学是概率论 数理统计与生物科学研究相结合形成的应用性学科 它主要研究生物科学研究中的统计设计方法 包括调查设计和试验设计 和统计分析方法 包括描述统计和推断统计 统计设计是在科研工作伊始 从统计学角度出发 遵循对照 重复 随机化 均衡等原则 对生物专业科研要获取的事实材料 试验数据的搜集 整理及最终可能采用的统计分析方法的选择 进行全面设计 形成科学合理的试验方案 统计分析是在科研工作获取数据后根据数理统计原理 针对不同的统计设计 对试验数据进行适当的运算处理 给出合理的统计学解释 为进一步作出正确的专业结论 给予统计学支持 可以说 每一种统计设计方法必须考虑最终可供选择的统计分析方法 而每一种统计分析方法又都针对特定的统计设计方法 二者相辅相成 密不可分 构成生物统计学的主要内容 2020 1 15 11 进行调查或试验必须解决二个问题 如何合理地进行调查或试验设计 如何科学地整理 分析所收集得来的具有变异的资料 揭示出隐藏在其内部的规律性 2020 1 15 12 一 提供试验或调查设计的方法广义的试验设计是指试验研究课题设计 也就是指整个试验计划的拟定 包含课题名称 试验目的 研究依据 内容及预期达到的效果 试验方案 供试单位的选取 重复数的确定 试验单位的分组 试验的记录项目和要求 试验结果的分析方法 经济效益或社会效益的估计 已具备的条件 需要购置的仪器设备 参加研究人员的分工 试验时间 地点 进度安排和经费预算 成果鉴定 学术论文撰写等内容 狭义的试验设计主要是指试验单位 如动物试验的畜 禽 的选取 重复数目的确定及试验单位的分组 2020 1 15 13 广义的调查设计是指整个调查计划的制定 包括调查研究的目的 对象与范围 调查项目及调查表 抽样方法的选取 抽样单位 抽样数量的确定 数据处理方法 调查组织工作 调查报告撰写与要求 经费预算等内容 狭义的调查设计主要包含抽样方法的选取 抽样单位 抽样数目的确定等内容 试验或调查设计主要解决合理地收集必要而有代表性资料的问题 2020 1 15 14 二 提供整理 分析资料的方法整理资料的基本方法是根据资料的特性将其整理成统计表 绘制成统计图 通过统计表 图可以大致看到所得资料集中 离散的情况 并利用所收集得来的数据计算出几个统计量 以表示该资料的数量特征 估计相应的总体参数 2020 1 15 15 统计分析最重要的内容是差异显著性检验 通过抽样调查或控制试验 获得的是具有变异的资料 产生变异的原因是什么 是由于进行比较的处理间 例如不同品种 不同饲料配方间有实质性的差异或是由于无法控制的偶然因素所引起 显著性检验的目的就在于承认并尽量排除这些无法控制的偶然因素的干扰 将处理间是否存在本质差异揭示出来 2020 1 15 16 显著性检验的方法很多 常用的有 t检验 主要用于检验两个处理平均数差异是否显著 方差分析 主要用于检验多个处理平均数间差异是否显著 检验 主要用于由质量性状得来的次数资料的显著性检验等 2020 1 15 17 统计分析的另一个重要内容是对试验指标或畜禽性状间的关系进行研究 或者研究它们之间的联系性质和程度 或者寻求它们之间的联系形式 即进行相关分析与回归分析 还有一类统计分析方法不考虑资料的分布类型 也不事先对有关总体参数进行估算 这类统计分析方法叫非参数检验法 非参数检验法计算简便 当通常的检验方法对畜禽 水产科研中的某些资料无能为力时 非参数检验法则正好发挥作用 2020 1 15 18 聚类分析 物以类聚 一种建立分类的多元统计分析方法 它能够将一批样本 或变量 数据根据其诸多特征 按照在性质上的亲疏程度进行自动分类 2020 1 15 19 生物统计的常用术语 一 总体与样本根据研究目的确定的研究对象的全体称为总体 population 总体中的一个研究单位称为个体 individual 总体的一部分称为样本 sample 含有有限个个体的总体称为有限总体 包含有无限多个个体的总体叫无限总体 2020 1 15 20 在实际研究中还有一类假想总体 例如进行几种饲料的饲养试验 实际上并不存在用这几种饲料进行饲养的总体 只是假设有这样的总体存在 把所进行的试验看成是假想总体的一个样本 样本中所包含的个体数目叫样本容量或大小 samplesize 样本容量常记为n 通常把n 30的样本叫小样本 n 30的样本叫大样本 研究的目的是要了解总体 然而能观测到的却是样本 通过样本来推断总体是统计分析的基本特点 2020 1 15 21 为了能可靠地从样本来推总体 要求样本具有一定的含量和代表性 只有从总体随机抽取的样本才具有代表性 所谓随机抽取 randomsampling 的样本是指总体中的每一个个体都有同等的机会被抽取组成样本 样本毕竟只是总体的一部分 尽管样本具有一定的含量也具有代表性 通过样本来推断总体也不可能是百分之百的正确 有很大的可靠性但有一定的错误率这是统计分析的又一特点 2020 1 15 22 二 参数与统计量为了表示总体和样本的数量特征 需要计算出几个特征数 由总体计算的特征数叫参数 parameter 由样本计算的特征数叫统计量 staistic 常用希腊字母表示参数 例如用 表示总体平均数 用 表示总体标准差 常用拉丁字母表示统计量 例如用表示样本平均数 用S表示样本标准差 2020 1 15 23 三 准确性与精确性准确性 accuracy 也叫准确度 指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度 精确性 precision 也叫精确度 指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度 调查或试验的准确性 精确性合称为正确性 2020 1 15 24 四 随机误差与系统误差随机误差 randomerror 与系统误差 systematicerror 随机误差也叫抽样误差 samplingerror 这是由于许多无法控制的内在和外在的偶然因素所造成 随机误差带有偶然性质 在试验中 即使十分小心也难以消除 随机误差影响试验的精确性 2020 1 15 25 统计上的试验误差指随机误差 这种误差愈小 试验的精确性愈高 系统误差也叫片面误差 lopsidederror 这是由于试验动物的初始条件相差较大 饲料种类 品质 数量 饲养条件未控制相同 测量的仪器不准 标准试剂未经校正 以及观测 记载 抄录 计算中的错误所引起 系统误差影响试验的准确性 2020 1 15 26 第一节试验指标的类型和数据资料的分类 试验指标是对研究对象进行观察 记录并进一步用于分析 比较的定性或定量标志 试验指标也相应地分为定性指标和定量指标两种类型 科研中 常见的定量指标有 人体的身高 体重 胸围 血压 血脂 胆固醇 白血球数 血红蛋白量 家畜的日增重 产仔数 初生重 产蛋数 产奶量 产毛量 农作物的产量 株高 千粒重 单穗粒数 常见的定性指标有 动物毒性试验中的死亡 存活 治疗疾病疗效的痊愈 好转 无效 加重 死亡 某项化验结果的 家畜毛色的黑 白 花 性别的公 母 血型的O A B AB 定性指标中 诸如疗效这类按等级划分的指标 特称为等级指标或半计量指标 资料的整理 2020 1 15 27 例如 某湖水不同季节氯化物含量测定值 mg L 春夏秋冬 22 619 118 919 022 822 813 616 921 024 517 217 616 918 015 114 820 015 216 613 121 918 414 216 921 520 116 716 221 221 219 514 5 对于定量指标一般直接记录或分组记录 形成的数据资料称为计量资料 2020 1 15 28 对于定性指标 一般是按指标 分类统计研究对象的例数 形成计数资料 或称频数资料 其中 与等级指标或半计量指标相对应的计数资料 特称为等级资料或半计量资料 计数资料因已对试验指标做了频数统计 因此也称计数资料统计表 例如 抗骨质增生丸对几种骨质增生病的疗效 病种 不同疗效例数 显效好转无效合计 增生性脊椎炎颈椎病退化性关节炎跟骨刺大关节炎合计 658115478207621231202820126026141050142214508021921061100 2020 1 15 29 因计量资料和计数资料适用的统计方法完全不同 而计量资料和计数资料本身 又分别因统计设计方法的不同而分成不同的子类 不同子类又可能适用不同的统计方法 故对试验数据形成资料的分类 应引起特别的重视 只有正确判定资料属计量资料还是计数资料后 才可能进一步正确判定分属它们的哪一个子类 最终选择正确的统计分析方法 2020 1 15 30 第二节资料的整理 一 资料的检查与核对检查和核对原始资料的目的在于确保原始资料的完整性和正确性 所谓完整性是指原始资料无遗缺或重复 所谓正确性是指原始资料的测量和记载无差错或未进行不合理的归并 检查中要特别注意特大 特小和异常数据 可结合专业知识作出判断 对于有重复 异常或遗漏的资料 应予以删除或补齐 对有错误 相互矛盾的资料应进行更正 必要时进行复查或重新试验 2020 1 15 31 二 资料的整理方法当观测值不多 n 30 时 不必分组 直接进行统计分析 当观测值较多 n 30 时 宜将观测值分成若干组 以便统计分析 将观测值分组后 制成次数分布表 即可看到资料的集中和变异情况 2020 1 15 32 一 计数资料的整理 抗骨质增生丸对几种骨质增生病的疗效 病种 不同疗效例数 显效好转无效合计 增生性脊椎炎颈椎病退化性关节炎跟骨刺大关节炎合计 658115478207621231202820126026141050142214508021921061100 例如 2020 1 15 33 二 计量资料的整理计量资料在分组前需要确定全距 组数 组距 组中值及组限 然后将全部观测值划线计数归组 例1 将126头基础母羊的体重资料 见下表 整理成次数分布表 2020 1 15 34 表126头基础母羊的体重资料单位 kg 2020 1 15 35 表样本含量与组数本例中 n 126 初步确定组数为10组 2020 1 15 36 表126头基础母羊的体重的次数分布表 2020 1 15 37 三 质量性状资料 半定量 等级 资料的整理对于质量性状资料 半定量 等级 资料 可按性状或等级进行分组 分别统计各组的次数 然后制成次数分布表 表F2代山羊的有角无角分离情况 2020 1 15 38 表仔猪死亡情况 2020 1 15 39 统计表与统计图是对科研数据进行统计描述的重要工具 统计表是以表格的形式 用样本统计量描述事物的特征和事物间的关联 同时也便于进一步计算 分析和比较 统计图则是用图形 形象 直观地勾画出事物的特征和事物间的关联 并可在短时间内给人以清晰 明了的印象 正确地采用统计表和统计图 还可以替代冗长的文字叙述 因此在科研论文中和展览图板上 统计表和统计图被广为应用 第三节统计表与统计图 统计表的结构统计表一般由标题 标目 线条 数字和备注五部分组成 1 标题标题位于统计表的上方 应简明扼要地概括出统计表的主要内容 叙述文字应少而精 当对统计表在上 下文中已做明确说明 该表以后又不被引用时 也可省略标题 一 统计表 2020 1 15 40 2 标目标目分为横标目 说明横行数值的涵义 纵标目 说明竖列数值的涵义 总标目 说明横标目 纵标目及其相关数据的涵义 叙述文字应少而精 3 线条统计表中一般不用竖线 斜线 只用横线对表中内容进行上 下分割 且横线也尽量少用 而对表中内容的左右分割 则以留适当的间隔实现 4 数字同一类目的数字应有相同的精确度 一般保留相同的小数位数 各位数应上 下对齐 0 表示数字为0 表示数字不详或省略 表示该处不应有数字 5 备注备注仅在特别需要时 列在统计表下方 并注明统计表中被说明的部分 2020 1 15 41 计数资料统计表计数资料本身已对定性指标分类做了例数统计 因此称为计数资料统计表 计数资料统计表中 还常常把有关的相对数 率 构成比列出 例计数资料统计表 2020 1 15 42 计量资料统计表计量资料统计表 是由计量资料经必要的统计分析后整理而成 例计量资料 10名某病患者治疗前及治疗后一个月的血沉 mm h 计量资料统计表 2020 1 15 43 统计图的构造统计图一般由标题 图域 标目 刻度和图例五部分构成 1 标题标题位于统计图下方 其作用 要求与统计表标题相同 当对统计图在上 下文中已做明确说明 该图以后又不被引用时 也可省略标题 2 图域图域是绘制图形的区域 除圆图外 习惯取直角坐标轴的正方向部分为图域的左边线和底边线 有时也画出上边线和右边线 方形图域的长宽比一般取7 5 3 标目标目分为横轴标目与纵轴标目 分别说明横轴与纵横标记刻度的意义 一般有刻度的度量衡单位 4 刻度刻度是指横 纵两个坐标轴上的刻度 多为定量指标刻度 有时横 纵轴之一也采用定性指标刻度 定量指标刻度一般采用算术尺度 有时也采用对数尺度 当两坐标轴的交点作为定量指标的起始刻度时 一般是0 有时也可以分别对两坐标轴取其它数值 5 图例图例是对图形的简要说明 仅在较复杂的统计图中使用 作用是便于区分同一图域中的代表不同意义的图形 图例可以放在图域内 也可放在图域外 标题上方 二 统计图 2020 1 15 44 常用统计图 一 条图条图是用宽度相等的长方条的长度 表示统计量的数值 统计量可以是绝对数 相对数或平均数 1 单式条图用于描述由一个因素分组的同一个统计量的比较 例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 突发公共卫生事件护理
- 智能制造印刷技术指南
- 化学工业废物处理规定
- 物业管理遗失物品处理方案
- 冒险卡通动漫报告
- 2025新疆兵团粮安储备粮管理有限责任公司招聘19人笔试含答案
- 2025西安光环电子科技有限公司招聘(3-5人)笔试含答案
- 2025年铁岭银行见习生招聘50人笔试含答案
- 企业规章制度的协同与协作
- 2025年事业单位工勤技能-福建-福建计算机信息处理员三级高级历年参考题库含答案解析
- 区妇联家庭教育工作的调研报告
- 劳保用品发放表格及管理
- 江苏省盐城市各县区乡镇行政村村庄村名居民村民委员会明细
- 税法(第三版)项目一任务三增值税应纳税额的计算
- Q∕SY 01004-2016 气田水回注技术规范
- TSG Z8002-2022 特种设备检验人员考核规则
- 非标自动化设备公司绩效与薪酬管理方案(范文)
- 2019年广东公务员考试行测真题及答案(县级)
- 电工常用工具(课堂PPT)
- 虹桥高铁外墙顾问建议ppt课件
- (高清版)外墙外保温工程技术标准JGJ144-2019
评论
0/150
提交评论