抽样原方法和样本量ppt课件.ppt

上传人：闯*** IP属地：广东上传时间：2019-12-27 格式：PPT 页数：50 大小：805KB 积分：25 举报 版权申诉

已阅读5页，还剩45页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 抽样方法和样本量 2 前面已经介绍总体在很多情况下往往是很大的有时是无限的因此对总体的研究往往是不可行的而生物统计学的特点之一是其概率归纳原理即通过对某一特定的具体的样本进行分析在一定概率保证下进行总体的推断例如对水体污染进行检查对空气质量检查不需要也不可能对整个水体整个空气逐一进行检查只需要抽取一小部分的水空气进行分析被抽取的这一小部分水空气就是样本抽取水和空气的这一过程就是抽样的过程 3 如何抽样抽样应当遵循什么原则什么样的样本才能认为符合标准这是本章要讨论的问题抽样的总原则是样本必须来自于所研究的总体样本必须能代表所研究的总体抽样方法必须与抽样目的相一致抽样认真抽样方法正确客观样本就具有代表性反之抽样马虎草率武断主观弄虚作假样本就差就不具有代表性 4 抽样方法试验调查的目的不同试验调查的方法不同抽样的方法也不同这里仅介绍几个抽样方法一随机抽样法总体比较整齐变异程度小群体分布均匀可用随机抽样法随机抽样法的原则是总体内每一个体数据都有同等的机会进入样本样本中每一个体数据进入任何一个组的机会也是相等的 5 随机抽样法可以完全排除个人的主观性随机抽样法是最简单最常用的抽样方法随机抽样法有以下几种方法抓阄法随机数字法伪随机数字法通过随机抽样法得到样本后一般需计算样本的特征值用以估计总体参数几乎所有调查和试验都可以采用随机抽样法进行抽样 6 二整群抽样和多层次抽样法从总体中抽取数个样本单位群对单位群内的全部个体作全面调查或用整个单位群进行试验样本单位群的抽取既可以用随机抽样法得到也可以有选择地取得在整群抽样的基础上对抽得的样本单位群不作全面调查或不是整个样本单位群进入试验而是在样本单位中继续抽取一定量的个体数据组成样本这就是二级抽样 7 如果二级抽样得到的不是个体数据而是更小的单位群再从中进行抽样这就是三级抽样以此类推二级及二级以上的抽样就称为多层次抽样多层次抽样方法适合于资源调查遗传学试验育种学试验传染病寄生虫病调查流行病学调查经济学调查等 8 三双重抽样法当所研究的性状比较复杂或所需经费较多或须将试验动物宰杀后才能测定因而不大可能进行重复性试验或采用直接抽样试验时有较大的难度可采用双重抽样法采用双重抽样法首先将所需要进行研究的性状定为目标性状或称为靶性状用y表示然后根据文献或其他方法确定一个或几个简单易测不具破坏性与靶性状相关性比较紧密的性状这些性状称为辅助性状用xi表示 9 从总体中抽取两个样本一个大样本一个小样本先对小样本进行调查或先用小样本进行试验对这一小样本既测y性状同时也测xi性状获得n对y和xi 并建立xi与y的回归方程最简单的回归方程就是只有一个xi的简单回归方程也可以是曲线回归方程也可以建立多元回归方程建立回归方程的原则是其r 或其绝对值或R必须很大以表明用x或xi估测y其效果比较好 10 而较大的样本在调查或试验中仅测xi性状并将这一样本中所有被测个体的xi代入上述回归方程中以求得相应的y估计值这样获得的大样本的y估计值能达到一定的精度这一抽样方法即为双重抽样法双重抽样法的优点是对于复杂性状的调查或试验仅需破坏较小的样本即能获得较大样本的精确性当目标性状为破坏性性状时这是唯一行之有效的方法 11 双重抽样法的适用范围遗传学试验育种学试验繁殖学试验生理生化学试验疾病防治试验等双重抽样示意图 xiyxi 总体 y 2 小样本大样本 12 样本容量样本容量越大试验结果就越具有代表性调查的精确性准确性也越高但随着样本容量的增大抽样或试验的成本也越大当样本容量大到一定程度时再增大样本容量试验或调查其精确性的提高就渐趋缓慢当标准差一定时标准误的大小与样本容量的平方根成反比样本容量较小时随着样本容量的增大标准误会急剧减小但当样本容量大到一定程度后再增大样本容量标准误的减小将会变得越来越慢即继续增大样本容量试验精确性的提高其效能将逐步下降 13 而随着样本容量的增大试验或调查所需成本时间人力物力等则可能会成倍地增长因此确定一个合宜的样本容量使得试验或调查既有一个较好的精确度又能最大限度地节省人力和时间财力物力是试验或调查必须要考虑的问题 14 样本容量的确定原则和确定方法总体有限且很大时同时注意抽样的代表性样本可占总体的千分之一到百分之一总体不很大时样本占总体的百分之五率的计算和估计一般要求大样本在试验中同一水平或同一组合的变异情况越严重所需样本越大同一组合的供试动物越整齐可适当减少动物数试验越规范试验结束后使用的统计方法越严格所需动物数可适当减少 15 小家畜的供试数应多一些如鸡猪大家畜的供试数可适当少一些试验时考虑的因子数越多每一组合内的供试动物数可少一些单因子试验则每一水平内的供试动物数应多一些 16 不同的抽样方法所需样本量还应当根据具体的抽样方法来确定整群抽样时既要考虑群体单位的大小又要考虑作为样本的群体的多少原则上应采取小群体多群体的抽样方法因为这样可以更全面地了解总体的情况多层次抽样时有一个每个层次样本量的比例的问题这里需要考虑每一层次的变异情况及各层次的抽样成本以便对每一层次内单位数进行合理的分配 17 在不知道总体的大小和情况时可以从试验要求的精确性来考虑样本容量根据参考文献他人或自己的经验专业知识等人为地定出一个样本平均值与总体平均值的离差即允许误差L 而其中一般初次总取1 96 置信度为95 因此 18 显然人为定出的允许误差越大所需样本量就小反之人为定出的允许误差越小即对试验的要求的精确度越高所需的样本量就越大一般来讲当所需要的样本量不大时 n 30 应当进行反复试求最后使得n稳定在某一个值上例已知一总体的大致标准差为9 7 若规定在抽样时允许存在L 2 5的误差试求抽样所需的样本容量 19 即在95 的置信度下需要61个个体作为一个样本才能较好地说明问题当要求有较高的置信度99 时其样本含量的计算公式为运用这一公式所得到的n值一般不应小于30 当所得样本量小于30时应作进一步的试运算直至所得样本量n稳定时为止 20 又例一总体其标准差为15 9 试验允许误差为L 10 求试验所需最小样本量暂设则由于n较小 30 故应重求n值查t值表得继续试算则继续试算则 21 所求样本量已稳定在n 12 即表示抽样以n 12为较宜样本量从上面两例可以看出调查或试验所规定的L 即允许误差亦即置信半径越大所需样本量就可以越小表示调查或试验越粗糙反之所规定的允许误差L越小即调查或试验需要更高的精确度时所需要的样本量就应越大这样所得到的结果也越可靠因此在实施某一调查或试验时应确定一个合宜的允许误差L 必要时应调整所设置的L值 22 对于百分率一类性状的调查或试验所需要的样本量由于而因此95 置信度下的样本量为例 p 0 7 规定调查时的允许误差置信半径 L 0 075 试求所需样本量调查百分率性状时样本量不能太小 n 100 23 百分率一类的性状求样本容量时应注意允许误差的取值应小于百分率特别是当该百分率趋于两端 0 7 时更应注意L的取值 24 关于允许误差L的取值允许误差L即为置信半径如何确定允许误差这关系到样本容量的大小也决定了试验或调查的成败因此允许误差的确定是试验或调查前需要慎重考虑的问题从前面所介绍的公式和例题中我们已经看出当总体方差标准差基本确定后样本容量即试验规模与允许误差的大小是有直接的关系的而总体方差的大小可以根据前人的结果所得到 25 允许误差如何确定一是需要查阅大量的文献从类似的试验或调查中确定本次试验或调查的规模二是根据自身试验或规模的大小来确定这里需要考虑的一个主要问题是试验或调查的资金来源和经费的充裕程度三是需要考虑试验或调查的精确程度允许误差实际就是样本平均值与总体平均值的差距最大不超过的某一界限因此它决定了试验或调查的精确程度 26 一旦确定了允许误差就可以用试验或调查结束后得到的样本平均值来告诉人们总体平均值在哪一个可能的范围里面这一个结论就有了理论依据不致被人所诘难或质疑因此确定允许误差得到的样本容量不宜太小样本容量太小试验或调查的结果比较粗糙也易引起别人的质疑但也不需要太大太大需要大量的经费和人力物力时间由于求率成数等所需要的样本容量还是尽可能大一些为好 27 抽样误差的估计抽样误差一般用标准误来表示因此估计抽样误差就是求标准误的大小标准误既与标准差有关也与样本容量有关样本不同所得到的误差不同抽样方法不同所得到的抽样误差也不同由于抽样误差表示的是样本平均数与总体平均数之间的差异因此为了使总体平均数的估计更可靠更精确应当使用合适的抽样方法标准误求得以后应计算总体平均值的置信区间 28 试验设计原理 29 研究进程什么是科学研究任何人想要达到自己的愿望或要求在充分尊重客观事实的前提下所进行的探索性工作研究进程分为如下几个阶段科学假设资料收集试验方案的制订及试验设计试验的实施资料的分析及统计研究成果的发表 30 误差误差的概念及分类从试验中获得的数据总或多或少地偏离真值这种偏离就称为误差误差分为系统误差随机误差三类错误系统误差有规律的偏离影响准确性可以消除随机误差无规律影响精确性可以缩小有统计学意义错误人为造成应当消灭 31 随机误差的来源这里所指误差是指随机误差简称误差生物体的复杂性导致了误差的存在动物体试验又有更大的误差了解误差其目的是为了缩小误差缩小误差有两个现实意义提高精确性有效减小试验规模缩小误差其实质是有效地保证数据的整齐程度试验所得到的数据越整齐误差就越小所需样本也就可以越小 32 误差来源于以下三个方面试验材料遗传物质的不同一或样本的本质不同试验动物的基因或遗传物质不可能纯合越是高等的动物其基因越是复杂所造成的误差也就越大这是造成误差的最根本原因试验过程中操作与管理技术的不一致操作人员的技术管理水平不可能一致不同的时间段内操作人员的体力精神情绪不可能一致操作人员的责任心也不可能一致 33 试验外界条件的不统一试验动物不可能安排在绝对一致的环境内对同一组内每一个供试动物的试验措施也不可能绝对一致 34 误差的控制针对造成误差的三大原因采取的控制措施选择基因型较为纯合的近交系基因纯合的程度依次为同卵双生个体自交系高度近交的近交系近交系全同胞半同胞家系纯种其中后三种是动物试验中可以实际使用的试验群体两个纯种的杂交后代F1代在某些情况下可以考虑使用 35 来自同一父亲的半同胞由于群体很大在遗传学试验育种学试验营养学试验繁殖学试验中经常使用家系一般可用来分析许多遗传性疾病和寻找疾病的遗传学规律可以用来作人类疾病动物模型中国许多动物地方品种由于地处交通闭塞的地区因而高度近交这样的纯种是很好的试验材料级进杂交的群体也是较好的试验材料 36 对操作人员进行培训教育制订标准化的操作规程制订规范化的操作程序尽可能机械化自动化对所用仪器设备进行校正设立标准器具制订标准曲线及校正公式同一批样品在同一天内由同一个人用同一批试剂完成测试 37 对外部环境进行有效的控制试验动物的取样分组配置试验次序采取随机化的原则采用局部控制的方法设置区组将试验动物进行分组统计分析时将区组时间空间作为一个因子进行处理减少试验动物的活动范围减少疾病对试验动物的袭扰消毒减少环境污染药物污染饲料污染控制温度湿度 38 试验设计的基本原则重复在同一处理内设置多个独立供试单位作用正确地评价误差有效地降低误差准确地估计处理效应为随机化局部控制提供基础 39 随机化在试验的整个过程中贯彻随机的精神而不带有任何主观偏见作用使误差的估计无偏准确正确地评价误差局部控制设置区组每一区组控制在同一环境内作用有效地降低系统误差 40 试验设计三原则的关系重复随机化设置区组局部控制使误差估计无偏准确评价误差统计推断降低误差提高精确度三原则作用 41 现在我们来看一个随机化和局部控制的例子假设设计了6种不同的饲料从A1至A6 每一种饲料饲喂8头猪每一头猪一个圈舍共计48头猪 48个圈舍共分6排每排8个圈 8头猪喂一种料排列如下表试验中需空腹称重假设从早晨8 00开始称重每头猪需时5分钟则共需240分钟即4个小时需称至中午12 00点钟称重顺序为先称A1的8头猪然后是A2的8头猪以后依次为A3 A4 A5 直至A6 那么 A1的8头猪称重时间为8 00到8 40 受空腹影响不大 A2的8头猪就受到一定的影响了因为这A2的8头猪是从8 40称至9 20的 A3受空腹的影响就更大因为是从9 20称至10 00点显然 A4 A5和A6的猪受空腹的影响一个比一个大到A6的最后8头猪事实上是在11 20以后称重的这8头猪整整饿了半天其体重肯定比A1的8头猪损失了好多下面3张表分别是顺序称重随机称重区组称重 42 称重顺序 43 称重顺序 44 一二三四五六七八 45 上述三种称重方法的比较显然第一种称重方法存在着很大的系统误差每一只猪的体重中不但有着饲料的效应而且混杂有称重时间的影响这一称重方法显然不妥第二种称重方法虽然没有了系统误差但随机误差却变大了而且大得让人不能容忍第三种称重方法由于设置了区组区组内又进行了随机化按区组进行称重称重时间引起的差异转化成了区组因素 B 区组内又进行随机配置随机称重将每一区组内残留的一点点系统误差转化成了随机误差因此这一称重方法就消除了所有的系统误差而随机误差也不致增大很多对试验精确性的影响不会很大其实很多试验都有类似的情况 46 试验设计的注意事项应全面

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

抽样原方法和样本量ppt课件.ppt

文档简介

温馨提示

最新文档

评论

抽样原方法和样本量ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档