浙大生物统计实验报告1.docx_第1页
浙大生物统计实验报告1.docx_第2页
浙大生物统计实验报告1.docx_第3页
浙大生物统计实验报告1.docx_第4页
浙大生物统计实验报告1.docx_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程名称:生物统计与实验设计姓 名:赵应学 院:农业与生物技术学院系:应用生物科学专 业:应用生物科学学 号:3140100080指导教师:朱军、徐海明2016年4 月11 日专业: 应用生物科学 姓名: 赵应 学号: 3140100080 日期: 2016年4月11日 地点:紫金港西1-106(多) 装 订 线实验报告课程名称: 生物统计与实验设计 指导老师: 徐海明 成绩:_ _实验名称: 简单统计分析和简单线性回归 实验类型: 综合实验 同组学生姓名: 无 一、 实验目的和要求初步了解Excel软件的数据分析功能,掌握连续变量和离散变量的样本资料简单统计分析的方法,掌握简单回归模型的分析方法。二、 实验内容和原理1、连续变量的统计分析方法;2、离散变量的分析方法;3、简单回归模型的统计分析方法。三、 主要仪器设备一台装有excel和SAS软件的PC四、 操作方法和实验步骤1、 实验数据的生成:本实验所用的数据需要基于设置的参数,运行计算机模拟软件(QTLSimulation.exe)产生。先打开参数设置文件SimPar.txt,用自己的学号替换第一设置行“The seed for initilizing the rand() = 2551949”中的随机数发生器的种子“2551949”。然后重新保存设置文件。运行模拟软件时需要输入参数设置文件名。模拟软件产生三个文件,DHSim.Par是基因数目、位置、效应的参数文件,DHSim.Map是分子标记遗传图谱的文件,DHSim.Txt是基因定位遗传群体(样本数n =200)的分子标记和二个环境模拟性状的表现型值的文件。以DHSimuData.xls文件的格式,整理可分析的数据文件。计算机模拟的参数设置如下:表 1 参数设置QTLChromosomeMarkerIntervalDistance(cM)AAE1AE21133.04.704.47-4.472178.00.000.000.003245.0-4.100.000.004362.00.000.000.005331.03.50-3.163.16表 2 参数设置InteractionQTL-iQTL-jAAAAE1AAE21123.200.000.002130.00-4.204.20324-3.003.16-3.162、 实验数据的分析:采用Excel软件整理数据,采用Excel对样本资料进行简单的统计分析和简单回归分析,如下:a) 连续变量的统计分析:采用Excel分别计算仿真群体的表现型数据的样本均值、样本方差、标准误。b) 离散变量的统计分析 :对各分子标记位点,采用Excel计算仿真群体的分子标记基因型频率、样本频率的方差、标准误。c) 简单回归模型的统计分析方法;采用Excel以环境一的数据为依变量,以环境二的数据为自变量,计算简单线性回归系数的估计值及其标准误、计算各项变异的自由度、平方和、均方。采用Excel分别以二个环境的表现型数据为依变量,分子标记为自变量,计算仿真群体表现型数据与分子标记的简单相关系数。五、 实验数据记录和处理表 3 连续变量的统计分析表现型方差表现型标准差表现型标准误环境1173.143597713.158404070.930439675环境294.651161719.728882860.687935904均值95%下限均值95%上限方差95%下限方差95%上限环境1102.2243844105.8939576143.58902212.91719环境296.8322499.5454078.49477116.39390表 4 离散变量的统计分析均值方差标准误A的频率0.4939390.000340.003211B的频率0.5060610.000340.003211以环境一的表现型值为依变量,以环境二的表现型值为自变量,运行sas程序,得到:表 5 仿真群体表现型数据与分子标记的简单相关系数Mk1Mk2Mk3Mk4Mk5Mk6Mk7Mk8Mk9环境1-0.40929-0.51972-0.67318-0.616-0.53924-0.40714-0.35012-0.29228-0.27644环境2-0.06068-0.0452-0.015160.0764560.1130360.0799870.0450660.045995-0.02191Mk10Mk11Mk12Mk13Mk14Mk15Mk16Mk17Mk18环境1-0.19791-0.200390.1902740.194260.2731340.3249830.2727910.2170110.188191环境2-0.05579-0.075730.2174890.2539640.2903370.3997820.3680530.2570150.238907Mk19Mk20Mk21Mk22Mk23Mk24Mk25Mk26Mk17环境10.124310.0713190.0629180.0403910.005624-0.01162-0.06373-0.17677-0.14065环境20.2715750.2604550.1944540.15109-0.33-0.32322-0.39922-0.49479-0.56993Mk28Mk29Mk30Mk31Mk32Mk33环境1-0.1258-0.11172-0.10073-0.09094-0.09902-0.08927环境2-0.66838-0.65725-0.47147-0.42518-0.38046-0.3616六、 实验结果与分析1、 检验群体均值和方差与零是否存在显著差异用二尾检验:H0:u=0 H1:u0 均值用t检验,得出环境1、2均值都存在显著差异H0: 2=0 H1: 20 方差用卡方检验,得出环境1、2方差存在显著差异2、 计算仿真群体各分子标记位点的基因型95%置信区间,检验分子标记基因型频率是否符合1:1的分离比例标记型A的95%置信区间:0.4939390.009403,因0.5属于其中,故符合1:1比例3、 对二个环境表现型值的线性回归关系进行评价:两个环境的表现型值的R2=0.0136,由此可知两者之间基本上不存在线性回归关系。4、 以二个环境的表现型值为依变量,以分子标记为自变量,进行多元回归分析:在SAS中对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:由此推断:环境1的数量性状基因在Mk3、Mk15、Mk5附近;环境2的数量性状基因在Mk28、Mk15、Mk29附近。七、 讨论、心得1、 通过本次实验,我初步了解了Excel软件的数据分析功能,掌

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论