保序统计细胞周期数据_第1页
保序统计细胞周期数据_第2页
保序统计细胞周期数据_第3页
保序统计细胞周期数据_第4页
保序统计细胞周期数据_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

保序统计细胞周期数据第一页,共三十一页,2022年,8月28日课题背景及意义背景:近年来,越来越多的课题中出现了约束条件下的循环数据,细胞周期数据就是最基本的一种。针对此类数据,研究者提出了保序回归的统计推断方法。目前,将保序回归方法用于对细胞周期数据进行处理成为许多学者研究讨论的热点话题。意义:由于某些基因在细胞周期过程中的表达呈现出周期性,而这些周期表达基因在细胞周期过程中扮演了重要的角色。细胞周期数据的保序统计推断方法,对于开发生物信息学软件和系统具有重要意义。第二页,共三十一页,2022年,8月28日主要研究内容一、细胞周期数据处理的基本理论和方法二、保序统计推断算法三、保序统计推断算法的软件实现四、实验研究第三页,共三十一页,2022年,8月28日一、细胞周期数据简介第四页,共三十一页,2022年,8月28日1、细胞周期模式图第五页,共三十一页,2022年,8月28日2、细胞周期数据定义细胞的分裂过程是周而复始的,因此细胞周期的四个阶段可以简单地表示成右图所示的形式。第六页,共三十一页,2022年,8月28日参与细胞分裂周期的神经基因被称为细胞周期基因。细胞周期基因的表达可以被映射到单位圆上,其峰值对应的角度被认为是基因的相位角,这些角度数据即为细胞周期数据。第七页,共三十一页,2022年,8月28日3、细胞周期数据简要分析假设一组细胞周期数据为,这些角度是以逆时针的顺序存在于一个单位圆上,它们之间满足某种约束条件,这组简单的圆形角参数之间的顺序可以表示如下:

第八页,共三十一页,2022年,8月28日二、保序回归算法第九页,共三十一页,2022年,8月28日1、保序回归定义保序回归是约束条件下的统计推断的一种最基本的形式,保序属于约束条件的一种,它是指所估计的参数满足某种特定的顺序。经典保序回归研究的是在约束条件下基于平方损失的最优化问题,它包括许多种算法,主要有PAVA法、最大最小公式法和MLS算法等等。第十页,共三十一页,2022年,8月28日2、PAVA算法简介给实验对象(某种动物)服用一种药剂,观察是否有药物反应,并且每组药物剂量是不同的。假定有k组药物剂量,分别为,它们满足递增的关系,即:

对于每一个剂量,选择个动物进行试验,令表示当剂量为时动物发生药物反应的概率,则是反应研究总体背景的样本参数。

第十一页,共三十一页,2022年,8月28日

之间满足特定的顺序:现在使P的最大估计值为,

PAVA算法为:(1)假如估计值满足递增顺序,那么,(2)如果不满足递增顺序,那么,第十二页,共三十一页,2022年,8月28日具体实例(k=5)

组数j1234520101015200.20.10.50.30.33025200.1670.380.330450.1670.344第十三页,共三十一页,2022年,8月28日在上表中:30=20+10,25=10+15,20=20;

0.167=(200.2+100.1)/(20+10),0.38=(100.5+150.3)/(10+15),0.3=0.3;

30=30,45=25+20;

0.167=0.167,

0.344=(250.38+200.3)/(25+20)。因为0.167<0.344,所以保序回归估计值为:第十四页,共三十一页,2022年,8月28日三、保序回归算法的

软件实现第十五页,共三十一页,2022年,8月28日使用的软件:R用到的程序包:isocir主要函数:CIRE(data,groups,circular)处理对象:满足约束条件的一组数据内容:对符合约束条件的周期数据进行保序回归估计第十六页,共三十一页,2022年,8月28日具体实例假定所观察的八个生物参数给出如下:参数满足的约束条件如下所示:第十七页,共三十一页,2022年,8月28日参数的保序回归估计为:

式中是循环误差的总和,定义如下:

主要算法:其中,第十八页,共三十一页,2022年,8月28日总程序:

>data(cirdata)>cirdata>orderGroups<-c(1,1,1,2,2,3,4,4)>example1CIRE<-CIRE(cirdata,groups=orderGroups,circular=TRUE)>example1CIRE第十九页,共三十一页,2022年,8月28日在R软件中运行后得到的结果:

CircularIsotonicRegressionEstimator(CIRE):0.9941.4763.0665.0573.0665.0575.0570.994所以,满足要求的参数的保序回归估计值为:第二十页,共三十一页,2022年,8月28日>plot(example1CIRE)

CircularIsotonicRegressionEstimator第二十一页,共三十一页,2022年,8月28日四、实验分析第二十二页,共三十一页,2022年,8月28日实验对象:酵母菌细胞周期数据实验目的:使用保序回归的统计推断方法对酵母菌细胞周期数据进行分析和处理,检测16个裂殖酵母的基因是否与芽殖酵母的同源基因满足相同的顺序。第二十三页,共三十一页,2022年,8月28日实验内容首先假定16个裂殖酵母的基因,即ssb1,cdc22,msh6,psm3,rad21,cig2,mik1,h3.3,hhf1,hht3,hta2,htb1,fkh2,chs2,sid2和slp1与芽殖酵母的同源基因(RFA1,RNR1,MSH6,SMC3,MCD1,CLN2,SWE1,HHT2,HHF1,HHT1,HTA2,HTB2,FKH1,CHS2,DBF2和CDC20)满足相同的顺序。第二十四页,共三十一页,2022年,8月28日对以下假设进行测试检验:isnottrue.第二十五页,共三十一页,2022年,8月28日检验水准用α表示,通常取0.05或0.10。这里取α=0.2当P>0.2时,接受零假设,即假设内容成立。当P<0.2时,拒绝零假设假设检验基本步骤第二十六页,共三十一页,2022年,8月28日酵母菌细胞周期原始数据第二十七页,共三十一页,2022年,8月28日P值求解方法:第二十八页,共三十一页,2022年,8月28日>data("cirgenes")>kappas<-c(2.64773,3.24742,2.15936,4.15314,4.54357,+29.07610,6.51408,14.19445,5.66920,11.12889)>allresults<-list()>resultIsoCIRE<-matrix(ncol=ncol(cirgenes),nrow=nrow(cirgenes))>SCEs<-vector(mode="numeric",length=nrow(cirgenes))>pvalues<-vector(mode="numeric",length=nrow(cirgenes))>for(iin1:nrow(cirgenes)){+k<-kappas[i]+genes<-as.numeric(cirgenes[i,!is.na(cirgenes[i,])])+allresults[[i]]<-cond.test(genes,kappa=k)+resultIsoCIRE[i,!is.na(cirgenes[i,])]<-unlist(allresults[[i]]$CIRE)+SCEs[i]<-allresults[[i]]$SCE+pvalues[i]<-allresults[[i]]$pvalue}总程序第二十九页,共三十一页,2022年,8月28日最后处理结果为:>pvalues[1]0.6658259[2]0.7214027[3]0.2436715[4]0.9982836[5]0.985040

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论