局部相似分析的统计研究及其在生物时间序列中的应用_第1页
局部相似分析的统计研究及其在生物时间序列中的应用_第2页
局部相似分析的统计研究及其在生物时间序列中的应用_第3页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

局部相似分析的统计研究及其在生物时间序列中的应用宏基因组表示自然环境中全部微生物遗传物质的总和,是生物信息学最热门的研究领域之一。宏基因组学无需对微生物进行培养,直接提取环境中存在的所有微生物的遗传信息,进而研究环境中微生物之间的相互作用,分析微生物群落的物种多样性。随着分子生物学技术的快速发展,特别是下一代测序技术的出现,大量的宏基因组测序数据不断产生。面对海量的测序数据,如何利用它们对微生物组进行研究分析是生物信息学面临的一大挑战。近十年来,受益于测序成本的大幅降低,分子生物学研究产生了大量的微生物群落时间序列数据。在时间序列相关的统计方法中,局部相似分析(localsimilarityanalysis,LSA)已被广泛用于研究不同环境中微生物群落的时空演变,寻找微生物物种之间潜在的局部和时间延迟关系。这些关系无法通过传统的相关性分析方法获得。通常利用置换检验对局部相似分析的统计显著性进行评估。最近,研究人员提出了一个理论方法分析局部相似得分的统计显著性。然而,这个方法和置换检验都需要假设原始时间序列是独立同分布的,但在很多实际问题中这个假设可能是不成立的。本文提出了一些新方法研究平稳时间序列局部相似分析的统计显著性,并将其应用于生物时间序列数据中。论文主要包含以下几个方面:第二章提出了平稳时间序列局部相似分析的统计显著性评价方法——数据驱动局部相似分析(DataDrivenLSA,DDLSA)。在DDLSA中,基于独立同分布理论评估方法,利用长期方差对局部相似分析的渐近理论进行了修正,得到了平稳时间序列局部相似得分的极限分布,其中的长期方差通过非参数核估计方法获得。另外,提出了一个基于残差的评价方法LSAres(LSAforresiduals),通过独立同分布理论评价方法评估给定统计模型残差序列的统计显著性,得到原始序列局部相似分析的统计显著性。模拟结果表明,在平稳时间序列模型中,DDLSA和LSAres可以有效控制第一类错误率,而其他方法却不能。另外,将不同方法应用于人类和海洋微生物数据集中,发现我们的方法可以识别大多数可能的显著关系,并且有效减少假阳性关系的数量。第三章将滑动分块自助法应用于平稳时间序列局部相似分析的统计显著性评估中,提出了MBBLSA(MovingBlockBootstrapLSA)方法。该方法首先将原始序列分为长度相同的可重叠的小块,然后对分块样本随机有放回抽样,最后拼接成与原始序列长度一样的重抽样样本。由于每个分块样本是平稳的,因此重抽样样本也会保留原始序列的部分平稳特征,从而克服了置换检验需要原始数据必须为独立同分布序列这一缺点。由于在滑动分块自助法中分块长度的选择对最终的结果起着至关重要的作用,因此需要找到一个合适的分块长度选择器。本文选择了一个基于AR(1)模型自回归系数的分块长度选择器。最后,将MBBLSA应用于模拟研究和实证分析中,结果表明,相比于现存的方法,MBBLSA的表现更好。第四章首先介绍了局部相似分析的扩展方法一一局部趋势分析(localtrendanalysis.LTA)。局部趋势分析首先将原始序列转化为趋势序列,然后对趋势序列进行局部相似分析,进而得到局部趋势得分。为了评估局部趋势得分的统计显著性,提出一个新的方法STLTA(StationaryTheoreticalLocalTrendAnalysis)。利用矩阵的谱分解理论,得到了不同状态空间趋势序列的调整方差,从而可得局部趋势得分的精确极限分布。模拟结果显示,在不同的时间序列模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论