IN399-SAPHANA在生物年代学和定量地层学-1118-PPT1-V1_第1页
IN399-SAPHANA在生物年代学和定量地层学-1118-PPT1-V1_第2页
IN399-SAPHANA在生物年代学和定量地层学-1118-PPT1-V1_第3页
IN399-SAPHANA在生物年代学和定量地层学-1118-PPT1-V1_第4页
IN399-SAPHANA在生物年代学和定量地层学-1118-PPT1-V1_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SAPHANA在生物年代学和定量地层学领域的应用樊隽轩侯旭东陈清罗琼李昕朱代辉GeologicaltimespiralcourtesyoftheU.S.GeologicalSurveyHistoryoflifeontheEarth生物集群灭绝(MassExtinction)—特点——结局—1)时限短2)波及面广3)涉及类别多4)灭绝量值大1)多样性和悬殊性急剧下跌2)生态域明显空缺3)群落结构严重破坏4)生物地理格局实质改变白垩纪末陆地生物群大灭绝想象图白垩纪-第三纪灭绝的地外起因

实验结果和理论解释

Alvarezetal.,1980撞击点12-13万亿吨(重量)100-130万亿吨TNT当量180km宽、900m深(坑)NASA供图八十年代HistoryoflifeontheEarthGeobiodiversityDatabase(GBDB)fieldworkpublicationsdatacollection;onlineinputsearching&download200320042005200620072008200920102011G(GBDB)GBDBwebsiteISQSP2010(summercourse)100,000occurrencerecords5000sectionsand2400sectionsand90,000occurrencerecords20126400sectionsand200,000occurrences2013地层记录地层记录古生物学地层学地史学古生物地理学古生态学演化古生物学埋藏学数字化科研平台e-Science数据库数据挖掘可视化定量分析200320042005200620072008200920102011G(GBDB)GBDBwebsiteISQSP2010(summercourse)100,000occurrencerecords5000sectionsand2400sectionsand90,000occurrencerecords201271,00sectionsand219,000occurrences2013GBDB平台–网址:;2006-2013年,已集成各类数据条目40万条,全球最大的地层学专业数据库与第二大的古生物学数据库;国际地层委员会官方数据库;面向全球用户提供在线地层信息服务;数据录入:项目聘用人员+学生;数据质量控制:科学家、教授。81312文献

91088分类名

241554产出记录

45586采集层8850剖面

113数据贡献者

26单位中国6000个剖面点的地理分布地层剖面的综合地层信息湖北宜昌界岭奥陶系-志留系剖面数据:大数据(6000剖面20万化石记录)

科学问题:地质历史中生命的“周期性”变化;

生命的地理演化过程;

生命与环境的协同演化关系

技术途径:

-定量地层学方法:建立时间标尺

-古地理信息系统:建立空间度量

科学问题什么是定量地层学?地层记录中的各种事件:首现末现岩石标志层岩心地球化学漂移古地磁极性倒转化石延限露头剖面放射性同位素孤立的化石产出记录

共生定量地层学-恢复完整的化石序列图形对比(Graphiccorrelation)-SinoCor4.0beta(Fanetal.,2012)约束最优化法(ConstrainedOptimization)–CONOP9(Sadleretal.,2002;2009)完整的化石序列Eachsectionrepresentsonesmallsubsetofidealsequence:lessfossilssmallerrangesWhy?IncompletepreservationandcollectingoffossilsPatchydistributionoflivingtaxaProvincialdistributionoffaunasFaunalmigration...RealancientworldadjustHowcanwefindtheidealsequence?Therulesare“simplicity”or“parsimony”Findthesmallestsetofadjustmentsnecessarytobringallthelocalrangechartsintoagreementwithonetime-lineSubjecttotheconstraintthatallobservedcoexistencesmustbehonoredThisis“constrainedoptimization”-CONOPOBSERVEDOPTIMIZEDTwoTaxaTwoSections0m400m800m1200m0m400m800m1200mDiplomocerascylindraceumDiplomocerascylindraceumKitchinitesdarwiniSeymourIs.SectionASeymourIs.SectionFtimeKitchinitesdarwiniTWO

TAXA:SixPossible

Time-LineSequences

offirst-andlast-appearancedatums(FADsandLADs)123456time0m400m800m1200m0m400m800m1200mDiplomocerascylindraceumDiplomocerascylindraceumKitchinitesdarwiniSeymourIs.SectionASeymourIs.SectionFtime

KitchinitesdarwiniBest-fit

Sequence:Sequence#4requirestheleastnetadjustmentofobservedrangesRANGEEXTENSION0m400m800m1200m0m400m800m1200mDiplomocerascylindraceumDiplomocerascylindraceumKitchinitesdarwiniSeymourIs.SectionASeymourIs.SectionFtime

KitchinitesdarwiniRANGEEXTENSIONSNearbest-fit

Sequence:Sequence#2requiresslightlymorenetadjustmentofobservedrangesTHREE

TAXA:90possiblesequencesall15possiblearrangementsofrange-endsfor3rdtaxon15x6=90possibletimelinesequencesAnagaudrycerasseymourianus4positionsoccupiedbyendsof1stand2ndtaxonranges(6permutations)possiblepositionsforendsof3rdtaxonrange4个物种:2520种可能的序列Pachydiscusultimusall28possiblearrangementsofrange-endsfor4thtaxon28x90=2520possibletimelinesequences6positionsoccupiedbyendsof1st,2ndand3rdtaxonranges(90permutations)possiblepositionsforendsof4thtaxonrangeTIMELINEIV.CONOP随着物种数目的增加,可能的序列数目呈阶乘式飞速增长

NP难题“Non-DeterministicPolynomial-TimeComplete”Problem计算机领域经典的NP难题:旅行商问题

13,509cities旅行商问题(TravelingSalemanProblem,TSP)是指一名推销员要拜访多个地点时,如何找到在拜访每个地点一次后再回到起点的最短路径。(D.Applegate,R.Bixby,V.Chvátal,andW.Cook,1998)可行的初始路径(例如随机生成一个路径)2.选择一个路径改变策略,得到更短的路径3.反复迭代直到获取最短路径旅行商问题与生物事件最优序列问题的类比

城市

可能的路径

最短路径

地层中生物的首现(FAD)、末现(LAD)事件

假设正确的生物事件序列

符合所有地层剖面的最优生物事件序列模拟退火算法(

SimulatedAnnealing,SA)从某一较高初温出发,伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解,即在局部最优解能概率性地跳出并最终趋于全局最优。模拟退火算法获取山区中最高峰的计算过程CONOP模拟退火运算界面化石延限当前最小调整量当前调整量温度曲线数据集规模:195条剖面,2730个生物事件运行环境:双CPU

3.4Ghz,24G内存基于OpenMP进行并行化实际的古生物学问题会引入大得多的数据集NORTHAMERICANLANDMAMMALS

>65millionyears

6486originationandextinctioneventsfrom4978faunallists; plusmorethan186datedevents. byappearanceeventordinationwithmaximumlikelihoodtuning(CONJUNCTprogram)Alroy,1992,1994,2000THEGRAPTOLITECLADE

~85millionyears

4180

originationandextinctioneventsfrom506localrangecharts; plus25datedeventsand30localmarkerbedsetc. bysequencepermutationusingsimulatedannealing (CONOP9program)Sadler,Cooper,&Melchin,2003,2009Co-innovationproject“Fossil”

PerformanceIntroductionSAPNICNov.,2013性能提升充分利用SAPHANA丰富的平台接口和高效的内存管理技术采用动态存储管理技术,充分利用SAPHANA内存计算引擎优势基于SAPHANA并行计算框架,充分提高多核CPU利用率可视化创新10:8080/fossil/或https:///a:8dmts3/MyAttachments/3d030c13-2e5d-46db-9b30-f35e9830f3a1/GBDB数据库+SAPHana=?Redbarsdepictstratigraphicrangeofwholese

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论