




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
l o w e s s 在同位素地层学中的应用 作者简介:黄喻,女,1 9 8 0 年2 月出生,汉族,2 0 0 4 年9 月一2 0 0 7 年6 月 师从于成都理工大学信息管理学院魏贵民教授,攻读应用数学专业硕士,并于 2 0 0 7 年6 月获硕士学位。 摘要 l o w e s s ( l o c a l l yw e i g h t e dr e g r e s s i o ns c a t t e r p l o ts m o o t h e r ,局部加权回归 散点平滑法,也称为l o e s s ) 是一种以拟合散点数据得到平滑曲线为目的的 一种稳健的,非参数统计方法,1 9 7 9 年由c l e v e l a n d 首创。所谓非参数统计方法 是指拟合技术并不需要优先详述因变量和白变量数据之间的关系。所谓稳健性 ( r o b u s t n e s s ) 是指当真实模型与假定的理论模型有不大偏离时,统计方法仍能 维持良好的性质。本文利用上扬子地区晚古生代海相碳酸盐的锶、碳同位素数据, 通过l o w e s s 方法,拟合了锶、碳同位素组成与地层厚度之间的曲线,并在此 基础上,利用国际上已有的8 7 s “8 6 s r 值一年龄曲线,建立了我国上扬子地区晚古 生代典型剖面地层厚度一年龄数据库,为该地区沉积地层年龄的标定和对比提供 了重要的基础资料。所建立的上扬子地区晚古生代锶、碳同位素的总体演化曲线 与世界其他地方同时代的曲线具有较好的一致性,显示出海相碳酸盐锶、碳同位 素组成的全球对比意义以及锶同位素组成在海相地层定年中的潜在价值,同时也 表明l o w e s s 是一种拟合海相碳酸盐锶、碳同位素数据( 可能还包括其它一些 随时间变化的地质数据) 的有效数学方法。 本文包括四个主要部分。第一部分说明研究锶、碳同位素的总体演化趋势的 必要性以及研究上扬子地区晚古生代锶同位素演化陆线的可行性,简要综述了锶 同位素地层学( s t r o n t i u mi s o t o p es t r a t i g r a p h y ,简称s i s ) 的研究历史、研究现状 和存在问题。 第二部分是本文的核心内容之一,指出参数回归与非参数回归的不同特点和 相应的优缺点。提出了非参数回归中的l o w e s s 平滑方法是本文的研究思路, 并用此方法建立了地层厚度( x ) 与8 7 s r 8 6 s r 值( y ) 的拟合曲线。详细介绍了 建立曲线的数学方法,讨论了这种方法的可行性。影响l o w e s s 曲线的主要因 素是窗宽和进行局部多项式回归中多项式次数的选择,本文用不同的窗宽和不同 的多项式次数得出不同的l o w e s s 曲线,比较这些曲线,从而得出最佳的 l o w e s s 拟合曲线;另外,本文也尝试把l o w e s s 拟合法应用到碳同位素地层 学方面,得出了地层厚度( x ) 与6 ”c 值( y ) 的拟合曲线。 第三部分是本文的另一核心内容,本文数据化了h o w a r t h 等( 2 0 0 1 ) 晚古生代 锶同位素演化曲线的中一t 3 部分,获得了晚古生代8 7 s r 8 6 s r 值一年龄数据库。在此 基础上,根据前面用l o w e s s 数学方法对上扬子地区典型剖面各地层厚度点的 海相碳酸盐的8 7 s r 8 6 s r 值进行拟合所获得的8 7 s r 8 6 s r 值一地层厚度关系曲线,采 取了以0 0 0 0 0 1 为单位在8 7 s r 8 6 s r 值区间上进行内插,从而得出上扬子地区典型 剖面8 7 s r 8 6 s r 值一地层厚度数据库( 置信区间9 5 ) 。通过比较两个数据库,得 出上扬予地区晚古生代”s r 8 6 s r 值地层厚度一年龄数据库。 在第四部分中,我们讨论了l o w e s s 数学拟合方法在同位素地层学领域( 可 能还包括其它一些随时间变化的地质信息领域) 中的应用前景,并根据建立的上 扬子地区晚古生代海相碳酸盐的锶同位素演化曲线( 随时间和随地层厚度) ,简 单讨论了上扬子地区海相碳酸盐的锶同位素演化趋势及控制这种演化趋势的主 要地质事件。 本文的创新性主要包括:利用非参数回归中的l o w e s s 方法拟合散点图, 首次对我国上扬予地区晚古生代海相碳酸盐的锶、碳同位素数据进行了科学的拟 合,并获得了上扬子地区晚古生代典型剖面各地层厚度点的年龄值,建立了此地 区地层厚度一年龄数据库,为相应的地质研究提供了极为重要的基础资料。论文 在全面概括和总结l o w e s s 的基本内容和基本方法的基础上,阐述了l o w e s s 数学方法在海相碳酸盐同位素总体演化趋势研究中的应用价值。 整篇论文以理论研究为主,兼顾实际应用,所得到的曲线和相应的数据库对 于海相地层的对比和定年有实用价值,对解决沉积地质学、地层学中海相地层定 年这一难题作了有益的尝试。 关键词非参数回归,l o w e s s ,散点平滑,锶、碳同位素,海相地层定年 t h ea p p l i c a t i o no fl o w e ssf i tt oi s o t o p es t r a t i g r a p h y t h eb r i e f i n t r o d u c t i o no f t h ea u t h o r - h u a n gy u ,w o m a n ,w a sb o r ni n1 9 8 0 ,t h e h a nn a t i o n a l i t y i ns e p t e m b e r , 2 0 0 4 一j u n e ,2 0 0 7 ,s t u d i e sf o ra p p l i e dm a t h e m a t i c s s p e c i a l i z e dm a s t e r , i nc h e n g d ut e c h n i c a lu n i v e r s i t yi n f o r m a t i o nm a n a g e m e n ti n s t i t u t e , t e a c h e rp r o f e s s o rw e ig u i n a i n a n di nj u n e ,2 0 0 7a t t a i n st h em a s t e r sd e g r e e a b s t r a c t l o w e s s ( l o c a l l yw e i g h t e dr e g r e s s i o ns c a t t e r p l o ts m o o t h e r , a l s o c a l l e d l o e s s ) i sar o b u s t n e s s ,n o n p a r a m e t r i cs t a t i cm e t h o df o rf i t t i n gs m o o t hc u r v et o s c a t t e rp l o td a t a c l e v e l a n ds e t st h i su pi n19 7 9a tt h ef i r s tt i m e ,t h i sp a p e ru t i l i z e d 8 7 s r 8 6 s r 、61 3 ci s o t o p ed a t ai nt h eu p p e ry a n g t z ep l m f o r m , t h o u g ht h i sm a t hm e t h o d e s t a b l i s h e ds t r o n t i u m 、c a r b o ni s o t o p e s t r a t u mt h i c k n e s sc u r v e o b t a i n e d8 7 s r 8 6 s r s t r a t u i l lt h i c k n e s sd a t ai nt h eu p p e ry a n g t z ep l a t f o r m ,a n do f f e r e di m p o r t a n tb a s e i n f o r m a t i o nf o rd e m a r c a t i n ga n dc o n t r a s ts t r a t m na g ei nt h i sa r e a t h i sv a r i a t i o nt r e n d o ft h ec u r v ei sq u i t ec o n s i s t e n tw i mt h a to ft h ec o n t e m p o r a n e o u sc u r v es e tu pb yt h e s a m p l e sf r o mn o r t ha m e r i c a ,e u r o p e ,a f r i c aa n da s i a ,s h o w i n gt h eg l o b a lc o r r e l a t i o n s i g n i f i c a n c eo f i s o t o p i cc o m p o s i t i o n so fs t r o n t i u mo f m a r i n ec a r b o n a t e t h i sp a p e ri n v o l v e df o u rm a i np a r t s t h ef i r s tp a r te x p l a i n e dt h en e e do fs t u d y i n g t h ev a r i a t i o nt r e n do ft h e8 7 s r 8 6 s r 、61 3 cc u i v ea n dr e s e a r c h e dt h ef e a s i b i l i t yo f t h e s e c u r v e ,l o o k i n gb a c kt h ea c t u a l i t yf o rs t r o n t i u mi s o t o p es t r a t i g r a p h y ( s i sf o rs h o r t ) b e u s e dt od a t em a r i n es e d i m e n t s t h es e c o n dp a r ti sah e a r tc o n t e n ti nt h i sp a p e r , p o i n t e do u tt h ea d v a n t a g ea n dt h e d i s a d v a n t a g eo fp a r a m e t e rr e g r e s s i o na n dn o n p a r a m e t r i cr e g r e s s i o n ,p u t t e df o r w a r d t h es t u d yt h o u g h t f u l n e s si nt h i sp a p e ri sl o w e s s ,a n du s e dl o w e s sf i t t i n gt h e c u r v ew h i c hi ss t r a t u m s t r a t u mt h i c k n e s s ( x ) 一8 7 s r s 6 s r ( y ) c u r v e p a r t i c u l a r l y , i n t r o d u c e dm a t h e m a t i c sm e t h o dt h a tb a s e dt h i sc u r v e ,d i s c u s s e df e a s i b i l i t yf o rt h i s m e t h o d t h em o s t l yf a c t o rw h i c hi n f l u e n c et h i sc u r v ei st h ec h o i c ef o rw i n d o wa n d p o l y n o m i a ld e g r e e t h i sp a p e rc o m eo u td i f f e r e n tl o w e s sc u r v e si n d i f f e r e n t w i n d o wa n dd i f f e r e n tp o l y n o m i a ld e g r e e ,c o m p a r e dt h o s ec u r v e s ,a n dc o m eo u tb e s t l o w e s sc a r v e t h i sp a p e ra l s ou s e dl o w e s sf i t t i n gt h eo t h e rc u r v ew h i c hi s 1 1 1 s t r a t u ms t r a t u mt h i c k n e s s ( x ) 一61 3 c ( y ) c u r v e 。 t h et h i r dp a r ti sa n o t h e rh e a r tc o n t e n t ,d i g i t i z e dc u r v ew h i c hc o m eo u ti n h o w a r t he ta 1 ( 2 0 0 1 ) ,i no r d e rt og a i n i n gn u m e r i ca g r 8 7 s r 8 6 s rd a t a ;a n du t i l i z e d c u r v ew h i c hc o m eo u ti nl o w e s s i n t e r p o l a t e da ti n t e r v a l so fo 0 0 0 0 1i n8 7 s r 8 6 s ri n o r d e rt og a i n i n gs t r a t u mt h i c k n e s s _ 8 7 s r f 6 s rd a t a ;c o m p a r e dt h i st w od a t a ,g a i n e d n u m e r i ca g e - - s t r a t u mt h i c k n e s sd a t ai nt h eu p p e ry a n g t z ep l a t f o r m i nt h ef o u r t hp a r t ,w ed i s c u s s c o l l e c t i v i t ye v o l v e m e n tt r e n df o rs t r o n t i u mi s o t o p e i nt h eu p p e ry a n g t z ep l a t f o r mt h o u g hs t r a t u ms t r a t u mt h i c k n e s s ( x ) 一8 7 s r ,8 6 s r ( y ) e u r v e s o m ec r e a t i v ec o n c l u s i o n si nt h i s p a p e rb e l o w :r e l a t i v e l yg e n e r a lu s i n g l o w e s sf o rd a t i n gm a r i n es e d i m e n t sf o rt h ef i r s tt i m e t h i sp a p e rs u m m e du pb a s i c c o n t e n ta n db a s i cm e t h o do fl o w e s s ,a n de x p o u n d e dt h e o r yf o u n d a t i o ni nd a t i n g m a r i n es e d i m e n t s t h et h e o r e t i c a lr e s e a r c h e sa r em a i np a r t so ft h i sp a p e r , b u ts o m ep r a c t i c a l a p p l i c a t i o n sa r ea l s oi n v o l v e di ni t s oi tw o u l dh a v es o m ev a l u a b l er e f e r e n c e si n d a t i n gm a r i n es e d i m e n t s ,a n dm a k eb e n e f i ta t t e m p tf o rs o l v i n gd i f f i c u l tp r o b l e mi n d a t i n gm a r i n es e d i m e n t s k e y w o r d sn o n p a r a m e t r i cr e g r e s s i o n ;l o w e s s ;s c a t t e rp l o ts m o o t h i n g ;s t r o n t i u m a n dc a r b o ni s o t o p e ;d a t i n gm a r i n es e d i m e n t s 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得盛壑堡王盔堂或其他教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均己在论文中作了明确的说明并表示谢意。 学位论文作者导师签名撇舐 一签名靠 小i 月弓日 学位论文版权使用授权书 本学位论文作者完全了解盛整理工太堂有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权盛壑堡王太堂可以将学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文储躲黄螽 。7 年。 月 弓日 第一章引言 第一章引言 锶同位素地层学( s t r o n t i u mi s o t o p es t r a t i g r a p h y ,简称s i s ) ,由瑞典地质学 家w i c k m a n ( 1 9 4 8 ) 年提出,其基本原理是:由于锶在海水中的残留时间( z 1 0 6 a ) 大大长于海水的混合时间( z 1 0 3 a ) ,因而任一时代全球范围内海相锶元素在同 位素组成上是均一的,从而导致地质历史中海水的8 7 s r 8 6 s r 值是时间的函数 ( v e i z e rc ta 1 。1 9 9 9 ;m c a r t h u re ta 1 ,2 0 0 1 ) 。这是利用锶同位素地层学进行海相 地层定年的理论基础,并为解决海相沉积地层年龄的确定这一世界难题的解决提 供了一个新的研究途径。基于此,我们可以通过未知年代地层中未遭受成蚀变的 海相同生矿物的8 7 s r s 6 s r 值,以及已建立的地质历史中海水8 7 s r s r 值曲线或锶 同位素数据库,推断未知地层的可能年代,因而,锶同位素地层学可成为海相地 层定年的有效方法之一。国外已有大量成功研究的实例,显示出海相碳酸盐的锶 同位素组成在海相地层的定年上具有的潜在价值( w a l t e re ta 1 ,2 0 0 0 ;m e l e z h i ke t a 1 ,2 0 0 1 ;g l e a s o n e t a l ,2 0 0 4 ;m e l e z h i k ae t a l ,2 0 0 5 ) ,并可望获得进一步的发展。 在利用海相沉积物的锶同位素定年方面,国外近年来也获得了较多的研究成 果:如h e s se 1a 1 ( 1 9 8 9 ) ;m i l l e re ta 1 ( 1 9 9 1 ) ;m c a r t h u re ta 1 ( 1 9 9 4 ) ;d i n g l ee ta 1 ( 1 9 9 7 ) ;d e n i s o ne ta 1 ( 1 9 9 8 ) ;w a t e re ta 1 ( 2 0 0 0 ) ;m e l e z h i ke ta 1 ( 2 0 0 1 ) ;g l e a s o ne t a 1 f 2 0 0 4 ) ;m e l e z h i k ae t a l ( 2 0 0 5 ) 。国内也作了一些尝试:杨杰东等( 2 0 0 1 ) 利用 锶( 也包括碳) 同位素对苏皖北部上前寒武系的时代作了界定;潘家华等( 2 0 0 2 ) 根据太平洋海山磷酸盐的锶同位素组成确定了其形成年代;黄思静等( 2 0 0 2 a ) 利用锶同位素确定了四川龙门山泥盆系剖面f r a s n i a n f a m e n n i a n 阶、以及泥盆 石炭系的界线,黄思静等( 2 0 0 4 ) 利用锶同位素标定了西藏南部岗巴剖面 c a m p a n i a n s a n t o n i a n 阶和m a a s t r i c h t i a n c a m p a n i a n 阶的界线等。这些成果都说 明国内海相地层的锶同位素研究在近年来已逐渐进入锶同位素地层学的核心领 域,正逐步与国际相应研究接轨。 然而,在利用海相碳酸盐的锶同位素组成定年( 也包括相应的全球对比) 过 程中,人们必须要对分散的数据点进行拟合,以推算获得没有采样的数据点之间 的8 7 s r f l 6 s r 值或年龄值,但在国内有关的地质研究中,这种拟合大都是地质学家 的随意连接( 当然,他们可能利用了有关的地质思维) ,如黄思静等( 2 0 0 4 ) 在 利用锶同位素标定了西藏南部岗巴剖面c a m p a n i a n s a m o n i a n 阶和m a a s t r i c h t i a n 成都理工大学硕士学位论文 c a m p a n i a n 阶的界线时就采用了这样的方法( 图1 1 ) ,这种连接方法显然是不 科学的,存在一定的局限性,更是缺乏数学依据的。为此,有人( h o w a r t he t a 1 ,1 9 9 7 ;m c a r t h u rc t a l ,2 0 0 1 ) 提出利用l o w e s s 方法对随时间( 或地层厚度) 变化的海相碳酸盐的锶同位素组成的数据进行拟合,并建立- t + u 应的8 7 s t 8 6 s r 一 年龄数据。自1 9 9 7 年完成了2 0 6m a 以来的版本2 ( h o w a r t he ta 1 ,1 9 9 7 ) 以来, 2 0 0 1 年已发展到了5 0 9 m a 以来的版本3 ( m c a r t h u re ta 1 ,2 0 0 1 ) 。然而,这项工 作在国内并未开展,因而有关的锶同位素地层学的研究也处于相对原始的阶段。 基于此,本文试图利用我国已经公布的上扬子晚古生代海相碳酸盐的锶同位素数 据( 黄思静,1 9 9 7 ) ,采用l 0 w e s s 方法对其进行科学的拟合,建立我国晚古生 代典型剖面的8 7 s r 8 6 s r 值一地层厚度一地质年龄数据库,以提高我国锶同位素 ( 可能还包括碳等其它同位素) 地层学的研究水平,并使之与相应的国际研究接 轨。 #镕ml = 0i一 i i 鎏鬻i 鹱蝴j 。l + z “】 “6 抽1 弦= ,王, l 。+ 。1 1 。j ry 翟! 卓 陌怒f 1 措。,罗i 9 i ( c ) 年瓣m 扩“ 善。一茅吼:、n h i 陟 1 a 图l 一1 西藏南部岗巴剖面晚自垩世锶同位素演化曲线与全球不同地方同时代演化曲线 ( 或演化趋势) 的对比( 据黄思静等,2 0 0 4 ) ( a ) 西藏南部岗巴剖面晚白垩世锶同位素演化曲线:( b ) m c a r t h u r 等综合的全球样品锶同 位素演化曲线的晚白垩世部分;( c ) 综合的晚白垩世8 7 s “s r 比值与年龄投点图;( d ) 美 国西部晚白垩世”s r “s r 比值与年龄投点图,空心方框为异常数据( 由m c a r t h u r 等的数据 作出) 。 2 m-p蛊“ n “勇m乒n n 第一章引言 在利用海相碳酸盐的锶同位素组成进行年龄标定时,结果的可靠性取决于如 下几个因素( h o w a r t he ta 1 ,1 9 9 7 ) :( 1 ) 样品中原始8 7 s r 8 6 s r 的保存情况( 这是 一个与海相碳酸盐的成岩蚀变有关的地质问题) ,( 2 ) 在8 7 s r 8 6 s r 值测量中人为 因素的影响( 这是一个分析测试问题) ,( 3 ) 8 7 s r 8 6 s r 值随地质年代变化的曲线 的斜率( 这是一个非主观因素的客观问题) ,( 4 ) 用于对同位素曲线赋予时间数 值刻度的地质年代模型的精确性( 这是一个年代地层学问题) ,( 5 ) 这种最佳拟 合曲线的方法与其相关的不确定性( 这是与我们有关的数学问题) 。因此,一种 最佳拟合曲线的数学方法便在锶同位素地层学定年方面有着重要的作用。 基于这些原理,首先,我们通过已作过地质处理的前人测试获得的上扬子地 区晚古生代的锶同位素数据,利用l o w e s s 这种非参数回归的数学方法,以拟合 这些随时间( 或地层厚度变化) 的散点数据,并得到平滑曲线。具体工作包括以 下步骤: 1 ) 用l o w e s s 方法拟合原始的8 7 s r 8 6 s r 值一地层厚度数据,以获得代表海水 中锶同位素组成随地层厚度变化的曲线。 2 ) 对m c a r t h u r 等( 2 0 0 1 ) 公布的5 0 9m a 以来海相地层的锶同位素组成随 时间的演化曲线中晚古生代部分进行数据化,获得了晚古生代的8 7 s r 8 6 s r 值一地 层年龄的数据库及相应的演化趋势曲线。 3 ) 采取了以0 0 0 0 0 1 为单位在8 7 s r 8 6 s r 值区间上进行内插的方法得出8 7 s r 8 6 s r 值一地层厚度间的数据库( 置信度为9 5 ) 。 4 ) 比较两个数据库,得出上扬子晚古生代地层厚度一地层年代数据库,可 望为相应的地质研究提供了重要的基础资料,同时本文也简单讨论了上扬子地区 海相碳酸盐的锶同位素演化趋势及控制这种演化趋势的主要地质事件。 已有的地质研究( 黄思静,1 9 9 7 ) 表明,晚古生代海相碳酸盐岩的锶同位素 组成的变化主要受地质时代控制,同一时代不同地区海相碳酸盐同位素组成之间 的差别远远小于不同地质时代所造成的差别,这就是所谓的同位素时代效应。基 于这一点,讨论由附录l 的表i 中数据建立的上扬子晚古生代锶同位素的完整演 化曲线是有意义的。第三章中的图3 一l 所示上扬子地区晚古生代碳酸盐锶同位 素的完整演化曲线,它们应该代表了上扬子地区晚古生代碳酸盐锶同位素的完整 演化趋势。由于锶同位素与地层厚度间的关系( 参见第二章中的图2 一1 ) 并不 是一种简单的线性关系,而用参数回归中拟合散点图的方法拟合数据也差强人意 3 成都理- 【大学硕十学位论文 ( 下面将具体的说明) ,所以我们选择了非参数回归中的l o w e s s 拟合方法,这 是一种崭新的非参数拟合方法,本文详细给出了此方法的具体步骤,这也是本文 的难点和创新点。 本论文受国家自然科学基金“上扬子晚古生代海相碳酸岩的锶同位素组成 及控制因素”、“川渝地区海相三叠系的锶同位素研究”的资助。 第二章参数回归模型和非参数回归模型的比较 把x ,y 的关系投到直角坐标系中,这就是一个二维散点图。二维散点图 是两个变量数据最基本的图表展示方法,同时,散点图也是对于多变量数据的 复杂图表展示。散点图的强大功能是可以形象的估计展示的变量间的关系。 依靠散点求解函数是一个相对简单的工作。然而,在实践中它却相当难。 这个问题是由于异常数据点,以及弱相关关系出现在这些数据点中。而且,如 果通常函数不可在图表中辨别出,就不可能只通过形象的观察散点刻画它们的 精确性质。 为解决前面所说的问题的一个有用方法是包括拟合散点的平滑曲线。拟合 曲线的目的是概括随x 变量分布的y 变量在不同位置分布的重要趋势。如果两 变量间没有关系,平滑曲线就是一条平的直线( 不管x 值变化,y 的分布都不会 变化) 。如果两变量间有关系,那么平滑曲线会展示出一种不一样的非水平的形 状。 拟合地质数据的散点图应该要注意两个问题:第一个问题是变量的选择, 地质年代和8 7 s “8 6 s r 值两项哪一项是因变量、哪一项是自变量,在变量的选择 上,选择哪个作为因变量对于研究几个百万年中某一时间段所得出的地质年代 并没有多大的差异( m c a r t h u rc ta 1 ,1 9 9 4 ) 。现在我们把年龄( 在实际工作中, 对于未知地层来说,与年龄刻度相应的是地层厚度或钻井深度) 作为自变量x , 8 7 s d 8 6 s r 值作为因变量y 来分析。 另一个问题是样本数据的选择。在某段地质时间段建立关于8 7 s r 8 6 s r 值的回 归模型时,数据点的采集是至关重要的。这是由于分析测试技术和支撑锶同位素 地层学的生物地层学基础会随着时间而不断发展,因此要对所公布的全部可利用 数据进行专业分析和筛选,这包括对海相碳酸盐样品成岩蚀变性及其对海水信息 保存性的评估。这样才能使所拟合的全球锶同位素演化曲线更符合地质事实,有 4 第二章参数同l 门模型与非参数同i 门模型的比较 更强的全球对比意义。本文所利用的是经过地质学家进行了相应评估和进行筛选 后的数据。 回归实际上就是把原始数据平滑化( 孙山泽,2 0 0 0 ) 。回归分为两种,参数 回归和非参数回归。 2 1 参数回归方法 参数回归最基本的假设是因变量和自变量的关系是一个已知函数( 姜吉坤, 2 0 0 6 ) ,通常这些函数是线性的或是非线性的。参数回归中的“参数”说明了这 种回归是通过参数估计得出来的,也就是说,无论是线性( y = a o + a l x + 占) ( 其 中占的期望值是0 ) ,还是多阶( y = a o + q x + a 2 x 24 - + 口。x 9 + s ) 的等式,都 是有系数的。参数回归的方法,需要我们首先指定函数模式的相关性,拟合的 运算法则是使指定的模式和经验数据间相应的最优化,通常估计方程系数的集 合,这些系数可以产生两变量( 甚至是多变量) 间最好的拟合。参数拟合方法是 用最小二乘法准确拟合由数据点集合得到的曲线。而且,参数回归中,每组数 据( x ,y ) 都是被“同等”的对待,也就是每组数据的权值都为1 。但是,在 实际问题中,由于数据当中夹杂着异常点( o u t l i e r s ) ,这种“同等”并不合理。 所谓异常点,是由两个因素产生的:一是环境因素的显著变化,二是人为因素。 由于在采样过程中,存在这两个因素,所以我们在拟合数据的时候不能排除数 据中有异常点。异常点有较大的偏差,偏差的平方和相对更大,为了压低平方 和,就不能不“将就”这些点,因而虚增加了残差大的数据,这些数据会对回 归线造成影响,从而异常点会把回归线拉得离它更近一些,导致回归线“失真” 较大,而通常的做法是凭直觉和经验将异常点剔除,这种处理有两方面不足: 是剔除异常点后得到的回归模型由于减少了一些数据会受影响;另一方面, 异常点恰好在某些方面真实反映了一些特殊情况,不应随意剔除。若用线性回 归去拟合非线性关系,那么将带来很大的模型误差。 对于多项式回归来说,其模型有以下几个缺点:1 ) 多项式有任意阶导数, 如果要拟合的曲线不具有这一性质,显然这一模型是不合理的;2 ) 对异常点的 敏感性,一个异常点对多项式的形式有很大的影响,导致模型的不稳定性;3 ) 成都理1 = 大学硕十学位论文 多项式次数p 的取值问题,大的p 值带来的是参数的增加和模型的不稳定性, 小的p 值带来的是模型误差的增加。 图2 1 为上扬予地区晚古生代海相碳酸盐锶同位素数据( n = 9 8 ) 的散点图 ( 数据参见附录1 中表1 ,数据已经过相应的地质筛选) ,横轴x 为地层厚度, 纵轴y 为8 7 s r 8 6 s r 值。由这个散点图可知,y 与x 的关系是非线性关系。图2 2 为锶同位素数据的线性拟合图,可见,用线性拟合来拟合非线性关系的散 点数据,拟合效果是很差的。图2 3 为锶同位素数据的抛物线拟合图,图2 4 为锶同位素数据的5 次方拟合图,可见对于给定的一个非线性关系,用参数 回归方法中的多项式拟合效果也不能令人满意。 图2 1 锶同位素数据( n - - 9 8 ) 的散点图图2 _ 2 锶同位素数据的线性拟合图 图2 - - 3 锶同位素数据的抛物线拟合图图2 4 锶同位素数据的5 次方拟合图 尽管有学者用参数回归来拟合8 7 s r s 6 s r 值随地质时间演化的曲线( h o d e l l e t a 1 ,1 9 9 4 ) ,但至少需要9 阶的等式。用参数回归在几个百万年的时间上可能 6 第二章参数同门模型与非参数同门模型的比较 是相对恰当的拟合方式,但更长时间尺度( 几十,甚至几百个m a ) 的全球锶同 位素曲线不会是一个简单的多项式函数关系,同时某些时问段中的数据量太少 甚至没有,那么使用参数回归的方法就比较困难。所以,我们要寻找适合的数 学方法拟合数据,尤其是不用参数的方法。 2 2 非参数回归方法 非参数回归方法是二十世纪3 0 年代中后期开始形成并逐步发展起来的。这 是与参数统计相比而存在的,它改变了传统统计学发展的格局,对未知分布的 数据模型的处理以及不完全数据的处理等提供了一种新的统计方法。非参数回 归是一种不依赖于总体分布及其参数,也就是不受分布约束的一种统计方法。 在过去的几十年里,非参数回归理论得到了进一步发展,并且已经在储多领域 得到一定的应用。如,在光谱学( r u c k s t u h lc t a l ,2 0 0 1 ) 、社会科学( j a c o b y ,2 0 0 0 ; b l a n t o m1 9 9 9 ) 、经济学( m a t t e o ,1 9 9 8 ) 、神经系统科学( h e ne ta 1 ,2 0 0 4 ) 、 医学( b o r k o w f e ta 1 ,2 0 0 3 ) 、生物学( r e d d e r s e n , 2 0 0 2 ) 、气候学( r o b s o n , 1 9 9 8 ) 以及环境学( f i l l e u le ta 1 ,2 0 0 4 ) 等领域的研究。然而,在地质领域中,有关非 参数方法应用很少,国内几乎没有。我们相信非参数回归可能是处理地质数据 的一种更为适当的方法。 非参数回归方法或之称为平滑方法,与参数回归方法相反,它不采用现成 的数学函数作为模型,也就是假定变量之间的函数关系未知,要对这个回归函 数进行估计,这是一种较新的拟合数据的方法。用非参数回归估计回归曲线有 以下的四个特点( 张颖,2 0 0 2 ) : 第一,关于两个变量的关系的探索是开放式的,不套用现成的数学函数。 第二,所拟合的曲线可以很好的描述变量之间关系的细微变化。 第三,非参数回归提供的是万能的拟合曲线,不管多么复杂的曲线关系都 能进行成功的拟合。 第四,虽然非参数回归没有参照固定的某个参数模型,但仍能给出观察值 的预测结果。 如此看来,非参数回归与参数回归拟合相比则显得更为灵活,可以对同一 数据进行多次不同拟合,以探索数据中可能隐藏的某种关系,这是参数回归拟 7 成都理_ t 大学硕+ 学位论文 合绝对做不到的。而且,非参数拟合可以对数据中的任何模式或变量间的任何 一种曲线关系进行拟合。 非参数回归的目的之一是减少参数回归模型可能存在的模型偏差( 孙云 利,2 0 0 5 ) 。一个错误的参数模型能产生额外的模型偏差,进而导致错误的结论。 非参数回归模型企图通过拟合一个大的模型来减少这种偏差,并容许数据本身 来决定合适的模型结构,同时提供一些有用的关于建模的工具。 一元非参数回归模型是 y = 肌( z ) + u , ( 2 1 ) 其中所( ) 是未知函数,“,是随机误差项,u l 的数学期望为0 。它反映了除 自变量外其他影响因变量的可观察或不可观察的因素以及模型的设定误差等。 此模型的特点是回归函数的形式可以是任意的,自变量x 和因变量y 的分布限 制很少,因而有大量的适应性。为了估计肌( ) ,人们提出了很多方法,s t o n e ( 1 9 7 7 ) 提出了非参数回归估计的权函数方法,引起了学术界广泛的重视。近几十年来, 权函数方法如核估计、局部多项式估计等方法都在不断发展完善。核估计和局 部多项式估计都具有相合性和渐近正态性( 于卓熙,2 0 0 6 ) ,但核估计是局部加 权平均,其偏差较大,核估计的偏差还与自变量的概率密度函数有关( 图2 5 ) , 局部多项式估计的偏差比核估计小,其偏差与自变量的概率密度函数无关,此 外,局部多项式估计在估计出回归函数m ( x 1 的同时也能估计出回归函数的导 函数m ( x ) 。在很多情况下,局部多项式估计比核估计更可取( 刘忠,2 0 0 3 ) 。 这里介绍一下局部多项式估计方法。 8 第二章参数回门模型与非参数回门模型的比较 图2 5 锶同位素组成与地层厚度的核估计 人们常用的局部线性估计方法是局部多项式估计方法的特殊情况。在这里 首先介绍线性估计方法。 假设m ( x ) 在附近有- - g r 导数,则在的某一邻域有 m ( x ) zm ( x o ) + m ( x o ) ( x x o )( 2 2 ) 极小化 y t r , _ 反一届( 置- - x 。) 】2 k h ( x , - - x 。) ( 2 3 ) t = l 其中瓦( ) = h - 置( ) ,k ( ) 是概率密度函数,h 称为窗宽或光滑参数, 它控制局部领域的大小,它的大小对估计的影响很敏感,关于它的选取将在下 面介绍。模型( 2 3 ) 解记为p o ,届,则定义埘( ) 及其导数m ( ) 的估计分别为 m ( x o ) = p o ,m ( ) = 届,可知 其中, 形r m ( x o ) = 鼍_ 一 彬 ,= l 成都理工大学硕十学位论文 形= ( z x 0 ) 最:- ( x ,一) 最,。】,s = 毛( z 一) ( z 一) 7 ( ,= 1 ,2 ) m ( x o ) 称为m ( x o ) 局部线性估计( 1 0 c a ll i n e a re s t i m a t o r ) ,就是落在 【一厅,x o + h 】的置与其对应的,】:关于局部模型( 2 3 ) 的加权最小二乘估计( 于 卓熙,2 0 0 6 ) 。所以,概率密度函数k ( ) 就是权函数。当z 越接近时,对应 j = :的权数就越大,反之,则越小。当z 落在 - 3 h ,+ 3 h 】之外时,权数基本 为零( 张日权,2 0 0 3 ) 。 将局部线性估计方法推广,可得如下的局部多项式估计方法: 假设m ( x ) 在附近有p + 1 阶导数,则在x 。的某一邻域有 月4 ( x ) 。月4 ( x 。) + 所,( z 。) ( 石一x 。) + + mc m ( x - x o ) ( 、x x 。) ,( 2 - - 4 ) 口! 极小化 z t r , 一艺局( 置一x o ) 个托( z x o ) ( 2 5 ) 其中吒( ) = h - t k ( 矗) ,k ( ) 是概率密度函数,h 称为窗宽或光滑参数,模型 ( 2 5 ) 的解记为,则定义脚( ) 的估计分别为m ( ) = j ! f l j ( = 0 ,1 ,p ) 记 x = ( z 一) ,y = i ,= ,= ,w = d i a g k h ( ( x , 一x o ) 】1 i n , o ,p 则 = ( xw x ) 。彳盼 使用局部多项式估计方法会涉及如下几个问题: ( 1 ) 窗宽h 的选取。局部多项式对窗宽的敏感性很强。窗宽太大,会引起大 的估计偏差;窗宽太小,会引起大的估计方差。所以取一个合适的窗宽是相当 重要的。在实际应用中,是通过不断地调整窗宽的值来达到满意的估计结果。 ( 2 ) 拟合多项式次数p 的选取。由于估计偏差和方差主要由窗宽来控制,所 1 0 第三章拟合l o w e s s 平滑曲线 以拟合多项式次数p 的选取就没有窗宽的选取重要,但是我们也不能忽视它在 局部多项式拟合中对拟合曲线的影响。对固定的窗宽来说,大的p 将减少偏差, 但是将导致方差的增加和计算量的增加;小的p 将增加偏差。所以应该选取一 个合适的p 值。 第三章拟合l o w e s s 平滑曲线 理论研究和实践证明,回归分析中最常用的方法是最b - 乘法,但在一些情 况下最t b - - 乘法的表现并不太理想,特别是有异常点出现时,最小二乘法显得不 稳定。为了克服这一缺点,人们提出了许多替代方法,稳健m 估计是其中之 一。这一方法由h u b e r ( 1 9 6 4 ) 提出,并且被应用到了一元线性回归分析中。h u b e r ( 1 9 7 3 ) , v 把这一方法应用到多元线性模型。紧接着,这一方法又被应用到非参数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025城镇公益性岗位人员招聘26人模拟试卷及1套参考答案详解
- 2025贵州罗甸县第一医共体板庚分院招聘合同制专业技术人员考前自测高频考点模拟试题带答案详解
- 2025湖南株洲市工业中等专业学校招聘第一批高层次人才13人模拟试卷及答案详解(有一套)
- 2025年压裂设备专用件项目合作计划书
- 2025年广元市贵商村镇银行科技人才招聘考前自测高频考点模拟试题及参考答案详解
- 2025年注射剂类药品项目发展计划
- 2025年春季中国诚通控股集团有限公司校园招聘49人考前自测高频考点模拟试题带答案详解
- 广播剧《撒野》课件
- IDO1-IN-27-生命科学试剂-MCE
- 2025黑龙江东北林业大学土木与交通学院派遣人才招聘1人考前自测高频考点模拟试题附答案详解(考试直接用)
- 无人仓库运营成本分析-洞察分析
- 幽门螺杆菌治疗进展
- 集装箱质量检测标准
- 导尿术操作并发症及处理规范
- 水利水电工程单元工程施工质量验收评定表及填表说明
- 人工智能训练师理论知识考核要素细目表四级
- 全国职业院校技能大赛高职组(服装创意设计与工艺赛项)备赛试题库(含答案)
- DL∕T 831-2015 大容量煤粉燃烧锅炉炉膛选型导则
- 金相检验中级试题
- 工业园区环保管家技术方案
- (正式版)QBT 8006-2024 年糕 标准
评论
0/150
提交评论