(运筹学与控制论专业论文)保险中小样本信息的分析处理与研究.pdf_第1页
(运筹学与控制论专业论文)保险中小样本信息的分析处理与研究.pdf_第2页
(运筹学与控制论专业论文)保险中小样本信息的分析处理与研究.pdf_第3页
(运筹学与控制论专业论文)保险中小样本信息的分析处理与研究.pdf_第4页
(运筹学与控制论专业论文)保险中小样本信息的分析处理与研究.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

(运筹学与控制论专业论文)保险中小样本信息的分析处理与研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上海大学硕士学位论文 摘要 在风险分析和评估过程中,由于种种条件限制,在许多情况下只能搜集到 少量的样本,即小样本,比如保险中的巨灾数据、豁免数据,健康险中的各种 重大疾病患病情况数据等等。然而即使可以收集到所有的数据,但有时数据量 不免会十分巨大,例如地震后的烈度分布调查、人口健康普查分析、民意调查 等等。如果能通过采集少量的样本来研究整体水平,这样不仅节省时间,又节 省人力和财力。因此如何充分利用有限的信息,挖掘出尽可能多的有用信息, 做出比较符合实际的估计,这是本文所要关注的。1 9 9 5 年起北大的黄崇福教授 提出了信息扩散理论;1 9 9 8 年开始,复旦大学尚汉冀教授和上海大学陆余楚教 授合作,致力于小样本信息扩散的研究;2 0 0 5 年罗马尼亚的m a k o 对信息扩散 技术也做了最新的研究。 本文的工作主要有:首先一维情况下,在原先均匀信息扩散的基础上,本 文提出了非均匀的信息扩散方法。利用m a c c o r m a e k 数值计算方法对非均匀信 息扩散方程进行求解,随后根据尚汉冀教授提出的“最小波动准则”和“有限 偏离度准则”进一步得到最优的扩散解。其次在二维情况下,提出了改进的带 交叉项的信息扩散方法,其对原有的受单个参数控制的二维均匀信息扩散方式 做了改进,通过构造一个概率扩散模型导出一个由三个参数控制的扩散函数, 再根据两个优化准则进行参数优化。最后,系统地运用核估计方法、均匀信息 扩散方法、非均匀信息扩散方法、改进的带交叉项的二维信息扩散方法,结合 实际项目,分别对一维、二维两种小样本情况做研究,并对这几种估计方法进 行了比较分析。本文所涉及到的数学方法有:模糊数学技术、信息扩散理论、 偏微分方程、数值计算方法以及最优化技术。 本文的数据来源于上海市某社区从1 9 9 7 年开始实施的一项近2 万条数据的 富裕性疾病调查,我们主要选用其中的高血压患病情况资料。以调查项目中的 原始数据作为大样本,以传统统计频率处理的大样本信息作为客观近似标准。 再采用随机抽样的方法分别建立一维、二维小样本,分别利用核估计方法、均 v 上海大学硕士学位论文 匀信息扩散方法、一维非均匀信息扩散方法、改进的带交叉项的二维信息扩散 方法来研究高血压患病率关于年龄、b m i 风险因素之间的关系,并与传统统计 频率处理的大样本标准值进行比较,得到了较为满意的结果,也说明了这些方 法在处理小样本问题上的有效性和可行性。通过这几种方法之间的比较分析, 发现由于一维情况下的非均匀信息扩散方法和二维情况下的改进的带交叉项的 信息扩散方法具有更大的灵活性,最终使得所估计的结果要略优于其它两种方 法。 本文立足点来自于保险中的一个实务问题,但其方法和研究结果对其他领 域类似的小样本信息问题也是适用的。 关键词:核估计、信息扩散、小样本、m a c c o 珊a c k 方法 v i 上海大学硕士学位论文 a b s t i 谴c t b e c a u s eo fv a r i o u sl i m i t a t i o n s ,p e o p l e u s u a l l yh a v et o a c c e s s i n c o m p l e t e i n f o r m a t i o na n di n s u f f i c i e n td a t ai nt h er i s ka n a l y s i sa n de v a l u a t i o np r o c e s s ,w h i c hi s k n o w na ss m a l l s a m p l ep r o b l e m ,s u c ha st h ed i s a s t e rd a t a , e x e m p td a t ai np r o p e r t y i l 塔u m c e ,t h ed r e a di l l n e s sd a t ai nt h el i f ei n s u r a n c ea n ds oo n h o w e v e ri ns o m e c a s 嚣a l lt h ed a t ac a nb eg o t , b u tt h ea m o u n tw o u l db eq u i e tg r e a t s u c ha st h e i n v e s t i g a t i o no fe a r t h q u a k ei n t e n s i t y , h u m a nh e a l t hm e a s u r e m e n ta n dp u b l i c - o p i n i o n p o l l ,e t e i f t h ew h o l es i t u a t i o nc a nb ei n v e s t i g a t e do n l yt h r o u g hc o l l e c t i n ga f e w d a t a , t h e nn o to n l yt i m eb u ta l s om a n p o w e ra n dm o n e yw o u l db es a v e d s ot h i sp a p e r a l m st of m ds o m em e t h o d st h a tc a ng e n e r a t em o r ei n f o r m a t i o na n dl e a dt om o r e a c c u r a t er e s u l t sf r o mt h er e l a t i v e l yi n s u f f i c i e n td a t a i n1 9 9 5 ,i n f o r m a t i o nd i f f u s i o n t h e o r yw a sp r o p o s e db yp r o f c h o n g f uh u a n go fb e i j i n gu n i v e r s i t y l a t e ri n1 9 9 8 , p r o f h a n j is h a n go ff u d a nu n i v e r s i t ya n dp r o f y u c h ul uo fs h a n g h a iu n i v e r s i t y w e r ed e d i c a t e dt oi n f o r m a t i o nd i f f u s i o nr e s e a r c ho fs m a l l s a m p l e t h e ni n2 0 0 5 , m a k oi nr o u m a n i aa l s om a d et h el a t e s tr e s e a r c ho f i n f o r m a t i o nd i f f u s i o n t h em a i nj o bo ft h i sp a p e ri s :f i r s t l yi nt h eo n e d i m e n s i o n a ls i t u a t i o n , o nt h e b a s i so fo r i g i n a l l yu n i f o r mi n f o r m a t i o nd i f f u s i o nm e t h o d ( u i d m ) ,an e wm e t h o d n a m e dg e n e r a ll i m i t e di n f o r m a t i o nd i f f u s i o nm e t h o d ( g i d m ) w a s p r e s e n t e d i n p a r t i c u l a r , m a c c o r m a c kt e c h n i q u ew a sa p p l i e dt og e tt h es o l u t i o n so fg i d m e q u a t i o n sa n dt h eo p t i m a ld i f f u s i o ns o l u t i o nw a sa c q u i r e db a s e do n l i m i t e d d e p a r t u r ec r i t e r i o n a n d m i n i m u mf l u c t u a t i o nc r i t e r i o n w h i c hw e r ep r o p o s e db y p r o f s h a n g s e c o n d l yi nt h et w o d i m e n s i o n a ls i t u a t i o n , a l li m p r o v e di n f o r m a t i o n d i f f u s i o nm e t h o dw i t hi n t e r e r o s s - i t e m ( i i d n ow a sp r e s e n t e d t h r o u g hi m p r o v i n g t h eu n i f o r mi n f o r m a t i o nd i f f u s i o ng o v e r n e db ya s i n g l ep a r a m e t e r , an e wi n f o r m a t i o n d i f f u s i o ng o v e r n e db yt h r e ep a r a m e t e r sw a sd e r i v e db yc o n s t r u c t i n gap r o b a b i l i t y d i f f u s i o nm o d e l t h e nt h ep a r a m e t e r sw e r eo p t i m i z e db yt h et w oo p t i m i z a t i o n p r i n c i p l e s l a s t l y , c o m b i n i n g w i t ht h e p r a c t i c a lp r o j e c t , t h ek e r n e ld e n s i t y i 上海大学硕士学位论文 e s t i m a t i o nm e t h o d ( k e r m ) ,u n i f o r mi n f o r m a t i o nd i f f u s i o nm e t h o d ( u m m ) , g e n e r a ll i m i t e di n f o r m a t i o nd i f f u s i o nm e t h o d ( g r a m ) a n di m p r o v e di n f o r m a t i o n d i f f u s i o nm e t h o dw i t hi n t e r c r o s s - i t e m0 i d m ) w e r eu s e dt o i n v e s t i g a t et h e s m a l l - s a m p l ep r o b l e m sr e s p e c t i v e l ba n dc o m p a r i s o nw a sm a d eb e t w e e nt h e s e m e t h o d s f o l l o w i n gm a t h e m a t i c a lm e t h o d s w e r ei n v o l v e di nt h i sp a p e r :f u z z y m a t h e m a t i c ,i n f o r m a t i o nd i f f u s i o nt h e o r y , p a r t i a ld i f f e r e n t i a le q u a t i o n , n u m e r i c a l c o m p u t a t i o nm e t h o da n do p t i m i z a t i o nt e c h n i q u e t h ed a t au s e dh e r ec a m ef r o ma p p r o x i m a t e l y2 0 ,0 0 0r e c o r d si nas u r v e yo i lt h e d i s e a s e sr e l a t e dt ob e t t e rl i v i n gc o n d i t i o n s ( d b l c ) i ns h a n g h a ii n1 9 9 7a n d e m p h a s i sw a sl a i do nt h ep r e v a l e n c er a t e so fd b l co fh y p e r t e n s i o nd i s e a s e ( p r d ) i nt h i sp a p e r t a k i n gt h eo r i g i m ad a t a 船t h el a r g es a m p l e t h ep r do b t a i n e db y t r a d i t i o n a ls t a t i s t i c a lm e t h o dc o u l db er e g a r d e da sas t a n d a r do n e r a n d o m l y - c h o s e n s a m p l em c t h o dw a su s e dt o s e tu pt h eo n e d i m e n s i o n a la n dt w o d i m e n s i o n a l s m a l l s a m p l e s t h e nk e r m , u i d m , g i d ma n di i d mw e r ea p p f i e dt os t u d yt h e r e l a t i o n s h i pb e t 、e e np r da n dt h er i s kf a c t o r sw h i c hw e r ea g ea n db m i a n da s a t i s f a c t o r yr e s u l tw a so b t a i n e d w h i c ht o l du st h a ta l lt h e s em e t h o d sw e r ef e a s i b l e a n dv a l i di nd e a l i n gw i t hs u c hs m a l l - s a m p l ep r o b l e m sa n dv e r i f i e dw e l lb yt r e a t i n g p r a c t i c a lp r o j e c t m o r e o v e rt h r o u g hc o m p a r i n gt h e s em e t h o d s ,w ef o u n dt h a tg i d m i no n e - d i m e n s i o n a ls i t u a t i o na n di i d mi nt w o - d i m e n s i o n a ls i t u a t i o nh a dm o r e f l e x i b i l i t y , s oe v e n t u a l l yt h e i rr e s u l t sw o u l db ea l i t t l eb e t t e rt h a no t h e rt w om e t h o d s a l t h o u g ht h i sp a p e ri sb a s e do nap r a c t i c a lp r o b l e mi ni n s u r a n c e ,t h em e t h o d s a n dr e s e a r c hr e s u l t sa l ea v a i l a b l et od e a l i n gw i t hs u c hs m a l l s a m p l ep r o b l e m si n o t h e rf i e l d s k e y w o r d s :k e r n e ld e n s i t ye s t i m a t i o n , i n f o r m a t i o nd i f f u s i o n , s m a l l s a m p l e , m a c c o r m a c kt e c h n i q u e i i 原创性声明 本人声明:所呈交的论文是本人在导师指导下进行的研究工作。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已发 表或撰写过的研究成果。参与同一工作的其他同志对本研究所做的 任何贡献均己在论文中作了明确的说明并表示了谢意。 签名:啦日期:兰盟f 垆 本论文使用授权说明 本人完全了解上海大学有关保留、使用学位论文的规定,即: 学校有权保留论文及送交论文复印件,允许论文被查阅和借阅;学 校可以公布论文的全部或部分内容。 ( 保密的论文在解密后应遵守此规定) 嗍业 上海大学硕士学位论文 本文主体结构图: i x 上海大学硕士学位论文 第一章绪论 1 1 研究的目的和意义 小样本客观存在于金融、信息、地震灾害、故障诊断等等十分广泛的领域。 在风险分析和评估过程中,由于种种条件限制,在许多情况下只能搜集到少量 的样本,a p :j , 样本。比如保险中的巨灾数据、豁免数据,健康险中的各种重大 疾病患病情况数据等等。前几年曾经发生的非典型性肺炎和禽流感,这些病毒 在全球范围内广泛传播,一般几十年甚至几百年才发生一次,在这些情况下我 们所得到的数据是少量而有限的,利用这些小样本数据通过建立合适的模型和 估计方法来预测大样本情况,不仅有利于人们进一步预防和控制病情,而且也 可使保险公司精算人员更准确地进行产品定价,从而可以很好地进一步制定产 品开发策略。此外,在保单核保中,我们可以根据被保险人提供的信息来分析 他患病的可能性,再根据危险因素进行分类来决定收取多少保费、甚至拒保。 然而即使没有条件限制,可以收集到所有的数据,但有时数据量不免会十 分巨大,例如地震后的烈度分布调查、人口健康普查分析、民意调查等等。如 果能通过采集少量的样本来研究整体水平,这样不仅可以节省时间,又可以节 省人力和财力。 因此如何充分利用有限的信息,挖掘出尽可能多的有用信息,分析出尽可 能精确的结果,这正是本文所要关注的。 1 2 国内外研究概况 概率密度的核估计方法自r o s e n b l a t t ( 1 9 5 5 ) 和p a r z e n ( 1 9 6 2 ) 提出以来,由 于其优良的统计特性和使用简便而迅速发展起来。核估计方法具有较参数估计 方法适用范围广,较直方图方法估计精确且光滑性好等特点。运用核估计方法 处理大样本信息是统计学中常用的一种手段。但用核估计方法来处理、解决、 上海大学硕士学位论文 分析保险中的小样本信息,在国内鲜见报道、登载。 以“信息扩散”和“信息分配”为核心的模糊信息优化处理技术是由中国 学者黄崇福教授独立提出和发展的一门新兴数据处理技术。信息扩散原理于 1 9 9 5 年黄崇福教授在模糊信息优化处理技术及其应用一书中提出,由于信 息扩散的目的是挖掘出尽可能多的有用信息,提高系统识别的精度,这种技术 就被称为模糊信息优化处理技术,最简单的方法是信息分配方法,最简单的扩 散函数是正态扩散函数i l 】。 模糊信息优化处理技术在国内的应用已广及气象、人寿保险、采矿、土木 工程、测绘、信号处理、决策支持系统、故障诊断、地质灾害、计算机仿真、 风险分析等许多领域【2 】。早在1 9 8 5 年,黄崇福、刘贞荣就用信息分配方法研究 了震害面积的估计问题。1 9 9 0 年8 月,甘肃天水的椒树湾、泰山庙斜坡在暴雨 的触发出现滑坡险情,王家鼎等工程地质专家采用模糊信息优化处理技术,准 确地预报了滑坡的发展趋势,建议当地政府采取了一系列减弱滑坡程度的工程 措施,仅搬迁费一项就节约了4 0 0 0 多万元【3 l 。 从1 9 9 8 年开始,复旦大学数学所尚汉冀教授和上海大学陆余楚教授合作, 致力于该领域的研究。1 9 9 9 年,他们提出了非线性信息分配公式,并将其用于 美国大都会人寿保险总公司资助项目“上海市富裕性疾病发病率”的研究上。 2 0 0 0 年,尚汉冀等提出了一个二维信息有限扩散方法【4 】,提高了人寿保险精算 的精度。继而在2 0 0 2 年,尚汉冀教授系统地提出“最小波动准则”和“有限偏 离度准则”,解决了一维、二维信息扩散函数的参数优化问题陋1 。但是黄崇福教 授和尚汉冀教授都非常希望信息扩散技术可以运用到非均匀问题中去,以便解 决实际问题中信息扩散不均匀的情况。于是,从2 0 0 5 年起我们就致力于研究一 维的非均匀信息扩散问题,并将目前的几种估计方法进行比较分析,所写的 a n a l y s i so fs m a l l - s a m p l ei n f o r m a t i o ni ni n s u r a n e e 一文已被2 0 0 6 年7 月在日 本东京召开的第十届亚太地区风险与保险年会( a p r i a ) 所采纳。 模糊信息优化处理技术的研究,在国际上也引起了国际同行的关注。2 0 0 0 年北美模糊信息处理学会第十九届国际大会设有名为“d i f f u s i o n ”的分会会场。 2 上海大学硕士学位论文 国外把这种技术看作软计算( s o f tc o m p u t i n g ) 技术。由于不需要专家经验支持, 这种技术也被看作是计算智能( c o m p u t a t i o n a li n t e l l i g e n t ) 技术。2 0 0 2 年德国的 s p r i n g e r 出版社出版了黄崇福教授信息扩散的第一本英文专著 t o w a r d s e f f i c i e n tf u z z yi n f o r m a t i o n p r o c e s s i n gu s i n gt h ep r i n c i p l e o fi n f o r m a t i o n d i f f u s i o n ) ) 【6 】。 1 3 项目情况 由美国大都会人寿保险总公司资助,复旦大学和新华医院合作领衔研究的 一个应用课题,该项目数据来源于上海市某社区从1 9 9 7 年开始实施的一项富裕 型疾病调查。这项调查在该社区全体1 6 岁以上常住户口居民中进行,历时约一 年,共获得1 8 7 2 5 条调查数据。这项调查有一个重要的特点是它不仅调查了居 民的基本情况和患病情况,而且对于一些可能对富裕型疾病产生重要影响的危 险因素( r i s kf a c t o r ) 或称为易患因素也进行了调查,其中包括居民的性别、 年龄、职业、文化程度、身高、体重等等各种相关因素。如何利用调查数据来 分析这些危险因素对某一人群或某人患富裕性疾病风险的影响,无疑十分重要。 它对医学或人身保险( 特别是医疗保险) 都是很有意义的。 1 4 本文工作 本文的工作主要有: 首先,在原先均匀信息扩散的基础上,本文提出了非均匀的信息扩散方法。 在一维情况下,利用m a e c o r m a c k 数值计算方法对非均匀信息扩散方程进行求 解,随后根据“最小波动准则”和“有限偏离度准则”进一步得到最优的扩散 解。 上海大学硕士学位论文 其次,在二维情况下提出了改进的带交叉项的信息扩散方法,其将对原有 的受单个参数控制的二维均匀信息扩散方式做改进,通过构造一个概率扩散模 型导出一个由三个参数控制的扩散函数,再根据两个优化准则进行参数优化。 最后,本文将以实际项目中的富裕性疾病之一高血压病为例,以项目原始 数据作为大样本,以传统统计频率处理的大样本信息作为客观近似标准。以数 学运算软件m a t l a b 作为计算平台,采用随机抽样的方法分别建立一维、二 维小样本,利用核估计方法、均匀信息扩散方法、一维非均匀信息扩散方法、 改进的带交叉项的二维信息扩散方法分别研究高血压患病率关于年龄、b m i 风 险因素之间的关系,并与传统统计频率处理的大样本标准值进行比较,得到了 较为满意的结果,也说明了这些方法在处理小样本问题上的有效性和可行性。 通过这几种方法之间的比较分析,发现由于一维情况下的非均匀信息扩散方法 和二维情况下的改进的带交叉项的信息扩散方法具有更大的灵活性,最终使得 所估计的结果要略优于其它两种方法。 4 上海大学硕士学位论文 第二章数学模型 2 1 核估计方法介绍 在任何一本初等统计书中都有介绍直方图( h i s t o g r a m ) 方法,这是一种最 简单而常用的密度估计方法1 7 】。这方法可追溯到十七世纪,当时由于概率和数 学工具都有限,当遇到统计问题时,只能从直观的角度提出处理的方法:以频 率估计概率,以直方图估计密度等。直方图估计的优点在于简单易行,较为直 观。但也有明显的缺点,它不是连续函数( 这可以通过适当的修匀来解决) ,且 从统计角度看一般说效率较低。每一区间中心部分密度估计较准,而边缘部分 则较差。, 于是r o s e n b l a t t 和p a r z e n 分别于1 9 5 5 年和1 9 6 2 年提出并研究了一类很重 要的密度估计核估计。下面我们给出核估计的一个定义: 核估计的定义: 设置,五以是随机变量z 的简单随机子样,f ( x ) 是x 的概率密度函 数,k ( ) 为r 上一个给定的概率密度函数,吃 0 是一个与胛有关的常数, 记以加击毫 k ( 三 一x h 。 则称无为总体未知密度函数厂的一个核估计,称k ( ) 为核函数,称吃为 窗宽( w i n d o w - w i d t h ) 嘲。 ( 1 ) 窗宽吃的含义。对每个观察值x 。限制在高为,宽为吃的“窗”内,而 n h 估计值为疗个这种“窗”之和。因而吃正是这”个“窗”的公共“窗宽”参 数。 5 上海大学硕士学位论文 ( 2 ) 窗宽吃的作用。由定义可知,核估计既同样本有关,又同核k 及窗宽吃的 些“碰撞”之和,核k 确定了每一个“碰撞”的形状,而吃则决定了“碰 撞”的宽度 当选得过大 由于x 经过压缩变换i :之后使分布的 主要部分的某些特征( 如多峰性) 被掩盖起来了,估计量有较大偏差;如吃太 这是因为待估的f 是密度,最好是估计量五本身也是密度函数。当k 为密 度时,容易验证z 满足这个条件。而且当k 满足某些光滑条件时,工作为工 :一知小加p l o , 巍b ( 2 ) k ( “) = 6 里幻 v i h 生 当 , 甜 甜 当 上海大学硕士学位论文 ( 3 ) k ( “) = 【3 。( ,1 - 当u 1 2 甜a i z 口) ;( 4 口) ,当l “i 口; ( 4 ) k ( “) 2 而i e x p ( 1一万u ) ( 一m 0 为常数,则 c 加南毫kc 等,称为总体密度厂的一个核黼 本文将选取标准正态密度函数为核函数,选取窗宽h n = c q n5 。其中 c :0 7 8 5 2 是相应于标准正态分布的一个常数,q 是样本的四分位数间距,以是 样本的观察数。 2 2 信息扩散方法介绍 信息是客观事物的存在方式和运动状态的反映。这种反映通常是通过一定 的物质或能量的形式表现出来,并直接或间接地能为人们的感官所感受。如果 人们所感受的信息不能够清楚地反映客观事物的存在方式或运动状态,这种信 7 上海大学硕士学位论文 息就叫模糊信息1 9 】。在扎德提出模糊集理论之前,人们通常采用某种清晰化的 方式处理模糊概念。例如,对于一条信息“火车站候车室里年青人居多”,如果 将“年青人”定义为1 8 岁到3 0 岁的人,将“居多”定义为此占总人数的6 0 到8 0 0 , 6 ,则对所给的模糊信息可以进行清晰化。模糊集理论帮助人们认识到, 用人为清晰化的方法会丢失一些信息,不利于人们对客观事物的认识,用模糊 集方法处理模糊信息,更为合理。 模糊信息优化处理的对象是不完备信息,主要是小样本提供的模糊信息( 仅 仅依靠它们,我们不可能清楚地认识有关的统计规律) ,主要的依据是信息扩散 原理。简单地讲,信息扩散就是将一个传统的数据样本点变成一个模糊集合。 信息扩散原理是一个断言:假设给定了一个知识样本,用它可以估计一个关系。 直接使用该样本,得出来的结果称非扩散估计。当且仅当该样本不完备时,一 定存在一个适当的扩散函数和一个相应的算法,使得扩散估计比非扩散估计更 靠近真实关系。已经证明,这一原理至少对于概率密度函数( 它是事件和概 率的一种关系) 的估计是成立的。有趣的是,对于概率密度函数的估计而言, 信息扩散估计和传统的p a r z e n 核估计有异曲同工之妙。但是,在信息扩散原理 提出来之前,核函数的物理意义并不清楚。信息扩散原理的提出,揭开了核估 计的面纱:核函数的物理意义,是通过集值化的手段填补样本点之间的空隙。 只有当所给样本不完备时,这种填补才有意义。 信息扩散原理的图示: 令a = x 。f k = 1 , 2 ,万) 是一可估计实关系月的样本。当且仅当a 中的样本 数n 太少以至于不能提供足够的精确度来估计r ,此时的彳称为小样本。设j 是 月的一个估计,当且仅当通过4 的任何算法不可能找到一个估计r 使得r = r , 此时的样本4 称为是不完备的。因此可知,小样本是不完备的0 0 1 。 8 上海大学硕士学位论文 信息扩散原理:令a = 红。i k = 1 2 ,一 是一在u = x x y 上可估计实关系足的样 本,而孟是由彳直接得到的实关系r 的一个最优估计。当且仅当么是不完备时, 一定存在一个非平凡的扩散函数使得通过扩散样本爿( ,u ) 得到估计f ,而彭 与实关系r 之间的距离将小于j 圣与实关系r 之间的距离】。 所谓的信息扩散就是改变观察对象为模糊集从而部分地填满了由于不完备 性所造成的空隙,因此比非扩散估计有所改进。图一中黄崇福教授等给出了信 息扩散原理的图示: a l r r l l o 是信息传导系数,竺 旦是信息密度的梯度,减号意味着信息流是从 高密度区域流向低密度区域的。现有边界为r 的区域q ,在 f l ,f 2 】中通过的信息 聚集量为“】: ,= 胁到o u 刊盯七( 窘+ 刳螂卜卿一啪施 另一方面,在 f i ,t 2 】中通过区域q 的信息聚集量也可表示为: 卜g 咖( 南y 卅( 工出f 2 ) 协砂2 盯i c 詈d 妣砂; nn v 黜船降害卜) 以= 酶詈t d t d x d y ; 峨肿q 的能也糊就有弑七f 塑o x 2 + 旁卜詈。 上海大学硕士学位论文 结合初始条件,就转换成了下面的柯西问题: ( 2 3 1 ) 于是可得解:甜( x ,少,7 ) 。百乏万p 4 戤 1 一三 假设在某时刻气,i 。f 达到了平稳点甜( y ) 2 i l _ i p 4 k b ; 即本文将选取均匀扩散函数为:。( x ,y ) = e - , t ( x 2 + y 2 ) ,其中a 将在下文中 讲行优化廿理。 j 鲁州窘,; 【u = 6 ( x ) ( 当t = o 时) 则一维均匀扩散函数可取为:2 ( x ) = p 一2 r ,其中旯将进行优化处理。 2 4 非均匀信息扩散方法 本文又考虑到大多数物体内的物质分布是不均匀的,各部分浓度不同,使 物质从浓度大的地方迁移到浓度小的地方,即产生了非均匀的信息扩散。 2 4 1 一维情况 对于扩散方程,形如:等= 丢( k ( 彬罢) ,其中k ( 蹦“)对于扩散方程,形如:百2 瓦【x ,“) 瓦j ,其中k ( 为,“) 塑矿翔 ( 潞川 k = 艿丝甜舻 上海大学硕士学位论文 表示扩散物质的浓度。 前文考虑的均匀信息扩散方程中的k 为常数,即上式为: 署t = kc 睾x ,;a、a 27 此处考虑到了非均匀的情况,故k ( x ,r ,t t ) 将不再是个常量,而是一个变量,我 们主要研究关于打的变量,即k ( u ) ,故扩散方程可转换为: 詈= 去( kc 咖罢 ; a fa xi 、7 a xj 5 其中关于扩散物质浓度k ( u ) 的选取,只要满足下列条件,可以是任意的: ( a ) 非负递增函数; ( b ) 扩散速度的非均匀性,浓度越高,扩散越快; ( c ) 即使没有浓度,也会有一点扩散。 因此不妨选用最简单的二次函数形式,即k ( u ) = + 1 ) 2 ,则非均匀信息扩散问 题可表述成: 詈= 丢( k c “,罢)。2 4 矿 u l 瑚= 万( x ) 于解此憾即署州窘+ 掣( 昙) 2 这样的拟线性 扩散方程,将用到m a c c o r m a e k 数值计算方法。 2 4 2m a e c o r m a c k 数值计算方法 下面将运用m a c c o r m a c k 数值计算方法对问题( 2 4 1 ) 进行求解。 m a c c o r m a c k 方法是l a x - w e n d r o f f 方法的一种特殊形式,其形式比一般 上海大学硕士学位论文 l a x - w e n d r o f f 方法要简单的多。和l a x - w e n d r o f f 方法相类似,m a c c o r m a e k 方法也是一种预测一校正格式,运用于对流方程时在时间和空间上都是二阶精 度的。m a e c o r m a c k 方法于1 9 6 9 首次发表,在发表后广泛应用于流体力学问题 的求解。 其主要思路如下: i 、区域破分: 即对于“的求解区域进行离散化,亦即对u ( x ,f ) 中x 的区域,t 的区域进行 某种划分,以便于在对微分方程进行离散化后,进行递推求解。 2 、微分方程的离散: 利用差分( 向前差分、向后差分、中心差分) 的线性组合代替分方程中相 应的微分项,求得t 时刻的“与f 时刻以前的u 的关系,从而得到递推关系式, 达到对微分方程离散的目的。 3 、初值和边界条件处理: 由于问题给的初始条件和边界条件都是连续的,因此需要利用上面两个步 骤,使其离散化。 户王晏步骤硼卜: 预测步: ( a ,就) ;= ,( 甜? ) 古( z f 二,一2 甜+ “二。) ( 而为距离步长) ; ( 矿) 广1 = “? + ( a ,甜) l f( r 为时间步长) ; 校正步: c o :) ”= 厂( 瓦7 + 1 ) 古( 瓦翁1 2 瓦7 + l + 瓦2 1 ) ; ( 咖k = 争( 咖) 卜( a 刃? “】; “】;,+ 1 = 甜? + ( a ,甜) 。,f : 1 4 上海大学硕士学位论文 根据m a c c o r m a c k 方法求得一系列离散解后,下文将通过两个优化准则进 行优化处理,从而得到最优的那个离散解。 而对于二维的非均匀信息扩散问题詈= 去( k ( 扯) 参+ 茜( k ( ) 爹; i u ( x ,y ,o ) = a ( x ,y ) 可类似一维的情况用m a c c o r m a c k 方法来求解,但因解法更为复杂烦琐,故本 文在此不做详细介绍,下面将介绍另一种二维的改进的带交叉项的信息扩散方 法。 2 5 改进的带交叉项的二维信息扩散方法 上文中的一般二维均匀信息扩散问题警= 足降芬 ,其只考虑了沿 x ,y 轴上下左右四个方向的等速扩散,但由于一般情况下,两组变量x 和y 的 量纲并不一样,它们之间还可能存在一定的相关性,所以有时扩散不仅仅会沿 x ,y 轴的方向,还会往斜的方向扩散。如下图: p7 上海大学硕士学位论文 假设信息点0 在时间间隔r 内向上图中8 个方向之一扩散一步( 工和y 方 向的步长分别为缸和缈) 的概率分别为a ,p 2 ,p 8 ,其中由扩散的对称性知, p 。= a + 4 ,o = 1 ,2 ,3 ,4 ) ,于是有a + 岛+ 马+ 风= j 1 。 由全概率公式: u ( x ,y ,t + a t ) = 甜( x a x , y , t ) p m + “( x + b 乃f ) a + “( x ,y - a y ,f ) p i + “( x ,y + a y ,t ) p 3 + 甜( x a x , y + 缈,f ) p i + “( x + x ,y 一缈,t ) p u + “( x + x ,y + 缈,) p 4 + “( x a x ,y 一缈,f ) 。既( 2 5 1 ) 在u ( x ,y ,) 处进行泰勒展开: “( x 缸彤r ) = 甜( 而y 力( 为y 力缸+ 掣缸2 铲缸3 + 0 ( 血4 ) ; “( 而y 缈力= 卵( 五弘d ( 而y 力分+ 塾芝产每2 掣缈3 + 。( 缈4 ) ; 甜( x + a x , y + 妙,f ) = 甜( ,f ) + 甜,( w ,f ) a x + u y ( w ,f ) 缈+ 监业x 2 + 姒缸a y + 型掣缈:+ d ( x z a y :) ; “( z 一一a y ,f ) = 甜( ,f ) 一甜,( ,f ) a x - u y ( w ,f ) 缈+ 监业x 2 + “掣( x ,) ,r ) x a y 2 + ! 掣y 2 + 。( a x 2 a y 2 ) ; ( x + x ,y a y ,f ) = 甜( x ,y ,f ) + 甜,( x ,y ,f ) a x - u y ( x , y , t ) a y + ! 生掣x 2 一甜。( x ,y ,f ) x 卸:+ 塾譬字旦妙:+ 。( x :劬:) ; 甜( x 一x ,y + a y ,f ) = 甜( ,) 一甜,( ,f ) x + 甜y ( x ,y ,f ) 妙+ 堑噜掣x 2 一吲w ,t ) a z a y 2 + 掣缈2 + d ( x :a y 2 ) ; u ( x ,y ,t + a t ) = u ( x ,) ,f ) + “,( x ,y ,t ) a t + o ( a t 2 ) : 1 6 代入( 2 5 1 ) 式,并整理得: u ( x ,y ,f ) + 虬( 并,y ,o a t + o ( a t ) :现m 五_ y 力+ 竺基生字华缸:+ 。( ) 】+ 2 p 3 扛( x 成f ) + 竺坚竽缈2 + 。( 缈) 】+ 2 p 2 协( 五y ,f ) + 竺坚5 雩掣缸2 一( 为y 力) c 妙+ 竺d 雩:掣妒 + d ( 缸2 缈2 ) 】+ 2 n m ( x ,y ,f ) + 丝三专:掣缸2 + u x y ( x ,y ,f ) 缸缈 + 掣缈2 + o ( a x 2 a y 2 ) 1 ; u ( x ,y ,f ) + u t ( x ,y ,t ) a t + o ( a t 2 ) = u ( x ,y ,f ) + ( p 1 + p 2 + p 4 ) “硝( x ,y ,f ) j 2 + 2 ( p 4 一p 2 ) z ,叫( x ,y ,t ) a x a y 十( p 2 + p 3 + p 4 ) “拶( x ,y ,t ) a y 2 + o ( a x 2 y 2 ) ; ( x ,y ,o a t + o ( a t 2 ) = ( 局+ p 2 + 风) ( z ,y ,f ) 缸2 + 2 ( 觑一见) z o ( x ,y ,t ) a x a y + ( 见+ p 3 + p 4 ) u y y ( x ,y ,t ) a y 2 + o ( a x 2 缈2 ) ; 令& _ o ,并假设等一琅 。, 芝_ d ,上述方程两边取极限得:v 0 a t 甜。:( p 。+ p 2 + p 4 ) d ,甜。( x ,y ,f ) + 2 ( p 4 一p 2 ) 厕。( x ,y ,f ) + ( p 2 + p 3 + p 4 ) d ,” ( x ,y ,f ) a = d ,( p i + p 2 + 内) ,丑= 瓦虿( p 4 一a ) ,c = d g p 2 + p , + a ) , 得到一个更为一般的线性扩散方程: u f = a u 。+ 2 b u 砂+ c u ( 2 5 2 ) ; 1 7 上海大学硕士学位论文 为了保证扩散运动是二维的,要求见乃o ,( 1 f o( 2 5 3 ) ; 在( 2 5 3 ) 成立的前提下可以用f o u r i e r 变换来求得方程( 2 5 2 ) 的基本解: 甜( x ,y ,f ) = 令 即 c 以2 - b 2 ) t 4 ( a c b y 。 ) 一垡:二! 墅! 生: 4 ( a c b2 ) , b 彳 彳2 i 五i 而v ,b = 南,c = 赤; 于是就得到在新的8 个方向非等速扩散假设下的二维扩散函数: “( z ,少,旯,y ,y ) :3 至互p c z ,:一:,+ ,:, 石 对于患

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论