




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
求实 进取 创业 报国 团结五班,发展五班 石油天然气数学地质总结第3、 四、五章1简述地质数据的概念、类型及特点。答:地质数据是表示地质信息的数、字母和符号的集合。从广义的角度来说,地质数据既可以是定量的,也可以是文字的说明,甚至是图形的显示;从狭义的角度来说,地质数据主要是指定量的和定性的地质数据。地质数据的主要类型有:(1)观测数据:对各种研究对象直接进行观测或度量所获得的数据。 分为定性数据(其中包括名义型数据和有序型数据) 和定量数据(其中包括间隔性数据和比例型数据)。 (2)综合数据:由观测数据经有限次算术或代数运算后得到的具有 明确地质意义的综合性数据。 (3)经验数据:在研究地质系统的变化规律时,根据大量实际观测 值归纳出来的或根据经验公式计算而得出的经验值地质数据的特点:(1)地质数据的类型多、性质不以,反应的地质内容十分广泛,数量的多 寡和数据的精度相差悬殊,量纲变化大,数据水平的高低亦不一样。 (2)地质数据由于反映多种地质作用迭加的结果而具有混合分布的特征。 (3)目前仍以定量数据为主,定性数据的定量化研究和应用尚处于早期的 开发阶段。2地质数据的误差有哪几种类型。答:(1)随机误差或偶然误差:在观测或测量过程中由不可控制的、无规律的偶然因素引起的误差,它服从正态分布。 (2)系统误差:观测仪器本身所引起的误差。 (3)过失误差:干扰或是认为的过失使地质数据失去自身的“真实性”和“代表性”。3选择地质数据时应注意哪些问题。答:(1)应根据研究目的和要求来选用数据。 (2)数据反映的指标其地质意义要明确。 (3)数据的水平要一致,可靠性要强。 (4)尽可能对数据的统计和函数规律性作出描述。 (5)数据的数量应满足数学模型的要求。 (6)数据的分布要合理,并尽可能的保持均匀。4对地质数据为什么要进行预处理?答:由于地质数据的类型多,量纲各异,数据量多寡不一,时空分布不均匀,且常有数据失真的情况发生,所以以原始数据形式出现的地质数据在大多数情况下都要经过预处理,以便构置成方法数据矩阵后才能供计算机进行处理。5简述地质变量的概念及类型。答:地质变量:用来表征在不同时间或是空间内总是不断变化的地质标志和特征的变量。地质变量类型:(1)观测变量:对地质指标或特征进行直接观测、分析或度量所获得的各种 原始观测值。 (2)综合变量:将两个或两个以上地质指标或特征的原始观测值加以综合(即 对原始数据作有限次数的算术或代数运算)构成一个新变量。6地质变量应具有哪些特征。答:(1)具有明确的地质意义 (2)统计特征明显(3)地质变量与研究对象之间存在着密切的或定量的关系7如何进行地质变量选择,选择地质变量有哪几种途径。答:地质变量选择的目的:(1)要获得一批地质意义明确,统计特征明显且与研究对象和目 的有着密切关系的地质变量。 (2)要达到变量结构的最优化,也就是要具有最优的变量组合。 (3)使实际地质系统的有用信息损失为最小。 (4)有利于建立最优的地质概念模型和数学模型,从而获得最佳 的地质效果。选择地质变量的途径:(1)地质途径:地面地质调差资料、地球物理勘探资料、地球化学勘探资料、遥感地质测量资料、钻井地质勘探资料、试油试采资料、地球物理测井资料、岩矿分析资料、油层物性资料、油气水性质资料、生油指标分析资料、古生物鉴定资料、其他化验分析资料。 (2)数学途径:相关系数法、统计推理法、地质特征矢量长度分析法。8为什么要对地质数据进行变换?有哪几种数据变换的方法。答:因为要得到原始数据矩阵生成和数学模型要求相匹配的方法数据矩阵就需要通过数据变换来完成。数据变换的方法:(1)统一量纲的数据变化方法:标准化变换、极差变换、均匀化变换。 (2)使数据呈正态分布的变化方法:对数变换、广义幂转换。9简述地质数据统计分布的概念及特征。答:地质数据统计分布:在研究时,用概率统计的方法对地质观测结果进行分析,作出频率直方图,经频率曲线拟合后得到的样本频率分布曲线。地质数据分布的特征:(1)曲线的高峰数:常见有单峰、双峰和多峰。 (2)曲线的偏度:对称曲线(其中包括有单峰对称曲线和双峰对称曲 线)和偏态曲线(其中包括有正偏和负偏)。 (3)曲线的峰度:统计分布线的陡峭程度P72。 (4)曲线的统计特征数:平均数、中位数、众数(以上三种为整体性 代表性特征数)、极差、方差和标准差、变异系数(以上四种为 离散型特征数)、偏态系数、峰态系数。第六、七章1什么是逐步回归?如何进行变量筛选?答:逐步回归:按一定的标准,从众多的变量中,根据它们对y(回归方程)的影响的大小,逐次选入回归方程,在此过程中,如果先已选入的某些变量,由于新变量的引入而失去其重要性时,则及时地将它从方程中剔除掉,继续这一过程,直到既无新变量可以添加也无旧变量可以剔除时为止,从而建立最终的回归方程。变量的筛选:(1)首先要根据实际问题,给出检验水平(一般不要取得太小,以便回归方 程中能包含较多的变量,通常取0.1),再查F分布表,确定F检验的临 界值F1和F2。 (2)逐步回归求的是标准回归方程(注:最后在利用回归系数间关系求出原始 变量之间的回归方程)因此逐步回归计算的每一部都是通过对R相继作求 解求逆紧凑变换来进行的。 (3)在会场方程中引入或剔除一个变量时,各变量的偏回归平方和都要起变化, 本来显著的变量可能变成不显著的,本来不显著的也可以变成显著的。 (4)如果回归方程中已没有可提出的变量,则应根据计算式考虑能否选入变量 (5)选入一个新变量后,新回归方程中又可能出现相形见拙的变量,应当再 进行变量的剔除工作。主要公式如下:剔除变量的标准:记为若:,则剔除引入变量的标准:记为若:,则引入。实际计算时,此时,剔除时的统计量:若,则剔除,否则,应保留。2在逐步回归分析中,如何进行数据变换,对变换后数据回归方程具有什么形式?标准回归方程中的标准回归系数与非标准回归方程中的回归系数有何关系?答:详见逐步回归的计算步骤P1033 什么是趋势面分析?它在石油及天然气地质中有哪些应用?答:趋势面分析: 从一批原始数据出发,用多项式函数计算出一个趋势面方程。即 式中:趋势值;待定系数,观测点的横、纵坐标将各个观测点的坐标代入方程式,即可算出各个观测点的趋势值,按一定间距,绘出趋势等值线图(简称趋势图),反映区域性变化规律;再计算出各点的剩余值(观测值趋势值),从剩余值中滤出随机分量,绘出剩余等值线图(简称剩余图),得到一个测区的异常分布图,反映了局部变化规律。应用:(1)用趋势面作构造分析,了解区域构造发生和发展的历史,掌握局部构造的 分布规律。 (2)用趋势面作地层分析,指出岩层区域性变化情况,反映地壳运动的形式和 变化的过程。 (3)用趋势面作岩相分析,指示物源方向,判断沉积环境。(如砂岩百分含量) (4)对生油岩的数据进行趋势面分析,掌握油气富集规律和最大富集部位,预 测成油的远景区。 (5)对试井、采油数据作趋势面分析,判断油、气、水层总的变化规律。4什么是多项式趋势面分析?写出二维三次趋势面方程和三维二次趋势面方程的一般形式。答:多项式趋势面分析:采用多项式函数来拟合(逼近)这批数据的方法。方程书写详见P112面5试比较多项式趋势面分析与多项式回归分析。答:6什么是趋势面的拟合度?如何检验趋势面方程的显著性?是否拟合度越高越好?为什么?答:趋势面的拟合度:对一组观测值数据作趋势面分析时,不同次数的趋势面对原始数据的逼近程度时不一样的,一般地,次数越高,逼近的越好,数学上用拟合度来衡量逼近的程度。检验趋势面方程的显著性:对趋势面方程是否显著,可以进行F检验:不是拟合度越高越好。实际工作中C不能太高,C太大易漏掉异常,但也不能太小,太小易出现假异常。C的取值,要根据具体问题而定。详细见书本P1137趋势面图和剩余图各有什么意义?试举出在石油和天然气地质中有哪些应用?答:趋势面图的意义:反映区域的变化规律。应用有:趋势面分析进行含油区预报。 剩余图的意义:得到一个测区的异常分布图,反映了局部变化规律。应用有:与许多成矿条件有关。8作趋势面分析时应该注意哪些问题?答:(1)控制点的分布:点要均匀,归则网格点较稳,不易畸变。可补点。 (2)拟合度的大小,次数高,易出现畸变,方程组易呈病态。 (3)内插与外推,一般内插效果好,外推时要谨慎。 (4)边界点的处理,不同图幅的拼接时,点要有适当的重复。第8、 九章1什么是聚类分析?阐述其基本思想。答:聚类分析:研究样品和变量分类的一种统计方法。研究样品称为Q型聚类分析,研究变量称R型聚类分析。基本思想:根据样品或变量的相似程度,把相似的归为一类,不相似的归为另一类,关系密切的归入一个小类,关系不太密切的归入一个大类。直到把所有的样品或变量归类完毕,形成一个由小到大的分类系统,最后得出一个树枝状分类谱系图。 2为什么要对原始数据作数据变换?常用的数据变换有哪几种?请写出变换式。答:聚类分析是根据样品的各个指标(即变量)的观测值予以分类的,而这些观测值在量纲和量级上可能是不一样的,因此直接使用原始数据计算,就可能突出某些数据级大的指标在分类中的作用,压低甚至派出某些量级小的指标的作用。为此,在计算前需对原始数据进行变换。常见数据变换方法有:(1)统一量纲的数据变化方法:标准化变换、极差变换、均匀化变换。 (2)使数据呈正态分布的变化方法:对数变换、广义幂转换。变换式:略3写出常用的几种相似性统计量,说明如何用它们刻划样品或变量之间的亲疏关系。答:常用的相似性统计量有三种,即:(1) (距离系数) (2) (相似系数) (3) (相关系数)。距离系数是一个衡量空间两点之间相似程度的统计量,距离系数越小,两点越相似。条件:直角坐标系,要求变量是独立的。相似系数是衡量空间两个向量相似性的一个指标,相似系数越大,两个向量越相似。相关系数是衡量变量之间相关程度的一个指标,变量与的相关系数定义为:4 什么是判别分析?试述构造判别函数的费歇准则。答:判别分析:判别分析是一种判别样品所属类型的统计方法。费歇准则:详见P135及实例15数据应该满足什么条件才可以建立贝叶斯线性判别函数?如何建立贝叶斯线性判别函数?答:建立贝叶斯线性判别函数条件:总体有多个时的判别叫多组判别,在多组判别分析中,我们是这样考虑的。在判别中,我们可能犯这样的错误,即把本应属于g组的样品错分到n组,或者把n组的样品错分到了g 组,这种错误是在所难免的,我们只希望由此造成的平均损失尽可能的小。平均损失最小的准则称为贝叶斯准则。何建立贝叶斯线性判别函数:详见实例2。6为什么要采用逐步判别方法?试述逐步判别的思想及计算步骤。答:指标多,计算量大,由于指标不独立导致计算时的精度下降或出现困难,使之降低判别效果,逐步判别就是采用“有进有出”的算法,来挑选重要指标进入判别式。第十章1什么是主成分分析?试用几何图形说明主成分分析的原理。答:为了说明主成分的数学原理,我们看一个简单的例子,从几何上说明其定义。例:设有6个样品,每个样品测定了两个指标:,这6个样品的分布大致是一条直线,见下图所示。由图不难看出:(1)在老坐标系中,6个点密切相关,在新坐标系中6个点相互独立,即独立沿着F1轴分布(F1与 F2无关)。(2)离差 在老坐标系中,轴上的离差基本相等(可从图上看出,样品点在轴上的分布范围差不多。在新坐标系中,样品在F2轴上为一个常数,离差为0(因为常数的离差=0),样品点的变化全反映在F1轴上,见下图所示。因此,F1就反映了样品的绝大部分变化信息,即达到了降维的目的,二维降到了一维。(3)新、老坐标的关系:从几何上讲,新坐标轴F1,F2是用老坐标轴旋转一个角度得到的,其关系为:从代数上讲,新的综合变量F1,F2是经过线性变换得到的,其关系为:式中:为原变量,为待定系数。 比较(1),(2)得:2什么是因子分析?什么是对应分析?试述其计算步骤。答:因子分析:把多个指标(变量)化为少数几个综合指标(变量)的一种多元统计方法,又称主分量或主因素分析。 对应分析:找出代表性指标,进行地质成因解释先对因子分析作一剖析:特征值R型 研究指标 因子分析找出代表性样品,进行地质作用解释方法Q型 研究样品3试写出R型、Q型因子分析的模型,说明模型中各个量的名称及统计意义。答:R型因子模型为:通常把R型因子模型改为:式中:称为公共的主因子,即每个变量共同包含的因子,是相互独立的因子,即前面讲的综合变量。称为特殊因子,是各变量特有的因子,各特殊因子与各公共因子都是独立的。称为因子载荷,是第变量在第个主因子轴上的负荷。称为因子载荷矩阵,称为特殊因子的负荷。Q型因子分析则是要研究样品的内部关系,须从样品之间的相似系数矩阵出发,最后得到主因子解。由R型因子模型知,Q型因子模型为:式中:为N个样品,为m个主因子,为因子载荷。4试从简化的R型因子模型出发,对因子载荷作几何解释。答:因子载荷的几何意义:假设变量在二维空间分别由向量表示。由下图所示:变量在主因子与上的载荷就是在主因子上的投影。即:(根据解析几何中向量的投影定理)之间的相关关系为:解释:由解析几何中两矢量的夹角公式:。对于标准化数据有:,故:推广之,在m维空间,则:5对R型因子分析如何求它的主因子解?对Q型因子分析如何求它的主因子解?答:主因子解:所谓主因子解,就是求前m个主因子载荷系数。对于p个变量,相关矩阵为:由上知,()于是:(叫做约相关矩阵)由于所求的主因子代表绝大部分信息(80%以上),故上式可简化为: 由前知:即: ,即: 即求得主因子解:可见主因子载荷与主成分系数仅差一个的倍数.6为什么要进行方差最大正交旋转?答:因子分析从相关(相似)系数矩阵出发,导出了m个主因子解,即找到了相互独立的m个主因子,用这m个主因子就能解释原来P个变量的绝大部分信息,达到了降维的目的。因子分析的功能并不在于此,更重要的是要知道每个主因子所代表的地质意义。因此,必须对因子载荷矩阵A实行旋转,使其结构简化,即使每个因子载荷按列向
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版社区老年人营养配餐服务合同范本
- 2025年二手房买卖合同补充条款及房屋交易合同备案服务协议
- 2025版商铺转租租赁物使用限制与责任界定合同
- 2025版科技项目研发成果托管合作协议
- 2025年度自流平地板买卖合同范本
- 2025版虚拟现实产业发展担保合同
- 2025版牲畜养殖企业承包与养殖产业链合作合同
- 2025年互联网企业知识产权抵押贷款合同
- 2025东莞租赁合同范本(含租赁期限延长)
- 2025版新能源发电设备采购与现场安装维护合同
- 2025湖南省低空经济发展集团有限公司招聘12人(第二次)笔试参考题库附带答案详解(10套)
- 2025重庆对外建设集团招聘41人笔试参考题库附带答案详解(10套)
- 2025年中级消控笔试题目及答案
- 《无人机飞行控制技术》全套教学课件
- 石油行业较大危险因素辨识与主要防范措施
- 2024年中国防锈油行业调查报告
- 2025年教育管理领导力案例分析试题及答案
- 办公软件培训课件
- 成人氧气吸入疗法-中华护理学会团体标准
- 2025年职业指导师(中级)考试试卷:职业指导师考试备考策略
- 护士分配科室管理办法
评论
0/150
提交评论