终极综合版本修改版

上传人：我*** IP属地：北京上传时间：2022-02-22 格式：DOCX 页数：12 大小：842.80KB 积分：9.6 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1.2视觉的处理过程?21.11.2 角点提取处理流程?21.3 仿射配准的处理流程：2.22.1 噪声和纹理是影响自然图像分割的主要因素，从这两个因素出发，分析基于阈值、边缘、区域分割各自的优缺点。22.1.1 基于阈值的分割22.1.2 基于边缘的分割222.1.3区域分割：区域分割分为区域生长和合并22.2根据你对图像分割算法的认知，提出对自然图像的分割的发展方向，并给出分割算法的基本思路。32.2.1原理：32.2.2步骤：32.2.3改进：3.43什么是数据挖掘？4什么是数据仓库？63.13.23.33.43.53.6数据挖掘与现有学科（传统数据分析）的差别有哪些？7数据挖掘的经典算

2、法有哪些？4什么是数据仓库？错误!未定义书签。为什么要引入数据仓库？7.84什么是 LOD(Levels of)技术，其模型分为哪几层，从低层向转变会有突4.1变要怎么解决？84.2坐标系？8蒲亦非855.1在欧式测度下，分数阶微积分有哪三个最基本的定义？三者之间有什么？85.2在图像处理过程中，分数阶微积分有三个特性：1.长时记忆；2.非局域性；3.常数微分不等于 0，这些特性对图像处理有哪些优势？8.966.1PPT） 9研究的领域，利用七种研究中的一种写一个研究计划。（不能全抄6.2请列举 23 种支持云计算开发的语言或工具（环境）。106.3你认为大数据的机遇和是什么。10林涛1177

3、.1为什么将人机交互作为一个究领域？117.2人机交互的重要性？117.3你认为最人机界面应该是什么样子？11中118.1主成分分析（PCA）的优缺点11.129.1可视化12891 / 1211.1处理过程?视觉的a 图像配准 b 摄像机标定（确定内部参数）c 确定摄像机相对放置（确定外部参数）d 三维表面重建（细则见往年资料）1.2角点提取处理流程?1. 从图像中提取边缘像素集2. 将边缘像素按照性降序排序 3. 对于当前性最大的像素，若其性大于指定阈值，则将其输出到角点集，否则结束处理流程 4. 对于剩余的边缘像素集，将其性乘以 H，转第 2 步（细则见往年资料）1.3仿射配准的处理流程

4、：1. 假设左图像与右图像的特征点集分别为 P、Q，从 P、Q 中选择一个未尝试的三点对，若已无三点对可以选择，则认为配准失败，并结束处理流程2. 使用相似三角形约束往年资料）三点对的合理性，若不合理，则转第一步（细则见22.1噪声和纹理是影响自然图像分割的主要因素，从这两个因素出发，分析基于阈值、边缘、区域分割各自的优缺点。2.1.1 基于阈值的分割优点：阈值处理直观、实现简单、计算速度快。缺点：对于噪声较大的图像，尤其是该图对应的直方图无法区分两个波峰，就很难找到一个合适的阈值来分割出特定的目标。2.1.2 基于边缘的分割基本思想是通过边缘检测检测出明显的边缘，利用此特征分割图像。优点：

5、经典的边缘检测算子具有实现简单、运算速度快等特点。缺点：常用的一阶微分算子有 Roberts 算子、Prewitt 算子和 Sobel 算子，微分算子有 Laplace 算子等，这些算子对噪声敏感，只适合于噪声较小不太复杂的图像。2.1.3 区域分割：区域分割分为区域生长和A 区域生长基本思想是将具有相似性质的像素集合起来合并区域优点：区域生效果。的优点是计算简单，对于较均匀的连通目标有很分割缺点：需要人为确定点，对噪声敏感，可能导致区域内有空洞。2 / 12B合并差不多是区域生长的逆过程：从整个图像出发，不断然后再把前景区域合并，实现目标提取。得到各个子区域，优点：这种对复杂图像的分割效果较

6、好。缺点：算法较复杂，计算量大，还可能破坏区域的边界。2.2根据你对图像分割算法的认知，提出对自然图像的分割的发展方向，并给出分割算法的基本思路。注：结合图像分割（1）（辅）与图像分割（2）（主）的算法，重点写一个算法思想，只写具体思路，不写公式。（如：写出 snakes 全局分割算法；如果有图论方面的分割算法，则更完美！）我认为基于主动轮廓的图像分割技术既承载了上层先验知识，又能融合图像的底层特征，因而能够有效地应用于图像分割领域。主要模型。2.2.1 原理：一下传统的 Snake将一条带有图像能量的闭合曲线在内外力的作用下，曲线最终收敛到轮廓。内力曲线的弯曲和拉伸，约束曲线的形状；外力，即

7、图像力，将曲线拖至有着显著图像特征的边缘处。当内外力达到平衡时，就可以将曲线固定在物体的目标轮廓。2.2.2 步骤：图像，然后对图像进行预处理。ab 根据图像的具体特征，对于背景简单的图像，选择一种或多种传统的分割，如阈值分割、边缘分割、区域分割，初始化目标轮廓线；对于背景复杂的图像，采用分水岭分割算法初始化轮廓线。轮廓线应当尽可能的靠但不能和真实轮廓有交叉，否则在后续处理中会发生错误。的轮廓，c 为了让轮廓线尽可能的靠轮廓，引入气球力模型，通过调整参数使曲线向外膨胀或者向内收缩，把轮廓线牵引至能量场有效范围之内;引入梯度矢量流模型，扩大 Snake 模型外力场的作用范围，比较边界；收敛到目标

8、的深度凹陷d 根据以上运算得到模型的各个参数开始迭代，直至达到则可以得到目标物体的轮廓。在实际应用中，迭代求解不容易得到全局的最优解，该算法往往会陷入局部最小值点，导致图像分割错误，所以经常采用动态规划法和贪婪算法进行优化。2.2.3 改进：Snake 主动轮廓模型对能量函数做了上述改进，可以达到比较图像分割效果，但是对拓扑变化的适应性不是很理想。基于水平集的 Snake 模型可以解决这一问题，它是一种几何主动轮廓模型。a 形态学重构对图像进行预处理，即淡化或消除图像的背景来增强目标图像；b 用基于水平集的 Snake 模型进行目标边缘检测:水平集的是将闭合曲线隐含地表达为二维曲面函数的水平集

9、，即具有相同函数值的点集，通过水平集函数曲面的进化隐含地求解曲线的。3 / 1233.1什么是数据挖掘？数据挖掘是通过仔细分析大量数据来揭示有意义的新的过程.、趋势和模式的数据挖掘（Data Mining)是从大量的、全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的和知识的过程.数据挖掘的广义观点：数据挖掘就是从存放在数据库，数据仓库或其他库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘，又称为数据库中知识发现，也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下步骤组成：（1）数据，（2）数据集成，（3）数据选择，（

10、4）数据变换，（5）数据挖掘，（6）模式评估，（7）知识表示。数据挖掘可以与用户或知识库交互。3.2数据挖掘的经典算法有哪些？国际权威的学术组织 the IEEE International Conference on Data Mining (ICDM) 2006 年 12 月评选出了数据挖掘领域的十大经典算法：C4.5, k-Means, SVM,Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅是选中的十大算法，其实参加评选的 18 种算法，实际上随便拿出一种来都可以称得上是经典算法，它们在数据挖掘领域都产生了极

11、为深远的影响。1.C4.5 算法是机器学习算法中的一种决策树算法,其算法是 ID3 算法.C4.5 算法继承了 ID3 算法的优点，并在以下几方面对 ID3 算法进行了改进：1) 用增益率来选择属性，克服了用增益选择属性时偏向选择取值多的属性的不足；2)3)4)在树构造过程中进行剪枝；能够完成对连续属性的离散化处理；能够对整数据进行处理。C4.5 算法有如下优点：产生的规则易于理解，准确率较高。其缺点是：在构造树的过程中，需要对数据集进行多次的顺序扫描和排序，因而导致算法的低效。2. The k-means algorithm 即 K-Means 算法k-means algorithm 算法是

12、一个聚类算法，把 n 的对象根据他们的属性分为 k 个分割，k < n。它与处理混合正态分布的最大期望算法很相似，因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量，并且目标是使各个群组内部的均方误差总和最小。4 / 123. Support vector machines支持向量机，英文为 Support Vector MachineSV 机（中SVM）。它是一种監督式學習的，它广泛的应用于统计以及回归分析中。支持向量机将向量到一个更高维的空间里，在这个空间里建立有一个最大间隔超平面。在数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两个平行超平面的距离最大化

13、。平行超平面间的距离或差距越大，器的总误差越小。一个极指南是 C.J.C Burges 的模式识别支持向量机指南。vander Walt 和 Barnard 将支持向量机和其他器进行了比较。4. The Apriori algorithmApriori 算法是一种最有影响的挖掘关联规则频繁的算法。其是基关联频集。于两阶段频集思想的递推算法。该关联规则在规则。在这里，所有支持度大于最小支持度的上属于、单层、称为频繁，5. 最大期望(EM)算法在统计计算中，最大期望（EM，Expectationization）算法是在概率（probabilistic）模型中寻找参数最大似然估计的算法，其中概率模型

14、依赖于无法观测的隐藏变量（Latent Variabl）。最大期望经常用在机器学习和计算机视觉的数据集聚（Data Clustering）领域。6. PageRankPageRank 是 Google 算法的重要内容。2001 年 9 月被授予专利，专利人是Google 创始人之一?（Larry Page）。因此，PageRank 里的 page 不是指网页，而是指PageRank 根据，即这个等级是以来命名的。的外部链接和内部链接的数量和质量俩衡量的价值。PageRank 背后的概念是，每个到页面的链接都是对该页面的一次投票，被链接的越多，就意味着被其他量多少人愿意将他们的投票越多。这个就是

15、所谓的“链接流行度”衡和你的挂钩。PageRank 这个概念引自学术中一篇的被引述的频度即被别人引述的次数越多这篇的权威性就越高。7. AdaBoostAdaboost 是一种迭代算法，其思想是同一个训练集训练不同的器(弱器)，然后把这些弱器集合起来，一个更强的最终器 (类器)。其算法本身是通过改变数据分布来实现的，它根据每次训练集之中每个样本的将修改是否正确，以及上次的总体的准确率，来确定每个样本的。值的新数据集送给下层器进行训练，最后将每次训练得到的器。器最后融合起来，作为最后的决策8. kNN: k-nearest neighbor classificationK 最近邻(k-Neare

16、st Neighbor，KNN)也是最简单的机器学习算法之一。该算法，是一个理论上比较成熟的，的思路是：如果一个样本在特征空间中5 / 12的 k 个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。9. Naive Bayes在众多的模型中，应用最的两种模型是决策树模型(DecisionTree M)和朴素模型（Naive Bayesian M，NBC）。朴素模型发源于古典数学理论，有着坚实的数学基础，以及的效率。同时，NBC 模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单。理论上，NBC 模型与其他相比具有最小的误差率。但是实际上并非总是如此

17、，这是因为 NBC 模型假设属性之间相互，这个假设在实际应用中往往是不成立的，这给 NBC 模型的正确带来了一定影响。在属性个数比较多或者属性之间相关性较大时，NBC 模型的NBC 模型的性能最为良好。效率比不上决策树模型。而在属性相关性较小时，10. CART:与回归树CART, Classification and Regression Trees。在树下面有两个关键的思想。第一个是关于递归地划分自变量空间的想法；第二个想法是用验证数据进行剪枝。3.3什么是数据仓库？数据仓库是一个面向的、集成的、相对合，用于支持管理决策。数据仓库的组成：a 数据仓库数据库的、反映历史变化的数据集是整个数

18、据仓库环境的b 数据抽取工具，是数据存放的地方和提供对数据检索的支持。对各种不同数据COBOL 程序、MVS 作业同的数据。c 元数据方式的能力是数据抽取工具的关键，应能生成语言（JCL）、UNIX 脚本、和 SQL 语句等，以不元数据是描述数据仓库内数据的结构和建立同分为两类，技术元数据和商业元数据。的数据。可将其按用途的不工具为用户d数据仓库提供。有数据和报表工具；应用开发工具；管理系统（EIS）工具；在线分析（OLAP）工具；数据挖掘工具。e 数据集市（Data Marts）为了特定的应用目的或应用范围，而从数据仓库中f 数据仓库管理出来的一部分数据。g发布系统6 / 123.4为什么要

19、引入数据仓库？数据库及其理论已经出现好长时间。早期的大多数数据库系统主要集中于操作性的日常事务处理。随着数据库的进一步发展，出现了一种更高级的数据库观念，即一种数据库服务于操作型需求，而另一种数据库则服务于型或分析型需求。将操作型数据库和型数据库分离开，是出于以下：a 服务于操作型需求的数据在物理上不同于支持型或分析型需求的数据。b 主持操作型处理的技术从根本上不同于支持型或分析型需求的技术。c 操作型数据的用户群体不同于或分析型数据所支持的用户群体。d 操作型环境的处理特点与型环境的处理特点从根本上是不同的。分析型环境或称为决策支持系统（DSS）环境。型和决策支持系统处理的是数据仓库。什么是

20、分析型、型处理呢？这种处理不同于只查找 12条数据的数据（如操作型处理），当 DSS 分析。进行分析处理时，需要大量基于以上，需要引入数据仓库与数据库并行发展。3.5数据挖掘与现有学科（传统数据分析）的差别有哪些？数据挖掘与传统的数据分析(如、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘息应具有先未知,有效和可实用三个特征.、发现知识.数据挖掘所得到的信a 数据挖掘的数据源与以前相比有了显著的改变；1 数据是海量的；2 数据有噪声；3 数据可能是非结构化的；b 传统的数据分析给出一个假设然后通过数据验证，在一定意义上是假设驱动的；与之相反，数据挖掘在一定意义上是发现驱

21、动的，模式都是通过大量的搜索工作从数据中自动提取出来。即数据挖掘是要发现那些不能靠直觉发现的或知识，甚至是违背直觉的或知识，挖掘出的越是出乎意料，就可能越有价值。在缺乏强的数据分析工具而不能分析这些资源的情况下，历史数据库也就变成了“数据坟墓”里面的数据几乎不再被。也就是说，极有价值的信息被“淹没”在海量数据堆中，领导者决策时还只能凭的经验和直觉。因此改进原有的数据分析，使之能够智能地处理海量数据，即演化为数据挖掘。先的是指该是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的或知识,甚至是违背直觉的或知识,挖掘出的越是出乎意料,就可能越有价值.在商业应用中最典型的例子就是一家连锁店通过

22、数据挖掘发现了小孩尿布和啤酒之间有着惊人的总结：。7 / 1244.1什么是 LOD(Levels of)技术，其模型分为哪几层，从低层向转变会有突变要怎么解决？LOD 技术称作多层次细节技术。为了解决可视化过程中系统的实时性和模型的逼真性之间的，按照当时视点到模型对象距离的不同细节层次，距离近时调用复杂的模型，显示的细节，距离远时调用简单的模型，不必显示细节，以便减少计算量，保证系统的交互速度。在系统开发过程中，为了解决 LOD 层次结构模型在运行时的突变效应，即在 Switch 转换时视觉上的不连续性，采用增大 Switch 距离和 Morphing 两种。增大 Switch 距离只是将不

23、同复杂度模型间的转换距离置远，使人眼不易觉察。Morphing从根本上解决 Pop是一种基于可视化合并一个 LOD 到另一个 LOD 的，能效应。为了实现 Morphing LOD，某些多边形的顶点被定取复杂度低的 LOD 模型上最靠近视点的那些顶点，义为 Morphing 顶点，当较高 LOD 出现时，系统首先显示 Morphing 顶点（位于较低的 LOD 上），然后逐步更新视景，直到把较高的 LOD 顶点全部显示为止，这样可以解决视觉上的突变问题。4.2坐标系？（见往年资料）5蒲亦非5.1在欧式测度下，分数阶微积分有哪三个最基本的定义？三者之间有什么？见5.2在图像处理过程中，分数阶微积

24、分有三个特性：1.长时记忆；2.非局域性；3.常数微分不等于 0，这些特性对图像处理有哪些优势？1）分数阶微积分具有记忆特性，一些研究者分别将分数阶样条小波应用到图像纹理的奇异性检查和图像融合中，较整数阶微积分取到更效果（）。2）分数阶导数具有全局相关性，能较体现系统函数发展的历史依赖过程；而整数阶导数具有局部性，不适合描述历史依赖过程。3）分数阶微分可以在提高信号高频成分的同时非线性地保留信号中的甚低8 / 12频，所以常数微分不等于零，根据以上特点，将该理论应用到图像增强中，可以使图像边缘更加突出，同时保留了图像平滑区域的纹理。4）基于分数阶微分理论的感受野模型较整数阶微积分理论更

25、符合人类的视觉特性（）。5）一些研究者利用分数阶微分算子具有弱导数性质的特点，利用分数阶梯度算子对含弱噪声的图像进行边缘检测，该能够有效地解决整数阶梯度算子对噪声敏感的问题，因此可以避免噪声的影响而准确的定位噪声图像的边缘。（）6）分数阶导数模型克服了经典的整数阶微分模型理论与实验结果吻合不好的严重缺点，使用较少的几个参数就可以获得很效果；7）选择适当阶次的分数阶微分算子在增强图像过程中可以大幅提升边缘和纹理细节的同时，非线性地保留了图像平滑区域的纹理；66.1研究的领域，利用七种研究中的一种写一个研究计划。（不能全抄 PPT）a 问题图像边缘检测后，对于轮廓的裂缝，采用哪种算法进行连接

26、效果好，选择图像形态学操作还是重复端点拟合法？b 两种算法的区别通过阅读该研究领域的大量文献找到两种算法的区别和具体的应用领域。形态学操作：利用结构元素在图像中移动，在移动过程中分析图像的结构特征，据此进行膨胀、腐蚀等运算。重复端点拟合法：不断改变线段的端点，直到所有的像素点能够被线段很好的拟合。比较两个技术的优缺点前者连接的准确率高，但其缺点是算法复杂，选取合适的结构元素比较。后者算法简单，其缺点是由于错误的数据点的c 两种算法的比较标准有可能会导致拟合错误。设计两种算法的预定义比较项，如算法执行的时空复杂度、连接效果、鲁棒性等，思考如何做到保证公正的比较两种技术，不偏向任何一项；查阅该研究

27、领域的文献综述，学习其他研究者的比较，根据研究内容的实际情况，做一些改进，期望可以供d 评分标准检查的研究者参考。分别将这两种技术应用到相同的实例当中进行评分比较：选择同一组有裂缝的轮廓图像，保证它们覆盖所有可能的特征，分别用两种算法处理每一幅图像，观察他们的处理结果并作出评价。e 比较用相关标准定量的比较两个算法，如执行过程中内存使用大小、执行时间等，同时，也要定性的比较两个算法，如它们的处理效果、算法的鲁棒性等。用对照表的形式呈现上述比较结果。9 / 126.2请列举 23 种支持云计算开发的语言或工具（环境）。Google Map/Reduce MapReduce 是 Google 开发的 C+编程工具，用于大规模数据集（大于 1TB）的并行运算APEX 语言第一个所需应变的、多用户编程语言和平台，一种 Java 式的语言，可以在云计算平台上运行的 AppStream，开发者在云端运行和渲染的应用，并以流媒体的形式通过不同平台呈现给用户。谷歌GAE（Google App Engine）是谷歌云计算的一部分，支持的编程语言： SAE（Sina App Engine）开发语言：PHP、Java 等新浪BAE（Baidu Cloud Environment）开发语言：Java、，阿里盛大ACE（Aliyun Cloud Engine）支持 PH

人人文库> 全部分类> 应用文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

终极综合版本修改版

文档简介

温馨提示

最新文档

评论

终极综合版本修改版

文档简介

温馨提示

最新文档

评论

相关文档