




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计推断在数模、模数转换中的应用第008组 顾婕昱 ,毕雨来 摘要:本论文在工程实践与科技创新3A的实验结果数据的基础上,探究统计推断在数模、模数转换中的应用。报告中利用DC-DC开关电源输出的电压值与PWM信号占空比的53组数据,采用选取7个特征点,运用随机函数和遗传算法并结合退火算法,来寻求满足所有数据的统一形式的函数,并得到满足评价函数的局部最优解。关键词:统计推断,曲线拟合,三次条样插值,模拟退火算法,遗传算法Application of Statistic Model in A/D and D/A Converse SystemABSTRACT: The paper is to ex
2、plore the application of statistic model in module-digital-analog conversion system on the basis of the experimental data from technological innovation3A. The report uses DC-DC switching power supply output voltage and PWM duty cycle of 53 sets of data to and picks seven characteristic points to fin
3、d a consensus function for all groups of data by means of random selection, genetic algorithm and simulated annealing algorithm to get the partial optional result.Key words: Statistic Model, Curve Fitting, Spine Interpolation, Simulated Annealing Algorithm, Genetic Algorithm1 引言在工程实践与科学实验中通常面对的对象是一个
4、由多个变量组成的一个系统,当我们需要寻找两个变量间的关系时,在理论上我们可以通过计算得出两个变量之间的确定的函数关系,但实际却很难找到非常精确描述两个变量的函数。通常采取的方法是通过多种不同曲线拟合,算出多种不同的方案,并选择某一统计量作为评定优劣标准,从而选出最优的方案。1.1问题的提出本次课题面对的对象是一个含有微处理器智能器件的开关电源(DCDC系统),通过输出一定的占空比的PWM波来控制输出的电压。电路板的D-U特性关系个体差异较大,实验室中,我们可以逐点测定53个电压设点对应的占空比D值,但是涉及到大批量的工业生产时,逐块测定势必会增加生产成本,降低可行性。那么是否可以通过几组事前观
5、测值来完成对系统的定标?系统定标准确度评价函数定义为: (1-1)说明:(1)j=1对应U1=4.9 (V),j=53对应U53=10.1 (V),此2点不纳入评价范围(2)式中,增加(-2)项使满分取到100,与百分制习惯相符合(3)限定A的最小取值为01.2数据来源实验课程中制作的可调电源模块,在本报告中视为一个黑盒抽象对象如图所示:图1-1 测量对象模型1数据来源为实验课程中所有小组的有效数据。每一组数据输出电压从4.9V 到10.1V,每隔0.1V 取样得到相应的占空比,共53个数据对。总共有544组数据。1.3课程目标限测7点事前观测值,获得平均得分不低于94分的估测方法。 2 方案
6、设计2.1数据点观察通过观察发现,随着采样点电压的增大,有些图像具有良好的线性性和平滑度,有些图像则分段具有较好的平滑度,但是有明显的分段跳变。另外观察到有一部分的曲线抖动比较厉害,平滑度较差。2.2数学背景给出一组对应的模拟量,要求确定一个函数逼近原函数,要求不要求过所有的点而且尽可能表现数据的趋势,靠近这些点。判断最优的准则可以是最小二乘、加权最小二乘、极大似然等。这里使用最小二乘法,是使观测数据的误差平方和达到最小值的一种预测方法。设dij为某一占空比的数值,uij为在该占空比下对应的电压值,当函数表达式确定好后,将某一占空比带入表达式即可得到理论的电压值,但是它与实际测量值之间必定存在
7、一定的误差,用随机误差ij来表示。即 uij=fdij+ ij (2-1)样本总得分可依据每个点的ij对应课程所给的评价函数求取Aij,并加和求取总评分,即i=1544 j=252Aij (2-2)评判一个数学模型的好坏的方式就是:计算平均得分,即score= i=1544j=252Aij - 2 (2-3)2.3特征点选取观察到第一个和最后一个数据偏差较大,所以舍弃这两个数据,将问题转化外在51个数据点中找到7个特征点。2.3.1非暴力穷举法获得全局最优解的方法是将所有可能性进行计算,也就是一共要计算C517=次,假设每次运算用时0.01秒,那么总共需要13.39天得到结果,对笔记本来说不合
8、适。但是考虑到特征点之间不可能分布得很接近并且应该分布得较为均匀,所以在全局范围内选点会有大量的不必要计算,可以对每个点划分范围。为了简化算法,首先选取处于端点的第2和第51个数据,并且规定任意两点之间的间距不能小于5。数据的选择区间如下所示:表2-1 观测点选取范围观测点序号选取区间26,26311,31416,36521,41626,46再利用循环来找到使平均得分最高的观测点,总共需要计算次,大大减少了运算的时间。2.3.2遗传算法遗传算法是基于达尔文的生物进化论和孟德尔的遗传学的一种通用的求解优化问题的适应性搜索方法,其基本原理是仿效生物界中物竞天择、适者生存的演化法则。遗传算法把问题参
9、数编码为染色体,再利用迭代的方式进行选择、交叉以及编译等运算来交换种群中染色体的信息,最终生成符合优化目标的染色体。遗传算法流程图如图2-1所示。图2-1 遗传算法流程图2常用的编码方式有二进制编码、实数编码、矩阵编码、树形编码等等,在这个实验中,我们考虑老师介绍的二进制编码和十进制编码,但二进制编码在与十进制进行转换的时候较为麻烦。而且在交配和变异的时候有较大随机性,因此选择后者。(1)初始群体的生成:随机产生了10组初始种群,每组中为7个点,以这些数据作为初始点开始进化。(2)选择:从群体中选择适应度高的个体,淘汰适应度低的个体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新
10、的个体再遗传到下一代。以评价函数得分作为选择依据,得分越高,被选择的概率就越高。(3)交叉:在自然界生物进化过程中起核心作用的是生物遗传基因的重组(和变异)。交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。通过交叉,遗传算法的搜索能力得以飞跃提高。本论文采用的是奇偶行进行重组,然后选择一个随机的点断开并分别结合。(4)变异:变异算子的基本内容是对群体中的个体串的某些基因位置上的基因值作变动。变异能够使遗传算法具有局部的随机搜索能力。当遗传算法通过交叉算子已接近最优解邻域时,利用变异算子的这种局部随机搜索能力可以加速向最优解收敛。显然,此种情况下的变异概率应取较小值,否则接近最优
11、解的积木块会因变异而遭到破坏。另外通过变异还可以维持群体多样性,以防止出现未成熟收敛现象。此时收敛概率应取较大值。初步设定初始种群有10个,交配种群10个,变异种群10个,一共30个,分别计算它们的评价值,在其中寻找平均得分最高的10个,作为下一代的初始种群。编码方面,重新采用的十进制算法。参数方面,交叉概率设定为0.9,变异概率设定为0.01。当最优个体的评价值不再上升或者迭代次数达到预设的代数时,算法终止。在本题中,我们没有设中止代数,只是当最高平均得分不再变化时(小于设定的阙值),中止计算。2.4拟合方法图像中观察到的跳变是因为整体系统特性与其电路系统中晶体管元件特的工作特性可分为前后衔
12、接的连续区间:截止区、线性区和饱和区,在跨越区间时物理特性是连续而非跳跃间断的。2.4.1 多项式拟合在多项式拟合次数选取中,我们直接对53组数据整体进行拟合,并以残差平方和以及运算时间为参考依据,选择出满足误差控制范围内的可行性拟合次数。表2-2为采用不同多项式拟合所得的最优点、平均得分以及样本得分情况。表2-2 多项式拟合所得结果拟合次数最优点平均得分样本得分=94组数样本得分=94组数样本得分90组数2,7,16,25,35,43,5194.3074381772,7,14,24,35,43,5194.3419379802,6,15,25,36,44,5194.2415385822,8,1
13、5,24,35,43,5194.3463381782,8,16,24,35,43,5294.290136977最终得到的最优解为2,8,15,24,35,43,51。544组数据的平均评价函数值为94.3463,其中,较好的完成了要求。2.4.3关于拟合方式选取的结论根据表2-2和表2-3的数据分析可知,虽然三次样条差值分段拟合的方法计算量较大、运算时间更长,但不论是从平均得分或是样本得分情况来看,分段拟合的结果要明显优于多项式拟合,但是所以,我们决定采用三次样条差值分段拟合的方式进行后续研究。3 拓展部分一 遗传退火算法结合3.1模拟退火算法模拟退火算法(Simulate Anneal Ar
14、ithmetia,SAA)是一种通用概率演算法,其出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。将固体温度升至充分高,固体内部粒子随温度的升高变为无序状,内能增大,再让其慢慢冷却,系统能量下降,得到晶体结构。退火算法流程图如图3-1所示。图3-1 模拟退火算法流程图2(1)初始化:设定初始温度T0足够大并设定衰减系数,随机生成初始解S1,确定每个T时的迭代次数L。初步决定取初始温度为98,衰减系数为0.98,终止温度为0.001。(2)对当前解扰动产生一个新解S2。当前解S1中使用随机数改变其中的一个。(3)计算增量df=f(S1)-f(S2),其中f为评价函数。若dfr
15、and,接受S2作为新的当前解,否则保留S1。(4)若满足终止条件则输出S1为最优解并结束程序否则返回步骤(2)。当满足终止条件或迭代次数达到上限时,程序停止。逐渐降低控制温度,重复以上过程直到满足终止条件。3.2模拟退火算法和遗传算法和遗传算法的结合遗传算法后期个体之间的适应度差异不大,优秀个体后代的优势不明显,减缓了趋向最优解的速度。所以我们在逸窜算法的基础上,融入退火思想尝试对适应度进行拉伸,克服了遗传算法的早熟现象。具体思路如下:在温度高时,对应遗传算法的前期,适应度相近的个体产生后代的概率相近,近似于随机搜索,可以保留群体之间较大的差异;随着温度不断下降,适应度较好的子代能够生存,适
16、应度较差的子代则被淘汰,加快收敛速度。通过不同的子种群各自独立的进行,把每次进化找到的最优解分配到各个子种群中去,进一步选取子种群中适应度高的优秀个体。整个过程中,拉伸作用加强,在保证优秀个体进化稳定性的同时,加快进化速度,避免单种群进化过程中过早收敛现象5。算法流程图如图3-2所示。是否是否是否返回最优解T减小终止条件?最大迭代次数?k = k+1接受新解t=0且exp(-t/T)random(0,1)计算个体平均得分,计算t交叉繁殖变异初始化T、p迭代次数k = 0, 计算个体平均得分图3-2 模拟遗传退火算法流程图参数方面,初步设定种群规模为30,交叉概率为0.9,变异概率为0.01,初
17、始温度98,衰减系数0.98,终止温度为0.001。3.3遗传退火算法运算结果表3-1 不同参数下遗传退火算法运算结果交叉概率变异概率初始温度衰减系数最优点平均得分0.90.01980.982,7,16,24,35,43,5194.36070.90.01970.972,8,16,24,35,43,5194.40070.90.01990.993,8,16,24,35,45,5194.33050.850.01980.982,8,15,24,35,43,5194.34630.850.01970.972,6,16,24,35,43,5194.33820.850.01990.992,8,16,25,35
18、,43,5194.2963经比较,最终得到最优点2,8,16,24,35,43,51 ,544组数据平均得分为94.4007。同时,产生最优点的时间略短于单纯应用遗传算法的时间。4 拓展部分二 寻求更好的拟合方式5拓展部分三 寻找更少特征点在七个特征点可以满足课题要求的情况下,我们认为完全有理由相信更少的点也可以满足是平均得分大于94分的课题要求。但考虑到数据本身呈现出来的分段特质,我们认为,特征点最少不能少于4个。基于以上分析,我们利用遗传退火算法分别做了5,6 个特征点的尝试。表5-1 更少特征点的结果特征点个数最优点平均最高得分62,10,22,33,45,5294.208552,10,
19、25,44,5292.457442,16,42,5287.0871当特征点数目减少时,寻求满足要求的特征点难度明显增大。并且,随着特征点的减少,平均得分逐渐降低,运算时间同步增长。在6个特征点的前提下还可以勉强找到满足要求的点,然而,4个、5个特征点的搜索基本是不可实现的。所以我们记录程序运行一段时间后的最高得分以及其对应的特征点。从上面的分析结果可知,由于53*544组数据较为离散,描述该问题的特征点以6个,7个为宜,特征点过少一方面不能得出代表曲线特征的拟合曲线,另一方面,会增大电脑运算负担,降低效率。6 拓展部分四 对评价函数的改进6.1对课程所给评价函数的分析本课程中给出的评价函数类似
20、等级评分制,即: (6-1)带有一定的人为主观性,从统计数学的角度讲并不严谨。例如,误差绝对值ij为0.011和0.03所对应的分数相同,但很明显,从统计学的角度出发,两个误差应该对应不同的得分。同时,该评价函数一定程度上无法杜绝两级分化的情况。6.2对新的评价函数的介绍基于6.1中所述两点考虑,我们小组在残差平方和的基础上做出修改,编写了新的评价函数,即score=100eijij2 (6-2)说明:(1)评价函数分值越低越能说明拟合曲线可以代表样本的变化趋势。应用此评价函数时,则需要搜寻可以使得分更低的特征点。(2)ij2为残差平方和的原型,eij相当于给残差平方和加权,误差越大,加权就越大,可以一定程度上杜绝两极分化的情况。(3)由于matlab输出值默认小数点后四位,由于直接应用eijij2得到平均得分基本小于0.0200,所得有效数字位数较少,所以我们乘以100,使输出有效数字位扩大到5位,有利于后续的比较。(4)根据事前部分穷举法得出的平均得分情况,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论