




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于分段线性回归的传感器网络数据压缩传输方法研究 第28卷第4期xx年4月传感技术学报CHINESE JOURNALOF SENSORSAND ACTUATORSV0lI28No4AprxxData CompressionM ethodwith Piece-W iseLinear Regressionin W SN ZHANGRuirui,DU Shangfeng,CHEN Liping,KAN Jie,XU Gang(1College ofInformation andElectri calEngineering,China AgricultureUniversit y,Bei jing100083,China;2Bering Research Center。 ,InteUigentEqui pmentforAgriculture,Bel ting AcademyofAgriculture andForestrySciences,Bei jing100097,China3National EngineeringResearchCenterof IntelligentEquipment forAgriculture,Bei jing100097,China;4College ofInformation Engineering,Capital NormalUniversity,Bel ting100048,China)AbstractSuffering fromthe limitationof bandwidth,W SNis confrontingthe challengeof bigdata transmissionBy obtainingBase-data andconstructing piece-wise linear regression equation,this paperproposed adata pressiontransmission algorithmfor WSN withlarge datavolume andstrong correlationand redundancymulti-parameterTaking environmenttemperature,relative airhumidity andsoil temperaturedata obtainedby aWSNsystem locatedin BeijingXiao Tangshannational demonstrationbase ofprecision agricultureas researchobject,we testedthe cor n-pression anddata recoverye ficiency of the algorithmResults showthat datapression ratiois ashigh as519when theRMSE betweenrestored dataand rawdata are387and049cCwhich bringsan enormousreduction ofthe amountof datatransmissionKey wordsWSN;data fusion;linear regression;correlation analysisEEACC7230doj103969jissn1004-1699xx04014基于分段线性回归的传感器网络数据压缩传输方法研究张瑞瑞,杜尚丰,陈立平,阚杰,徐刚,(1中国农业大学信息与电气工程学院,北京100083;2北京农业智能装备技术研究中心,北京100097;3国家农业智能装备T程技术研究中心,北京100097;4首都师范大学信息T程学院,北京100048;)摘要无线传感器网络通信带宽等十分有限,难以实现较大量数据传输。 针对多参数传感器网络,通过提取基准参数数据集,并分段构建线性回归方程的方法,设计了一种适合多参数、较大数据量传感器网络网内数据的压缩传输算法。 以某基地实际采样环境温度、空气相对湿度、土壤温度数据为研究对象,对算法压缩效率和数据恢复效果进行了分析。 结果表明对于空气相对湿度和土壤温度,恢复数据与原始数据均方根误差RMSE分别为387、O49时,整体数据压缩率可达519,有效降低了数据传送量。 关键词传感器网络;数据融合;线性回归;相关分析TP3919A1004-1699 (xx)04-0531-06无线传感器网络wsN(Wireless Sensor Network)是以感知、采集和处理网络覆盖区域中被感知对象的信息为目的,利用大量传感器节点以无线、多跳、自组织方式构成的数据协同处理网络卜。 如何有效减少数据传送量,延长网络生命周期,是当前WSN能耗控制研究重点。 数据压缩传输技术是解决上述问题的有效方法之一。 Deligiannakis A等提出了一种基于分段线性项目北京市自然科学基金项目 (4121001);北京市农林科学院青年科研基金项目(QNJJxx17);国家863高技术研究发展计划项目(xxAA101901)xx116修改日期xx1224532传感技术学报ehinatransdueerseom第28卷回归模型的WSN数据估计算法。 算法通过对数据分段处理,从中选出基础信号数据,并传送基于以段为单位的线性回归运算得出的回归方程系数,有效地减低了传感器网络的网内数据传送量。 王玲等从数据时间相关性分析层面考虑,基于线性回归模型构建了不同的数据压缩算法。 杨圣洪等1针对数据时间、空间相关性特征,提出了一种基于环模型的分布式时一空小波数据压缩算法。 李杨等提出了一种基于小波分段常值压缩的数据收集算法,利用压缩采样理论和分段化方法降低数据传输量。 Deepak Ganesa等提出了一种基于小波压缩层次系统,基于时空相关性,在节点层对数据时间序列上相关性进行分析,在聚合节点上对不同节点进行空间相关性分析,通过两次处理降低数据冗余。 侯鑫、杨永健等l15-17基于神经网络、卡尔曼滤波等算法模型构建了传感器网络数据融合算法。 考虑到非实时多参数WSN节点环境监测应用背景下,网内参数间表现出强相关、大冗余特点,以及传感器网络节点对数据融合算法的简单、易实现等特殊要求,本文提出了一种基于相关性分析的节点一基站分离式的分段线性回归数据压缩传输算法PWLR(PieceWise LinearRegression)。 算法通过挖掘参数问相关性,减少网内数据量,延长WSN生命周期1算法的模型描述传感器节点采集数据可以描述为矩阵结构,如式 (1)所示。 式中行向量表示单个参数在时间序列上采样数据集。 nm矩阵表示当前最新样本数据,n表示节点有n个监测参数,m表示节点已采样周期数(假设各参数具有相同的采样周期)。 X=l,l l,2Y1I YJ22】22对于强相关性参数(如空气温度和土壤温度),利用标准线性回归估计模型建立参数间数学关系方程,如 (2)所示,并基于最小二乘法确定拟合方程拟合误差RMSE最小时的回归系数(a,b)。 传感器网络节点将作为基准数据集BD(Base Data)发送至基站,对于数据集的传送则可以通过只发送拟合方程回归系数(a,b)实现。 Yi=0ri+b+e(I=i,=n) (2)然而,对整个时间序列进行线性回归会产生较大误差,主要原因在于参数在不同时间段表现的相关程度不同。 例如环境温度在一天的正午时段变化率较小,而傍晚时分变化率较大。 不同参数的相互影响在时问维度上具有滞后性。 当某个参数改变时其他相关参数的相应变化会延迟发生。 例如环境温度与土壤温度的相互影响。 本文提出一种分段线性回归映射方法,将时间序列上的样本数据划分成段,以段为单位进行线性回归计算,并以自定义结构化精简集5的形式进行特征描述,如定义1。 定义1结构化精简集S由以下部分组成f段长度;start段在行上的开始坐标,例如该段在行i上的区间可表示为start,start+1migration该段做线性回归运算时在基准数据集上的起始偏移量,例如可表示为BDmigration,migration+a,b,erra,b为分段线性回归方程的回归系数,err为均方根误差(e r用于分段搜索时可不用传输,见22节)当rtm个样本数据采集完毕后,传感器网络节点首先选取基准数据集(设为见21节),并将行i分成rm段(rm表示对ml的计算值做上取整运算)。 每段以长度f搜索上对应的线性回归运算最优数据区间,并将结果以结构化形式发送给基站。 基准数据集整体直接发送给基站作为数据恢复依据。 每行完成分段回归运算后,该行可用结构化精简集s(Skm,k=rm17)代替,精简集作为行i的特征描述,用以在基站进行数据恢复。 假设y,是基准数据集,则y中的某段数据ystar t,start+可表示为n。 migration,migration+6此时节点数据传输量为Data=基准数据集,精简集S假设传感器采集参数数据表示与结构化精简集5成员参数的数据表示占用相同存储空问,则数据压缩率可简化表示为CR=1一-4+m L一 (3)式中z是第i个参数的分段长度,n是传感器网络节点的监测参数种类数,m是节点已采样周期数。 2算法实现算法包括建立和运行维护两个阶段。 在能量充m肿第4期张瑞瑞,杜尚丰等基于分段线性回归的传感器网络数据压缩传输方法研究533足的基站端,算法通过分析历史数据,挖掘单节点多参数间相关性,定义参数相关性贡献评价模型,选取基准数据集,并建立最佳分段方式和动态分段线性映射模型,并将模型参数发送给节点。 节点根据基站的配置参数做融合计算,并将基准数据集和精简集S发送基站,基站做恢复运算,得到节点传送数据。 基站根据已接收到的数据动态分析并适时更改模型参数,并定时对节点相应配置更新。 由于算法复杂的参数选取过程在基站完成,节点只需进行简单的数据映射操作,因此如果忽略基站的能耗,该算法对网络的能量消耗较小。 21算法的建立211基准数据集选取基站对收集到的感知数据样本进行相关性计算,从中选取一个相关性最高的样本。 如式 (1)所示,单一节点具有n个感知参数,t时刻第i个参数采集数据表示为Y时间序列上的传感器数据集描述为矩阵。 为了便于选取,对每行参数建立如下基准数据集评价模型benefit(i)=,ri (4)J=了式中r表示矩阵行,之间的相关系数。 y与l,=y,I=1,?,n,i相关系数和称为其贡献(benef it(i)。 基准数据集的贡献最大。 具体步骤描述如下计算样本相关系数rr表示第i个参数样本与第个参数样本之间的相关系数,采用简单样本相关系数计算方法,r,定义为样本间协方差与样本各自方差的商,如式 (5)(一xi)(xjk一)兰_二二=(5二=二=二二二()(一 (一)计算所有行相关系数和benefit(i),对其进行排序,选择排序最高行作为回归模型基准数据集。 212分段线性回归计算。 对于某待压缩参数,假设其分段数据长度为f。 分段后,算法以Z为单位从基准数据集首个元素进行线性回归移动搜索,搜索区间为(1,m-l+1),当搜索区间内某段长度为2的区问使得回归方程err最小时,记录此时的精简集作为最终发送数据。 对于最后分段数据长度可能小于Z情况,算法将按其实际长度进行搜索。 类似的,将所有其他参数进行搜索运算得出最终发送数据集合Data=S,m,算法流程如表1所示。 表1中regression()函数为标准算法以段为单位进行数据集线性回归映射操作,不同的分段数会给算法带来不同的表现。 理论上当分段数较小时,算法误差下降速率较大,随着分段数的增加误差将缓慢下降,当分段数无限增加时,算法误差将趋于0。 然而,当段数增加时,每段进行回归估计的数据量减少,这可能导致线性回归的估计误差不减反增,即此时的分段数超过了算法局部最优选择,同时算法压缩率也随之增大。 由于压缩率随着分段数的增加线性增长,继续增加分段数反而会降低算法的性能。 实际中应该根据需求综合考虑误差和压缩率两方面因素。 可以选择算法的局部最优分段,或当误差满足需求阈值时的分段方式。 由于不能给出理论上合理的分段方法,将从实验中得出最佳分段方式。 534传感技术学报chinatransducerscor n第28卷表2标准线性回归函数标准线性回归函数(regression)U为基准数据集,为待运算行,2en为数据长度InputU,V,len Outputa,b,err数据初始化1ur neaI1=Ul2vmean=VleIt;3,sumxx=()一Die n);4sumxy=(u()一umean)()一Vmean);5a=sumxyumxN,6b vmeana umean7err=sqrt(I,()一(。 ()+6)z1en);8return a,b,err22算法执行与维护流程基站以一定的周期动态更新基准数据集,提高数据估计精度。 同样,基站将以一定周期进行最佳分段的更新操作,提高数据估计精度。 算法执行与维护流程如图1所示。 WSN节点WSN基站图1算法执行与维护流程图3实验分析以北京市小汤山国家精准农业示范基地xx年5月2日5月11日实际采样数据为实验样本,其中包含环境温度、空气湿度、土壤温度3个参数,参数采样周期为10r ain,其中5月2日5月6日共5天数据进行基站算法初始化参数计算,5月7日5月l1日数据进行节点实验,为了及时感知监测参数变化,基站的算法参数更新周期设为5天。 算法数据恢复精度以式 (6)所示均方根误差(RMSE)作为衡量标准,并与ISDT算法进行对比根据三参数的贡献值如表3所示。 选取环境温度为基准数据集。 1一RMSE=(a一d) (6)n、式中a表示基站对根据精简集得出的恢复值,d表示真实测量值。 表3仿真参数贡献值参数名称贡献值环境温度空气湿度土壤温度165147150为了进行样本最优分段,实验以不同段数为变量,以算法RMSE误差为输出,分别对空气湿度,土壤温度进行算法仿真,实验设置分段范围为130,结果如图2所示。 可以看出,当节点对两种数据不进行分段,直接以数据样本整体进行线性回归计算时,虽然此时数据压缩率最好为3378(每行参数只需用一个精简集描述),但其误差达到最大值,分别达到18和122。 当对数据进行分段线性回归后,开始时算法RMSE降低速率较快,当增加某个值时(实验中土壤温度为16,空气相对湿度为18),算法误差达到局部最优值,此时的分段数使得数据相关性达到局部最佳。 当分段数继续增加时,误差开始增加,这是由于样本数据总数不变,随着分段数的增加,每段进行回归估计计算的数据减少。 此后算法RMSE变化趋于平缓,继续增加分段数将不会带来算法表现的明显提升,反而导致压缩率的增加。 本文采用局部最优解的方式选取分段数。 露图2不同分段下算法均方根误差通过分析均方根误差和压缩率变化关系进行算法比较,结果如图3和图4所示。 图3可以看出,当压缩率较小时,压缩的数据足够描述参数的变化特征,基于时间序列分段线性化的ISDT算法能够获得较小的压缩误差,随着压缩误差增加,压缩率超过70时,ISDT算法压缩误差超过PWLR算法,此时压缩数据量较少,PWLR算法能够更加准确的还原第4期张瑞瑞,杜尚丰等基于分段线性回归的传感器网络数据压缩传输方法研究535数据。 图4所示的空气湿度数据具有类似的特点,当数据压缩率超过60时,PWLR算法压缩误差明显小于ISDT算法。 从中可以看出,PWLR算法能够在高压缩率的需求下获得更加准确的压缩效果。 相比于ISDT,PWLR算法更加适合于大数据、高压缩比、高精度的应用需求下。 压缩率,图3土壤温度数据均方误差与压缩率关系露压缩率,图4空气湿度数据均方误差与压缩率关系当土壤温度数据集分为16段,空气相对温度分为18段,进行回归运算时,基站根据精简集对数据恢复效果如图5和图6所示。 3530越25爨xx10靛0100xx00400500600时间序列图5土壤温度恢复数据与原始数据对比时间序列图6空气相对湿度恢复数据与原始数据对比可以看出算法能够根据基准数据集准确给出融合数据的特征描述。 对于土壤温度和空气相对湿度,恢复数据与原始数据均方根误差RMSE分别为049、387,此时整体数据压缩率可达591。 4结论分布密集的众多节点使得传感器网络内部产生了巨大的数据传输量。 如何对数据进行有效压缩以应对WSN资源受限的现状是WSN应用研究中一项具有挑战性的课题。 针对监测参数间相关性特点,本文给出了一种基于分段线性回归的多参数WSN数据融合算法PWLR。 仿真实验表明,算法以基准数据集为自变量,对分段数据进行最优线性回归搜索,最小化回归方程误差,从而在高压缩率的条件下保证数据融合质量,较原始传输策略显著降低数据传输量。 参考文献1Akyildiz IF,Su W,Sensor NetworksJ (8)102114234567891O1213h Y,et a1A Surveyon IEEECommunication Magazine,xx,40Yick JMukherjee B,Ghosal DWireless Sensor Network SurveyJComputer Networks,xx,52 (12)22922330林蔚,韩丽红无线传感器网络的数据压缩算法综述J小型微型计算机系统,xx,33 (9)20432048陈正宇,杨庚,陈蕾,等无线传感器网络数据融合技术研究综述J计算机应用研究,xx,28 (5)16011604康健,左宪章,唐力伟,等无线传感器网络数据融合技术J计算机科学,xx,37 (4)3135Nakamura EF,Loureiro AA F,Frery ACInformation Fusionfor Wireless Sensor NetworksMethods,Models,and ClassificationscACM Computxx,399Deligiannakis A,Kotidis Y,Roussopoulos NCompressing HistoricalInformation inSensor NetworksIn Proceedings of ACMSIGMOD Conferenee,xx王玲,石为人,石欣,等基于时间相关性的无线传感器网络数据压缩与优化算法J计算机应用,xx,33 (12)34533456王举,房鼎益,陈晓红,等文物监测中无线传感器网络数据压缩算法J西安电子科技大学学报,xx,39 (1)157162宋欣,王翠荣基于线性回归的无线传感器网络分布式数据采集优化策略J计算机学报,xx,35 (3)568580杨圣洪,贾焰,周四望无线传感器网络基于虚拟节点的小波压缩算法J软件学报,xx,24 (3)557-563李杨,郭龙江,李金宝,等传感器网络基于小波分段常值压缩的数据收集研究J仪
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025北京大兴区榆垡镇中心卫生院招聘临时辅助用工考前自测高频考点模拟试题及答案详解(易错题)
- 安全培训效率课件
- Glycoisolithocholanoic-acid-生命科学试剂-MCE
- Glucoraphanin-sodium-d5-生命科学试剂-MCE
- 2025广东广州市中山大学孙逸仙纪念医院超声科医教研岗位招聘模拟试卷及答案详解(名师系列)
- 2025广东深圳市九洲电器有限公司关IQC招聘1人模拟试卷及答案详解(网校专用)
- 2025广东惠州龙门县教育局招聘教师80人考前自测高频考点模拟试题附答案详解(典型题)
- 2025河南许昌市建安区招聘公益性岗位人员13人模拟试卷及1套参考答案详解
- 2025广西柳州市城中区委社会工作部招聘专职化城市社区工作者5人模拟试卷及答案详解(有一套)
- 项目管理进度跟踪表标准化流程控制
- 收费站岗位安全操作培训课件
- 鼻炎的培训知识课件
- 高三运动会课件
- 法语幼儿教学课件1
- 钩针课件教学课件
- 班组长岗位安全培训课件
- 淮阳豆门乡消防安全培训课件
- 海上风电场安全培训课件
- 2025版CSCO非小细胞肺癌诊疗指南解读
- 前列腺增生科普课件
- 红星照耀中国第九章课件
评论
0/150
提交评论