版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
区域PM2.5浓度描述性统计和影响因素分析目录TOC\o"1-3"\h\u31574区域PM2.5浓度描述性统计和影响因素分析 1150121.1PM2.5浓度描述性统计 1162491.1.1研究对象 1147651.1.2PM2.5浓度描述性分析 4323001.2影响因素分析 7286201.2.1区域PM2.5浓度主要影响因素分析 851871.2.2预测模型的变量选择 91.1PM2.5浓度描述性统计1.1.1研究对象PM2.5的成因比较复杂,其主要成分由一次颗粒物(由排放源直接排放到空气中的颗粒物)和二次颗粒物(和空气中某些成分发生物化反应所生成的颗粒物)构成,而颗粒物主要有两种来源途径,一是自然源,比如海洋中的海盐、火山喷发等;二是人为源,包括露天燃烧活动、燃煤、机动车尾气、工业废气等。空气中的硫、氮等氧化物可通过复杂物化反应转化成PM2.5,气流、降雨等气象因素可实现PM2.5的稀释沉降,进而影响PM2.5浓度。通过对已有研究成果中PM2.5浓度预测变量的梳理总结,结果如表1.1所示,影响PM2.5浓度的变量可总结为两方面:一是气象和空气污染物等微观变量,二是人口密度、污染企业数量、建设用地面积等宏观变量。宏观变量主要是季度或年度数据,鉴于本文预测的是PM2.5日均浓度,因此使用气象和空气污染物等微观变量预测PM2.5浓度。基于上述分析,并考虑到数据的可获得性,本文选取了2017年1月1日至2019年12月31日的空气污染物以及气象数据对PM2.5浓度预测进行实证研究,具体空气污染物和气象因素如表1.2所示。选取2017年1月1日至2019年5月31日数据作为训练集,进行模型的拟合分析;2019年6月1日至2019年12月31日数据作为测试集,用作模型预测分析。表1.1已有研究成果中PM2.5浓度预测变量变量变量选择方法来源气象因素平均气温、平均相对湿度、平均风速相关性分析Ordieres等(2005)[35]日最低气温、日最高气温、日平均大气压、日总降水量、相对湿度、日地面空气相对湿度、日地面风速逐步回归Zhou等(2014)[39]气温、风速、风向、日照时数、气压、相对湿度、降水量距离相关系数王黎明等(2017)[28]气温、风速、降雨量、相对湿度无Bai等(2019)[44]空气污染物PM10、SO2、NO2、CO、O3无朱险峰等(2015)[23]续表1.1变量变量选择方法来源空气污染物和气象因素前一日PM2.5、气温、相对湿度、风速无Lv等(2016)[25]前一日PM2.5、日平均气温、相对湿度、风速、平均海平面气压、日照时数、五日内降雨量无陈强等(2015)[31]PM10、SO2、NO2、CO、O3、气温、相对湿度、风向、风速无Voukantsis等(2011)[41]CO、PM10、气温、风速相关性分析马天成等(2014)[42]NO2、SO2、CO、气温、湿度、地面平均风速、气压无胡玉筱和段显明(2015)[21]PM10、SO2、NO2、CO、O3、最低气温、最高气温、平均气压、日总降水量、空气相对湿度、平均风速逐步回归Ausati和Amanollahi(2016)[24]PM10、SO2、NO、NO2、CO、O3、气温、相对湿度、风速无Biancofiore等(2017)[36]PM10、SO2、NO、NO2、NOx、CO、O3、空气湿度、气压、气温、风速、天气无齐甜方等(2018)[38]PM10、SO2、NO2、CO、O3、平均/最高/最低气压、平均/最高/最低气温、平均/最低相对湿度、平均/最高/最高/最高风速、最高/最高风速方向、日照时间灰色关联度Zhu等(2018)[43]PM10、SO2、NO2、CO、O3、相对湿度、风速、最低气温、最高气温相关性分析李栋等(2019)[46]气象和其他因素相对湿度、气温、地面风速、气溶胶光学厚度无Hu等(2013)[27]日最高气温、日最低气温、露点气温、相对湿度、云量、大气透射比、风向、风速、日气温范围、降雨量、一天的长度逐步回归Cobourn(2010)[26]相对湿度、风速、日照持续时间、气温、气压、降水、气溶胶光学厚度、纬度、经度、植被指数、人口密度、污染企业数量、道路长度、建设用地面积主成分Wang等(2019)[32]气温、能见度、气压、蒸发水平、湿度、风速、气溶胶光学厚度、土地使用变量(道路网络数据,森林覆盖和硬化地表数据、人口密度数据)、区域虚拟变量、月虚拟变量和日虚拟变量无Park等(2020)[37]空气污染物数据来源于天气后报网站(/),包括PM2.5(PM2.5,μg/m3)、PM10(PM10,μg/m3)、SO2(SO2,μg/m3)、NO2(NO2,μg/m3)、CO(CO,mg/m3)和O3(O3,μg/m3);气象数据包括日最高气压(MAXP,0.1hPa)、日最低气压(MINP,0.1hPa)、平均气压(AP,0.1hPa)、日最高气温(MAXT,0.1℃)、日最低气温(MINT,0.1℃)、平均气温(AT,0.1℃)、平均相对湿度(AH,1%)、日累计降水量(RAIN,0.1mm)、平均风速(AW,0.1m/s)、最大风速(MAXW,0.1m/s)和日照时数(SUN,0.1小时)等,通过中国气象数据网(/)获取。表1.2空气污染物和气象因素变量名变量表示符号单位变量名变量表示符号单位PM10PM10μg/m3平均气温AT0.1℃SO2SO2μg/m3日最高气温MAXT0.1℃NO2NO2μg/m3日最低气温MINT0.1℃COCOμg/m3平均相对湿度AH1%O3O3μg/m3日累计降水量RAIN0.1mm平均气压AP0.1hPa平均风速AW0.1m/s日最高气压MAXP0.1hPa最大风速MAXW0.1m/s日最低气压MINP0.1hPa日照时数SUN0.1小时空气污染物和气象两部分数据根据城市和区站名进行匹配,融合形成80个城市数据。采用国务院发展研究中心的课题报告《中国(大陆)区域社会经济发展特征分析》中把中国(大陆)划分为八大区域的观点,将80个城市数据进行区域划分,这80个城市的区域分布情况如表1.3所示。表1.3城市分布区域省份城市黄河中游河南安阳、信阳、郑州、驻马店内蒙古赤峰、呼和浩特、呼伦贝尔、通辽山西大同、太原、运城陕西汉中、榆林北部沿海北京北京河北承德山东济南、潍坊天津天津东北黑龙江哈尔滨、鸡西、牡丹江、齐齐哈尔吉林四平、长春辽宁本溪、朝阳、大连、丹东、沈阳、营口东部沿海江苏南京、徐州浙江杭州南部沿海福建福州、厦门广东广州、河源、汕头、汕尾、韶关、阳江海南海口西北甘肃酒泉、天水宁夏银川青海西宁、玉树新疆哈密、和田、喀什、克拉玛依、吐鲁番续表1.3区域省份城市西南广西桂林、河池、南宁、钦州、梧州贵州毕节、贵阳四川甘孜、凉山、南充、宜宾云南昆明、丽江、临沧重庆重庆长江中游安徽蚌埠、亳州、合肥湖北恩施、武汉、宜昌湖南常德、永州、长沙江西赣州、吉安、景德镇、南昌1.1.2PM2.5浓度描述性分析对在2017年1月1日至2019年12月31日期间的各区域PM2.5浓度进行描述性统计,结果如表1.4所示。根据PM2.5浓度平均值从高到低对各区域排序为北部沿海区域、西北区域、东部沿海区域、黄河中游区域、长江中游区域、东北区域、西南区域、南部沿海区域,其中南部沿海区域和西南区域PM2.5浓度平均值都低于35μg/m3,空气质量较好;八大区域下四分位数均低于75μg/m3,即各区域的空气质量优、良级别天数占比均超过75%;南部沿海区域的PM2.5浓度最大值低于250μg/m3,即没有出现PM2.5严重污染天气,而其他区域均有严重污染天气出现。注a:中国目前使用的PM2.5日均浓度空气质量等级划分标准见附录1。表1.4各区域PM2.5浓度描述性统计北部沿海西北东部沿海黄河中游长江中游东北西南南部沿海最小值32224222上四分位数2518252123171515中位数4031383436272423平均值49.5247.5947.4746.4644.2236.6530.5226.29下四分位数6055595655453834最大值4301787275597347470276172由表1.4可以看出,各区域PM2.5浓度中位数小于平均值,表明各区域PM2.5浓度分布呈右偏态。对八大区域的PM2.5浓度数据进行正态性检验,QQ图和达戈斯提诺(D′Agostino)正态性检验结果见附录2,各区域的PM2.5浓度数据均显著拒绝服从正态分布的假设,因此,可认为这八大区域的PM2.5浓度数据均不服从正态分布。八大区域中80个城市的PM2.5浓度分布情况如图1.1所示。北部沿海区域的5个城市中,PM2.5浓度平均值最小的是承德,济南的PM2.5浓度平均值最大,北京PM2.5浓度的四分位距最大,其离散度较高。东部沿海区域的3个城市中,杭州的空气质量最优,南京次之,徐州的空气质量最差。东北区域的12个城市中,PM2.5浓度分布情况相近,出现严重污染天气的城市有牡丹江、长春、齐齐哈尔和哈尔滨四个城市。黄河中游区域的13个城市中,呼伦贝尔空气质量最优,且四分位距最小,其PM2.5浓度数据离散度较低;下四分位数高于75μg/m3的只有郑州、运城和安阳三个城市,表明这三个城市的空气质量优、良级别天数占比不足75%。南部沿海区域的9个城市中,海口的空气质量最优,韶关的空气质量最差。西北区域的10个城市中,和田、吐鲁番、喀什的四分位距较大,PM2.5浓度数据离散度较高,且出现PM2.5浓度高于500μg/m3的天气。长江中游区域13个城市中,所有城市的下四分位数小于75μg/m3,即所有城市的空气质量优、良级别天数占比都超过75%;长沙、宜昌、亳州、常德出现严重污染天气。西南区域的15个城市中,仅宜宾一个城市出现严重污染天气,其他城市的严重污染天数均为0,丽江、甘孜、凉山、昆明、临沧空气质量较好,出现空气质量优级别天数占比均超过75%,且其离散度较低。图1.1各城市PM2.5浓度箱线图由图1.1可以看出,各城市PM2.5浓度均出现超过箱线图上限值的情况,且超过箱线图上限值的天数较多,表明各城市PM2.5浓度数据分布尾部较重,分布呈右偏态。对这80个城市的PM2.5浓度数据进行Shapiro-Wilk正态性检验,检验结果表明各城市的PM2.5浓度数据均显著拒绝服从正态分布的假设。因此,可认为这80个城市的PM2.5浓度数据均不服从正态分布。1.2影响因素分析1.2.1区域PM2.5浓度主要影响因素分析GAM中的方差解释度可表示模型中的变量对响应变量变化的解释能力。对八大区域可能影响PM2.5浓度的5种空气污染物变量PM10、SO2、NO2、CO、O3和11种气象变量AP、MAXP、MINP、AT、MAXT、MINT、AH、RAIN、AW、MAXW、SUN分别建立单变量GAM。由于各区域的PM2.5浓度数据均没有通过正态性检验,选择对数(log)连接函数,利用REML确定最优平滑参数,平滑函数使用三次回归样条进行拟合。黄河中游区域单变量GAM拟合得出的各变量方差解释度的结果如表1.5所示,方差解释度越大表明该变量的重要性越强。根据单变量GAM拟合得出的各变量方差解释度对变量进行排序,各区域排在前五位的变量情况如表1.6所示。表1.5黄河中游区域的单变量GAM方差解释度变量方差解释度变量方差解释度变量方差解释度变量方差解释度PM1078.80%MAXP17.90%O320.50%MAXW12.30%CO48.90%AP17.70%AT19.70%AW12.20%NO242.10%MINP17.50%MAXT19.00%AH5.32%SO224.70%MINT16.70%SUN18.50%RAIN2.42%表1.6各区域单变量GAM变量重要性排序第1位第2位第3位第4位第5位北部沿海PM10CONO2SO2AH东北PM10CONO2SO2MINT东部沿海PM10CONO2MINTSO2黄河中游PM10CONO2SO2O3南部沿海PM10COSO2NO2MINT西北PM10APMAXPMINPO3西南PM10NO2COMAXPAP长江中游PM10NO2MINTCOAT从表1.6可以看出,对PM2.5浓度变化影响较大的变量主要是PM10、CO、NO2、日最低气温和SO2,有个别区域在方差解释度排在前五位的变量中包含日最高气压(西北地区和西南地区)、平均气压(西北地区和西南地区)、日最低气压(西北地区)、平均气温(长江中游地区)、平均相对湿度(北部沿海地区)、O3(黄河中游地区和西北地区)。所有区域对PM2.5浓度变化影响最大的变量均是PM10,变量CO和NO2对大部分区域的PM2.5浓度变化影响较大,西北地区除外,西北地区是受气压影响较大。随机森林在识别重要变量中有着广泛应用,本文使用节点纯度增量作为衡量变量相对重要程度的指标,如表1.7列示出黄河中游区域各变量的节点纯度增量。节点纯度由基尼指数度量,变量的节点纯度增量越大,表示该变量的重要性越强。根据节点纯度增量对变量进行排序,各区域排在前五位的变量情况如表1.8所示。表1.7黄河中游区域的各变量节点纯度增量变量节点纯度增量变量节点纯度增量PM109635829.39AH541341.93CO3690059.76SUN514230.2NO21949192.73MAXT448079.67MAXP740945.97AT438349.27AP667932.51MINT268655.97O3656278.34MAXW217924.08SO2621055.93AW147548.19MINP592798.23RAIN45590.53由表1.6和表1.8可知,根据单变量GAM和随机森林两种方法,确定的北部沿海区域、东部沿海区域、南部沿海区域和西南区域的变量重要性排序的前五位变量完全相同,而其他区域的变量重要性排序结果在后几位的变量稍有不同,单变量GAM和随机森林两种方法对变量重要性排序的结果基本一致。表1.8各区域随机森林变量重要性排序第1位第2位第3位第4位第5位北部沿海PM10CONO2SO2AH东北PM10CONO2SO2AT东部沿海PM10CONO2MINTSO2黄河中游PM10CONO2MAXPAP南部沿海PM10COSO2NO2MINT西北PM10CONO2APAH西南PM10NO2COMAXPAP长江中游PM10CONO2MINTAT1.2.2预测模型的变量选择本文收集到空气污染物及气象变量共16个,各变量与PM2.5浓度之间存在复杂关系,且部分变量间存在多重共线性,若将全部变量引入预测模型,则预测模型可能受到非必要因素的干扰,会导致参数估计量的实际意义不合理,或部分变量的显著性检验失去意义等。因此,需要对变量进行筛选,进而确定预测模型的输入变量。预测模型中的输入变量可根据变量间的相关性和单变量GAM方差解释度确定,下面分别对各区域的PM2.5浓度预测模型的输入变量进行选择。首先,根据单变量GAM得出的方差解释度进行初步的变量选择。然后,计算变量两两间的相关系数,对相关性较强(相关系数的绝对值大于0.7)的两变量中,保留方差解释度较大的变量,将方差解释度较小的变量剔除,以避免共线性。黄河中游区域的训练集数据的单变量GAM结果如表1.9所示。表1.9黄河中游区域的单变量GAM结果变量方差解释度有效自由度p值变量方差解释度有效自由度p值PM1078.80%8.868<2e-16AT19.70%8.518<2e-16SO224.70%8.460<2e-16MAXT19.00%7.731<2e-16NO242.10%8.318<2e-16MINT16.70%8.636<2e-16CO48.90%8.555<2e-16AH5.32%7.853<2e-16O320.50%6.590<2e-16RAIN2.42%4.224<2e-16AP17.70%8.951<2e-16AW12.20%7.712<2e-16MAXP17.90%8.962<2e-16MAXW12.30%8.328<2e-16MINP17.50%8.947<2e-16SUN18.50%8.606<2e-16根据表1.9对黄河中游区域预测模型的输入变量进行初步的变量选择,剔除不显著或方差解释度低于10%的变量,即剔除变量AH和RAIN。观察图1.2中变量间的相关系数,风速变量AW和MAXW的相关系数大于0.7,剔除方差解释度较小的变量AW;气温变量MINT、AT和MAXT间相关性较强,剔除方差解释度较小的变量MINT和MAXT;气压变量MINP、AP和MAXP间具有完全相关性,剔除方差解释度较小的变量MINP和AP。根据单变量GAM结果和变量间的相关性初步确定的黄河中游区域的预测模型输入变量为PM10、SO2、NO2、CO、O3、MAXP、AT、MAXW、SUN。图1.2黄河中游区域的变量间相关系数对上述保留的变量建立初步多变量GAM,与单变量GAM相同,选择log连接函数,平滑函数使用三次回归样条进行拟合,最优平滑参数确定方法为REML。对拟合模型中的平滑函数进行共曲线性检验,若某两变量的共曲线性检验结果大于0.5,则剔除方差解释度较小的变量,若检验结果均小于0.5,即可认为该拟合模型的共曲线性在可接受范围内。对拟合模型中的变量进行显著性检验,若拟合结果显示部分变量不显著,则剔除不显著的变量。经平滑项的共曲线性检验和显著性检验后,预测模型的输入变量确定。黄河中游区域的初步多变量GAM中,平滑项s(SO2)和s(CO)、s(NO2)和s(CO)、s(O3)和s(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年金华武义县卫健系统下属医疗单位招聘事业单位工作人员24人笔试模拟试题及答案解析
- 2026重庆九龙坡区人民法院公开招聘司法警务3人考试备考试题及答案解析
- 2026中国科学院合肥肿瘤医院放射影像医师招聘8人(安徽)笔试备考题库及答案解析
- 2026年中原人工智能产业技术研究院招聘工作人员(博士)10名考试参考题库及答案解析
- 2026上海华东师范大学精密光谱科学与技术高等研究院王少伟教授团队博士后、专职科研人员招聘考试参考题库及答案解析
- 2026重庆市万州区柱山乡人民政府公益性岗位聘用1人考试模拟试题及答案解析
- 2026年大兴安岭呼中区乡镇卫生院公开招聘医学毕业生补充2人笔试参考题库及答案解析
- 2026广东省特种设备检测研究院清远检测院招聘3人考试参考题库及答案解析
- 2026江苏南通通州湾三余人民医院招聘医疗辅助人员1人笔试备考题库及答案解析
- 2026恒丰银行杭州分行社会招聘26人考试参考题库及答案解析
- 《AQ3067-2026化工和危险化学品重大生产安全事故隐患判定准则》解读
- 国家机关事务管理局所属事业单位2025年度公开招聘应届毕业生笔试模拟试题
- 国开2026年《公共政策概论》形成性考核任务1-4答案
- 【MOOC】航空燃气涡轮发动机结构设计-北京航空航天大学 中国大学慕课MOOC答案
- GB/T 12616.1-2004封闭型沉头抽芯铆钉11级
- 医学课件人参课件
- 2022年各省市公选乡镇副科面试题
- 中考历史复习-历史最后一课课件
- 内部审计培训系列课件
- [贵州]高速公路隧道贯通施工专项方案
- 工业电气厂用电r技术和使用说明书
评论
0/150
提交评论