影响戒烟成功因素的分析毕业论文_第1页
影响戒烟成功因素的分析毕业论文_第2页
影响戒烟成功因素的分析毕业论文_第3页
影响戒烟成功因素的分析毕业论文_第4页
影响戒烟成功因素的分析毕业论文_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、戒烟成功影响因素的分析摘 要本文针对戒烟的影响因素分析,对具体不同问题分别建立了合理的模型,并依据所给的数据,使用数理统计、相关性分析、曲线拟合、主成分分析等知识和利用MATLAB、SPSS、EXCEL等软件编程给出一定的算法。最后,得出与问题相关的结论,对戒烟人士提出自己的戒烟对策和建议。针对问题一,要求对再次吸烟的累加发病率分布情况进行说明,首先对缺失数据进行剔除处理,使用多元统计方法对数据进行处理,通过图表的形式得到不同年龄段、不同性别等因素下的累加发病率分布情况;针对问题二,要求定量分析出不同因素对戒烟时间长短的影响,首先利用SPSS软件对相关变量因素与戒烟天数进行相关性分析,得到对戒

2、烟时间有显著影响是每日抽烟数和调整的CO浓度两个因素,然后分别对每日抽烟数和调整的CO浓度与戒烟天数的关系进行曲线拟合,得到回归模型;针对问题三,要求得到影响戒烟成功的主要因素,结合问题一和问题二得到的结论,根据成功戒烟的数据进行主成分分析得到主要影响因素为每天抽烟数,调整CO浓度和年龄,其比重分别为35.328%,28.873%,22.383%,另外,通过层次分析法,对得到的主要影响因素进行了可靠性检验;针对问题四,要求撰写一篇500字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。本文综合问题一、二、三所得到的结论,结合实际,在短文中有针对性的提出了自己的意见。本文还对模型的误差进行了定

3、量分析;利用MATLAB对问题二中拟合模型进行了优化度检验;利用层次分析法对问题三建立的模型进行了可靠性检验。最后,基于问题二中自变量之间是否存在多重共线性的考虑,对模型进行了恰当的改进;并把多元回归模型、主成分分析法和层次分析法应用于相关方面,对模型做出了纵向的推广和横向的推广。本文分析思路清晰、全面,数据处理得当,切入点独到,模型运用合理,特色鲜明。关键词:戒烟;数据拟合;回归分析;主成分分析;层次分析;MATLAB;SPSS1 问题的重述一、背景知识众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的

4、研究课题。本文研究数据涉及 234人,他们都自愿表示戒烟但还未戒烟。在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO测定时间。CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO的水平。记录下研究对象的性别、年龄及自述每日抽烟支数。这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 其中假设原烟民戒烟的可信度是很低的(更恰当地说多数是再犯者)戒烟天数是从0到他(她)退出戒烟或研究截止时间(1 年)的天数。

5、假定他们全部没有人中途退出研究。二、相关数据1.本文研究数据变量说明见原题数据表12.研究所得数据详见原题数据表2三、需要解决的问题根据原题所提供数据,回答以下问题:问题一:试分析上述234人中再次吸烟的累加发病率分布情况(如不同年龄段、不同性别等因素下的累加发病率分布情况)。问题二:你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?如果影响请利用附录中的数据,分别给出戒烟时间与上述你认为有影响的因素之间的定量分析结果。问题三:请利用附录中的数据建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。问题四:请根据你的模型,撰写一篇50

6、0字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。2 问题的分析一、对问题的总分析 本文针对戒烟的影响因素分析是对大样本多数据的统计分析和模型建立,首先要对数据做合理优化,对具体不同问题分别建立了合理的模型,并依据所给的数据,使用数理统计、相关性分析、曲线拟合、主成分分析等知识和利用MATLAB、SPSS、EXCEL等软件编程给出一定的算法。最后,得出与问题相关的结论,对戒烟人士提出自己的戒烟对策和建议。二、对具体问题的分析1.对问题一的分析根据附件所给出的数据(见附表一),分析被研究者的再次吸烟的累加发病率分布情况。首先利用excel剔除了数据有所缺失的个体变量,然后根据统计学原理的有关

7、知识,通过控制变量法对不同性别、年龄、抽烟支数等因素下的累加发病率进行分组、统计,并利用excel做出条形图进行直观的比较,得出相应的结果。2.对问题二的分析 问题二要求利用附录中的数据来定量分析年龄、性别、每日抽烟支数及调整的CO浓度等因素队戒烟时间(天数)长短影响。首先我们对其它各变量与戒烟天数的相关性分析,得到和戒烟天数相关的变量,然后根据题意,得到会对戒烟天数长短的变量。对相关变量的数据进行分组处理,求不同区间内戒烟天数的平均值,把组距中间值作为那一组的数值,用SPSS和MATLAB对数据进行处理得到相关变量和戒烟天数的定量分析结果。3.对问题三的分析根据原题所给的数据,假设戒烟天数达

8、到365天的为戒烟成功。因此,抽取出所有戒烟天数为365天的数据,进而研究影响戒烟成功的主要因素。根据问题一、问题二的结论,运用是spss进行主成分分析,将所有影响因素降维成最主要的影响因素,从而得出影响戒烟成功的主要因素。4.对问题四的分析根据问题一、二、三的研究讨论,我们可得出戒烟成功的主要因素,从这些具体的因素进行讨论,对有志戒烟得人士提出戒烟的对策和意见。3 模型的假设1.假设原烟民戒烟的可信度是很低的;2.假设被研究的234人中没有人在研究期间中途退出研究;3.假设原题所给研究数据都是真实有效的,不存在人为因素的影响;4.假设被研究对象中存在数据缺失的个体删除后不对研究结果构成显著性

9、影响;5.假设本次研究中戒烟天数没有达到365天的都算作戒烟不成功;6.假设被研究对象的选取是随机的;7.假设戒烟时间没有达到365天的视为戒烟失败;4 名词解释与符号说明一、名词解释累加发病率:指已知无某种疾病的人群,经过一段特定的观察期(一年及以上)以后,发生某病的频率。累加发病率集中在01之间。(1)二、符号说明序号符号意义1x1年龄2x2性别(1表示男,2表示女)3x3每日抽烟支数4x4CO浓度5x5距离抽最后一支烟的分钟数6x6调整的CO浓度7y戒烟天数8p累加发病率5 模型的建立与求解一、问题一的分析与求解1.对问题的分析根据附件所给出的数据(见附表一),分析被研究者的再次吸烟的累

10、加发病率分布情况。首先利用excel剔除了数据有所缺失的个体变量,然后根据统计学原理的有关知识,通过控制变量法对不同性别、年龄、抽烟支数等因素下的累加发病率进行分组、统计,并利用excel做出条形图进行直观的比较,得出相应的结果。2.对问题的求解模型 统计分布模型(1)模型的建立为了保证研究数据的可靠程度,利用excel将数据不完整的10个个体变量进行删除。同时根据不同的影响因素,控制其他变量的,利用数理统计的知识,对不同因素对累加发病率的影响用表和直方图的表达出来,可得出不同因素下的累加发病率的频率分布情况。(2)模型的求解 性别因素利用统计学原理,通过对经过处理之后的数据进行分组、统计后,

11、得到不同性别的累加发病率分布频率表,见表1.1表1.1 不同性别的累加发病率频率分布表总人数戒烟成功戒烟失败累计发病率p男104178738.84%女1201410647.32%根据表1.1,利用excel做出的不同性别对累加发病率的影响分布直方图如图一。图一 不同性别对累加发病率的影响频率分布图由表1.2及图一可得出:男女的性别不同对累加发病率的影响基本一致,女性累加发病率略高于男性。年龄因素根据统计学原理,将年龄进行分段,统计每一年龄段的参与研究的总人数及戒烟失败的人数,并根据公式(1)计算其累加发病率,得到不同年龄阶段的累计发病率分布频率表,见表1.2。表1.2 不同年龄段的累加发病率频

12、率分布表不同年龄段总人数戒烟成功戒烟失败累加发病率p20-294343917.41%30-396185323.66%40-495484620.54%50-594453917.41%60-69175125.36%70-795141.79%根据表1.2,利用excel做出不同年龄段的累加发病率频率分布图,见图二.图二 不同年龄段的累加发病率频率分布直方图由表1.2结合图二可得:年龄在30-40岁时的累加发病率最高,之后随着年龄的上升,累加发病率逐渐降低。60岁以后急剧降低。 每日抽烟支数因素与年龄因素的研究方法相似,将224名被研究者的每日抽烟支数进行统计整理,利用数理统计的知识,分层次计算不同阶

13、段的参与人数和戒烟失败的人数,根据公式(1)计算出累加发病率,得到各阶段的累加发病率分布表,见表1.3。表1.3 不同的每日抽烟支数下的累加发病率的频率分布表每日抽烟支数参与人数戒烟成功戒烟失败累加发病率P0-9434156.70%10-196123616.07%20-2954117633.93%30-394483013.39%40-491732511.16%50-10053114.91%根据表1.3,利用excel画出每日抽烟支数各阶段的累加发病率分布直方图,见图三。图三 每日抽烟支数不同阶段的累加发病率的分布直方图由表1.3结合图三可得:每日抽烟在20-29支,累加发病率最大。30之后,随

14、诊每日抽烟支数的增加,累加发病率逐渐降低。当每日抽烟支数大于50之后,累加发病率最小。可能是因为被研究人群中,每日抽烟支数大于50的所占比例较小,基数小。CO浓度因素将研究所得的CO浓度进行区间划分,统计各区间段的累加发病率大小,得到CO浓度因素下的累加发病率的频率分布表,见表1.4.表1.4 不同CO浓度下的累加发病率分布表CO浓度参与人数戒烟成功戒烟失败累加发病率P0-99316251116%100-1995174419.64%200-29964105424.11%300-3994453917.41%400-499243219.38%500-900100104.46%根据表1.4,利用ex

15、cel得出CO浓度的频率分布直方图,见图四。图四 CO浓度因素影响下的频率分布直方图由表1.4及图四可得:CO浓度在100-400之间时,累加发病率较高,其中最高点位于200-300之间。当CO浓度高于400时,累加发病率随着CO浓度的升高而降低。而当其浓度超过600时,累加发病率极低,不过这可能是由于此时的参与人数较小,因此累加发病率低。调整的CO浓度因素与CO浓度的影响作用相似的,将调整的CO浓度进行区间划分,统计各层级的累加发病率分布频率表,见表1.5.表1.5 不同调整CO浓度的累加发病率频率分布表调整的CO浓度参与人数戒烟成功戒烟失败累加发病率P0-991492312610.27%1

16、00-199412390.89%200-2998260.89%300-5993030.00%600-8998260.89%900-119910190.45%12300-15005140.45%根据表1.5,利用excel可得出不同调整CO浓度下的累加发病率频率分布直方图,见图五。图五 不同调整CO浓度影响下的累加发病率频率分布直方图结合表1.5及图五可得:由图可看出调整CO浓度在1400-1600之间时累加发病率最高,在浓度教育600及大于1800时较低。调整的CO浓度位于(600,1400)时,累加发病率随着浓度的增加而升高,而在调整的CO浓度位于(1400,2000)时,累加发病率与浓度呈

17、负相关关系。二、问题二的分析与求解1.对问题的分析问题二要求利用附录中的数据来定量分析年龄、性别、每日抽烟支数及调整的CO浓度等因素队戒烟时间(天数)长短影响。首先我们对其它各变量与戒烟天数的相关性分析,得到和戒烟天数相关的变量,然后根据题意,得到会对戒烟天数长短的变量。对相关变量的数据进行分组处理,求不同区间内戒烟天数的平均值,把组距中间值作为那一组的数值,用SPSS和MATLAB对数据进行处理得到相关变量和戒烟天数的定量分析结果。2.对问题的求解模型 拟合回归模型(1)模型的准备与问题一一样,为了便于研究对戒烟时间的影响,我们把缺失值进行了剔除处理。同时,本问考虑到研究中所获得的戒烟天数是

18、指从0到他(她)退出戒烟或研究截止时间的天数,因此数据中戒烟天数为365天的戒烟者,其戒烟天数是不确定的。为提高模型的精确性,我们又把戒烟天数是365天的数据剔除,只对戒烟天数小于365天的数据进行处理和分析。(2)模型的建立与求解由SPSS中双变量相关性分析得到的每个变量之间的相关性数据(见附表),得到变量年龄、性别、每日抽烟支数、CO浓度、距离抽最后一支烟的分钟数、调整的CO浓度和戒烟天数的显著性(双侧)值,结果如表2.1:表2.1 相关变量与戒烟天数的相关性变量显著性(双侧)值相关性年龄0.075不相关性别0.781不相关每日抽烟支数0.059不相关CO浓度0.0000.01水平显著相关

19、距离抽最后一支烟的分钟数0.0450.05水平显著相关调整的CO浓度0.0050.01水平显著相关根据题意变量CO浓度和距离抽最后一支烟的分钟数可得到调整的CO浓度,调整的CO浓度水平提供了一个自愿者们先前抽烟数量的客观标准,在一定程度上,调整的CO浓度和每日抽烟支数有一定的关系。由此,我们可以主观的认为每日抽烟数和调整的CO浓度能影响戒烟时间的长短。每日抽烟数与戒烟天数的定量分析我们分别对每日抽烟数和调整的CO浓度和戒烟天数的数据进行处理。由筛选后的数据可得每日抽烟数的范围为2,60,我们对每日抽烟数以10为组距在1,60内分组,处理后的数据见表2.2:表2.2 每日抽烟支数与戒烟天数的关系

20、表每日抽烟数组距中间值戒烟总天数总人数戒烟天数均值1-105.515832271.9511-2015.516876924.4521-3025.515165726.6031-4035.511613236.2841-5045.5324746.2951-6055.5197632.83同时,根据表2.2,利用excel可得出每日抽烟支数与戒烟天数的变化关系折线图,见图六。图六 每日抽烟支数与戒烟天数的变化关系图利用SPSS软件进行曲线拟合,结果证明:立方拟合的效果最好,此时造成的误差最小,显著性较高。此时,检验统计量=0.985,=45.117,=0.022。模型汇总RR 方调整 R 方估计值的标准误

21、.993.985.9643.356自变量为 每日抽烟数。由上述方法可得到戒烟天数与每日抽烟支数之间的关系,见图七。图七 每日抽烟支数与戒烟天数的曲线拟合。由上得到每日抽烟数和戒烟天数的回归分析方程式:可以看出每日抽烟数和戒烟天数在整体上呈负相关 调整的CO浓度与戒烟天数的定量分析与每日抽烟支数的分析类似,将调整的CO浓度与戒烟天数的数据进行预处理,得到表2.3.表2.3 调整的CO浓度与戒烟天数之间的数据处理调整的CO浓度组距中间值戒烟总天数总人数戒烟天数均值800-999899.5159819.881000-11991099.55701733.531200-13991299.53073605

22、1.221400-15991499.522117828.351600-17991699.54802817.141800-19991899.51125.50利用SPSS进行数据的处理可得到结果:二次的R方为0.805且为最大值。此时F值为6.184较小,Sig值为0.086较大,拟合较好。由此可得到调整的CO浓度与戒烟天数之间的曲线关系,见图八:图八 调整的CO浓度与戒烟天数的曲线拟合由SPSS得到的参数估计值,可以得到调整的CO浓度和戒烟天数的回归分析方程式:可以看出调整的CO浓度和戒烟天数呈负相关。三、问题三的分析与求解1.对问题 的分析根据原题所给的数据,假设戒烟天数达到365天的为戒烟成

23、功。因此,抽取出所有戒烟天数为365天的数据,进而研究影响戒烟成功的主要因素。根据问题一、问题二的结论,运用是spss进行主成分分析,将所有影响因素降维成最主要的影响因素,从而得出影响戒烟成功的主要因素。2.对问题的求解模型 主成分分析模型(1)模型的准备为消除不同变量的量纲的影响,且不改变变量的相关系数,首先需要对变量进行标准化处理,标准化处理可通过SPSS实现。(2) 模型的建立与求解忽略其他因素对戒烟成功的影响,认为年龄,性别,每日抽烟数以及调整CO浓度为影响戒烟成功的主成分,通过主成分分析可知,相应的主成分特征值和累计贡献率如下表3.1:表3.2 各个因素的主成分特征值和累计贡献率解释

24、的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %11.41335.32835.3281.41335.32835.3281.39334.83234.83221.15528.87364.2001.15528.87364.2001.17529.36864.2003.89522.38386.5834.53713.417100.000提取方法:主成份分析。(3)模型的可靠性检验由表3.2可得:根据各因素权重向量可知戒烟成功主要因素有每日抽烟支数,调整CO浓度和年龄。其比重分别为35.328%,28.873%,22.383%。由此可知影响

25、戒烟的主要因素为每日抽烟支数,调整的CO浓度和年龄。考虑到每一种成分对戒烟成功的影响不一样,为确定各指标对戒烟成功影响的权重,本文采用层次分析法进行影响程度评判。模型的层次结构如下:目标层A为“戒烟成功因素分析”;准则层B包括年龄x1、性别x2、每天吸烟支数x3和调整的CO浓度x4;方案层C为“戒烟成功”和“戒烟失败”。流程图如下:对于层次分析法中的比较判断矩阵,根据每个成分的累计贡献率来确定各个指标之间相对重要程度,构造比较判断矩阵如下: 得到判断矩阵后,利用MATLAB(附程序一)求其最大特征向量并进行一致性检验,结果如下:w =(0.2239,0.1338,0.3535,0.2888)C

26、I=-1;CR= -1.1111CR0.1,表明比较判断矩阵的不一致程度在允许范围内,判断矩阵具有满意一致性,可以作为评判的权向量。根据各因素权重向量可知戒烟成功主要因素有每天抽烟数,调整CO浓度和年龄。其比重分别为35.328%,28.873%,22.383%四、问题四的分析与求解1.对问题的分析问题四要求撰写一篇500字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。本文综合问题一、二、三所得到的结论,结合实际,在短文中有针对性的提出了自己的意见。2对问题的求解对戒烟者的建议众所周知,吸烟不仅危害自身的健康,也对社会和公众产生诸多不利影响,尤其是由此引起的被动吸烟更是危害公众身心健康的主

27、要原因。戒烟已经成为一项势在必行的任务。因此,对于提高戒烟成功率的主要影响因素的研究,将对推动戒烟者的戒烟具有重大意义。结合问题一、二、三的数据以及具体的模型分析,可以看出,性别、年龄不同的戒烟者在累加发病率和戒烟天数上的差别并不是很大。而每日抽烟支数和CO浓度和戒烟者的累加发病率的关系相对来说比较明显。因此可以得知,烟龄越长,抽烟数量(即烟瘾)越大的戒烟者的累加发病率越高,也越不容易戒烟。据此,我们将对戒烟者提出以下几点建议:(1)不论性别如何,也不管年龄多大,只要有一颗戒烟的决心,并且努力克制自己的烟瘾,最后都是能够成功戒烟的。(2)由于每日抽烟只数,也可以当作平时所说的烟瘾对戒烟成功与否

28、的影响较大,因此戒烟者应当从每日抽烟只数的减少处开始着手,每天坚持减少抽烟只数,发挥自己坚强的毅力,必然是能够戒烟成功的。(3)根据数据分析和模型的求解结果可知,CO浓度以及调整的CO浓度可以在一定程度上反映戒烟者的烟龄大小和烟瘾大小,由于烟龄越大、烟瘾越大的人戒烟越难,所以尤其是年龄较大的戒烟者,越应该发挥巨大的戒烟决心。最后,戒烟是一项长远而艰巨的任务,戒烟者务必相信自己,无论性别、无论年龄、也无论烟瘾的大小,都应该坚定不移的贯彻落实每日提醒自己克制的做法,坚持每天减少抽烟量,长久之后,一定能够实现戒烟成功的目标。6 误差分析1.在缺失值的处理时为了方便研究,我们直接进行了剔除处理,没有对

29、样本进行插值,对模型的结果会造成一定误差;2.曲线拟合过程中,我们把显著性较低的自变量忽略,不考虑其中,使得拟合后的模型不够精确;3.在进行数据处理时,为方便得到回归曲线,我们对自变量进行了分组研究,并取均值进行分析,会导致结果模糊化。7 模型的评价一、模型的优点(1)在构建模型前,对数据进行了预处理,删除了部分缺失数据,在简化了数据处理的同时,增加了模型的科学性,也体现出思维的严谨性与灵活性;(2)充分利用了题目所提供的各种信息,尽可能地保持了数据的完整性,使得模型更加精确更加科学;(3)多次利用SPSS及MATLAB等高效的数学软件进行数据处理和模型的求解,成功地解决了问题,得到了比较理想

30、的结果;(4)运用了简化之后的多元回归分析模型,将复杂的问题简单化,并逐步对模型进行改进,最终得出较为准确可靠的结果。二、模型的缺点(1)使用原始数据进行模型的建立和求解,加大了数据处理的难度,也使模型的结果可能受到个别异常数据的影响。(2)由于原题所提供的仅为234人的数据,该数据可能不足以准确地反映普遍的规律,也不能够利用数据作出精确的模型来揭示累加发病率的分布情况。(3)运用MATLAB进行去点拟合时,丢失部分数据,模型的结果与实际情况存在一定的误差。8 模型的推广本文的模型是建立在解决多个具有相关性的自变量与因变量之间的相关关系的问题上的基础上,采用了多变量分析,构建出了多元回归分析模型,具有一般性,适合进行进一步推广。上述模型不局限于本题所解决的戒烟问题,可以推广到大部分求解多变量的相关性分析问题。在解决具体问题时,可以根据具体问题对该模型进行一定的改进和修改。参考文献1 史书良.统计学原理M.北京:清华大学出版社,2007.2 茆诗松.周纪芗.概率论与数理统计M.北京:中国统计出版社,2007.3 张文彤.SPSS 11 统计分析教程M.北京:北京希望

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论