数学建模影响戒烟成功因素的分析.doc_第1页
数学建模影响戒烟成功因素的分析.doc_第2页
数学建模影响戒烟成功因素的分析.doc_第3页
数学建模影响戒烟成功因素的分析.doc_第4页
数学建模影响戒烟成功因素的分析.doc_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题目:影响戒烟成功的因素分析姓名1:许沛韩姓名2:马雪瑜姓名3:秦栋2012年8月20日星期一目录摘要3关键词3问题重述4问题分析5建模过程5问题一5模型假设与约定5符号说明及名词定义6模型建立与求解6问题二9模型假设与约定9符号说明及名词定义9建立模型进行求解9问题三15模型假设与约定15符号说明及名词定义15建立模型进行求解16问题四18模型优缺点19参考文献及参考书籍和网站19附录20摘要 据调查,中国是烟草生产和消费大国,生产和消费均占全球三分之一以上。目前,中国约有亿吸烟者,尽管与之前相比吸烟率略有下降,但是随着中国总人口的增加,吸烟人数仍然在增加。为了帮助相关人士摆脱烟瘾的困扰,研究小组对234个自愿表示戒烟但还未戒烟的人进行调查,并记录下了调查的数据。根据数据,我们对戒烟成功的因素、再次吸烟的累加发病率和影响戒烟时间长短的因素进行分析。在分析过程中,我们利用MATLAB和SAS统计工具对数据进行拟合并进行逐步多元回归分析和方差分析,其次在建立模型时我们还利用了残差分析法发现了模型的缺陷,并及时引入交互作用项来对模型进行修改。而在分析再次吸烟的累加发病率时,我们用控制变量法对各个影响因素的数据进行控制并在Excel中用直方图表现出来,使其看起来直观易懂。最后,通过了对其建立起模型分析,得出了影响戒烟成功的因素有每天抽烟的支数、CO的浓度和调整的CO浓度等三个因素,而影响戒烟时间长短除了上述三个因素外则还有性别的因素在影响。关键词累加发病率、CO的浓度、调整的CO浓度问题重述为了帮助相关人士摆脱烟瘾的困扰,研究小组展开了调查,对234个自愿表示戒烟但还未戒烟的人进行调查. 在他们戒烟的这一天, 测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO 测定的时间. CO的水平提供了一个他们先前抽烟数量的客观指标, 但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO 的水平. 记录下研究对象的性别、年龄及自述每日抽烟支数. 这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 戒烟天数是从0到他(她)退出戒烟或研究截止时间(1 年)的天数.假定他们全部没有人中途退出研究. 1)试分析上述234人中再次吸烟的累加发病率在不同因素下的分布情况。 2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?若影响,请利用附录中的数据,对其进行定量分析。 3)建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。 4)撰写一篇短文,向有志于戒烟的人士提供戒烟对策和建议。问题分析上述问题中提到对234个自愿表示戒烟但还未戒烟的人进行调查. 在他们戒烟的这一天, 测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO 测定的时间. CO的水平提供了一个他们先前抽烟数量的客观指标, 但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO 的水平. 记录下研究对象的性别、年龄及自述每日抽烟支数. 并用这些数据来估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例。为此,我们第一步应该明确再次吸烟的累加发病率的概念及根据常识自己估计一下影响戒烟时间和能否戒烟的因素有哪些,然后再从数据中找出一些有代表性的数据进行整理,接着建立起数学模型,用数据去拟合运算来验证假设并做出修改以解决问题。最后再从所建立的模型中提取有效信息,对有意戒烟者提出一些建议。建模过程问题一模型假设与约定1、假定被调查者没有人中途退出研究。2、假定被调查者中没有坚持到365天的都认为是再犯者。符号说明及名词定义再一次吸烟的累加发病率:原吸烟者戒烟一段时间后又再吸烟所占周刚开始调查时总人数的比例模型建立与求解在上述问题中,我们以再犯者人数除以总调查人数来计算累加发病率。首先,我们先从234个被调查者中去除了10个数据不全的调查者。然后再对剩下的224个被调查者进行分析,发现其中有193个是属于再犯者,因此,这些人中再一次吸烟的累加发病率是193/224。为了看出再次吸烟的累加发病率的分布情况,我们利用控制变量法分别对性别、各个年龄段、调整的CO浓度和戒烟天数进行分析,在对年龄段进行分析的时候,我们将年龄分成青年、中年和老年三个年龄阶段进行分析,并做出其分布直方图如下图所示:不同年龄段和不同性别之间累加发病率条形统计图不同年龄段和不同性别累积发病率表年龄段/性别男女合计青年39/22453/22492/224中年35/22450/22485/224老年13/2243/22416/224合计87/224106/224193/224上图则是对性别还有各个年龄段进行分析的直方图,从上图可以看出,在同一个年龄段中,青年和中年的女性的累加发病率高一点,这个可能是由女性吸烟的人数少导致基数低和女性的毅力低的原因引起的,而相对来说老年的男性累加发病率高于女性。而在同一性别中,在三个年龄段中,女性的累加发病率最高的是中年阶段;而男性的累加发病率最高的是青年阶段。上图则是不同调整的CO浓度情况下累积发病率的不同分布,由图可以看出在(1400,1600)这个范围内的累加发病率是最高的,在小于1000的情况下累加发病率是最低的。在小于1600之前的阶段是随着调整浓度的增高,累加发病率也随着增大,在1600之后又回归正常,这是因为大于1600时的人数很少,所以累加发病率也就比较小。上图则是每天抽烟支数不同情况下累加发病率的不同分布,由上图可以看出每天抽烟支数在(10,20)范围内的累加发病率是最高的,在大于50的范围内的累加发病率是最低的。从图中还可以看出一点就是从每天抽烟支数大于10支起,随着抽烟支数的增加,累加发病率反而减少,这其中的原因是每天抽烟支数多的人群所占的比例很少,基数小,所以累加发病率也会小。问题二模型假设与约定1、假定被调查者没有人中途退出研究。2 、假定被调查者自述提供的数据是可靠。3、 假定被调查者是在自愿戒烟的人群中随机选取的,没有任何人为的主观因素影响。符号说明及名词定义:年龄:性别(1表示男性,2表示女性):每日抽烟支数:CO的浓度:调整的CO浓度Y:戒烟时间(天数)建立模型进行求解为了分析问题,首先,我们从已知的234个调查者中剔除了10个资料不全的调查者之后剩下224个调查者。然后再将这224个调查者中戒烟天数相同的调查者的各项影响因素中的数据取均值当成一个新的新的数据进行分析。以下的模型建立也都是在此基础上进行的(处理后的数据如附录1所示)。基本模型为了简单起见,在大假设的前提下,我们再假定年龄、性别、每日抽烟支数、调整的CO浓度及CO浓度对戒烟时间(长短)的作用是线性的;同时年龄、性别、年龄、性别、每日抽烟支数、调整的CO浓度及CO浓度等因素之间没有交互作用。由此设戒烟时间Y与(年龄)、(性别)、(每天抽烟支数)、 (CO的浓度)和(调整的CO浓度)之间的多元线性回归模型为:其中是待估计的回归系数,是随机误差。 利用MATLAB的统计工具可以得到回归系数及其置信区间(a=0.05)、检验统计量的结果,如下表所示参数参数估计值置信区间-113.8034-433.0170 ,205.4102-0.2095-2.5236 ,2.104538.8328-20.0172 ,97.68281.8081-0.4675 ,4.0837-0.4936-0.7694 ,-0.21780.1566-0.0529 ,0.3662=0.2 F=3.2 P= 0进一步分析讨论从上表中,我们可以看出,即因变量(戒烟时间的长短)的20%可由模型确定,而且F的值才3.2,所以该模型还需要改进。还有一点需要指出,以上的求解我们都以各个变量之间没有相互作用来做的,而现在看来各个变量之间应该会有一些交互作用,因此,我们对刚才建立的模型进行修改。修改后的模型结合常识,我们认为年龄、性别与每天抽烟的支数之间可能会有交互作用。因此,在上述的模型中我们增加了与、的交互项后,得到的模型记作:其中是待估计的回归系数,是随机误差。再一次利用MATLAB的统计工具经过多次的去点拟合可以得到回归系数及其置信区间(a=0.05)、检验统计量的结果,如下表所示:参数参数估计值置信区间195.82263.0853 , 388.5599-1.9402-4.4711,0.59089.6849-54.1522 ,73.5220-14.4118-23.0221,-5.8014-0.1284-0.2256 ,-0.03110.06880.0125 ,0.12520.26810.1880 , 0.34820.0341 -0.0765 , 0.1447-0.5083 -3.0585 ,2.0418=0.8051 F=18.0759 P= 0进一步分析讨论从上表中,我们可以看出=0.8051,即因变量(戒烟时间)的80%可由该模型确定,F=18.0759也还可以,p远小于a,因而模型总体上来说还是可以用的。但是美中不足的是、的置信区间包含了零点。为此,我们再对此模型进行了修改。更好的模型根据上述的分析,我们将上述模型中的性别()、还有年龄、性别分别与每天抽烟的支数的交互去掉,改成以下模型:其中是待估计的回归系数,是随机误差。利用MATLAB的统计工具对以上式子进行回归分析,经过多次的去点拟合,得到了以下回归系数及其置信区间(a=0.05)、检验统计量的结果(其运算过程见附录2),如下表所示:参数参数估计值置信区间205.0931 153.4352 ,256.7510-1.7613-2.2552 ,-1.2673-14.4455-16.4947 ,-12.3963-0.2012-0.2566 , -0.14580.07350.0404 , 0.10660.30310.2601 ,0.3461=0.9325 F=85.5996 P= 0进一步分析讨论 由上表,我们可以得出=0.9325,即因变量(戒烟时间)的93.25%可由该模型确定,F=85.5996也远大于临界值,p远小于a,因此,该模型整体上还是可以用的,也可从中得出该模型的关系式为: 模型中的各个回归系数的含义可解释如下:的系数为,说明年龄每增加一岁,戒烟时间减少天;的系数为,说明每天抽烟的支数每增加一支,戒烟时间减少天;的系数为,说明CO的浓度每增加一个单位,戒烟的时间减少天;的系数为,说明调整的CO浓度每增加一个单位,戒烟的时间增加天。 综上所述,影响戒烟时间长短的因素有年龄()、每天抽烟的支数()、C0的浓度()和调整的CO浓度(),这些因素对戒烟时间的影响程度有如下关系:问题三模型假设与约定1、假定被调查者没有人中途退出研究。2 、假定被调查者自述提供的数据是可靠。3、 假定被调查者是在自愿戒烟的人群中随机选取的,没有任何人为的主观因素影响。符号说明及名词定义:每日抽烟支数:CO的浓度:调整的CO浓度Y:戒烟时间(天数)戒烟的决心:戒烟天数与365天之比建立模型进行求解根据问题二我们的分析,我们用戒烟的决心来恒量戒烟是否能成功,即戒烟天数与365天之比。由于分母同是365天,所以为了简单计算,我们用天数来代替。现在假定戒烟是否成功与每日抽烟支数、CO的浓度还有调整的CO浓度有关,并将模型记作:其中是待估计的回归系数,是随机误差。利用MATLAB的统计工具对以上式子进行回归分析,经过多次的去点拟合,得到了以下回归系数及其置信区间(a=0.05)、检验统计量的结果(其运算过程见附录3),如下表所示:参数参数估计值置信区间51.2517-5.5908 ,108.0942-13.7322-16.1336 ,-11.3307-0.1935-0.2594 ,-0.12770.1292 0.0858 ,0.17260.27550.2256 ,0.3254=0.8869 F=64.6712 P= 0进一步分析讨论由上表可以看出,=0.8869,即因变量(戒烟时间)的88.69%可由该模型确定,F=64.6712也远大于临界值,p远小于a,因此,该模型整体上还是可以用的,也可从中得出该模型的关系式为:模型中的各个回归系数的含义可解释如下:的系数为,说明每天抽烟的支数每增加一支,戒烟时间减少天;的系数为,说明CO的浓度每增加一个单位,戒烟时间减少天;的系数为,说明调整的CO浓度每增加一个单位,戒烟的时间减少天。 综上所述,可以看出影响戒烟的因素有每日抽烟支数、CO的浓度和调整的CO浓度,由其系数可知,影响最大的是每日抽烟支数。问题四根据我们按提供的数据拟合出的模型,可见,戒烟者戒烟前每日的吸烟量对戒烟成功机会的影响有显著作用,同时年龄和烟龄也有相当程度的影响。由此对有意戒烟者提出以下建议:(1)戒烟者开始治疗前应该严格控制每日的吸烟量,以便在正式治疗中增加痊愈的几率。(2)因为性别、年龄、体质等方面的差异,戒烟者面临的难度不同,因此需要做好充足的心理准备和决心。(3)从原始数据的统计中可以发现,烟民的年龄在降低,青年和女烟民的占一定的比重,戒烟成功者仅占少数,因此只有正确认识吸烟的危害,并且根据自身情况选择合理戒烟方式十分重要。(4)戒烟者应该在正规的医疗机构接受治疗,并且全力配合,为医护人员提供真实有效的自身情况,以便制定合理的治疗方案。(5)依据原始数据的分析,我们发现,在开始治疗的一段区间内,放弃的戒烟者众多,。因此戒烟者应该在开始的一段时间内加强自制能力,抵制诱惑。 本论文建立的合理的假设之上,和现实情况可能有一定的出入,本文提出的模型仅用回归分析的方法体现出影响戒烟成功的因素的显著关系提供参考。模型优缺点优点:1、 运用了MATLAB和SAS进行数据的整理和运算,使得运算和拟合变得更加简单。2、 用残差分析的方法发现了模型的缺陷,并引入了交互作用项来对模型进行修改。3、 在拟合数据时,我们运用了相同项求均值再计算的方法,使得数据个数减少以容易拟合,节约时间。缺点:1、 我们先对其原始数据进行求均值后再用来拟合,使得拟合时与原始数据比较产生了误差。2、 由数据拟合出来的曲线相关度还不够高,与理想值还有一定的距离。参考文献及参考书籍和网站//kns50/index.aspx数学模型(第三版)姜启源、谢金星、叶俊 编SAS软件与统计应用教程 汪远征、徐雅静 主编MATLAB教程(R2006a-R2007a) 张志涌、汤祖樱等编著附录附录(1)各戒烟天数的平均数据处理年龄性别每天吸烟支数CO%Min-lastCO%adj戒烟天数47.67 1.83 31.17 252.08 114.75 1410.83 0.00 45.14 1.50 25.29 318.57 79.43 1446.71 1.00 41.50 1.55 23.95 278.00 188.45 1468.45 2.00 41.89 1.50 26.89 302.22 75.06 1441.11 3.00 41.10 1.70 28.50 342.00 166.70 1454.00 4.00 43.00 1.67 22.83 300.00 110.83 1410.17 5.00 40.67 1.33 23.83 255.00 66.67 1384.33 6.00 44.00 1.30 27.10 362.00 78.40 1509.70 7.00 42.00 1.50 19.00 190.00 30.50 1246.50 8.00 55.50 1.50 25.00 92.50 636.00 1254.50 9.00 43.50 2.00 25.00 332.50 92.50 1529.50 10.00 45.00 1.00 30.00 293.33 78.33 1448.00 11.00 51.67 1.67 15.00 240.00 110.00 1364.00 12.00 39.50 1.25 29.00 367.50 41.50 1531.75 13.00 34.55 1.55 26.64 215.45 276.18 1326.45 14.00 42.60 1.60 22.00 283.00 135.00 1405.40 15.00 34.25 1.50 21.75 211.25 65.00 1270.25 16.00 35.00 2.00 30.00 390.00 66.00 1582.00 17.00 36.00 1.33 28.33 368.33 128.33 1588.33 20.00 36.00 1.80 22.60 232.00 88.00 1346.20 21.00 26.00 1.50 17.50 107.50 598.00 1253.00 25.00 42.00 2.00 20.00 145.00 143.00 1202.00 26.00 59.00 1.00 20.00 300.00 65.00 1468.00 29.00 40.00 2.00 30.00 150.00 120.00 1202.00 30.00 33.00 1.00 20.00 315.00 15.00 1457.00 32.00 35.00 2.00 25.00 260.00 120.00 1440.00 33.00 33.50 1.50 9.50 82.50 585.00 1233.50 35.00 60.00 1.00 11.00 160.00 95.00 1214.00 36.00 28.00 2.00 35.00 405.00 20.00 1569.00 41.00 66.00 1.00 60.00 220.00 60.00 1330.00 42.00 43.00 1.00 35.00 267.50 80.00 1427.00 45.00 52.67 1.33 20.00 190.00 110.00 1284.00 47.00 35.00 2.00 20.00 60.00 1110.00 1435.00 54.00 33.00 2.00 25.00 380.00 2.00 1530.00 55.00 38.50 1.50 9.00 160.00 86.00 1207.00 60.00 62.00 1.00 50.00 440.00 45.00 1621.00 62.00 27.00 2.00 20.00 180.00 100.00 1268.00 63.00 47.00 2.00 40.00 445.00 75.00 1645.00 64.00 64.00 1.00 40.00 185.00 60.00 1254.00 67.00 21.00 2.00 15.00 120.00 60.00 1066.00 71.00 27.00 1.00 20.00 140.00 105.00 1162.00 72.00 64.00 1.00 20.00 180.00 55.00 1239.00 74.00 56.00 2.00 20.00 140.00 108.00 1164.00 82.00 44.00 1.50 12.00 160.00 216.00 1152.00 90.00 37.00 1.00 23.00 85.00 1440.00 1797.00 96.00 41.00 2.00 7.00 80.00 674.00 1282.00 97.00 28.00 2.00 17.00 285.00 100.00 1468.00 106.00 35.00 1.00 60.00 350.00 1.00 1494.00 121.00 36.00 1.00 40.00 500.00 10.00 1654.00 124.00 35.00 2.00 11.00 150.00 90.00 1182.00 129.00 63.00 1.00 20.00 270.00 30.00 1399.00 130.00 55.00 1.00 23.00 265.00 130.00 1455.00 150.00 32.00 2.00 7.00 40.00 1320.00 1393.00 153.00 25.00 2.00 30.00 290.00 75.00 1459.00 157.00 53.00 2.00 40.00 130.00 372.00 1300.00 160.00 40.00 2.00 4.00 40.00 1080.00 1240.00 185.00 37.00 1.00 20.00 85.00 700.00 1325.00 196.00 47.00 2.00 50.00 315.00 95.00 1508.00 235.00 28.00 2.00 5.00 210.00 26.00 1288.00 23

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论