止痛剂疗效评价预测.doc_第1页
止痛剂疗效评价预测.doc_第2页
止痛剂疗效评价预测.doc_第3页
止痛剂疗效评价预测.doc_第4页
止痛剂疗效评价预测.doc_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题目: 止痛剂疗效评价预测 摘要随着现代科学技术的发展,医学方面的技术也大步前进,给人们的带来了很多帮助,减轻了许多病痛。某医药公司本着减少病痛患者的疼痛研制了一种新的止痛药,现通过医药实验来预测其疗效。本文根据该公司的医药实验所提供的数据进行深究,以得出一种模型来预测对于不同服药剂量、不同性别以及不同血压的病人服用该药起作用所需要的时间。这是一个多元线性回归问题,通过对该题题意的探究,我们采用统计回归方法进行解决。我们先用软件画出图中所给数据的散点图,可以分析出需要采用2次项来建立模型,如图4.3.2。再根据对该问题的初步认识建立一个基本模型:,用MATLAB软件解出模型,再通过残差图两次剔除数据并且回归,得到最终结果,其最佳模型为:,虽然模型看起来可用,但是作为药物,其适用范围只有85.14%,因此再考虑模型改进。在改进模型中,我们对几组变量均采用了01变量,以增加精确度。和基本模型相同,我们所建立的改进后的模型为:,还是采用MATLAB软件来解出模型,由于残差图中存在异常数据,剔除再回归,若还是有异常数据,再剔除,再回归。通过三次回归,得到的最终结果如表5.2.4,此时其适用范围可以达到99.45%,所以最佳模型为改进后的模型,即:,对于该模型,只需要了解病人情况,获得的值代入模型就可以知道其病痛开始减轻的时间了。 本文具有一定的实用性和科学合理性,只要该公司所给数据是真实可信的,那么可以在新药推广中实践。关键词:多元线性回归 统计回归方法 残差图 模型改进 0-1变量一、问题重述一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物实验,给患有同种病痛的病人使用这种新止痛剂的以下4个剂量中的某一个:2g,5g,7g和10g ,并记录每个病人病痛明显减轻的时间(以分钟计)。为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压得低,中,高三档平均分配来进行测试。通过比较每个人病人的血压历史数据,从低到高分成三组,分别计作0.25,0.50,0.75。实验结束后,公司的记录结果见下表(性别以0表示女,1表示男)。请你为公司建立一个模型,根据病人用药的剂量、性别和血压组别,预测出服药后病痛明显减轻的时间。病人序号病痛减轻时间/min用药剂量/g性别血压组别135200.25243200.50355200.75447210.25543210.50657210.75726500.25827500.50928500.751029510.251122510.501229510.751319700.251411700.501514700.751623710.251720710.501822710.7519131000.252081000.502131000.7522271010.2523261010.502451010.752、 基本假设1、 假设病人没吃其他止痛药;2、 假设题目所给的数据真实可信;3、 假设题目所给的调查结果能够反映止痛药对所有病人的效果;4、 假设服用止痛剂前后,病人未服用其他抑制止痛药效果的药物。3、 符号说明符号含义单位备注病痛减轻时间min用药剂量g性别女-0,男-1血压组别随机误差待估计的回归系数4、 问题分析4.1问题背景随着现代科学技术的发展,医学方面的技术也大步前进,给人们的带来了很多帮助,减轻了许多病痛。医药公司在确定药物使用剂量之前,都要进行药物实验,以防剂量服用不当而产生副作用。根据药物实验所取得的数据要进行详细分析,得出不同性别和血压的人最佳服用时间、剂量,以保证病人的安全。4.2概念分析止痛药,部分或完全缓解疼痛的药物。根据疼痛程度、规律及首次有效止痛时间,应按时给予止痛药,以保持药物在血液中的浓度,将疼痛刺激控制在痛阈之下。根据实际需要,在确保安全的前提下,药物剂量由小到大,直到病人止痛为止。比如恨不得病马上好,擅自加大药量;或者不把吃药当回事,想起来吃点,想不起来就算了,或者两次药并成一次吃,都是不对的。4.3数据分析要对该题深入了解,首先是要先进行数据分析,以便确定模型方向。根据题中所给数据,画出的散点图如下:(图4.3.1): 图4.3.1由上图可知:对可用二次函数拟合,拟合后如图4.3.2。图4.3.2(图4.3.3):图4.3.3(图4.3.4):图4.3.4由以上散点图可以知道在模型建立中要采用2次项才能保证模型的可靠性。4.4问题分析本问题是一个在新药推广中,医药公司的新药研究部门设计了一种药物给患有同种疾病的病人使用后,根据病人的用药剂量、性别和血压组别,预测病痛时间减轻多少的统计回归问题。针对这个问题,我们采用了两种方法解答,并且用MATLAB软件的Regress求解。五、模型的建立与求解5.1问题的模型建立与求解根据题意需要,设根据散点图的分析,可以知道对可用二次函数拟合,所以有:,而对、可用线性模型表示:和,所以与之间的多元线性回归模型为:用MATLAB求解得到数据如表5.1:表5.1.1参数参数估计值参数置信区间63.129148.7173 77.5409-10.2706-14.9243 -5.61695.6667-0.0213 11.3546-1.5000-15.4325 12.43250.51110.1319 0.8903= 0.8275 F= 22.7903 P= 0.0000 = 44.3109由表5.1可以看出,因变量的82.75%由模型确定,拟合度不高,值远超临界值,所以模型整体来看是可用的,但的置信区间含有零点,这两个个系数的解释是不可靠的。所以要对模型进行残差分析,首次回归所得图形如图5.1:图5.1.1出现两个异常数据,剔除第3和第24个数据后再次回归,结果如表5.1.2:表5.1.2参数参数估计值参数置信区间58.356146.0028 70.7094-9.6490-13.7231 -5.57488.14193.1888 13.0950-1.6471-14.1394 10.84530.50780.1765 0.8392= 0.8594 F= 25.9679 P= 0.0000 = 29.8002 的置信区间还是含有零点,再次进行残差分析,如图5.1.2:图5.1.2剔除第五个异常数据再次回归,结果如表5.1.3:表5.1.3参数参数估计值参数置信区间55.812144.3918 67.2324-8.0962-12.0605 -4.13207.13112.5539 11.7083-6.3868-18.5348 5.76120.40250.0869 0.7181= 0.8514 F= 22.9153 P= 0.0000 = 24.1056残差图见图5.1.3:图5.1.3 此时,该模型在大程度上都有了提升,也无异常数据,模型基本可用。所以最佳模型为:模型似乎可以使用了,但是为了得到更准确的模型,我们将对其进行改进。5.2模型的改进现对模型进行改进,在这里增加一个01变量: 所以血压低(0.25)时可以用表示,血压中用表示,血压高用表示。5.2.1线性回归假设用药剂量、性别、血压组别无交互作用,则用MATLAB求得以下数据:参数参数估计值置信区间49.365239.7308 58.9996-4.1373-5.2888 -2.98575.6667-1.0479 12.3812-0.7500-8.9736 7.4736-2.3750-10.5986 5.8486 F=15.0126 p=0.0000 由此可见:置信区间都包含零点,解释不可靠,而且明显偏低,又偏高,所以该线性模型不可用。5.2.2增加交互项假设方程:首次回归,用MATLAB解得数据如表5.2.1:表5.2,1参数参数估计值参数置信区间56.276145.9721 66.5802-9.2951-12.2689 -6.32132.2500-6.9397 11.439724.338213.8899 34.78662.9706-7.4778 13.41900.51110.2833 0.73891.0000-0.1718 2.1718-3.7647-5.1999 -2.3295-0.6618-2.0970 0.7734-5.0000-13.3685 3.3685-2.7500-11.1185 5.6185=0.9600 F=31.2308 P=0.0000 =15.0053 由表5.4可以看出:由表二可以看出: 置信区间都包含零点,再看残差图图5.2.2:图5.2.2第1组和第23组数据出现异常,剔除后回归。再次回归,得到的数据见表5.2.2:表5.2.2参数参数估计值参数置信区间60.349247.5549 73.1435-9.4786-12.4356 -6.52151.0011-8.2277 10.229819.29949.3447 29.25412.1418-9.1017 13.38530.49130.2985 0.68410.8599-0.2292 1.9491-3.2731-4.4996 -2.0466-0.8718-2.3219 0.5782-2.9107-9.6350 3.8136-3.6429-11.1280 3.8422= 0.9818 F= 59.3390 P=0.0000 = 7.9468 表5.5中增大,说明回归有效,只是置信区间仍然包含零点,观察残差图图5.2.2:图5.2.2只有第22组数据出现异常,剔除后再一次进行回归。回归所的数据如表5.2.3:表5.2.3参数参数估计值参数置信区间68.199554.7975 81.6014-11.3881-14.5394 -8.2368-4.6058-14.2421 5.030413.01852.4940 23.5430-2.1172-12.6417 8.40730.59740.4019 0.79281.60880.4214 2.7962-2.4120-3.7599 -1.0640-0.3477-1.6956 1.00020.7492-6.0458 7.5442-1.4151-8.2101 5.3799=0.9868 F= 74.6792 P=0.0000 =5.7386 本此回归之后,的置信区间还是存在零点,继续进行残差分析,如图5.2.3:图5.2.3同样按照之前的步骤再进行回归,结果如下表5.2.4:表5.2.4参数参数估计值参数置信区间71.654462.1266 81.1821-12.4291-14.7077 -10.1505-5.9647-12.6854 0.755911.43074.0817 18.7798-6.4184-14.1981 1.36130.66940.5266 0.81221.76610.9387 2.5934-2.2165-3.1571 -1.27600.0013-0.9571 0.95981.5797-3.1495 6.30901.4122-3.6221 6.4464=0.9945 F= 162.1908 P=0.0000 =2.6629 表5.7中增大,说明回归有效,只是置信区间仍然包含零点,但是接下来的循环回归我们发现,的增长数非常小,所以到这第二次回归就已经足够了,从开始假设的线性模型到四次回归,不难看出、F的变化情况,即:由此可以得出,最优模型为:5.3模型的结果分析将原模型和改进后的模型进行比较,不难发现,改进后的模型要比原模型大得多,适用范围也就广得多,采用改进后的模型疗效更好也更安全,因此最佳模型为:使用该模型时,只需用把用药剂量、性别、血压组别所对应的数据代入模型,就可以得出服药病痛减轻的大概时间。六、模型评价、改进与推广6.1模型的评价6.1.1优点1.本文的模型在建立的过程中充分考虑到止痛药与病人的重要相关因素,得出我们建立的模型中的最佳模型。 2.充分利用MATLAB等软件进行画图求证,所以误差较小,数据准确合理。3.该模型实用性强,对现实有较强的指导意义。4.在求解模型时多次回归,直到无异常数据,因此该模型准确度高。 6.1.2缺点 1.本文在解决问题中使用的数据大部分为实验值,本身存在误差,我们没有使用实际数据进行检验。 2.在模型建立中,所建模型相对复杂,与建模要求中模型的简单、明了不符。 6.2改进与推广 1. 我们建的模型不仅可用于医药公司新药的推广,也可用于其它资源的安排,还可用于诸如像工资薪金模型的其它类型的问题。 2. 由于题目给出的统计数据不是很精确,如果我们能对统计的方法进行改进,估计时间可以更加精确。3. 这个模型比较接近现实,它很有实用价值,可以为以后其他新药的推广提供参考。 七、参考文献1 数学模型(第四版).姜启源,谢金星,叶俊.北京,高等教育出版社,20112 张立军 任英华,多元统计分析实验,北京,中国统计出版社,2009.38、 附录Y对x1的散点图 x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10 10; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5;plot(x1,y,*);拟合曲线 x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10 10; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; p=polyfit(x1,y,2); x1x1=linspace(min(x1),max(x1); yy=polyval(p,x1x1); plot(x1,y,o,x1x1,yy);Y对x2的散点图 x2=0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; plot(x2,y,*)Y对x3的散点图 x3=0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; plot(x3,y,*);首次回归: x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10 10;x2=0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1;x3=0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75;y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5;x=ones(24,1),x1,x2,x3,(x1.2); b,bint,r,rint,stats=regress(y,x,0.05)rcoplot(r,rint) % 残差图5.1.1剔除第3和第24个异常数据再回归: x1=2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10;x2=0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1;x3=0.25 0.50 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50;y=35 43 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26;x=ones(22,1),x1,x2,x3,(x1.2);b,bint,r,rint,stats=regress(y,x,0.05) rcoplot(r,rint) % 残差图5.1.2剔除第5个异常数据后再次回归: x1=2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10;x2=0 0 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1;x3=0.25 0.50 0.25 0.50 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50;y=35 43 47 43 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26;x=ones(21,1),x1,x2,x3,(x1.2);b,bint,r,rint,stats=regress(y,x,0.05) rcoplot(r,rint) % 残差图5.1.3模型改进增加交互项后:首次回归: x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10 10;x2=0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1;x3=0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1;x4=0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0;y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5;x=ones(24,1),x1,x2,x3,x4,(x1.2),(x1.*x2),(x1.*x3),(x1.*x4),(x2.*x3),(x2.*x4); b,bint,r,rint,stats=regress(y,x,0.05) rcoplot(r,rint) %残差图5.2.1剔除第1和第23个异常数据后再次回归: x1=2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10;x2=0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1;x3=0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 1;x4=1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0;y=43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 5;x=ones(22,1),x1,x2,x3,x4,(x1.2),(x1.*x2),(x1.*x3)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论