艾滋病疗法的评价及疗效的预测(统计分析)2006B.doc_第1页
艾滋病疗法的评价及疗效的预测(统计分析)2006B.doc_第2页
艾滋病疗法的评价及疗效的预测(统计分析)2006B.doc_第3页
艾滋病疗法的评价及疗效的预测(统计分析)2006B.doc_第4页
艾滋病疗法的评价及疗效的预测(统计分析)2006B.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

艾滋病疗法的评价及疗效预测 中国地质大学(武汉)谭 毅 罗文行 敖争光 指导教师 韩世勤 全国一等奖 摘 要:CD4细胞数和HIV病毒载量是反映人体感染HIV病毒之后病程状况的重要指标,尤其是CD4具有重要意义。本文分析了ACTG公布的两组数据,提出建立统计分析模型,结合多项式曲线拟合和统计的方法求解问题。利用相关软件(Matlab,Spss,Excel)和自编程序对所给数据进行了大量的统计处理:分组、求均值、消除初值差异、剔除残缺数据和错误数据、加权平均、插值、等效转换等。用线性回归分析了CD4与HIV的关系为负相关,相关性较好,二者作多项式曲线拟合相关性更高。以CD4/HIV比值作为反映患者病情的指标与时间t作2阶多项式曲线拟合,得到2次回归方程。该方程对时间求导得CD4/HIV比值的随时间变化率。变化率的正负反映患者病情走势。当处于曲线极大值点时,导数为0,且随时间越过该点导数由正变负,反映患者病情由好变坏,继续服药则药物副作用明显,应立即终止治疗。根据这一思想可以确定各种疗法的最佳治疗终止时间。由卫生部发布的免疫学指标:患者经治疗3个月后CD4+T淋巴细胞计数与治疗前相比增加30%即提示治疗有效;和CD4值总体走势(由末值减去初值判断)计算各种疗法有效率,结合最佳终止时间的长短可以评价疗法的优劣。患者年龄反映了体质的强弱,与其免疫能力关系密切。按年龄段对每种疗法的患者相关数据分组,利用以上标准计算疗法有效人数和有效率。将各年龄段某疗法有效人数与该疗法总的有效人数之比作为各年龄段对该疗法的权重(vi),然后对各测试时间点不同年龄段CD4值求加权平均值。经Newton插值后将CD4与时间t作多项式曲线拟合,得到统计意义上适用于所有年龄段人群的CD4值随时间t的变化趋势。由回归方程求导并取0值,可以确定最佳医疗终止时间。当考虑医疗费用时,须在疗效最好和费用最低之间确定一平衡点,使得总体最优。本文结果:1)最佳治疗终止之间为34.5周;2)疗法优-次序:4-2-3-1;疗法4最佳治疗终止时间为42.816周;3)考虑医疗费用时各疗法优-劣次序:3-2-1-4。关键词:统计分析 多项式曲线拟合相关性AIDS CD4 HIV一.问题简述当前人类社会最严重的瘟疫之一艾滋病的主要病理过程是人体感染了HIV病毒之后免疫系统的损害。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。目前艾滋病的疗法还远不成熟,各国都在努力探索更好的方法。题目给出了美国艾滋病医疗试验机构ACTG公布的有关HIV感染者CD4细胞数和HIV(病毒载量)的两组数据。要求根据数据和有关知识预测继续治疗的效果或者确定最佳治疗终止时间;评价不同疗法的优劣;在考虑经济因素条件下各种疗法的取舍。二问题分析与建模人体感染了HIV病毒之后的病理过程主要表现为:CD4+T淋巴细胞的丢失,绝对数量的减少,同时CD8+T淋巴细胞数量增加,CD4和CD8的比例失调。因此CD4,CD4+T淋巴细胞记数作为直接测定免疫功能的方法,是提供HIV感染病人免疫系统损害状况最明确的指标,也是抗HIV药物疗效的重要判断指标1。HIV病毒载量也是反映病人病情的重要指标。而且,CD4和HIV二者是相关的。根据对题意的分析和查阅有关资料2,CD4和HIV都是评估病程的有效指标。因此,病人病情由这两个参数反映出来。现指定参数表示病人t时刻的病情,CD4和HIV分别用参数x和y表示。由此可建立多元回归模型: (1)其中为随机误差,服从正态分布N(0,2),也可以写为: (2)其中为回归系数。由于CD4和HIV二者即x,y是相关的,故可以通过统计处理所给数据找出x,y的关系。对于附件1的数据,为了减少数据量和增大数据典型性,按照不同的HIV分组,计算不同的HIV水平下CD4细胞数的平均值。随着HIV的增高,CD4细胞数平均值明显下降(见图1)。将HIV与CD4平均值进行最小二乘意义上的多项式曲线拟合(使用Matlab),取多项式阶次分别为1,2,6,得到一系列拟合曲线,其相关系数随阶次升高而上升(图1中展示了阶次为1,3,6的曲线及其相关性指标R2),但变化不大。当阶次为1即线性拟合的时候,R20.7407。一般当相关系数R0.7,R20.5时即可认为拟合效果较好,因此可以近似认为HIV与CD4是线性负相关的,其拟合方程为: (3) R2= 0.7407把(3)式代入(2)中,则可得一元线性回归模型:(4)因此,Xg(t)a0a1x ,即CD4指标x为t的函数。病情X对t求导,可得X随时间t的变化率X,X可以反映疗效:, 病情好转,疗效好, 病情保持稳定,疗效较好, 病情恶化,疗效差以上是根据CD4细胞数一个参数评价预测病程的理论基础,但是在拥有HIV测试数据的情况下使用一元线性回归模型略显粗糙,在此情况下不应将HIV与CD4简单的看做线性负相关的。经分析数据,CD4过大或过小的时候,CD4与HIV关系不明显;当CD4处于适当范围时,CD4和HIV随时间呈镜像波动。CD4/HIV比值也可以作为反映病情的参数:(5)令x/yz,有,故 也是t的函数。三.模型的求解符号约定:-第k周所有参加测试的病人CD4细胞数的平均值;-第k周所有参加测试的病人HIV病毒载量的平均值;-第k周取得CD4细胞数测试数据的人数;-第k周取得HIV病毒载量测试数据的人数;第k周第i个人CD4细胞数的测试值;第k周第i个人HIV病毒载量的测试值;基本假设:1. 1. 药品具有副作用,长期服用会严重影响身体健康;因此必定存在一个时间需要终止使用某一药品。2. 2. 接受某疗法的病人对该疗法所用药物无正常副反应之外的不良反映。3. 3. 同一年龄的人群具有相同的身体素质。问题1:为了消除患者开始治疗时病情的不同对统计结果的不良影响,对附件1数据进行处理:第k周测试的CD4细胞数和HIV病毒载量值减去第0周测试值,然后就第k周相对第0周增量对人数求均值得Ak,Bk: (i1,2)Bk (i1,2)以上式中,对应测试值须存在。Nk和Mk过小时,意义不大,故将,疗法2疗法3疗法1下面针对某一种疗法进行分析:由于患者是随机分配接受某一疗法的,因此接受某一疗法的患者包括不同年龄段的人群。年龄因素对疗效有一定的影响,不同的疗法对于不同年龄段的患者疗效也可能不同。为了分析各种疗法对不同年龄人群的适宜程度,我们采用以下统计方法:1) 对于同一疗法,将CD4值再按年龄段进行分组(20岁以下,21岁30岁,31岁40岁,41岁50岁,51岁以上)。2) 对于每个年龄段的数据,将CD4值和时间t(由于测试大约每隔8周进行一次,为便于统计,将时间t归位于0周,8周,16周,24周,32周,40周)进行最小二乘意义上的多项式(阶数n2)曲线拟合。为了避免初始病情的不同对于统计的不良影响,将0周以外各个测试时间点的CD4值减去0周CD4测试值。对于某一种疗法,不同年龄段的有效人数与总有效人数之比可以反映各年龄段对该疗法评价的贡献程度,因此须将该比值作为不同年龄段在该疗法评价中的权重(vi)(见附表1)。然后将各测试时间点不同年龄段CD4值求加权平均值Ek: 其中为第k周第i年龄段的CD4值(由统计方法对第i年龄段所有患者求均值得到)。然后经Newton插值后将与进行最小二乘意义上的多项式曲线拟合,得到统计意义上适用于所有年龄段人群的CD4值随时间t的变化趋势。下面对疗法4作以上拟合:对于20岁以前的拟合,由于样本数目为一,不足以构成统计信息。以下展示的为其余4个年龄段的多项式拟合曲线。 下图为考虑年龄段权重之后得到的曲线,其中纵轴CD4刻度表示的即上文述及的Ek:其回归方程为:对x(即Ek对t)求导,得:令0,得:x5.3528周42.816周因此,可基本确定疗法4的最佳治疗终止时间为42.816周。问题3:仍使用附件2数据,加以考虑经济因素后评价4种疗法的优劣。4种疗法所用药品及其价格见下表:表3 四种疗法所用药品及价格疗法用 药价格($)1600mg zidovudine&400mg didanosine(去羟基苷)(按月轮换)1.6&0.851.2252600mg zidovudine2.25 mg zalcitabine(扎西他滨)3.453600mg zidovudine400 mg didanosine2.454600mg zidovudine400mg didanosine400mg nevirapine(奈韦拉平)。3.65因疗法1按月轮换使用两种不同药品,附件2中数据测试间隔为8周,大约两个月。故每次测试的时候,接受疗法1治疗的患者的两种药品都使用过了(不管使用顺序如何),而且使用时间相同。因此,疗法1的经济效果等同于同时使用两种药品而药量减半,其价格可统一为两种药品价格的算术平均值即$1.225。结合问题2的思路,对4种疗法在考虑年龄段权重的条件下进行CD4值与时间t的多项式曲线拟合,得到回归方程之后通过求导确定各种疗法的最佳治疗终止时间,然后结合各疗法药品价格,评价4种疗法的优劣。其最终拟合曲线图如下:为了便于比较,以上将1,2,3,4疗法图线全部列出,其中图14与上文图10相同各种疗法回归方程(疗法4问题2中已经求出):对以上三个方程分别求导,令导函数为零,得出各种疗法的最佳治疗终止时间: 疗法1: 9.81*878.5周疗法2: 3.26*826.8周疗法3:4.13*833.04周疗法4:5.352*842.8周其中疗法4结果上文已求得,此处与之同。结合不同疗法费用统计如下: 表4 各种疗法费用统计表疗法药价($/天)终止时间(周)费用($)11.22578.5673.13723.4526.8647.2232.4533.04566.6643.6542.81093.54当患者选择疗法需要考虑费用时根据以上统计数据易得4种疗法由优到劣为:疗法3疗法2疗法1疗法4四模型分析与外延分析题意及数据可知,可以用统计模型解决该类问题。本文开始考虑用多元线性回归分析,但发现线性方程不足以反映问题的全部内涵。于是改为多项式曲线回归,基本可以满足解决该问题的要求。但两种模型是相通的,其数学思想一致。在变量的多项式曲线拟合关系中,相关性普遍较高(R20.7)。一般认为R0.7或R20.5,拟合就比较好了。本文还大量使用了统计方法对数据进行处理,包括剔除无用和意义不大的数据,排除干扰数据,数据不足时还需插值等等。总之,本文的统计模型是解决该类问题的一个普遍可行的模型,其效果也比较理想。此外,在建模过程中我们曾想到,所谓最佳治疗终止时间,是指所测试病人的CD4和HIV或其综合因素(如二者的某函数值)越过某一指标的时候,并不代表某个病人应该停止治疗的具体时间。根据这一基本认识,通过数学方法找到这一指标,或许可以建立其他模型来解决这一问题。参考文献:1 作者未知,HIVCD4、CD8细胞计数及其意义,/n387c20.aspx, 2006-9-152 李敬云等,21例HIV感染者/艾滋病患者HIV载量及CD4细胞数分析,军事医学科学院院刊,26卷 第4期:277-279,20023 卫生部,艾滋病诊疗指南,/Article/class5/yzgl/200502/209.html#bottom 2006-9-16 4 苏金明 张莲花 MATLAB工具箱应用 电子工业出版社疗法1234年龄段总人数有效数有效率(%)权重vi总人数有效数有效率(%)权重vi总人数有效数有效率(%)权重vi总人数有效数有效率(%)权重vi权重vi(1)300.0000.0001110.010400.0000.000100.0000.0000.0002130(2)56120.2140.16748140.2920.13948170.3540.17352270.5190.1730.1733140(3)142300.2110.417166460.2530.455164430.2620.439159730.4590.4680.4684150(4)95240.2530.33385320.3760.31791270.2970.27689400.4490.2560.25650(5)2960.2070.0832480.6670.07923110.4780.11229160.5520.1030.103总 体3257222.2132410131.213309829.7133015647.3112006年数学建模甲组B题,论文附表:附表1 按照疗法和年龄段分组后数据统计结果(部分)附表1 2006年数学建模甲组B题,论文附录:附录1:#include#include#includedouble num2000105;int cnt2000 , tot , ok , id , age10 , all10;double x10 , y10;double nton1212;double st , max;double mul(double t , double X , int n)double ans = 1 , res;ans *= nton00; res = 1;for (int i = 1; i n; i+) res *= (X - ti-1);ans = ntoni0 * res;return ans;double cal(double num , double t , int n)int i , j , k;i = n;for ( j = 0; j = i; j+) nton0j = numj;for ( j = 1; j i; j+)for ( k = 0; k i-j; k+) ntonjk = (ntonj-1k - ntonj-1k+1)/(tk - tk+j);int main()int i , j , a;double b;freopen(4.txt , r , stdin);freopen(4out.txt , w , stdout);memset(cnt , 0 , sizeof(cnt);while( true )tot = 0; ok = 0;memset(all , 0 , sizeof(all);memset(all , 0 , sizeof(all);while(scanf(%d , &id)!=EOF)tot+;scanf(%d%lf%lf%lf , &a , &numidcntid2 , &num

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论