付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
附录B习题第一章1设20~60岁的男子大脑莹量与头颅长度(Y,cm)服从二元正态分布.已知X与Y的相关系数为;X的均数和标准差分别为:和。试写出X与Y的二元正态分布函数。并绘制二元正态分布的正态曲面。2已知成年女子的胸围、腰围和臀围服从三元正态分布,均数分别为:,八协方差矩阵为:‘30.530 、25.53639.859J9.53220.70327.363,试写出相应的三元正态分布函数。3证明,若变量心花服从二元正态分布MN(从of;心b;;p),对州內作线性变换:则Z],®亦服从二元正态分布。并分别求出乙]也2的均数.方差及石与6的相关系数。1-4就例资料,图示二元分布的90%参考值范囲。1-5设S和R分别是随机向量X的方差-协方差矩阵和相关系数矩阵,证明:|S|二佝込2…%)岡.第二幸2-1对20名健康女性的汗水进行测量和化脸,数据如下,其中.Xi为排汗董,X2为汗水中钾的含量,X3为汗水中钠的含量。试检验,样本是否来自Uo‘=(4,50,10)的总体。试验者X,X2X3试验者Xi<2 X31・2.3.4.5.6.7.8・9.10.11.12.13.14.15.16.17.18.19.20.资料来濂:王学仁.王松桂.《实用多元统计分析》,上海科学技术出版社.1232以两均向量比较为例,证明,队数据阵作线性变换,不改变假设检验的结果。
2-3脸证:当m=1时,HotelIingT?检验与t检验等价。状况有无差别。男生女生编号编号身高 体重胸国身高 体莹 胸国11223344556677889910101112为了解某溶栓药对脑梗塞患者血压的影响,观察10名患者,分别与疗前、溶后5分钟、10分钟.20分钟测定患者的收缩压(X,mmHg)和舒张压(Y,mniHg),结果如下表,问该溶栓药对血压有无影响?疗前ID溶后5分钟溶后10分钟溶后20分钟X YX YX YX Y117511517511017011017090213693130901359513597314289138991389914210841801001801001801001809051709017080180701707061257011467111641126871401001409014090140908150701448116687151919150981509815098143831010575113751137511375许料来源:陈清棠,九五攻关项目。1999为寻找挤压塑料胶卷的就优工艺条件,在研究中考虑两个因子:拉力和添加剂的浓厦。观察3个指标,耐力(XJ,光泽(X2),不透明度(X3)。结呆如下。问拉力和添加剂的浓度对3个指标有无影响添加剂谯(A1) 添加剂%(A2)XiX2 X3 Xi X2 Xj低拉速(B1)鬲拉速(B2)资料来源:王学仁、王松佳,《实用多元统计分析》,上海科学技术出版社,1990,188页。第三章1证明:在两样本均数的比较,如将分组变量视为自变量,将观察指标视为因变董,作回归分析,则所得回归系数的t检脸与两样本均数的t检验结果是等价的。3-2下列资料是用三种饲料喂大白乱后得到的肝重比值。将分组变量视为自变量,并用哑变量表示,将观察指标视为因变量,作回归分析。验证,所得回归方程的F检验与三纽均数比较的方差分析的F值是相同的,结论是等价的:三种饲料喂大白鼠后的肝重比值(%) fOJ甲 乙 丙y均数 3-3 ~~以上两个练习题说明,通常的方差分析模型是线性回归模型的特殊情况。找一个区组设计的例子,将其用线性模型表示,并比较均数的方差分析结果与模型检验的结果。3-4
为研究建立年龄(age)^体重(weight)、跑英里所用的时间(runtime)、休息时的脉搏数(runpluse)及跑步时的最大脉搏数(maxpluse)与肺活董间的关系,测量了31人的数据。结杲如下。试进行回归分析。ageweightruntimerstpulserunpulsemaxpulseoxy44621781824062185185444515616842401661723855178180475817617640701761804364162170446317417638481701864445168168455618619245511761764747162164545016617049441801855758174176546215616551591861885749148155495618618848521701765253170172資料来源:高冬琰编译,《SAS系统SAS/STAT软件使用手册》,中国统计出版社,1997,148页。3—5文中所述逐步回归中的消去变换是从离差阵出发,罠后可直接得到偏回归系数b,和参差平方和Q。从离差阵出发进行消去变换有一个缺点,当样本含董较大时,离差阵中元素可能很大,則其倒数将很小,此时需要保留足够的小数位数,有时保留8位或10位还不够。此时,可以考虑从相关矩阵出发进行消去变换等运算,常保留6位小数。所得变量的剔选过程是等价的。而最后得到的是相应的标准僞回归系数b,和标准残差平方和Q=1-R2o试验证之。3—6试证明,R是y与9的Pearson相关系数。3-7学校里孩子的体重看成是他们的身商和年龄的函数模型。从学校里调査了237个小学生的性别(f:女性,m:男性)、身鬲(英寸)、年龄(月)和体重(磅)。试建立体重与性别、身高、年龄的回归模型。年身体性年身体性年身性别龄高重别龄高重别龄高体重f14385F155105f153108
f1615992F191113f171112f18559104F14269f16062f140F139104f178f157124F14993f143f14589F191107f150f147115F180114f14185f14081F16458f176112f185101F166104f175f18059112F210140f146f17090F1625884f149f13996F18695f197121f169F177143f185118f182105F173103f166f16895F16962f15094f184108F139f147f144F177112f178f197112F14660109f14559f14775F14584f155107f167F183110f14384f183103F18560106f14877f147112F15460114f15675f144F154f152105f191114F190140f1406077f148F189114f143f178118F16498f157112f147101F1485995f17781f17191F172142f190f183112F143117f17963f18657F182133f18262f14256F165107f16567f15461123F15074f15566f16384F14156f14764f21062116F1716384f16761f18264112F1446192f193115f14185F164108f186108f16985F17586f180m16598M157105m144m15084M150128m13987m18967128M183111m14779m14690M16084m156112m17393M151117m14184m15059M16495m1536084m206134M250172m176//H=130.17,l22=1016518 ,厶3=218849 '=48820.5,(5=29980.8,m17665119M 140m18566105m180104M14683m18366m14084M15186m1516181m14494M160m178m193133M162119m16495m18666112M14375m1756492m17568112M175m17369m170113M17466108m164108m14488M156106m1495792m14460118M1475784m188112m16962100M17265112m15084m193128M15758m16860m140M156m156m15865121M184112m156114m1445784M17681m168m14981M1425570m18871140m203117M14284m189112m188151M20071147m152105m174120M16684m14591m143101M163118m166121m18267133M17366112m155m16260105M17763111m177112m175114M1666291m1505998m150118M188116m16366112m171112M1626391m14185m17463112M14256m148118m140M16064116m1446089m206172M159112m14972m19372150M194135m15297m14655M13955m186112m16175M153128m19698m1645884M15999m178112m153M155m178m1425576M164112m18965114m164140M16762108m151873—8为研究正常少儿的心象面积(y,cm2),与性别(x—畀取1,女取0)、年龄(X2,月人身鬲(x3,cm)、体重(X4,kg)、胸国(xs,cm)之间的关系,菜单位调查了521名2岁半至15岁的少儿。得各•指标均数.离均差平方和如下:x{=0.48,x2=10.37,x3=124.47,x4=24.76,x5=60.23,y=61.75lyy=127402相关矩阵如下:1-0.039603-0.0410570.965799-0.0344470.9216310.9382340.0479920.9082980.9153320.966865lyy=127402相关矩阵如下:1-0.039603-0.0410570.965799-0.0344470.9216310.9382340.0479920.9082980.9153320.9668650.037969資料来源:史来绰,杨埼编著,试进行逐步回归分析。0.855474.08838570.8634410.850318;《医用多元分析》,人民卫生出版社,1990.第80页。3—9为研究初生儿体莹与胎儿的孕龄,头径,胸径,腹径,股骨长的关系,以预测初生儿童的体重,某医院用超声波测得18名胎儿的上述指标,结果如下。试建立回归方程。孕龄(天)头径(mm)胸径(mm)腹径(mm) ■一生儿体重(g)YX1X2X3X412891011091077339002282868483692500327010210110066340042849896927432005275101100104683100628510194986932007270981039968310082599780816324009285109102104883800102681039510173320011280107991077635001226711290987135001327110010210471300014283101106103683700152871021061077139001627310310210261300017276102989988310018276106103103743650许料来源:郭祖超主编,《医学统计学X1999,人民军医出版社,201页。第四幸1对菜够商中一年级男生38人进行体力测试及运动能力测试,包括:X1一反复横向跳(次人X2—纵跳(cm),X3—背力(Kg),X4—握力(Kg).X5—台阶试验(指数),X6—立定体前驱(cm),X7—俯卧上体后仰(cm)。运动能力测试的指标为:X8-50米跑(秒),X9—跳远(cm),X10—投球(m),X11—引体向上(次人X12—耐力跑(秒)。试进行主成
分分析。序号X1x2x3x4x5x6x7x8x9;<10 x11 x121465512651752572489278360252559542811850464305348346691073898187443032938644950105489816603622663315425590466726845323113916486110643782558740529738974960100499115607420211037984863122525617684662823629455510548761561415246396104864120386020624132873981149521004253642404236400124762100346110624272574071341511015362560737225340914525512543865624963010350154552945051206539424339916495711047721945744630113371753651124790157544630123571847779547729644202544471948601204786126244728113812049551134184156073982743872148691284248206348530735022425712246541563400286388235464155517119615113312298245363120425785343029435325427113844651755748729937026466612045622268470287360274556912966185138026535828506012042578574603253482942511265050135739827238330485011541536394152863143142521404856156047027113483248671053969236045028103263349741514954205875003012330344755113407119644102973313549741205355225950033213423644521103755145740029242137526613047461445505281135538486810045542370522289352进料来源:于秀林、任雪松、《多元统计分析》,中国统计出版社,1999,226页。阿昌族28851京族39610222独龙族176619裕固族360普来族29032怒族31225徳环族33219基诺族3763520他佬族92撒拉族143807毛南族81资料来源:钱建明等,《中国少数民族健康趋勞研究》,成都科学技术出版社,19994-4在我国制定服装标准时,测量了3454名成年女子的14个部位的数据,得协方差矩阵如下,是进行主成分分析。x1x2x3x4x5x6x7x8x9x10 x11 x12 x13 x14上体长X1手臂长x2胸国x3颈围x4总肩宽x5前胸宽x6后背宽x7前腰节高x8后腰节高x9总体高x10身高x11下体长x12腰国x13x14资料来源:张尧庭方开泰著《多元统计分析方法》,科学出版社,1982,P115第五章1比较因子分析与主成分分析模型的关系,说明它们的相似之处和不同点。5-2对练习4-1资料进行因子分析。
5-3从协方差矩阵出发,对例4-1资料进行因子分析,比较两者的结果。5-4HolzingerKJ(1934)告了355名小学生12项心理测试项目间的相关系数矩阵如下,试作因子分析。Perceptionofbrightnesscountdotsstraightandcurvedlettersspeedinsimplecode1111111TheUniversityofChicago页。资料来•源:Harry(I960).ModernFactorAnalyses.第六幸1在例中,就下列两种情况解释logistic回归模型中x的系数的涵义,并导出x的系数,写出相应的logistic回归方程。暴翳时X—,非暴露时X一1:点露时x一19非暴露时x~-1o6-2某研究调查了169名妇女吸烟和使用口服避孕药对血栓形成的影响,资料如下,试进行分析。病人类别用避孕药吸烟不用避孕药血栓14 7对照2 22病人类别用避孕药吸烟不用避孕药血栓14 7对照2 22不吸烟用避孕药不用避孕药12 258 84合计581116-3为研究血压、胆固醇于心脏病的关系,调査了13396-3为研究血压、胆固醇于心脏病的关系,调査了1339名冠心病和健康人的血压和胆固醇,结果如下。试建立logistic回归方程,并探讨自变量的适宜尺度。冠心病胆固醇(mg/1000mI)收缩压(mmHg)<127 127〜146 147〜166 >166<2002 3 3<2002 3 3200〜200〜219 3220〜26081166>2607121111<2001171214722200〜21985984320220〜2601192096843>260679946336-4下表列出了100个参加研究的个体之年龄(AGE),有无冠心病(CHD)的明显症状,表中ID为编号,AGEP为年龄分纽变量。结果变量是CHD.CHD=0表示个体无冠心病.CHD—1表示有冠心病。⑴作CHD与AGE的散点图;对年龄分组变量AGRP分别统计冠心病人数,计算各年龄组冠心病的患病率P;分别作P与AGRP,及logitP与AGRP的散点图,并与⑴的结果比较:分别建立CHD与AGE,及CHD与AGRP的logistic回归,并比较两个回归的结果:⑸建立P与AGRP的logistic曲线,并与(4)的结果比较。100个个体的年龄和冠心病(CHD)状况IDCHDAGEAGRPIDCHDAGEAGRPIDCHDAGEAGRP102013503836805162023136039369052630241371393701526402513804047115365125139140472153660261400414731546702614104147405578028142042475155790281430424761557100292440424771567110302451424781567120302460434791567130302470434800577140302481434810577150302490444821577160302500444831577171322511444841577180322521444851577190332530455860587200332541455871587210342550465881587220342561465891597231342570475901597
24034258047591060825034359147592160826035360048593161827035361148594162828036362148595162829136363049596163830036364049597064831037365149598164832137366050699165833037367150610016983403836-5为了解睾丸癌与隐睾症的关系.以及两者是否具有同侧性或异侧性倾向,在某地进行了病例一对照研究,结果如下:结果分组隐癌症无左侧 右侧双侧对照组658372左侧睾丸癌130812右侧睾丸癌1564143根据上述结果拟合多类结果logistic回归模型根据拟合模型,检验睾丸癌与隐睾症是否有同侧性;根据拟合模型,检验睾丸癌与隐睾症是否有异侧性:检验隐睾症与同侧睾丸癌的优势■比是否与异侧隐睾症的优势比相同。6-6某.医科大学外科在腿溃疡的治疗临床研究中,釆用两种处理treat(TrentaI一1和Placebo―),两种细带(bandage4layer—1和Convatec-0),两种包扎方法(Granuflex一1和Na=0),治疗结果分为3各等级heal(无效一0,有效二仁痊愈一2)。根据上述结果拟合累积比数logistic回归模型:拟合相邻比数logistic回归模型;对⑴和⑵的结果进行比较;treatbandagedressingheaI0Freq19treatbandagedressingheaI0freq21000100000141001200022100240010211010100011310115001221012100100911005010181101100102611028011010111012
0 1 1 1 10 1 1 1 1 70 1 1 2 5 11 12 7(4)该资料是否符合建模的条件6-7hosmer,•给出了1:3配比的低出生体莹危险因素研究,结果如下表。研究中按年龄配比,及年龄相同者配方,match是配比纽,obs是配比组中的患者编号,low表示低出生体重变董(Iow=1,体重出生低于2500g,否则low=0),Iwt表示母亲灵后一次月经的体重,smoke表示母亲吸烟状况(吸烟=1不吸烟=0),ptl表示早产史(有=1无=0),表示高血压(有=无二0)ui表示子宫过敏危险情况(有二1无=0)时对该资料进行分析。obsIOWageIwtsmokehtuiptlobsIowageIwtsmokehtuiptl111613000003022112100120161120000402216900003016135100011239700104016950000202313000001117130101130231190000201710300004023123000030171221000112311010014017113000020231280000111712000003023190000020171130000402311000003017119000011241320100401711900002024115000011181480000302411500002018100100040241100000301890101011241380000401822900002024901001111811010013024133000020181071010402411600003018100100011258500104018901010202511810001119911011302512500002019138100040251200000301918900001125921000401914710002025120001011191020000302514000002019150000040252410100301923511001125105000140191841100202515500001119112101030259510112019182001040251300000
30199500001126190100040191320000202611310001120150100030261681000202012000104026160000030201051000112812010114020141001120281400000112012010003028250100020201030000402813400003020127000011289510004020170100020281201000112012110113028120000020201690011402813000003020121100011291300010402012000002029150000011212000010302913500002021108101040291301000302112400001130142100140211851000203010700111121100000130301530000202116000004030137000030211101010113110210014021115000020311000010112213010113031150100020228510004031120000030221301000113210510004022125000020321210000112110000013032132000020211600000403213410013021110101011311021001402111500002031100001011221301000303115010002022120010040311200000第七章7-1验证,四格表的pearson^与肮等价。7-2对例资料用极大似然法建立可加效应的poisson模型(列出
详细步骤)。7-3AlanMorrison作了一项乳腺癌患者3年生存情况调查•其中慢性炎症反应的程度分为轻炎症和重炎症,核的量级分为相对恶性和相对良性,并按诊断中心和年龄分层.结果如下.使就影响乳腺癌患者3年生存率的有关因素进行分析.诊斷中心年龄存活情况轻炎症重炎症恶性良性恶性良性东京50以下死9743活266825950~69死99112活204618570以上死2310活1651波士顿50以下死6760活11244050~69死82032活18581370以上死91830活152611格拉摩根50以下死16730活16208150~69死141230
活273910470以上死3730活1211417-4为探的讨肿瘤坏死因子(TNF)与干扰素(IFN)的免疫活化能力,各选4个计量,共16个组合,见下表第2,3栏,每种组合下,观察200个细胞中有多少个分化(y)•结果见下表第一栏•研究的目的是要检验肿瘤坏死因子仃NF)与干扰素(INF)对细胞的分化作用是独立的,协同的还是拮抗的.试对该资料建立logistic回归,Poisson回归和负2项回归,并对它们进行评价.N0yTNF的剂量(U/ml)IFN的剂量(U/ml)1110021804320020439010052210638147521208691100931100106810411691020
12128101001210210001417110041518010020161931001005..Weinberg(1988)等报道了Colorado地区1978-1983年儿童糖尿病按性别、年龄分组的逐月发病情况,下表是按各组人口数校正后的发病人数。试用Poisson回归模型分析糖尿病的发病和年龄、性别之间的关系,并探讨是否有季节波动。Colorado地区1978-1983年儿童糖尿病病人数另女男女年月年月0-45-9 10-170-45-910-170-45-9 10-170-45-9 10-1778.10250452115016312112340211115033016\610202171200158013002920021010111013110410211201501179.10160052142012302311440121205332030600211270000228100024901304110010132111080141203912580.121614522130213212123400112251020126005111711101283121439106113100411221111210412003014变量编码:年龄(age)(0性别(sex)(0时间(month):1一4;:女;1(月份)1:1—9::男);2:10—17),第八幸8T设一组病人的生存分布服从A=0・65的指数分布。请:画出生存函数曲线;计算平均生存时间,中位生存时间;(3)计算生存大于2个单位时间的概率。2设一组病人的生存分布服从八一.m-3的WeibulI分布。请:画出生存函数曲线和危险度函数曲线;估计平均生存时间;、 (3)计算生存大于1个单位时间的槪率。8-3为了比较药品6-疏喋吟(6-MP)与一种安慰剂在缓解血癌患者的痛苦方面的疗效■请定狡生存时间和死亡事件。如每组分别观察了21名患者,缓解的时间(周)如下。其中带星号为截尾。试进行分析和比较。(资料来源:JFLawless(弗诗松等译)寿命数据中的统计模型与方法,P5)6-MP组:6,6,6,6+,7,9“,10,10',1V,13,16,17*19*20',22,23,25*,32*,32',34*35*安慰剂:1,1,2,2,3,4,4,5,5,8,8,8,8,11,11,12,K2,15,117,22,238-4在深度的静脉血栓形成的研究中,20名病人的血凝块渐退时间(小日寸)如下(许料来源:ETLee(陈家鼎等浑)生存数据的统计方法,P268):2,3,4,5,5,9,13,,,,7,6,,6,14,25,49,,49,28拟合指数分布;拟合Weibull分布;何种分布模型较好8-5对例资料建立指数回归和Weibull回归,并与Cox回归模型进行比较。8-6对例资料用逐步回归方法建立Cox模型。8-7有33位患肾上腺样瘤的病人接手化学疗法、免疫疗法及激素疗法的综合治疗。进料如下。试对该资料进行分析。其中,age表示年龄;gender表示性别,F表示女性,M女性男性;tiemO和timeI分布表示开始治疗和终止治疗的时间:response是对治疗的反应,0表示无反应,1表示完全反应,2表示部分反应,3表示稳定:其余5个指标是皮肤试验的反应面积,ND表示没有做agegendertimeOresponsetime1outcomeMoniliaMumpsPPDPHA53F03/31/77111/01/7707X723X230X025X61M06/18/76008/21/76110X1015X200X013X56F02/01/77310/01/7700X07X70X025X48M12/19/74201/15/7610X00X00X00X55M11/10/75001/15/76112X12ND10X108X62F10/07/74204/05/75110X105X50X07X57M10/28/74001/06/75115X1515X150X00X53M10/06/75206/18/7710X0ND0X012X45M04/11/77010/01/7706X44X40X00X58M08/04/76302/11/77113X1313X1322X2223X61F01/01/77310/01/7700X08X817X1711X61M07/25/76110/01/7703X912X120X020X77M05/08/75009/26/7510X00X00X00X
55M04/27/77210/01/7700X00X015X1510X50M04/20/77310/01/7700X014X145X532X42M08/24/76010/01/77011X117X70X012X50F01/08/75006/30/7510X00X00X00X66F09/08/76310/01/7709X910X106X615X58M02/18/75010/01/7700X00X00X00X62M05/12/76010/17/7612X2NDND3X71F10/22/76312/12/76110X106X60X012X44M06/06/77310/01/77010X1010X100X020X69M06/21/76010/13/7610X015X1525X2525X56M06/07/77210/01/7700X07X70X00X57M11/16/76012/10/76111X115X50X020X69M05/10/77007/25/7710X00X00X015X60M06/29/77007/07/7710X00X00X026X60M07/21/75310/01/77011X1120X2010X1018X72M07/19/75010/18/75110X100X07X710X42F03/03/75004/23/7510X0ND0X00X57M02/24/77210/01/7705X58X80X025X66M06/15/77310/01/7700X015X150X010X59M03/04/77004/02/7710X00X00X016X1选择何种标准进行聚类分析,要依具体数据的实际背景来决定.标准选择是否得当,对于聚类分析效果有直接影响。已知一个二维正态分布总体有分布:现在有两点A=(lj/和现在有两点A=(lj/和B=(l,—lj。若按欧氏距离距离计算,点A与点B到均数的距离同为血。若按马氏距离计算,是否也一样9-2欲以能耗.糖耗将运动项目分类,以便针对不同能耗、糖耗的运动提供不同膳仓,使运动员既能得到能董的补充,又不造成多余的脂肪堆积。某单位对上海划船队6名运动员作了能量代谢测定,得13个项目的平均数如下,试进行分析。运动项目变量名能耗(焦耳/分.M2)糖耗(%)负重下蹲X1高力翻X2提铃X3引体向上X4腰腹转X5手脚并举X6仰卧蹬腿X7快挺X8趴拉X9卧推X10
X11X12X11X12X139-3练习4—1的资料进行变量聚类答案:1.1X与Y的二元正态分布函数:12^0.152*7.522*(1-0.52192)2(l-0.52192)Ll0.15x-1.47y-176.557.52--2xO.5219xx-1.470.15y_176.557.52-TITLE*绘制二元正态分布曲面';GOPTIONSRESET=GLOBALGUNIT=PCTNOBORDERFTEXT二SWISSBHTITLE=6HTEXT=3;DATAex1_1;S1=**2;s2=**2;r=;pi=3.;DOx=TOBY;DOy二-20TO20BY;z=1/(2*pi*SQRT(s1*s2*(1-r*r)))*EXP(-1/2/(1-r*r)*(x*x/s1+y*y/s2-2*r*x*y/SQRT(s1*s2)));OUTPUT;END;END;RUN;/*title'BivariableNormaISurface';*/PROCG3D;PLOTx*y=z/R0TATE=135XTICKNUM二9YTICKNUM二11ZMAX=ZTICKNUM二5;RUN;-1X-•83.39T|70.2627.363bp.5201.2三元正态分布的密度函数:(r83.39lj;3().53O-1)x-70.26 25.53638.859fW= 30.530(2fW= 30.530(2龙)小x25.53619.53239.85920.70327.3631.3证明:Fl“二bl2、<cr21b22,令乂=设X=“+AY〜”2(吃)(丫〜(0,1))
1\、/<i\A\&)Y~N、厶z0,AIJAG)則Z=—~~—=—AY=0+bb心)民)z •\则z~N20,心)民)z •\则z~N20,肱=—AA
b得证。冷克)1.4思路:x与y的90%参考值范围是下列方程的解:1 J(x—165・8338)・1-0.580624.91550^fOg(x_165・8338)(y_53・5694)+(y_53・5691 J(x—165・8338)・1-0.580624.91550^fOg(x_165・8338)(y_53・5694)+(y_53・569盯4.9155x4.89214.89212证明:记》%分别表示变量£的标准差和方差,因£的X」的相关系数◎及协方差%有如下关系:则:s〕rs〕r计2…环阳S2m■•=$22■■…S2SmS2m•••••'mm♦♦SmS2rm2••… ^nuns}0 …0Grn…r\ms、0 …00s2•…0r2X r22 …®0s2…00 0 …5,„_佝乙2…S0 0 …5;„_故得:同=(几屉…%)外练习Title'样本均向量与总体均向量的比较';DATAex2_1;INPUTx1x2x3昶;Y1=x1-4;y2=x2-50;y3=x3-10;Cards;Procanova;Modely1y2y3=/nouni;Manovah二intercept;Run;练习令A=(a1,a2,•••,an-i,aj,B=diag(b1,b2,•••bj对X作线性变换:Z二A+BX则Z=A+BX,V2=BVxB,V;1=(BVxB')J(B‘)“上匹(ZZAV「(ZZ2)=处L(BX,-BX2),(B,厂7?1+n2 nl+n2Vx^1(BX1-BX2)= "心(X1-X2)JBf(B・)・1VxQb(X1-X2)=721+712旦匕(乂厂乂2)'Vx"1(X,-X2)=Txnl+n2得证。3Title"hotellingT?检验与t检验’;Dataex2-3;Inputx@@;G=1;If_n_>14theng二2;Cards;Procttest;Varx;Classg;Run;Procglm;Classg;Modelx=g/nouni;Manovah=g;Run;4Title'多元方差分析:成组分析';DATAex2_4;Inputhwbsex$CARDS;PROCGLM;CLASSsex;MODELhwb=sex/MOUNI;MANOVAH=sex;RUN;练习TITLE'多元方差分析:区组设计':DATAex2_5;INPUTxyab魏;CARDS;175 155 1 1 175 110 2 1 170 110 3 1 170 90 4 1•••••••••105 75 1 10 113 75 2 10 113 75 3 10 113 75 4 10■PROCGLM;CLASSab;MODELxy=ab/NOUNI;MANOVAH=ab;RUN;练习TITLE'多元方差分析:析因设计';DATAex2_6;INPUTx1x2x3abCARDS;1121PROCGLM;CLASSab;MODELx1x2x3=aba*b;均数分别为丙.K2,均数分别为丙.K2,标准差分别为1答:设两样本Y2,样本含量分别为nbn2,不妨设回归方程为:Y=a+bg则当g=1时,r1=a+bg=Y\:当沪0时,Y2=a=Y2a故有b=y2-rio此 时忆(J/_[工厲一«)2+》(5一上2)2_何一1)才+(“2一碍V~n^2V V ~n^2'皿一外=如1一群+呱°一群十一扯5(o-绘),("1-1)/1+(心-1)打/j戸〃2/:-2 *戸i+n2得证。均数2答:TITLE,回归方程F检验与均数之方差分析':DATAex3_2;INPUTygg1g2CARDS;10021 0 30110021 0 30110021 0 30110021 0 301PROCREG;MODELy=g1g2;RUN;PROCANOVA;CLASSg;MODELy=g;RUN;3-3答:TITLE'方差分析模型与线性回归模型'DATAex3_3;DOb=1to5;DOa=1to4;INPUTx00;OUTPUT;END;END;CARDS;PROCANOVA;CLASSab;MODELx=ab;RUN;PROCGLM;CLASSab;MODELx=ab;RUN;3-4答:TITLE”弼选自变量的最优子集":DATAex3_4;INPUTageweightruntimerstpulsemaxpulseoxy;CARDS;44 6217818252 53170172PROCREGRSQUAREMSECPAICADJRSQSELECT二2;MODELoxy=ageweightruntimerstpulserunpulsemaxpulse;run;练习X1X2 X3X4YX1X2X3X4以(2,2)为主元作消去变换,结果如下:X1X2X3X4X1X2X3X4Y以(4,4)为主元作消去变换,结果如下:X1X2X3X4 Y
X1X2X3X4X2 X3X4以(1,1)为主元作消去变换,结果如下:X2 X3X4X1X2X3X4以(2,2)为主元作消去变换,结果如下:X4X1 X2 X3X4X1X2X3X4练习因% -也山一方2£ bm心,U=工加珥,故:TOC\o"1-5"\h\zft -a_ n - -几 工(儿一刃0厂刃工(兀一刃(4+%心+…+5%-y)_yy_z-i f.in质/r.-py-y) "ri 一rr« — 一 —工[®-刃工-®)]工◎[工(x-刃(®-©)]/-I /-1 _;-1j-imm得证。练习TITLE”小学生的身高、年龄和体重的数据”;DATAex3_7;INPUTsex$ageheightweight
CARDS;f143f155f153m164m167m151■9PROCREG0UTEST=est1OUTSSCP二sscpl;BYsex;EQ1:MODELweight=height;EQ2:MODELweight=heightage;PROCPRINTDATA=sscp1;TITLE2”sscp类型的数据集”;PROCPRINTDATA=est1;TITLE2”est类型的数据集”;RUN;练习TITLE*逐步回归';OPTIONLINESIZE=12O;DATAex3_8(TYPE二CORR);_TYPE_=”CORR”;INPUT_name_$x1x2x3x4x5y;CARDS;x1 11・11x31・11x3x4yRUN;PROCSTEPWISE;MODELY=x1x2x3x4x5/SLENTRY=SLSTAY=DETAILS;RUN;练习TITLE'所有子集的回归';DATAex3_9;INPUTx1x2x3x4x5魏;CARDS;28910110910773390026810395101733200285109102104883800276106193103743650
PROCREG;MODELy二x1-x5/SELECTI0N二RSQUAREADJRSQCPMSEAICBEST=1O;RUN;练习TITLE'主成分分析';DATAex4T;INPUTx1-x12;CARDS;465512651 2572 48927836048 68100452370 522289352PROCPRINCOMP;RUN;练习2-1令|Z/3-A|=-p-p-p2-1-p-p-p=0,解得:2-1人=1+2/7兄2二1一。右=1一/?对于人二1+2。<[(l+2p)]/-A]z、ox2=00求得其特征向量为求得其特征向量为求得其特征向量为K“+K<h(K「K?不同时为0)(xx对于Z>=l-p<[(l-p)]/-A]x22练习4-3TITLE'主成分分析'OPTIONLINESIZE=120;DATAex4-3;INPUTmz$x1-x8;CARDS满族毛南族PROCPRINCOMPN=4OUT二COMP;RUNPROCSORTDATA二COMP;BYPRIN1RUNPROCPRINTIDmzVARPRIN1PRIN2X1-X8TITLE'用第一主成分对42个少数民族进行排序':■RUN;练习TITLE'从方差协方差矩阵出发进行主成分分析和因子分析;DATAex4-4(TYPE=COV)OUTPUTa(TYPE二CORR);-TYPE—COV\INPUT-name-$x1~x14;CARDS;PROCPRINCOMP;RUN;5T答:主成分分析与因子分析都是研究多个变量间的互依性,但出发点不同。主成分分析是寻找出能反映原变量信息的综合指标,是对变量共性的一种提取,主成分的个数与原变量数相同,贡献大的主成分常用于评价,或进一步分析,贡献小的主成分常用于判斷变董间的关系。因子分析是寻找出能解释原变量的公共因子,这些公共因子互相独立代表某一方面的特性,
它们不能被测董,但对可测量的变量产生影响,或者说通过这些变量体现出来。因子分析的任务是通过原变量提供的错综复杂的关系,寻找潜在的公共因子,当初始因子不好解释时,常对其作旋转变换。提取公共因子的方法很多,主成分是就常用的提取公共因子的方法之一。因此,很多应用者将主成分和因子分析看成一回爭,这芋片面的。5-2TITLE'因子分析';OPTIONLINESIZE=12O;DATAex5_2;INPUTx1-x12;CARDS;465512651 25724892783604868100452370522289352■/*从原始数据出发,进行因子分析*/PROCFACTORMETHODSN二3ROTATE=VARIMAX;RUN;/*从协方差矩阵出发,进行因子分析*/PROCFACTORCOVMETHODSN=3ROTATE=VARIMAX;RUN;练习TITLE'因子分析与因子旋转';DATAex5_4(TYPE二CORR);_TYPE_=”CORR”;INPUT_name_$x1—x12;CARDS;x1x2x3x41111111111x6x7x8x9x10x11x12/*方差最大正交旋转*/
PROCFACTORMETHOD=PN=4ROTATE=VARIMAXRES;RUN;/*斜交旋转*/PROCFACTORMETHOD=PN=3ROTATE=PROMAXRES;RUN;6-1解:不妨假设回归方程为:logitP=a+ 。(1)ln(O/?)=In几1几=log〃£)_log〃人=a_(a+0)=_05/I-门丿0=In丄可解释为优妙比导数的对数值。OR对例,当x=0时,log/r/J=In-^―=In—= =1.06291-几19当x=1时,Iog〃〃=ln-^=ln£=a+0,0=—1.3107l-/?i 164所以相应的 logistic 回归方程为logitP=ln(O/?)=lnPJ'—P' =(a+0)—(a—0)=200=lnV^可解1宀/1-j丿释为优步比平方根的对数值。当x=1时,logitp.=In卩'=\n—=a+13TOC\o"1-5"\h\z5 1 1-门 19) ]28当x=-1时,logitp.=ln卩-\ =ln^-=&_0I-”.】 164联列上面两式,解得:a=0.4075,0=0.6554所以相应的logistic回归方程为IogitP=+6-2解:Title*logistic回归Dataex6-2;Inputfyx1x2@@;x12=x1*x2;Iablex仁”吸烟否”;Iablex2二"用药否”;cards;1 7 1 1 0 1214 1 1
1 7 1 1 0 12■2■2019Proclogisticdescending;Weightf;ModeIy=x1x2x12;Run;Procsort;byx2;Proclogisticdescending;122010Weightf;ModeIy=x1;Byx2;Run;6-3解:Dataex6~3;Doy=0to1;Docho1to4;Dosbp1to4;InputfOutput;End;End;End;Cards;23343203811667121111117121472285984320119209684367994633Datatemp;Setex6-3;Y=y-1run;s1=0;Ifsbp=2thens1=1s2=0;Ifsbp=3thens2=1s3=0;Ifsbp=4thens2=1c1=0;Ifcho=2thenc1=1c2=0;Ifcho=3thenc2=1c3=0;Ifcho=4thenc2=1s1=0;Ifsbp=2thens1=1s2=0;Ifsbp=3thens2=1s3=0;Ifsbp=4thens2=1c1=0;Ifcho=2thenc1=1c2=0;Ifcho=3thenc2=1c3=0;Ifcho=4thenc2=1Proclogisticdescending;Weightf;ModeIy=sbpcho;;Run;
Proclogisticdescending;Weightf;Modely=s1-s3c1-c3;Testi:tests2-s1=s1;Test2:tests3-s2=s2-s1;Test3:testc2-c1=c1;Test4:Testi:tests2-s1=s1;Test2:tests3-s2=s2-s1;Test3:testc2-c1=c1;Test4:testc3-c2=c2-c1;Run;Run;Dataex6-4;InputidchdageCards;1agrp@@;0Dataex6-4;InputidchdageCards;1agrp@@;0201••• •••34•••0•••3836-4解:350 383 68Run;ProcgpIot;Plotchd*age;Run;/*计算条件均数p*/Procsortout=temp;Byagrp;Procunivariatedata二tempnoprint;Byagrp;Varchd;Outputout二temp2N=nsum=n1mean=p;Run;Procprintdataemp2;Run;data二temp3;settemp2;logitp=log(p/(1-p));run;ProcgpIotdata二temp3;Plotchd*agelogitp*agrp;Run;Proclogisticdescendingdataex6-4;ModeIchd=age;Run;Proclogisticdescendingdataex6-4;Modelchd=agrp;Run;Procregdata二temp3graphics;Modellogitp二agrp;Run;Outputout=temp4predicted=lp;Plotlogitp*agrp;Run;Datatemp5;Settemp4;Pp=exp(lp)/(1+exp(Ip));ProcgpIotdata二temp5;Plotpp*agrp;Run;6-5解:TITLE'多类结果的logistic回归,;DATAex6_5;INPUTyx1x2f;y1=2-y;CARDS;0006580103001701121001301108101111122001562104201142113PROCCATMOD;WEIGHTf;DIRECTx1x2;MODELy1=x1x2/FREQONEWAYCOVBCORRB;RUN;检验睾丸癌与隐睾症的同侧性和异侧性,需比较不同变量之间的系数,SAS无法解决,建议使用stata6-6解:Titleex6-6;InputtreatbangagedressingheaIfreqCards;0000190001400014001021001130012201009010180102601101001111001125RUN;Proclogistiicdescending;101110110110111012012012012Freqfreq;Modelheal=treatbangagedressing/clodds=waId;Run;Proccatmod;Weightfreq;Directtreatbandagedressing;Responsealogits;Modelheal=_response_treatbandagedressing;Run;6-7解:TITLE'1:3配对资料条件logistic回归':DATAex6_7;INPUTmatchobsIowageI毗smokehtuiptI:time=2Tow;CARDS;111161300000120161120000130161351000140169500002911321051000292032121000029303213200002940321341001PROCPHREG;MODELtime*low(0)=lwtsmokehtuiptI/TIES二DISCRETE;
7-2DATAexp7_2;INPUTyx;CARDS;2-1TOC\o"1-5"\h\z3 -10000112115 1■PROCGENMOD;INTERCEPT二MODELy=x/DIST=POISSONLINK二id INITIALINTERCEPT二ITPRINT;Run;T7_3解答DATAex7_3;INPUTyquaIityyanzhengagecenterf;IFquaIity=1Jyanzhneg=1THENbingsi=1;IFquaIity=2IFquaIity二1IFquaIity=2CARDS;3yanzhneg二1Jyanzhneg=2Jyanzhneg=2THENbingsi二2;THENbingsi=3;THENbingsi=4;21140213311022PROCGENMOD;FREQf;MODELy=bingsiagecenter/L
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 夜间临建施工资源配置施工组织方案
- 线上招聘平台广告投放预算审批说明3篇
- 2026年丝绸之路历史宣讲题库
- 2026年高考作文命题趋势及备考策略
- 2026年殡葬系统版殡仪服务人员职业技能考试题
- 可持续发展理念实施承诺书4篇
- 老年痴呆预防护理方案
- 零担物流文员工作总结
- 机械设备维保周期检查执行方案
- 保障物资供应质量承诺责任书5篇范文
- 2026深圳中考历史考前冲刺卷含答案
- 2026哈尔滨兰兴资产运营管理有限公司公开招聘备考题库(含答案详解)
- 卫生院信用管理工作制度
- 2026年新疆投资发展集团有限责任公司校园招聘笔试备考试题及答案解析
- 2026四川省现代种业发展集团成都农业开发有限公司社会化招聘拟人员笔试历年典型考点题库附带答案详解
- 物流公司运输调度工作流程
- DB43-T 3447-2025 烟花爆竹生产企业对标改造技术指南
- ISO 15609-1 2019 金属材料焊接工艺规程和评定-焊接工艺规程-电弧焊(中文版)
- 《锥套锁紧钢筋连接接头》
- 沈阳航空航天大学硕士研究生复试政审表
- 土木工程毕业设计答辩ppt
评论
0/150
提交评论