应用多元统计分析报告SAS作业_第1页
应用多元统计分析报告SAS作业_第2页
应用多元统计分析报告SAS作业_第3页
应用多元统计分析报告SAS作业_第4页
应用多元统计分析报告SAS作业_第5页
免费预览已结束,剩余7页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、标准文案59设在某地区抽取了 14块岩石标本,其中7块含矿,7块不含矿。对每块岩石测 定了 Cu, Ag, Bi三种化学成分的含量,得到的数据如表1。表1岩石化学成分的含量数据类型序号CuAgBi类型序号CuAgBi12.580.90r 0.9582.251.981.0622.901.231.0092.161.801.06含33.551.151.00不102.331.741.10矿42.351.150.79含111.961.481.0453.541.850.79矿121.941.401.0062.702.231.30133.001.301.0072.701.700.48142.781.701.

2、48假定两类样本服从正态分布,使用广义平方距离判别法进行判别归类(先验概率 取为相等,并假定两类样本的协方差阵相等);(2)今得一块标本,并测得其Cu, Ag, Bi的含量分别为2.95,2.15和1.54,试 判断该标本是含矿还是不含矿?问题求解1使用广义平方距离判别法对样本进行判别归类用SAS软件中的DISCRIM过程进 行判别归类。SAS程序及结果如下。data d59;in put group x1-x3;cards ;1 2.58 0.9 0.951 2.9 1.23 11 3.55 1.15 11 2.35 1.15 0.791 3.54 1.85 0.791 2.7 2.23 1

3、.31 2.7 1.7 0.482 2,25 1.98 1.062 2.16 1.8 1.062 2.33 1.74 1.12 1.96 1.48 1.042 1.94 1.4 123 1.3 12 2.78 1.7 1.485proc print data =d59;run ;proc discrim data =d59 pool =yes distanee list class group;var x1-x3;run ;大全SAS系统M proup的甲方廉苦121& 21S7742 3 1B774 QiF 雄计虬 N|ih-3f UUF-IOCK Moup 的甲方Alkgroup1

4、21Q3.1DSS12310SM0W* > M wroup韵半方码氏量画Mfirdup1?.11 COX' 0 临2 CX OT56 IDOCC A roup的广义甲方距直跟 grQLtp 1210319774? 3 八3774以节对81前嵯愕判网画韩tircup12-21 11050le. 737A7Xl13 76351IQJ1 瓶X2S 21204 i:凶 MO日勺11 3310Bie A577SSAS系统DJSCHIH 述程战卜鞭淮魅随的枯冥城集WORK Db9便JB门下血的垂结草Aksrouo料青group1z11Q 箭 55 C 34*152»10广伽0 22

5、763110 071 fi 0 Q26tA11o 63ir: 0 BD75110. B64I 9013yGI2*0 12B0 Q 87107i109541 ,822U 1243 0 8TJ79220 1057 0 99331022Q. 1533 0 84071122Q0797 0 921312220 0B5 0 DCH41321 *CL Si 9A0.1&021422CL 0935 0.3015木谍井类的璇加由输出结果可知,两总体间的广义平方距离为D=3.19774。还可知两个三元 总体均值相等的检验结果:D=3.19774 , F=3.10891 , p=0.0756<0.10

6、,故在显 性水平=0.10时量总体的均值向量有显著差异,即认为讨论这两个三元总体的 判 别问题是有意义的。线性判别函数为:¥ Z1. 31.1105 13.7895CU 8.2120Ag 11.3311 Bi,YA - -28.7375 10.3139Cu 8.9904Ag 16.8578BI.判别结果为含矿的6号样本错判为不含矿;不含矿的13号样本错判为含矿2对给定样本判别归类将Cu, Ag, Bi的含量数值2.95、2.15、1.54分别代入线性判别函数得:Y =44.6742,匕=46.97888贝叶斯判别的解D一 D;I I ,D为D; AX|YX)Yj(X),jH,j=1,

7、1 山 k”t” 川,k),由于Y =44.67422% =46.97888因此待判的样品判为不含矿。5-10已知某研究对象分为三类,每个样品考察4项指标,各类的观测样品数分别 为7,4,6 ;类外还有3个待判样品(所有观测数据见表2)。假定样本均来自正态总 体。表2判别分类的数据样品号XiX2%X4类别号123 45678910111213141516176.0-11.090.2-4.00.00.5-10.00.020.0-100.0-100.013.0-5.010.0-8.00.6-40.0-11.5-18.5-17.0-15.0-14.0-11.5-19.0-23.0-22.0-21.4

8、-21.5-17.2-18.5-18.0-14.0-13.0-20.019.025.017.013.020.019.021.05.08.07.015.018.015.014.016.026.022.090.0 1-36.03.054.035.037.0-42.0-35.0-20.0-15.0-40.02.018.050.056.021.0-50.0CO (XJ(XI CO CO lCO lCMCMlllCOCOT-123-8.092.2-14.0-14.0-17.0-18.516.018.025.056.03.0-36.0试用马氏距离判别法进行判别分析,并对 3个待判样品进行判别归类。(2)使

9、用其他的判别法进行判别分析,并对3个待判样品进行判别归类,然 后比较之。问题求解1判别分析及判别归类使用SAS软件中的DISCRIM过程进行判别归类,SAS程序及结果如下 data d510;in put x1 -x4 group ;cards ;6-11.5-11 18.5192590 1-36 390.2-17 1732-4 -15 135410-14 2035 20.5-11.51937 3-10-1921-42 30-23 5-35 120 -22 8-20 3-100-21.47-15 1.100-21.515-40 213 -17.21822-5 -18.51518 110 -18

10、 14501-8 -14 165610.6-13 26213-50 356.3.25 -36.data =d510 simple-40 -20 22-8 -14 1692.2-17 18-14-18.55proc pri nt;run ;proc discrim pcov wsscp psscp wcov dista nee list class group;var x1-x4;SAS系统SAS系统DISCRIM iMfill*大小17总自由度DISCRIM 过程以下校准数18的分类结H: WORK 0510便用以下龙 的歪新哲*结黑堤性判剧再数164分类内自由废14成员的后idlSAxrou

11、p分类 一 3分类间自由度2Akgroup 分为 qrwp1231110 9812 0 0184 0COJ4读取的观测数20233OttOJ 0 1401 QS599使用的溟测数173220C019 0 0473 Q 43034110 9604 0 02B8 0 COM分类水平信G5220 0975 0 6672 a 2353group名徐疑 ttX比例先益俺 率6330CCG5 Q4128 058377330CCO3 0 1弓|1 a 64851 J7 7 0020 0 4117650333333812 »0 4274 0 5195 0 C6322 _24 4 01X0 0 235

12、2940332333931 «0 5048 0 4582 0 CG703 .36 6 OCCO 0 9529410. 93333310110 9762 0 0229 0 CO%1122Q 1728 0 0807 Q2 切DISCRIM 过健M group的甲方捷12220 02050 6296 0 949&1311o85600 1367 0 0073ALgroup12314110 8980 ooceo ooooo10 10523 12.沏.1511a 90330.C618 Q004826 1C62301.3*1216330 0X5 0MCG 0 73603 12 89173

13、1 3401201733a 03010.1609 Q 9330F 纽i十 NDF DDT-11 < W group 的平方Akgroup1218-1 M 0 90330 CfilS 0 00483103. C626I&1812»192 X0 00160 5301 0 468323 C626I00 6317?203 X OCDOO 0 1420 0 858038 181290 631770,误分类的农iMdiscrim过理分宴内侮方釜矩阵X1Aroup = I. DF = 6X4321.604762group -2 DF - 3xlI4S3. C623&X267

14、311905X3 97.190476xlx2x3x4x267 31100616 8306241ft 619043vl174 123810 Xl6100 $26867149.596667?Q 4666671432 20COXIx33 193761&61&W824 MK22(M 3»A52 x21-49. 5866679.5225038.21686794 986667x4821. KM7«2174 12381023. 39C&521039. 476110 x370 4666876.2a66674.33333362 333333x41432 2000009

15、4 86886782.393393946 000000group = 3.OF = 5sroup的早方JE?I3£9xlx2X3X4Mnroup12xl391.255CC09 67COOO-75 06COOO389 720X0106.1052312.89173x29. 6?axo17 16666712 66666?129 10OOOO26 1C52301 34012x3F. 05XC012 66666742 1666674 40(XX»3 12 的 1731.340120X4珈 72OC0129 IvXCOOq4X081284 COCOZO15聿至小roup的平方马氏距离从

16、 group123103C626181912923 C626100 6317738191290 631770F 统计试.NRF 二 4. DDF 二 11group 的年方 3EX >AKgroup12311 00300 06410 0IT620 06411.00000 650130 00260 65011 0000从结果来看,样本2、3类之间的马氏距离为02=1.34,检验H。(2)二(3)的F统计量为0.63177,相应的p=0,651>0.10,故在显著性水平:=0.10时量总体2、3 类的均值向量没有显著差异,即认为对讨论样本分为2、3类的判别问题是没有太 大意义的。此外,

17、判别结果中两个样本被判错归类:1类中8号样本应属于2类,2类中9 号样本应属于1类;且待判得三个样本分别属于1 , 2, 3类。2二次判别函数判别由第一问SAS运行结果可知三个总体的协方差阵不同,因此使用二次判别函数 进行判别。此时贝叶斯判别的解I I , Dks为Dt:x|Zt(x)Zj(x),j=tj,,r,k”t=i,川,k),其中Zj(X) =1 nqfj(X)d。冷21 nqln $ ch(X)将第一问中SAS程序proc discrim data=d510后加入pool=no,使其采用 二次 判别函数进行再分类,变动部分程序如下: proc discrim data =d510 s

18、imple pool =nodista nee list;程序运行结果如下图。SAS系统DISCRIM mMg roup 分Algroojp123t11 OJOtJODimt) 0000733 0X00. ccx1 QQQO322 IXJOO1. DUDQ auoo41t rrmamr522QOOOD1.DODOUOIOJ6330 00000 00001 00007330 CrXiOo. oca.1.J30008110 715S0. QOOOo>L?9著3a 39110. QQOO o g10111 00000 00000 0000It22D0000i ocmaOIKO12220 IJK

19、X:0即40 000313111 OCiX0. OCOO 0 co%14111 0必0 OCDD D 00C015111 OClXi0 OCOD 0 i jXC1633u 丁双QQIJI) 1 (XXL1733o n rr r0 MOD 1 TOj181*1 UMU UL JO JJJ219.11 oxc0 0000 0 ooco203*0 J 3XQQOOO 1 0(X0由此可知17个观测全部判别正确;待判的三个观测依次判归1,1,3类5-11某城市的环保监测站与1982年在全市均匀地布置了 14个监测点,每日三年次 定时抽取大气样品,测量大气中的二氧化硫、氮氧化物和飘尘的含量。前后5天,每

20、 个取样点(监测点)每种污染元素实测15次,取15次实测值的平均作为该取样点 的大气污染元素的含量(数据见表3)。表中最后一列给出的类号是使用第六章将介绍的聚类分析方法分析得到的结果(第1类为严重污染地区,第2类为一般污染地区,第3类为基本没有污染地区)。表3大气污染数据样品号号、二氧化硫 (X)氮氧化物(X)飘尘(X0类别10.0450.0430.265220.0660.0390.264230.0940.0610.194240.0030.0030.102350.0480.0150.106360.2100.0660.263170.0860.0720.274280.1960.0720.21119

21、0.1870.0820.3011100.0530.0600.2092110.0200.0080.1123120.0350.0150.1703130.2050.0680.2841140.0880.0580.2152150.1010.0520.181160.0450.0050.122(1)试用广义平方距离判别法建立判别准则(假设三个总体为多元正态总体, 其协方差阵相等,先验概率取为各类样本的比例),并列出回判结果。(2)该城市另有两个单位在同一期间测定了所在单位大气中这三种污染元素 的含量(见表3中最后两行),试用马氏距离判别方法判断这两个单位的污染情 况 属于哪一类。问题求解 用SAS软件中的D

22、ISCRIM过程进行判别归类。 data d511;in put x1-x3 group ;cards ;0.0450.0430.26520.0660.0390.26420.0940.0610.19420.0030.0030.10230.0480.0150.10630.2100.0660.26310.0860.0720.27420.1960.0720.21110.1870.0820.30110.0530.0600.20920.0200.0080.11230.0350.0150.17030.2050.0680.28410.0880.0580.21520.1010.0520.1810.0450.0

23、050.1225procrun ;print;procdiscrimdata =d511 simple dista nee list;class group;var x1-x3;SAS系统SAS系统QISCRIU 过程DISCRIM in以下杭淮数IB药骨矣结黑WOftK D51»便用取下IS的辈浙管揍结果域性判财邑数虚贵的后虢1EE率坐rcunfit group的半方挺裁乩言寸岬1231056S39G3 121 03535256 &O933D 33. <7«43124 03535 3340葱40F墉计孔NMP, DQF=?Hrog的平右JE禹】 从Hruup 1231037 2 函 3807 055S5237 24S3E021 8SS82307 B55S52, 930820概率SI gr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论