版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021年7月13日MATLAB和R软件1 第五讲第五讲 MATLAB数理统计数理统计 2021年7月13日MATLAB和R软件2 引言引言 数理统计研究的对象是受随机因素影响的数据数理统计研究的对象是受随机因素影响的数据 数据样本少则几个,多则成千上万,人们希望能用数据样本少则几个,多则成千上万,人们希望能用 少数几个包含其最多相关信息的数值来体现数据样少数几个包含其最多相关信息的数值来体现数据样 本总体的规律。本总体的规律。 面对一批数据如何进行描述与分析,需要掌握参数面对一批数据如何进行描述与分析,需要掌握参数 估计和假设检验这两个数理统计的最基本方法。估计和假设检验这两个数理统计的最基
2、本方法。 我们将用我们将用MATLAB 的统计工具箱的统计工具箱(Statistics Toolbox) 来实现数据的统计描述和分析。来实现数据的统计描述和分析。 2021年7月13日MATLAB和R软件3 频数表和直方图 一组数据(样本)往往是杂乱无章的,作出它的频一组数据(样本)往往是杂乱无章的,作出它的频 数表和直方图,可以看作是对这组数据的一个初步数表和直方图,可以看作是对这组数据的一个初步 整理和直观描述。整理和直观描述。 将数据的取值范围划分为若干个区间,然后统计这将数据的取值范围划分为若干个区间,然后统计这 组数据在每个区间中出现的次数,称为频数,由此组数据在每个区间中出现的次数
3、,称为频数,由此 得到一个频数表。以数据的取值为横坐标,频数为得到一个频数表。以数据的取值为横坐标,频数为 纵坐标,画出一个阶梯形的图,称为直方图,或频纵坐标,画出一个阶梯形的图,称为直方图,或频 数分布图。数分布图。 若样本容量不大,能够手工作出频数表和直方图,若样本容量不大,能够手工作出频数表和直方图, 当样本容量较大时则可以借助当样本容量较大时则可以借助MATLAB 这样的软件这样的软件 了。了。 2021年7月13日MATLAB和R软件4 例1 学生的身高和体重 学校随机抽取学校随机抽取100名学生,测量他们的身高和体重,名学生,测量他们的身高和体重, 所得数据如表所得数据如表 身高
4、体重 172 75 171 62 166 62 160 55 155 57 173 58 166 55 170 63 167 53 173 60 身高 体重 169 55 168 67 168 65 175 67 176 64 168 50 161 49 169 63 171 61 178 64 身高 体重 169 64 165 52 164 59 173 74 172 69 169 52 173 57 173 61 166 70 163 57 身高 体重 171 65 169 62 170 58 172 64 169 58 167 72 175 76 164 59 166 63 169 54
5、 身高 体重 167 47 168 65 165 64 168 57 176 57 170 57 158 51 165 62 172 53 169 66 2021年7月13日MATLAB和R软件5 数据输入 两种方法 一种是在交互环境中直接输入 如果在统计中数据量比较大,这样作不太方便; 另一种办法是先把数据写入一个纯文本数据 文件data.txt中,数据列之间用空格键或Tab 键分割,该数据文件data.txt存放在 matlabwork子目录下,在MATLAB中用load 命令读入数据 具体作法是:load data.txt 这样在内存中建立了一个变量data,它是一个数 据矩阵。 202
6、1年7月13日MATLAB和R软件6 作频数表及直方图 用hist命令实现,其用法是:N,X = hist(Y,M) 数组(行、列均可)Y的频数表 它将区间min(Y),max(Y)等分为M份(缺省 时M设定为10),N返回M个小区间的频数, X返回M个小区间的中点。 hist(Y,M) 数组Y的直方图。 2021年7月13日MATLAB和R软件7 例1的程序 load data.txt; high=data(:,1:2:9);high=high(:); weight=data(:,2:2:10);weight=weight(:); n1,x1=hist(high) n2,x2=hist(we
7、ight) subplot(1,2,1) hist(high) subplot(1,2,2) hist(weight) 2021年7月13日MATLAB和R软件8 例2 统计字符出现的频数 统计下列五行字符串中字符统计下列五行字符串中字符a、g、c、t出现的频数出现的频数 1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggagg 2.cggaggacaaacgggatggcggtattggaggtggcggactgttcgggga 3.gggacggatacggattctggccacggacggaaaggaggacacggcggacat
8、aca 4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagctta 5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggc 2021年7月13日MATLAB和R软件9 例例2的程序的程序 clc fid1=fopen(shuju.txt,r); i=1; while (feof(fid1) data=fgetl(fid1); a=length(find(data=97); b=length(find(data=99); c=length(find(data=103); d=length(
9、find(data=116); e=length(find(data=973 4 5; Y=mean(X) Y = 1.5000 2.5000 3.5000 Y=mean(X,2) Y = 1 4 2021年7月13日MATLAB和R软件15 计算统计量的函数计算统计量的函数 样本方差样本方差:var 调用格式调用格式: (1)Y=var(X) (2)Y=var(X,1) 用用n-1标准化标准化 用用n标准化标准化 X=4 -2 1;9 5 7; Y=var(X) Y = 12.5000 24.5000 18.0000 Y=var(X,1) Y = 6.2500 12.2500 9.0000
10、2021年7月13日MATLAB和R软件16 计算统计量的函数计算统计量的函数 样本标准差样本标准差:std 调用格式调用格式: (1)Y=std(X) (2)Y=std(X,1) X=4 -2 1;9 5 7; Y=std(X) Y = 3.5355 4.9497 4.2426 Y=std(X,1) Y = 2.5000 3.5000 3.0000 2021年7月13日MATLAB和R软件17 计算统计量的函数计算统计量的函数 协方差矩阵协方差矩阵:cov 调用格式调用格式: (1)C=cov(X) (2)C=cov(X,Y) (3)C=cov(X,1) (4)C=cov(X,Y,1) X=
11、-1 1 2;-2 3 1;4 0 3; Y=cov(X) Y = 10.3333 -4.1667 3.0000 -4.1667 2.3333 -1.5000 3.0000 -1.5000 1.0000 2021年7月13日MATLAB和R软件18 计算统计量的函数计算统计量的函数 相关系数相关系数:corrcoef 调用格式调用格式: R=corrcoef(X) 中心矩中心矩:moment 调用格式调用格式: M=moment(X,order) X=-1 1 2;-2 3 1;4 0 3; Y=corrcoef(X) Y = 1.0000 -0.8486 0.9333 -0.8486 1.0
12、000 -0.9820 0.9333 -0.9820 1.0000 Y=moment(X,3) Y = 11.4074 0.7407 0 2021年7月13日MATLAB和R软件19 参数估计与假设检验参数估计与假设检验 最大似然估计和区间估计最大似然估计和区间估计:mle 调用格式调用格式: (1)phat=mle(dist,data) (2)phat,pci=mle(dist,data,alpha) data=0.9501,0.2311,0.6068,0.4860,. 0.8913,0.7621,0.4565,0.0185,0.8214,0.4447; phat=mle(normal,da
13、ta) phat = 0.5669 0.2835 正态分布的均值和均方差正态分布的均值和均方差 的最大似然估计的最大似然估计 2021年7月13日MATLAB和R软件20 参数估计与假设检验参数估计与假设检验 单总体的单总体的U检验检验:ztest 调用格式调用格式: (1)H=ztest(X,m,sigma) (2)H=ztest(X,m,sigma,alpha) (3)H=ztest(X,m,sigma,alpha,tail) (4)H,p=ztest(.) (5)H,p,ci=ztest(.) 例例3 某车间用一台包装机包装糖果。包某车间用一台包装机包装糖果。包 得的袋装糖重是一个随机变
14、量,它服从得的袋装糖重是一个随机变量,它服从 正态分布。当机器正常时,其均值为正态分布。当机器正常时,其均值为 0.5公斤,标准差为公斤,标准差为0.015公斤。某日开公斤。某日开 工后为检验包装机是否正常,随机地抽工后为检验包装机是否正常,随机地抽 取它所包装的糖取它所包装的糖9袋,称得净重为(公袋,称得净重为(公 斤):斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512,问机器是否正常?问机器是否正常? 解:总体解:总体已知,已知,XN (,.0152),未知。于是提出假设未知。于是提出假设H0:=0.500和和H1: 0.5
15、。 Matlab实现如下:实现如下: x=0.497 0.506 0.518 0.524 0.498. 0.511 0.520 0.515 0.512; h,p,ci=ztest(x,0.5,0.015) 求得求得h=1,p=0.0248,说明在,说明在0.05的水平下,可拒绝原假设,即认为这天包装机的水平下,可拒绝原假设,即认为这天包装机 工作不正常。工作不正常。 2021年7月13日MATLAB和R软件21 参数估计与假设检验参数估计与假设检验 单总体的单总体的t检验检验:ttest 调用格式调用格式: (1)H=ttest(X) (2)H=ttest(X,m) (3)H=ttest(.,
16、alpha) (4)H=ttest(.,tail) (5)H,p=ttest(.) (6)H,p,ci=ttest(.) 例例4 某种电子元件的寿命某种电子元件的寿命x (以小时计以小时计)服从服从 正态分布正态分布, , 2均未知均未知.现得现得16只元件的寿只元件的寿 命如下命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命大于问是否有理由认为元件的平均寿命大于 225(小时小时)? 解解 按题意需检验按题意需检验 H0: 225 , 取取 = 0.05。Matlab实现如
17、下:实现如下: x=159 280 101 212 224 379 179 264 . 222 362 168 250 149 260 485 170; h,p,ci=ttest(x,225,0.05,1) 求得求得h=0,p=0.2570,说明在显著水平为,说明在显著水平为0.05的情况下,不能拒绝原假设,认为的情况下,不能拒绝原假设,认为 元件的平均寿命不大于元件的平均寿命不大于225小时。小时。 2021年7月13日MATLAB和R软件22 参数估计与假设检验参数估计与假设检验 双总体的双总体的t检验检验:ttest2 调用格式调用格式: (1)H=ttest2(X,Y) (2)H=tt
18、est2(X,Y,alpha) (3)H=ttest2(X,Y,alpha,tail) (4)H,p=ttest2(.) (5)H,p,ci=ttest2(.) 例例5 在平炉上进行一项试验以确定改变操作方法的建在平炉上进行一项试验以确定改变操作方法的建 议是否会增加钢的得率议是否会增加钢的得率,试验是在同一平炉上进行的。试验是在同一平炉上进行的。 每炼一炉钢时除操作方法外每炼一炉钢时除操作方法外,其它条件都可能做到相其它条件都可能做到相 同。先用标准方法炼一炉同。先用标准方法炼一炉,然后用建议的新方法炼一然后用建议的新方法炼一 炉炉,以后交换进行以后交换进行,各炼了各炼了10炉炉,其得率分别
19、为其得率分别为 1标准方法标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.6 76.7 77.3 2新方法新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1 设这两个样本相互独立且分别来自正态总体设这两个样本相互独立且分别来自正态总体N(1, 2) 和和N(2, 2),1, 2, 2均未知,问建议的新方法能否均未知,问建议的新方法能否 提高得率提高得率?(取取 = 0.05) 解解 (i)需要检验假设)需要检验假设H0: 1=2 ,H1:1 X=binocdf(0:20,20,0.5); H,p,k,
20、c=kstest(X,0.05,0) H = 1 p = 2.8173e-005 k = 0.5000 c = 0.2873 X服从二项分布服从二项分布,不不 服从标准正态分布服从标准正态分布, 拒绝原假设拒绝原假设 2021年7月13日MATLAB和R软件24 非参数假设检验非参数假设检验 例例6 下面列出了下面列出了84 个伊特拉斯坎个伊特拉斯坎 (Etruscan)人男子的头颅的最大宽度)人男子的头颅的最大宽度 (mm),试检验这些数据是否来自正态总),试检验这些数据是否来自正态总 体(取体(取 = 0.1)。 141 148 132 138 154 142 150 146 155 15
21、8 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 141 136 140 146 142 137 148 154 137 139 143 140 131 143 141 149 148 135 148 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142 140 137 152 145 mi
22、n(x),max(x) %求数据中的最小数和最大数求数据中的最小数和最大数 hist(x,8) %画直方图画直方图 fi=length(find(x=135 求得皮尔逊统计量求得皮尔逊统计量chisum=1.9723, 0.1 2(7-2-1)= 0.1 2(4) =7.7794,故在水平,故在水平0.1下接受下接受 H0 ,即认为数据来自正,即认为数据来自正 态分布总体。态分布总体。 2021年7月13日MATLAB和R软件25 非参数假设检验非参数假设检验 双样本双样本K-S检验检验:kstest2 调用格式调用格式: (1)H=kstest2(X1,X2) (2)H=kstest2(X1
23、,X2,alpha) (3)H=kstest2(X1,X2,alpha,tail) (4)H,p,ksstat,cv=kstest2(.) X=-1:1:5; Y=randn(20,1); H,p,k=kstest2(X,Y) H = 1 p = 0.0219 k = 0.6143 Y是由是由randn生成的生成的 正态分布随机数正态分布随机数,拒拒 绝绝X和和Y具有相同的具有相同的 分布的假设分布的假设 2021年7月13日MATLAB和R软件26 非参数假设检验非参数假设检验 符号检验符号检验:signtest 调用格式调用格式: (1)p=signtest(X) (2)p=signtes
24、t(X,m) (3)p=signtest(X,Y) (4)p=signtest(.,alpha) (5)p,H=signtest(.) (6)p,H,stats=signtest(.) X=normrnd(0,1,20,1); Y=normrnd(0,2,20,1); p,H=signtest(X,Y,0.05) p = 0.8238 H = 0 不能拒绝原假设不能拒绝原假设 2021年7月13日MATLAB和R软件27 非参数假设检验非参数假设检验 秩和检验秩和检验:ranksum 调用格式调用格式: (1)p=ranksum(X,Y) (2)p=ranksum(X,Y,alpha) (3)
25、p,H=ranksum(.) (4)p,H,stats=ranksum(.) 例例7 某商店为了确定向公司某商店为了确定向公司A或公司或公司B 购买某种购买某种 产品,将产品,将A,B公司以往各次进货的次品率进行比公司以往各次进货的次品率进行比 较,数据如下所示,设两样本独立。问两公司的较,数据如下所示,设两样本独立。问两公司的 商品的质量有无显著差异。设两公司的商品的次商品的质量有无显著差异。设两公司的商品的次 品的密度最多只差一个平移,取品的密度最多只差一个平移,取 = 0.05。 A:7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5 B :5.7 3.2
26、 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3 解解 分别以分别以A、B记公司记公司A、B 的商品次品率总体的均值。所需检验的假设是的商品次品率总体的均值。所需检验的假设是 H0: A=B,H1:AB . Matlab实现如下:实现如下: a=7.0 3.5 9.6 8.1 6.2 5.1 10.4 4.0 2.0 10.5; b=5.7 3.2 4.2 11.0 9.7 6.9 3.6 4.8 5.6 8.4 10.1 5.5 12.3; p,h=ranksum(a,b) 求得求得p=0.8041,h=0,表明两样本总体均值相等的概率为,表明两
27、样本总体均值相等的概率为0.8041,并不很接近于零,并不很接近于零, 且且h=0说明可以接受原假设,即认为两个公司的商品的质量无明显差异。说明可以接受原假设,即认为两个公司的商品的质量无明显差异。 2021年7月13日MATLAB和R软件28 方差分析方差分析 单因素方差分析单因素方差分析:anova1 调用格式调用格式: (1)p=anova1(X) (2)p=anova1(X,group) (3)p=anova1(X,group,displayopt) (4)p,table=anova1(.) (5)p,table,stats=anova1(.) X=2.1650 3.6961 1.55
28、38 3.6400 4.9551 1.6268 2.0591 2.2988 3.8644 4.2011 1.0751 3.7971 4.2460 2.6507 4.2348 1.3516 2.2641 2.3610 2.7296 5.8617 0.3035 2.8717 3.5774 4.9846 4.9438; p=anova1(X) p = 5.9952e-005 2021年7月13日MATLAB和R软件29 方差分析方差分析 方差分析方差分析 2021年7月13日MATLAB和R软件30 例例8 用用4种工艺生产灯泡,从各种工艺制成的灯泡中各抽出了若干个测量其寿种工艺生产灯泡,从各种工艺
29、制成的灯泡中各抽出了若干个测量其寿 命,结果如下表,试推断这几种工艺制成的灯泡寿命是否有显著差异。命,结果如下表,试推断这几种工艺制成的灯泡寿命是否有显著差异。 工艺工艺 序号序号 A1A2A3A4 1162015801460 1500 21670 160015401550 31700164016201610 4175017201680 51800 解解 编写程序如下:编写程序如下: x=1620 1580 1460 1500 1670 1600 1540 1550 1700 1640 1620 1610 1750 1720 1680 1800; x=x(1:4),x(16),x(5:8),x
30、(9:11),x(12:15); g=ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4); p=anova1(x,g) 求得求得 0.01p=0.0331 X=5.5 4.5 3.5 5.5 4.5 4.0 6.0 4.0 3.0 6.5 5.0 4.0 7.0 5.5 5.0 7.0 5.0 4.5; p=anova2(X,3) p = 0.0000 0.0001 0.7462 2021年7月13日MATLAB和R软件32 方差分析方差分析 方差分析方差分析 2021年7月13日MATLAB和R软件33 例例9 一火箭使用了一火箭使用了4种燃料,种燃料
31、,3种推进器作射程试验,每种燃料与每种推进器的种推进器作射程试验,每种燃料与每种推进器的 组合各发射火箭组合各发射火箭2次,得到结果如下:次,得到结果如下: B1B2B3 A158.2,52.6 56.2,41.265.3,60.8 A249.1,42.854.1,50.551.6,48.4 A360.1,58.370.9,73.239.2,40.7 A475.8,71.5 58.2,51.048.7,41.4 试在水平试在水平0.05下,检验不同燃料(因素下,检验不同燃料(因素A)、不同推进器(因素)、不同推进器(因素B )下的射程是)下的射程是 否有显著差异?交互作用是否显著?否有显著差异
32、?交互作用是否显著? 方差分析方差分析 2021年7月13日MATLAB和R软件34 解解 编写程序如下:编写程序如下: clc,clear x0=58.2,52.6 56.2,41.2 65.3,60.8 49.1,42.8 54.1,50.5 51.6,48.4 60.1,58.3 70.9,73.2 39.2,40.7 75.8,71.5 58.2,51.0 48.7,41.4; x1=x0(:,1:2:5);x2=x0(:,2:2:6); for i=1:4 x(2*i-1,:)=x1(i,:); x(2*i,:)=x2(i,:); end p=anova2(x,2) 求得求得p=0.
33、0035 0.0260 0.001,表明各试验均值相等的概率都为小概率,故,表明各试验均值相等的概率都为小概率,故 可拒绝均值相等假设。即认为不同燃料(因素可拒绝均值相等假设。即认为不同燃料(因素A)、不同推进器(因素)、不同推进器(因素B) 下的射程有显著差异,交互作用也是显著的。下的射程有显著差异,交互作用也是显著的。 2021年7月13日MATLAB和R软件35 回归分析回归分析 线性回归线性回归:regress 调用格式调用格式: (1)B=regress(Y,X) (2)B,BINT=regress(Y,X) (3)B,BINT,R=regress(Y,X) (4)B,BINT,R,
34、RINT= regress(Y,X) (5)B,BINT,R,RINT,stats= regress(Y,X) (6).=regress(Y,X,alpha) 2021年7月13日MATLAB和R软件36 回归分析回归分析 X=1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 1 10; Y=11.1165 12.0627 13.0075 14.0352 14.9303 16.1696 17.0059 18.1797 19.0264 20.0872; b,bint=regress(Y,X,0.05) b = 10.0456 1.0030 bint = 9.9165 10.
35、1747 0.9822 1.0238 回归分析回归分析 2021年7月13日MATLAB和R软件37 例例10 合金的强度合金的强度y 与其中的碳含量与其中的碳含量x有比较密切的关系,今从生产中收集了一批有比较密切的关系,今从生产中收集了一批 数据如下表:数据如下表: x 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 y 42.0 41.5 45.0 45.5 45.0 47.5 49.0 55.0 50.0 试先拟合一个函数试先拟合一个函数y(x),再用回归分析对它进行检验。,再用回归分析对它进行检验。 解解 先画出散点图:先画出散点图: x=0.
36、1:0.01:0.18; y=42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0; plot(x,y,+) 可知可知y 与与x大致上为线性关系。大致上为线性关系。 用用regress和和rcoplot编程如下:编程如下: clc,clear x1=0.1:0.01:0.18; y=42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0; x=ones(9,1),x1; b,bint,r,rint,stats=regress(y,x); b,bint,stats,rcoplot(r,rint) 设回归模型为设回归模型为 y=0 +
37、1x 得到得到 b =27.4722 137.5000 bint =18.6851 36.2594 75.7755 199.2245 stats =0.7985 27.7469 0.0012 即即0=27.4722,1=137.5000, 0的置信区间是的置信区间是18.6851,36.2594 , 1的置信区间是的置信区间是75.7755,199.2245; R2 = 0.7985,F = 27.7469, p = 0.0012。 可知模型成立可知模型成立 观察命令观察命令rcoplot(r,rint)所画的残差分布,所画的残差分布, 除第除第8个数据外其余残差的置信区间均个数据外其余残差的
38、置信区间均 包含零点,第包含零点,第8个点应视为异常点,将个点应视为异常点,将 其剔除后重新计算,可得其剔除后重新计算,可得 b =30.7820 109.3985 bint =26.2805 35.2834 76.9014 141.8955 stats =0.9188 67.8534 0.0002 应该用修改后的这个结果。应该用修改后的这个结果。 2021年7月13日MATLAB和R软件38 例例:若若x=2,3,4,5,6,7,8,9,10,11,12,13,14,15,16, y=6.42,8.2,9.58,9.5,9.7,10,9.93,9.99,10.49,10.59,10.6,10
39、.8,10.6,10.9,10.76; 用用 进行拟合进行拟合. x ba y 11 回归分析回归分析 非线性回归非线性回归:nlinfit 调用格式调用格式: (1)beta=nlinfit(X,Y,fun,beta0) (2)beta,R,J=nlinfit(X,Y,fun,beta0) 先创建函数先创建函数: function y=f(beta,x) a=beta(1); b=beta(2); y=x./(a.*x+b); 2021年7月13日MATLAB和R软件39 回归分析回归分析 在命令窗口输入在命令窗口输入: x=2:16; y=6.42,8.2,9.58,9.5,9.7,10,
40、9.93,9.99,10.49,. 10.59,10.6,10.8,10.6,10.9,10.76; beta0=0.1,0.1; beta=nlinfit(x,y,f,beta0) beta = 0.0845 0.1152 拟合函数是拟合函数是 xy 1152. 0 0845. 0 1 回归分析回归分析 2021年7月13日MATLAB和R软件40 例例11 在研究化学动力学反应过程中,建立了一个反应速度和反应物含量在研究化学动力学反应过程中,建立了一个反应速度和反应物含量 的数学模型,形式为的数学模型,形式为 其中其中1,5是未知的参数,是未知的参数,x1, x2, x3是三种反应物(氢,
41、是三种反应物(氢,n戊烷,异构戊烷)戊烷,异构戊烷) 的含量,的含量, y 是反应速度。今测得一组数据如下表,试由此确定参数是反应速度。今测得一组数据如下表,试由此确定参数1,5, 并给出其置信区间。并给出其置信区间。1,5的参考值为(的参考值为(0.1,0.05,0.02,1,2)。)。 序号序号 反应速度反应速度y 氢氢 x1 n戊烷戊烷x2 异构戊烷异构戊烷 x3 1 8.55 470 300 10 2 3.79 285 80 10 3 4.82 470 300 120 4 0.02 470 80 120 5 2.75 470 80 10 6 14.39 100 190 10 7 2.5
42、4 100 80 65 序号序号 反应速度反应速度y 氢氢 x1 n戊烷戊烷x2 异构戊烷异构戊烷 x3 8 4.35 470 190 65 9 13.00 100 300 54 10 8.50 100 300 120 11 0.05 100 80 120 12 11.32 285 300 10 13 3.13 285 190 120 回归分析回归分析 2021年7月13日MATLAB和R软件41 解解 首先,以回归系数和自变量为输入变量,将要拟首先,以回归系数和自变量为输入变量,将要拟 合的模型写成函数文件合的模型写成函数文件huaxue.m: function yhat=huaxue(be
43、ta,x); yhat=(beta(4)*x(2)-x(3)/beta(5)./(1+beta(1)*x(1)+. beta(2)*x(2)+beta(3)*x(3); 然后,用然后,用nlinfit计算回归系数,用计算回归系数,用nlparci计算回归系计算回归系 数的置信区间,用数的置信区间,用nlpredci计算预测值及其置信区间计算预测值及其置信区间 clc,clear x0= 1 8.55 470 300 10 2 3.79 285 80 10 3 4.82 470 300 120 4 0.02 470 80 120 5 2.75 470 80 10 6 14.39 100 190
44、10 7 2.54 100 80 65 8 4.35 470 190 65 9 13.00 100 300 54 10 8.50 100 300 120 11 0.05 100 80 120 12 11.32 285 300 10 13 3.13 285 190 120; x=x0(:,3:5); y=x0(:,2); beta=0.1,0.05,0.02,1,2; %回归系数的初值回归系数的初值 betahat,f,j=nlinfit(x,y,huaxue,beta); %f,j是下面是下面 命令用的信息命令用的信息 betaci=nlparci(betahat,f,j); betaa=be
45、tahat,betaci %回归系数及其置信区间回归系数及其置信区间 yhat,delta=nlpredci(huaxue,x,betahat,f,j) 用用nlintool得到一个交互式画面,左下方的得到一个交互式画面,左下方的 Export可向工作区传送数据,如剩余标准差等。可向工作区传送数据,如剩余标准差等。 使用命令使用命令nlintool(x,y,huaxue,beta)可看到画面,可看到画面, 并传出剩余标准差并传出剩余标准差rmse= 0.1933。 回归分析回归分析 2021年7月13日MATLAB和R软件42 例例12 某厂生产的一种电器的销售量某厂生产的一种电器的销售量y
46、与竞争对手的价格与竞争对手的价格 x 1和本厂的价格和本厂的价格x 2 有关。下表是该商品在有关。下表是该商品在10个城市的销售记录。个城市的销售记录。 x 1(元元) 120 140 190 130 155 175 125 145 180 150 x 2(元元) 100 110 90 150 210 150 250 270 300 250 y (个个) 102 100 120 77 46 93 26 69 65 85 试根据这些数据建立试根据这些数据建立y 与与 x 1和和 x2 的关系式,对得到的模型和系数进行检验。的关系式,对得到的模型和系数进行检验。 若某市本厂产品售价若某市本厂产品售
47、价160(元),竞争对手售价(元),竞争对手售价170(元),预测商品在该(元),预测商品在该 市的销售量。市的销售量。 解解 分别画出分别画出y 关于关于x 1和和y 关于关于x2 的散点图,可以看出的散点图,可以看出y 与与x2 有较明显的线有较明显的线 性关系,而性关系,而y 与与x 1之间的关系则难以确定,我们将作几种尝试,用统计之间的关系则难以确定,我们将作几种尝试,用统计 分析决定优劣。分析决定优劣。 设回归模型为设回归模型为 y=0+1x 1+2x2 回归分析回归分析 2021年7月13日MATLAB和R软件43 编写如下程序:编写如下程序: x1=120 140 190 130
48、 155 175 125 145 180 150; x2=100 110 90 150 210 150 250 270 300 250; y=102 100 120 77 46 93 26 69 65 85; x=ones(10,1),x1,x2; b,bint,r,rint,stats=regress(y,x); b,bint,stats 得到得到 b =66.5176 0.4139 -0.2698 bint =-32.5060 165.5411 -0.2018 1.0296 -0.4611 -0.0785 stats =0.6527 6.5786 0.0247 可以看出结果不是太好:可以看出结果不是太好: p = 0.0247,取,取= 0.05时回归模型时回归模型y=0+1x 1+2x2 可用,但取可用,但取= 0.01则模型不能用;则模型不能用;R2 = 0.6527较小;较小; 置信区间包含了零点。置信区间包含了零点。 2021年7月13日MATLAB和R软件44 上机练习上机练习 1.绘制参数绘制参数=2,=1的正态分布的概率密度函数、累计分布函的正态分布的概率密度函数、累计分布函 数、逆累计分布函数的图象数、逆累计分布函数的图象 2.对于标准正态分布函数,求出上侧分位点,并绘制对于标准正态分布函数,求出上侧分位点,并绘制=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公共交通运营服务收费标准制度
- 公共交通车辆调度管理制度
- 中山市古镇镇曹一幼儿园2026年招聘备考题库完整答案详解
- 2026年集美区坑内小学顶岗教师招聘备考题库及1套完整答案详解
- 2026年长垣市外国语学校教师招聘备考题库及参考答案详解一套
- 养老院志愿者服务管理制度
- 2026年长铺专职消防站招聘9人备考题库及答案详解1套
- 2026年招聘备考题库(专职教学督导)及参考答案详解
- 2026年江西省江投路桥投资有限公司本部公开招聘备考题库含答案详解
- 2026年通号工程局集团有限公司天津分公司招聘备考题库有答案详解
- 污水管网工程监理规划修改
- (机构动态仿真设计)adams
- 北京市社保信息化发展评估研究报告
- NB-T 31053-2021 风电机组电气仿真模型验证规程
- GB/T 8336-2011气瓶专用螺纹量规
- GB/T 1048-2019管道元件公称压力的定义和选用
- 临床见习带教2课件
- 文化创意产品设计及案例PPT完整全套教学课件
- 网络营销(第三版)
- 10000中国普通人名大全
- 1000条灯谜及答案
评论
0/150
提交评论