




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、项目八 假设检验、回归分析与方差分析实验1 假设检验实验目的 掌握用Mathematica作单正态总体均值、方差的假设检验, 双正态总体的均值差、方差比的假设检验方法, 了解用Mathematica作分布拟合函数检验的方法.单正态总体均值的假设检验(方差已知情形)例1.1 (教材 例1.1) 某车间生产钢丝, 用表示钢丝的折断力, 由经验判断, 其中, 今换了一批材料, 从性能上看, 估计折断力的方差不会有什么变化(即仍有), 但不知折断力的均值和原先有无差别. 现抽得样本, 测得其折断力为578 572 570 568 572 570 570 572 596 584取试检验折断力均值有无变化
2、?根据题意, 要对均值作双侧假设检验 输入<<StatisticsHypothesisTests.m执行后, 再输入data1=578,572,570,568,572,570,570,572,596,584;MeanTestdata1,570,SignificanceLevel->0.05,KnownVariance->64,TwoSided->True,FullReport->True (*检验均值, 显著性水平, 方差已知*)则输出结果FullReport->MeanTestStatDistribution575.22.05548 NormalDi
3、stributionTwoSidedPValue->0.0398326,Reject null hypothesis at significance level ->0.05即结果给出检验报告: 样本均值, 所用的检验统计量为统计量(正态分布),检验统计量的观测值为2.05548, 双侧检验的值为0.0398326, 在显著性水平下, 拒绝原假设, 即认为折断力的均值发生了变化.例1.2 (教材 例1.2) 有一工厂生产一种灯管, 已知灯管的寿命X服从正态分布, 根据以往的生产经验, 知道灯管的平均寿命不会超过1500小时. 为了提高灯管的平均寿命, 工厂采用了新的工艺. 为了弄清
4、楚新工艺是否真的能提高灯管的平均寿命,他们测试了采用新工艺生产的25只灯管的寿命. 其平均值是1575小时, 尽管样本的平均值大于1500小时, 试问: 可否由此判定这恰是新工艺的效应, 而非偶然的原因使得抽出的这25只灯管的平均寿命较长呢?根据题意, 需对均值的作单侧假设检验 检验的统计量为 , 输入p1=NormalPValue(1575-1500)/200*Sqrt25ResultOfTestp12,SignificanceLevel ->0.05,FullReport ->True执行后的输出结果为OneSidedPValue ->0.0303964OneSidedP
5、Value->0.0303964, Fail to reject null hypothesis at significance level ->0.05即输出结果拒绝原假设单正态总体均值的假设检验(方差未知情形)例1.3 (教材 例1.3) 水泥厂用自动包装机包装水泥, 每袋额定重量是50kg, 某日开工后随机抽查了9袋, 称得重量如下:49.6 49.3 50.1 50.0 49.2 49.9 49.8 51.0 50.2设每袋重量服从正态分布, 问包装机工作是否正常()?根据题意, 要对均值作双侧假设检验: 输入data2=49.6,49.3,50.1,50.0,49.2,4
6、9.9,49.8,51.0,50.2;MeanTestdata2,50.0,SignificanceLevel ->0.05,FullReport ->True(*单边检验且未知方差,故选项TwoSided,KnownVariance均采用缺省值*)执行后的输出结果为FullReport->Mean TestStat Distribution,49.9 -0.559503 StudentTDistribution8OneSidedPValue ->0.295567,Fail to reject null hypothesis at significance level
7、->0.05即结果给出检验报告: 样本均值, 所用的检验统计量为自由度8的分布(检验),检验统计量的观测值为-0.559503, 双侧检验的值为0.295567, 在显著性水平下, 不拒绝原假设, 即认为包装机工作正常.例1.4 (教材 例1.4) 从一批零件中任取100件,测其直径,得平均直径为5.2,标准差为1.6.在显著性水平下,判定这批零件的直径是否符合5的标准.根据题意, 要对均值作假设检验:检验的统计量为, 它服从自由度为的分布. 已知样本容量 样本均值, 样本标准差.输入StudentTPValue(5.2-5)/1.6*Sqrt100,100-1,TwoSided->
8、;True则输出TwoSidedPValue->0.214246即值等于0.214246, 大于0.05, 故不拒绝原假设, 认为这批零件的直径符合5的标准.单正态总体的方差的假设检验例1.5 (教材 例1.5) 某工厂生产金属丝, 产品指标为折断力. 折断力的方差被用作工厂生产精度的表征. 方差越小, 表明精度越高. 以往工厂一直把该方差保持在64(kg)与64以下. 最近从一批产品中抽取10根作折断力试验, 测得的结果(单位为千克) 如下:578 572 570 568 572 570 572 596 584 570由上述样本数据算得.为此, 厂方怀疑金属丝折断力的方差是否变大了.
9、如确实增大了, 表明生产精度不如以前, 就需对生产流程作一番检验, 以发现生产环节中存在的问题.根据题意, 要对方差作双边假设检验: 输入data3=578,572,570,568,572,570,572,596,584,570;VarianceTestdata3,64,SignificanceLevel->0.05,FullReport->True(*方差检验,使用双边检验,*)则输出FullReport->Variance TestStat Distribution75.7333 10.65 ChiSquareDistribution9OneSidedPValue->
10、;0.300464,Fail to reject null hypothesis at significance level->0.05即检验报告给出: 样本方差 所用检验统计量为自由度4的分布统计量(检验), 检验统计量的观测值为10.65, 双边检验的值为0.300464, 在显著性水平时, 接受原假设, 即认为样本方差的偏大系偶然因素, 生产流程正常, 故不需再作进一步的检查.例1.6 (教材 例1.6) 某厂生产的某种型号的电池, 其寿命(以小时计) 长期以来服从方差的正态分布, 现有一批这种电池, 从它的生产情况来看, 寿命的波动性有所改变. 现随机取26只电池, 测出其寿命的
11、样本方差.问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化(取)?根据题意, 要对方差作双边假设检验: 所用的检验统计量为它服从自由度为的分布.已知样本容量 样本方差输入ChiSquarePValue(26-1)*9200/5000, 26-1,TwoSided->True则输出TwoSidedPValue->0.0128357.即值小于0.05, 故拒绝原假设. 认为这批电池寿命的波动性较以往有显著的变化.双正态总体均值差的检验(方差未知但相等)例1.7 (教材 例1.7) 某地某年高考后随机抽得15名男生、12名女生的物理考试成绩如下:男生: 49 48 47
12、53 51 43 39 57 56 46 42 44 55 44 40女生: 46 40 47 51 43 36 43 38 48 54 48 34从这27名学生的成绩能说明这个地区男女生的物理考试成绩不相上下吗?(显著性水平).根据题意, 要对均值差作单边假设检验: 输入data4=49.0,48,47,53,51,43,39,57,56,46,42,44,55,44,40;data5=46,40,47,51,43,36,43,38,48,54,48,34;MeanDifferenceTestdata4,data5,0,SignificanceLevel->0.05,TwoSided-
13、>True,FullReport->True,EqualVariances->True,FullReport->True (*指定显著性水平,且方差相等*)则输出FullReport->MeanDiff TestStat Distribution3.6 1.56528 tudentTDistribution25,OneSidedPValue->0.13009,Fail to reject null hypothesis at significance level->0.05即检验报告给出: 两个正态总体的均值差为3.6, 检验统计量为自由度25的分布(
14、检验),检验统计量的观察值为1.56528, 单边检验的值为0.13009, 从而没有充分理由否认原假设, 即认为这一地区男女生的物理考试成绩不相上下.双正态总体方差比的假设检验例1.8 (教材 例1.8) 为比较甲、乙两种安眠药的疗效, 将20名患者分成两组, 每组10人, 如服药后延长的睡眠时间分别服从正态分布, 其数据为(单位:小时):甲: 5.5 4.6 4.4 3.4 1.9 1.6 1.1 0.8 0.1 -0.1 乙: 3.7 3.4 2.0 2.0 0.8 0.7 0 -0.1 -0.2 -1.6问在显著性水平下两重要的疗效又无显著差别.根据题意, 先在未知的条件下检验假设:
15、输入list1=5.5,4.6,4.4,3.4,1.9,1.6,1.1,0.8,0.1,-0.1;list2=3.7,3.4,2.0,2.0,0.8,0.7,0,-0.1,-0.2,-1.6;VarianceRatioTestlist1,list2,1,SignificanceLevel->0.05,TwoSided->True,FullReport->True (*方差比检验,使用双边检验,*)则输出FullReport->Ratio TestStat Distribution1.41267 1.41267 FratioDistribution9,9,TwoSided
16、PValue->0.615073,Fail to reject null hypothesis at significancelevel->0.05即检验报告给出: 两个正态总体的样本方差之比为1.41267, 检验统计量的分布为分布(F检验), 检验统计量的观察值为1.41267, 双侧检验的值为0.615073. 由检验报告知两总体方差相等的假设成立. 其次, 要在方差相等的条件下作均值是否相等的假设检验: 输入MeanDifferenceTestlist1,list2,0,EqualVariances->True,SignificanceLevel->0.05,T
17、woSided->True,FullReport->True (*均值差是否为零的检验,已知方差相等,双边检验*)则输出FullReport->MeanDiff TestStat Distribution1.26 1.52273 StudentTDistribution18,TwoSidedPValue->0.1452,Fail to reject null hypothesis at significance level->0.05根据输出的检验报告, 应接受原假设因此, 在显著性水平下可认为. 综合上述讨论结果, 可以认为两种安眠药疗效无显著差异.例1.9 (
18、教材 例1.9) 甲、乙两厂生产同一种电阻, 现从甲乙两厂的产品中分别随机抽取12个和10个样品, 测得它们的电阻值后, 计算出样本方差分别为 假设电阻值服从正态分布, 在显著性水平下, 我们是否可以认为两厂生产的电阻值的方差相等.根据题意, 检验统计量为它服从自由度()的分布.已知样本容量, 样本方差该问题即检验假设: 输入 FRatioPValue1.40/4.38,12-1,10-1,TwoSided->True,SignificanceLevel->0.1则输出TwoSidedPValue->0.0785523,Reject null hypothesis at si
19、gnificance level->0.1所以, 我们拒绝原假设, 即认为两厂生产的电阻阻值的方差不同分布拟合检验检验法例1.10 (教材 例1.10) 下面列出84个伊特拉斯坎男子头颅的最大宽度(单位:mm):141 148 132 138 154 142 150 146 155 158 150 140 147 148 144150 149 145 149 158 143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137 148 154 137 139 143140 131 143 14
20、1 149 148 135 148 152 143 144 141 143 147 146150 132 142 142 143 153 149 146 149 138 142 149 142 137 134144 146 147 140 142 140 137 152 145试检验上述头颅的最大宽度数据是否来自正态总体()?输入数据data2=141,148,132,138,154,142,150,146,155,158,150,140, 147,148,144,150,149,145,149,158,143,141,144,144,126,140, 144,142,141,140,145,
21、135,147,146,141,136,140,146,142,137, 148,154,137,139,143,140,131,143,141,149,148,135,148,152, 143,144,141,143,147,146,150,132,142,142,143,153,149,146, 149,138,142,149,142,137,134,144,146,147,140,142,140,137,152,145;输入Mindata2|Maxdata2则输出126|158即头颅宽度数据的最小值为126, 最大值为158. 考虑区间124.5,159.5, 它包括了所有的数据. 以5
22、为间隔, 划分小区间. 计算落入每个小区间的频数, 输入pshu=BinCountsdata2,124.5,159.5,5则输出1,4,10,33,24,9,3因为出现了两个区间内的频数小于5, 所以要合并小区间. 现在把频数为1, 4的两个区间合并, 再把频数为9, 3的两个区间合并. 这样只有5个小区间. 这些区间为(),为了计算分布函数在端点的值, 输入zu=Table129.5+j*5,j,1,4则输出134.5,139.5,144.5,149.5以这4个数为分点,把分成5个区间后,落入5个小区间的频数分别为5, 10, 33, 24, 12.它们除以数据的总个数就得到频率. 输入pl
23、v=5,10,33,24,12/Lengthdata2则输出下面计算在成立条件下, 数据落入5个小区间的概率. 输入nor=NormalDistributionMeandata2,StandardDeviationMLEdata2; (*Meandata2是总体均值的极大似然估计,StandardDeviationMLEdata2是总体标准差的极大似然估计,NormalDistribution是正态分布,因此nor是由极大似然估计得到的正态分布*)Fhat=CDFnor,zu (*CDF是分布函数的值*)则输出0.0590736,0.235726,0.548693,0.832687此即成立条件
24、下分布函数在分点的值. 再求相邻两个端点的分布函数值之差, 输入Fhat2=Join0,Fhat,1;glv=TableFhat2j-Fhat2j-1,j,2,LengthFhat2则输出0.0590736,0.176652,0.312967,0.283994,0.167313输入计算检验统计量值的命令chi=ApplyPlus,(plv-glv)2/glv*Lengthdata2则输出3.59235再输入求分布的值命令ChiSquarePValuechi,2 (*5-2-1=2为分布的自由度*)则输出OneSidedPValue->0.165932这个结果表明成立条件下, 统计量取3.
25、59235及比它更大的概率为0.165932, 因此不拒绝, 即头颅的最大宽度数据服从正态分布.实验2 回归分析实验目的 学习利用Mathematica求解一元线性回归问题. 学会正确使用命令线性回归Regress, 并从输出表中读懂线性回归模型中各参数的估计, 回归方程, 线性假设的显著性检验结果, 因变量Y在预察点的预测区间等.例2.1 (教材 例2.1) 某建材实验室做陶粒混凝土实验室中, 考察每立方米混凝土的水泥用量(kg)对混凝土抗压强度的影响, 测得下列数据:(1) 画出散点图;(2) 求y关于x的线性回归方程并作回归分析;(3) 设kg, 求y的预测值及置信水平为0.95的预测区
26、间.先输入数据:aa = 150,56.9,160,58.3,170,61.6,180,64.6,190,68.1,200,71.3,210,74.1,220,77.4,230,80.2,240,82.6,250,86.4,260,89.7; (1) 作出数据表的散点图. 输入ListPlotaa,PlotRange->140,270,50,90则输出图2.1.图2.1(2) 作一元回归分析, 输入Regressaa,1,x,x,RegressionReport->BestFit,ParameterCITable,SummaryReport则输出BestFit->10.282
27、9+0.303986x, ParameterCITable->EstimateSECI110.28290.8503758.388111,12.1776,x0.3039860.004090580.294872,0.3131ParameterTable->EsimateSETstatPValue110.28290.85037512.09222.71852,x0.3039860.0040905874.31374.88498Rsquared->0.998193,AdjustedRSquared->0.998012,EstimatedVariance->0.0407025,
28、ANOVATable->DFSumOfSqMeanSqFratio PValueModel 1 1321.431321.435522.52 4.77396Error 10 2.39280.23928Total 11 1323.82现对上述回归分析报告说明如下:BestFit(最优拟合)-> 10.2829+0.303986x表示一元回归方程为;ParameterCITable(参数置信区间表)中: Estimate这一列表示回归函数中参数a, b的点估计为=10.2829 (第一行), = 0.303986 (第二行); SE这一列的第一行表示估计量的标准差为0.850375, 第
29、二行表示估计量的标准差为0.00409058; CI这一列分别表示的置信水平为0.95的置信区间是(8.388111,12.1776), 的置信水平为0.95的置信区间是(0.294872,0.3131).ParameterTable(参数表)中前两列的意义同参数置信区间表; Tstat与Pvalue这两列的第一行表示作假设检验(t检验):时, T统计量的观察值为12.0922, 检验统计量的P值为2.71852, 这个P值非常小, 检验结果强烈地否定, 接受; 第二行表示作假设检验(t检验): 时T统计量的观察值为74.3137, 检验统计量的P值为4.88498, 这个P值也非常小, 检验
30、结果强烈地否定接受.Rsquared->0.998193, 表示 它说明y的变化有99.8%来自x的变化; AdjustedRSquared->0.998012, 表示修正后的0.998012. EstimatedVariance->0.0407025, 表示线性模型中方差的估计为0.0407025.ANOVATable(回归方差分析表)中的DF这一列为自由度: Model(一元线性回归模型)的自由度为1, Error(残差)的自由度为Total(总的)自由度为SumOfSq这一列为平方和: 回归平方和1321.43, 残差平方和2.3928,总的平方和1323.82;Mea
31、nSq这一列是平方和的平均值, 由SumOfSq这一列除以对应的DF得到, 即FRatio这一列为统计量的值, 即最后一列表示统计量F的P值非常接近于0. 因此在作模型参数的假设检验(F检验):时, 强烈地否定, 即模型的参数向量因此回归效果非常显著.(3) 在命令RegressionReport的选项中增加RegressionReport->SinglePredictionCITable就可以得到在变量x的观察点处的y的预测值和预测区间. 虽然不是观察点, 但是可以用线性插值的方法得到近似的置信区间. 输入aa=Sortaa; (*对数据aa按照水泥用量x的大小进行排序*)regres
32、s2=Regressaa,1,x,x,RegressionReport->SinglePredictionCITable(*对数据aa作线性回归, 回归报告输出y值的预测区间*)执行后输出SinglePredictionCITable->Observed PredictedSECI56.955.88080.5566354.6405,57.12158.358.92060.54139157.7143,60.1269 61.661.96050.52888360.7821,63.1389 64.665.00030.51930563.8433,66.157468.168.04020.5128
33、266.8976,69.182871.371.08010.50954769.9447,72.215474.174.11990.50954772.9846,75.255377.477.15980.5128276.0172,78.302480.280.19970.51930579.0426,81.356782.683.23950.52888382.0611,84.417986.486.27940.54139185.0731,87.485789.789.31920.5566388.079,90.5595上表中第一列是观察到的y的值, 第二列是y的预测值, 第三列是标准差, 第四列是相应的预测区间(置
34、信度为0.95). 从上表可见在时, y的预测值为77.1598, 置信度为0.95的预测区间为(76.0172,75.2553), 在时, y的预测值为80.1997, 置信度为0.95的预测区间为79.0426,81.3567. 利用线性回归方程, 可算得时, y的预测值为78.68, 置信度为0.95的预测区间为(77.546, 79.814).利用上述插值思想, 可以进一步作出预测区间的图形.先输入调用图软件包命令<<Graphics执行后再输入observed2,predicted2,se2,ci2=Transpose(SinglePredictionCITable/.r
35、egress2)1;(*取出上面输出表中的四组数据, 分别记作observed2,predicted2,se2,ci2*)xva12=MapFirst,aa;(*取出数据aa中的第一列, 即数据中x的值, 记作xva12*)Predicted3=Transposexva12,predicted2;(*把x的值xva12与相应的预测值predicted2配成数对, 它们应该在一条回归直线上*)lowerCI2=Transposexva12,MapFirst,ci2;(*MapFirst,ci2取出预测区间的第一个值, 即置信下限. x的值xva12与相应的置信下限配成数对*)upperCI2=T
36、ransposexva12,MapLast,ci2;(*MapLast,ci2取出预测区间的第二个值, 即置信上限. x的值xva12与相应的置信上限配成数对*)MultipleListPlotaa,Predicted3,lowerCI2,upperCI2,PlotJoined->False,True,True,True,SymbolShape->PlotSymbolDiamond,None,None, None,PlotStyle->Automatic,Automatic,Dashing0.04,0.04,Dashing0.04,0.04(*把原始数据aa和上面命令得到的三
37、组数对predicted3,lowerCI2,upperCI2用多重散点图命令MultipleListPlot在同一个坐标中画出来. 图形中数据aa的散点图不用线段连接起来, 其余的三组散点图用线段连接起来, 而且最后两组数据的散点图用虚线连接.*)则输出图2.2.图2.2从图形中可以看到, 由Y的预测值连接起来的实线就是回归直线. 钻石形的点是原始数据. 虚线构成预测区间.多元线性回归例2.2 (教材 例2.2) 一种合金在某种添加剂的不同浓度下, 各做三次试验, 得到数据如下表:(1) 作散点图;(2) 以模型拟合数据, 其中与x无关; (3) 求回归方程并作回归分析.先输入数据bb=10
38、.0,25.2,10.0,27.3,10.0,28.7,15.0,29.8,15.0,31.1,15.0,27.8,20.0,31.2,20.0,32.6,20.0,29.7,25.0,31.7,25.0,30.1,25.0,32.3,30.0,29.4,30.0,30.8,30.0,32.8; (1) 作散点图, 输入ListPlotbb,PlotRange->5,32,23,33,AxesOrigin->8,24则输出图2.3.图2.3(2) 作二元线性回归, 输入Regressbb,1,x,x2,x,RegressionReport->BestFit,Parameter
39、CITable,SummaryReport(*对数据bb作回归分析, 回归函数为用1,x,x2表示, 自变量为x, 参数,的置信水平为0.95的置信区间)执行后得到输出的结果:2,ParameterCITable->EstimateSECI1 19.03333.2775511.8922,26.1745x 1.008570.3564310.231975,1.78517x2 -0.0203810.00881488-0.0395869,-0.00117497ParameterTable->EstimateSETstatPValue1 19.03333.277555.807180.0000
40、837856x 1.008570.3564312.829640.0151859x2 -0.0203810.00881488-2.312110.0393258Rsquared->0.614021,AdjustedRSquared->0.549692,EstimatedVariance->2.03968,ANOVATable->DF SumOfSqMeanSqFratioPValueMode1 2 38.937119.46869.54490.00330658Error 12 24.47622.03968Total 14 63.4133从输出结果可见: 回归方程为它们的置信水
41、平为0.95的置信区间分别是(11.8922,26.1745),(0.231975,1.78517),(-0.0395869,-0.00117497).假设检验的结果是: 在显著性水平为0.95时它们都不等于零. 模型中,的估计为2.03968. 对模型参数是否等于零的检验结果是: 因此回归效果显著.非线性回归例2.3 下面的数据来自对某种遗传特征的研究结果, 一共有2723对数据, 把它们分成8类后归纳为下表.研究者通过散点图认为y和x符合指数关系: 其中是参数. 求参数的最小二乘估计.因为y和x的关系不是能用Fit命令拟合的线性关系, 也不能转换为线性回归模型. 因此考虑用(1)多元微积分
42、的方法求的最小二乘估计; (2)非线性拟合命令NonlinearFit求的最小二乘估计.(1) 微积分方法输入OffGenera1:spe11OffGenera1:spe111Clearx,y,a,b,cdataset=579,1,38.08,1021,2,29.70,607,3,25.42,324,4,23.15,120,5,21.79,46,6,20.91,17,7,19.37,9,8,19.36; (*输入数据集*)yx_:=a Expb x+c (*定义函数关系*)下面一组命令先定义了曲线与2723个数据点的垂直方向的距离平方和, 记为再求对的偏导数分别记为用FindRoot命令解三个
43、偏导数等于零组成的方程组(求解). 其结果就是所要求的的最小二乘估计. 输入Cleara,b,c,f,fa,fb,fcga_,b_,c_:=Sumdataseti,1*(dataseti,3-a*Expdataseti,2*b-c)2,i,1,Lengthdatasetgaa_,b_,c_=Dga,b,c,a;gba_,b_,c_=Dga,b,c,b;gca_,b_,c_=Dga,b,c,c;Cleara,b,coursolution=FindRootgaa,b,c=0,gba,b,c=0,gca,b,c=0,a,40.,b,-1.,c,20.(* 40是a的初值, -1是b的初值, 20是c
44、的初值*)则输出a->33.2221,b->-0.626855,c->20.2913再输入yhatx_=yx/.oursolution则输出20.2913+33.2221这就是y和x的最佳拟合关系. 输入以下命令可以得到拟合函数和数据点的图形:p1=Plotyhatx,x,0,12,PlotRange->15,55,DisplayFunction->Identity;pts=Tabledataseti,2,dataseti,3,i,1,Lengthdataset;p2=ListPlotpts,PlotStyle->PointSize.01,DisplayFu
45、nction->Identity;Showp1,p2,DisplayFunction->$DisplayFunction;则输出图2.4.图2.4(2) 直接用非线性拟合命令NonlinearFit方法输入data2=FlattenTableTabledatasetj,2,datasetj, 3,i,datasetj,1,j,1,Lengthdataset,1;(*把数据集恢复成2723个数对的形式*)<<Statisticsw=NonlinearFitdata2,a*Expb*x+c,x,a,40,b,-1,c,20则输出这个结果与(1)的结果完全相同. 这里同样要注
46、意的是参数必须选择合适的初值.如果要评价回归效果, 则只要求出2723个数据的残差平方和 输入yest=Tableyhatdataseti,2,i,1,Lengthdataset;yact=Tabledataseti,3,i,1,Lengthdataset;wts=Tabledataseti,1,i,1,Lengthdataset;sse=wts.(yact-yest)2 (*作点乘运算*)则输出59.9664即2723个数据的残差平方和是59.9664. 再求出2723个数据的总的相对误差的平方和 输入sse2=wts.(yact-yest)2/yest) (*作点乘运算)则输出2.7407
47、5由此可见, 回归效果是显著的.实验3 方差分析实验目的 学习利用Mathematica求单因素方差分析的方法.例3.1 (教材 例3.1) 今有某种型号的电池三批, 它们分别是A,B,C三个工厂所生产的. 为评比起质量, 各随机抽取5只电池为样品, 经试验得其寿命(单位:h)如下表:A4042484538B2628343230C3950405043试在显著性水平0.05下检验电池的平均寿命有无显著的差异. 若差异是显著的, 试求均值差及的置信水平为95%的置信区间.这是方差分析问题, 先把它转化为线性模型:Y = Xb +e. 令 则线性模型(3.3)与方差分析模型(3.1)完全等价. 模型
48、(3.3)完全可以用DesignedRegress命令作设计回归, 得到所要的方差分析表.我们面临的任务是: (1) 检验3个总体的均值是否相等,即作假设检验(2) 求均值差及的置信水平为95%的置信区间.任务(1)等价于对模型(3.3)作检验:而任务(2)等价于求的置信区间. 在DesignedRegress命令中加入选项RegressionReport->ParameterCITable,MeanPredictionCITable,SummaryReport后便能完成上述任务. 用回归分析作单因素方差分析 完成对模型的假设检验和对模型参数的区间估计任务.输入设计矩阵和数据X1=1.0
49、,0,0,1,0,0,1,0,0,1,0,0,1,0,0,1,1,0,1,1,0,1,1,0,1,1,0,1,1,0,1,0,1,1,0,1,1,0,1,1,0,1,1,0,1; Y1=40,42,48,45,38,26,28,34,32,30,39,50,40,50,43;再输入设计回归命令DesignedRegressX1,Y1,RegressionReport-> ParameterCITable,MeanPredictionCITable,SummaryReport(*回归报告输出参数的置信区间,均值的置信区间和总结报告*)执行后得到输出Estimate SE CI142.61.
50、8991238.4622,46.7378ParameterCITable->2-12.62.68576-18.4518,-6.74822 31.82.68576-4.05178,7.65178MeanPredictionCITable->ObservedPredictedSECI40.42.61.8991238.4622,46.737842.42.61.8991238.4622,46.737848.42.61.8991238.4622,46.737845.42.61.8991238.4622,46.737838.42.61.8991238.4622,46.737826.30.1.8
51、991225.8622,34.137828.30.1.8991225.8622,34.137834.30.1.8991225.8622,34.137832.30.1.8991225.8622,34.137830.30.1.8991225.8622,34.137839.44.41.8991240.2622,48.537850.44.41.8991240.2622,48.537840.44.41.8991240.2622,48.537850.44.41.8991240.2622,48.537843.44.41.8991240.2622,48.5378Estimate SE TStatPValue142.61.8991222.43143.63987×10-11ParameterCITable->2-12.62.68576-4.69140.00052196 31.82.685760.67020.515421Rsquared->0.739904,AdjustedRSquared->0.696554,EstimatedVariance->18.0333,ANOVATable-> DFSumOfsqMeanSqFratioPvalueModel2615.6307.8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车融资租赁出借资金借款合同
- 成品油运输与物流信息化管理合同
- 餐厅餐饮文化传承与发展合作协议
- 城市环卫工人意外伤害赔偿合同范本
- 高端商场专业安保场务专员劳动合同范本
- 纺织品百货品牌加盟合作协议
- 车辆保险代理合同范本:全方位车辆保险代理服务协议
- 旅游景区场地租赁分成及运营管理合同
- 高科技环保装备厂房建造与环保技术研发合同
- 餐饮品牌形象设计与推广合同
- 2024年天津市南开区初中学业考查模拟地理试卷
- 第四届福建省水产技术推广职业技能竞赛-水生物病害防治员备赛题库(含答案)
- 数字供应链对营运资金周转效率的影响分析
- 轻型卒中临床诊疗中国专家共识要点(2024年)解读课件
- 2022联合国电子政务调查报告(中文版)
- 国家开放大学《管理英语4》期末机考题库
- DeepSeek在银行业务场景的应用
- 居家适老化改造指导手册(2025年版)
- 炊事员培训试题及答案
- 模板包清工合同协议
- 2025年安全月主题宣贯课件
评论
0/150
提交评论