版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计的基本概念统计的基本概念参数估计参数估计假设检验假设检验数据的统计描述和分析数据的统计描述和分析一、随机变量的概率分布一、随机变量的概率分布1.随机变量及其概率分布随机变量及其概率分布(1)随机变量:随机变量是定义在样本空间)随机变量:随机变量是定义在样本空间的实函数,常用的实函数,常用X,Y,Z等表示。等表示。它有两个特点:变异性与随机性。它有两个特点:变异性与随机性。按取值情况分类:离散型、连续型。按取值情况分类:离散型、连续型。(2)分布函数:)分布函数:设设X为随机变量,为随机变量,x为任意实数,称为任意实数,称F(x)=PXx为随机变量为随机变量X的概率分布函数或累积概率函数,的
2、概率分布函数或累积概率函数,简称分布函数。简称分布函数。若随机变量若随机变量X的分布函数的分布函数F(x) ,则对任意则对任意x1与与x2 (x1x2),Px1X x2= F(x2)F(x1)。若若X为连续型随机变量,为连续型随机变量,F(x)是是X的分布函数,的分布函数,则存在非负函数则存在非负函数f(x),对任意对任意x,有有 xdxxfxF)()(称称f(x)为随机变量为随机变量X的概率密度。的概率密度。2.常见的概率分布:常见的概率分布:(1)离散型:)离散型: 概率密度(分布律)概率密度(分布律) 二项分布二项分布 几何分布几何分布 泊松分布泊松分布xnxxnppCy )1(xppy
3、)1( exyx!(2)连续型:)连续型:均匀分布:概率均匀分布:概率密度函数密度函数 ),( 0),( 1baxbaxaby指数分布:概率指数分布:概率密度函数密度函数)0( xeyx-4-2024600.050.10.150.20.250.30.350.4正态分布:正态分布:),(2 N密度函数:密度函数:222)(21)( xexp标准正态分布:标准正态分布:N(0,1)密度函数:密度函数:2221)(xex 0510152000.020.040.060.080.10.120.140.16)(2n 2分布:分布:若随机变量若随机变量X1,X2, ,Xn相互独立,都服从标准正相互独立,都服
4、从标准正态分布态分布N(0,1),则随机变量,则随机变量22221nXXXY 服从自由度为服从自由度为n的的 分布,记为:分布,记为:2 的均值为的均值为n,方差为,方差为2n. )(2nY t-分布分布若若XN(0,1),)(2nY 且相互独立,且相互独立,则随机变量则随机变量nYXT 服从自由度为服从自由度为n的的t分布,分布,记为记为Tt(n) , t分布:分布:t(20)的密度函数曲线和的密度函数曲线和N(0,1)的密度函数的密度函数曲线形状相似曲线形状相似. n时时 ,)1 , 0()(Nnt-6-4-2024600.050.10.150.20.250.30.350.4 F-分布分布
5、),(121nX ),(222nX 且相互独立,且相互独立,则随机变量则随机变量2211 nXnXF 服从自由度为服从自由度为(n1 n2)的的F分布,分布,记为记为FF(n1 n2)。F(10,50)密度函数曲线:密度函数曲线:00.511.522.5300.10.20.30.40.50.60.70.80.913.常见概率分布的常见概率分布的MATLAB命令命令运算功能符:运算功能符:pdf:概率密度,概率密度,cdf:分布函数分布函数, inv:逆分布函数,逆分布函数,stat:均值与方差,均值与方差,rnd:产生随机数产生随机数概率分布符:概率分布符:分布分布均匀均匀几何几何超几何超几何
6、指数指数正态正态2tF二项二项泊松泊松字符字符unifgeohypeexpnormchi2tfbionpoiss (当需要一种分布的某一类函数时,将以上所(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可自变量(可以是标量、数组或矩阵)和参数即可. .)例例1.1 (1)x,y=expstat(2),求出参数为求出参数为2的指数分布的指数分布的均值与方差。的均值与方差。(2) a=2,3 x,y=expstat(a),(3) a=2,3;3,4 x,y=expstat(a),
7、构成参数为构成参数为2和参数为和参数为3的指数分布的均值数组的指数分布的均值数组与方差数组。与方差数组。构成参数为构成参数为2和参数为和参数为3参数为参数为3和参数为和参数为4的指的指数分布的均值矩阵与方数分布的均值矩阵与方差矩阵。差矩阵。 (4) x=normcdf(2,1,0.5),正态分布正态分布XN(1,0.52)累计概率累计概率F(2) (5) c=0:0.2:1 x=normcdf(c,1,0.5),正态分布正态分布XN(1,0.52)累计概率累计概率F(0), F(0.2),F(1) (6) n=10;a=; for j=1:n a(j)=unifrnd(0,1) end 例例1
8、.2 设设), 2(2 Nx(1) 若若 求求P1.8X2.9(2) 若若 PX0称为右偏态,称为右偏态,此时数据位于均值右边的比位于左边的多;此时数据位于均值右边的比位于左边的多; g1 0称为左偏态,情况相反;称为左偏态,情况相反;而而g1接近接近0则可认为分布是对称的则可认为分布是对称的.峰度峰度: niiXXsg1442)(1 正态分布的峰度为正态分布的峰度为3,若,若g2比比3大很多,说明样大很多,说明样本中含有较多远离均值的数据,因而峰度可用本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一作衡量偏离正态分布的尺度之一 k阶原点矩阶原点矩: nikkXnV11 k
9、阶中心矩阶中心矩: nikikXXnU1)(1 (4)样本的矩)样本的矩:将样本观察值将样本观察值依大小次序排列,得区间依大小次序排列,得区间nnfii 现的次数现的次数ni 频数。频数。频率频率:统计样本观查值在每个小区间中出统计样本观查值在每个小区间中出2. 频数和频率:频数和频率:等分该区间,等分该区间,,*1nxx输出频数表:输出频数表:n,y=hist(x,k),k为等分区间数。为等分区间数。输出频数直方图:输出频数直方图: hist(x,k)设来自总体设来自总体X的一组样本为:的一组样本为:X1, X2, , Xn3.计算统计量的计算统计量的MATLAB命令命令均值均值:mean(
10、x),中位数中位数:median(x),标准差标准差:std(x),方差方差var(x),偏度偏度:skewness(x),峰度:峰度:kurtosis(x),原点矩原点矩:kurtosis (x,k),中心矩中心矩: moment (x,k). 例例2.1 为设计公交车车门的高度,随机抽查了为设计公交车车门的高度,随机抽查了100名成年男子名成年男子的身高(单位的身高(单位cm):): x=182,176,168,175,166,171,172,169,172,171,172,181,177,172,178,181,166,173,184,177,180,176,176,170,178,16
11、8,181,178,171,177,186,180,157,185,174,171,169,192,186,159,161,193,182,187,180,173,167,174,162,163,187,186,184,175,173,174,168,172,183,181,174,162,187,175,174,169,175,174,175,182,183,169,182,170,179,172,173,174,166,175,165,178,165,182,173,174,190,176,182,179,183,167,165,174,181,186,165,172,173,178求出身
12、高数据的均值、中位数,标准差、峰度,绘出频数直求出身高数据的均值、中位数,标准差、峰度,绘出频数直方图,若车门高度是按成年男子与车门顶碰头的机会不超过方图,若车门高度是按成年男子与车门顶碰头的机会不超过1%设计,求车门最低高度是多少?设计,求车门最低高度是多少? x=182,176,.;T=mean(x),median(x),std(x),kurtosis(x) 得得:T=175.2000, 174.5000, 7.3691, 2.7241hist(x,7)155160165170175180185190195051015202530设车门高度为设车门高度为h,成年男乘客身高是随机变量,成年男
13、乘客身高是随机变量X,01. 0)( hXP99. 0)( hXP),3691. 7 , 2 .175(2NX h=norminv(0.99,175.2,7.3691) 得得:h=1.9234车门最低高度为:车门最低高度为:1.9234),(2 NX99. 021222)( dxehx99. 0)( hXP223691. 7, 2 .175 计算:计算:即求即求h使:使:可用数值积分的方法求得;可用数值积分的方法求得;取取h=185,190,195,计算上述积分,找出计算上述积分,找出积分值大于积分值大于0.99的所对应的的所对应的h。Matlab中关于数值积分的命令:中关于数值积分的命令:(
14、1) quad函数:基于变步长函数:基于变步长simpson法计算积分。法计算积分。该函数调用格式:该函数调用格式:I,n=quad(fname,a,b,Tol,trace)其中:其中:fname是被积函数名是被积函数名 a,b是积分上下限是积分上下限 Tol是精度控制值,省却时取是精度控制值,省却时取0.001 Trace:控制是否显示展现积分过程,取控制是否显示展现积分过程,取0不展现不展现 I:积分值:积分值 n:被积函数调用次数:被积函数调用次数dxxx 24sin如:求积分如:求积分ac=inline(sin(x)./x,x)s=quad(ac,pi/4,pi/2)如:求椭圆周长如:
15、求椭圆周长19422 yxh=185:1:195;p=;ab=inline(1/(7.3691*(2*pi)0.5)*exp(-(x-175.2).2/(2*7.38912),x)for i=1:11 h(i); p(i)=0.5+quad(ab,175.2,h(i);endA=h;pA = 185.0000 0.9087 186.0000 0.9292 187.0000 0.9461 188.0000 0.9596 189.0000 0.9704 190.0000 0.9787 191.0000 0.9851 192.0000 0.9898 193.0000 0.9933 194.0000
16、0.9959 195.0000 0.9977Matlab中关于数值积分的命令:中关于数值积分的命令:(2)quad8函数:函数:用用8 8样条牛顿样条牛顿- -柯特斯法计算积分。柯特斯法计算积分。函数调用格式:函数调用格式:I,nI,n=quad8(fname,a,b,Tol,trace)=quad8(fname,a,b,Tol,trace)TolTol是精度控制值,省却时取是精度控制值,省却时取610 该函数可更精确的求定积分。该函数可更精确的求定积分。(3) trapz函数:用梯形法计算积分,函数:用梯形法计算积分,适用于被积函数为离散数据时,适用于被积函数为离散数据时,求函数的定积分。求
17、函数的定积分。该函数调用格式:该函数调用格式:I=trapz(x,y)例例2.2 某地为了发展旅游产业及美化环境,规划将一某地为了发展旅游产业及美化环境,规划将一片水域改造成一个景观湖,需测算该水域的面积,并片水域改造成一个景观湖,需测算该水域的面积,并计划沿湖修建一条观光道路。已在水域边界上测量了计划沿湖修建一条观光道路。已在水域边界上测量了n个点的坐标(见表),现要求解决下列问题:个点的坐标(见表),现要求解决下列问题: (1)做出该水域的平面图做出该水域的平面图 (2)求出该水域面积的近似值求出该水域面积的近似值 (3)求出该水域边界的周长求出该水域边界的周长表:表:湖的边界点实测坐标湖
18、的边界点实测坐标X2 215.015.028.628.652.052.061.861.875.475.492.992.9105.9105.9Y138.518.612.45.810.623.836.838.8Y238.578.586.881.598.6114.2160.6172.8X121.1121.1 140.8140.8 157.2157.2 180.5180.5 216.8216.8 248.5248.5 279.8279.8 310.4310.4Y125.428.718.838.650.520.45.432.8Y2176.6165.5158.6155.6186.8252.4268.827
19、6.7X335.0335.0 360.6360.6 378.5378.5 400.1400.1 420.5420.5 448.5448.5 470.5470.5 493.1493.1Y151.956.872.866.655.565.590.5170.4Y2275.4258.2235.2228.9198.5195.5188.1170.4A=2,15.0,28.6,52.0,61.8,75.4,92.9,105.9;38.5,18.6,12.4,5.8,10.6,23.8,36.8,38.8;38.5,78.5,86.8,81.5,98.6,114.2,160.6,172.8;121.1,140.
20、8,157.2,180.5,216.8,248.5,279.8,310.4;25.4,28.7,18.8,38.6,50.5,20.4,5.4,32.8;176.6,165.5,158.6,155.6,186.8,252.4,268.8,276.7;335.0,360.6,378.5,400.1,420.5,448.5,470.5,493.1;51.9,56.8,72.8,66.6,55.5,65.5,90.5,170.4;275.4,258.2,235.2,228.9,198.5,195.5,188.1,170.4;x=A(1,:),A(4,:),A(7,:); y1=A(2,:),A(5,
21、:),A(8,:);y2=A(3,:),A(6,:),A(9,:);plot(x,y1,x,y2)axis equalA=2,15.0,28.6,52.0,61.8,75.4,92.9,105.9;38.5,18.6,12.4,5.8,10.6,23.8,36.8,38.8;38.5,78.5,86.8,81.5,98.6,114.2,160.6,172.8;121.1,140.8,157.2,180.5,216.8,248.5,279.8,310.4;25.4,28.7,18.8,38.6,50.5,20.4,5.4,32.8;176.6,165.5,158.6,155.6,186.8,25
22、2.4,268.8,276.7;335.0,360.6,378.5,400.1,420.5,448.5,470.5,493.1;51.9,56.8,72.8,66.6,55.5,65.5,90.5,170.4;275.4,258.2,235.2,228.9,198.5,195.5,188.1,170.4;x=A(1,:),A(4,:),A(7,:);y1=A(2,:),A(5,:),A(8,:);y2=A(3,:),A(6,:),A(9,:);x1=fliplr(x);y21=fliplr(y2);x0=x,x1;y0=y1,y21plot(x0,y0)axis equalfill(x0,y0
23、,b)Mianji=trapz(x,y2-y1)050100150200250300350400450500050100150200250300Mianji = 7.3331e+004三、数据的处理三、数据的处理1.数据矩阵的建立与常用的统计操作命令数据矩阵的建立与常用的统计操作命令(1)由)由word文档建立数据矩阵文档建立数据矩阵(2)由)由excel文档建立数据矩阵文档建立数据矩阵(3)常用的统计操作命令)常用的统计操作命令 mean(A):求矩阵求矩阵A的各列的均值的各列的均值 var(A):求矩阵求矩阵A的各列的方差的各列的方差 std(A):求矩阵求矩阵A的各列的标准差的各列的标准
24、差 rang(A):求矩阵求矩阵A的各列的极差的各列的极差 cov(A):求矩阵求矩阵A的各列的协方差矩阵的各列的协方差矩阵 corrcoef(A):求矩阵求矩阵A的各列的相关系数矩阵。的各列的相关系数矩阵。2. 向量的距离与夹角余弦向量的距离与夹角余弦(1)设两个)设两个n维向量维向量,Tnxxxx),(21 Tnyyyy),(21 niiixyyxd122)(),(称为向量称为向量x与与y的欧氏距离。的欧氏距离。 niiixyyxd11|),(称为向量称为向量x与与y的绝对距离。的绝对距离。rniriirxyyxd11|),( 称为向量称为向量x与与y的闵可夫斯的闵可夫斯基距离。基距离。
25、niixx122|称为向量称为向量x的的2-范数。范数。称称 向量向量x与向量与向量y的夹角余弦的夹角余弦22|yxyx (2)距离与夹角余弦的)距离与夹角余弦的matlab命令命令 pdist(X)计算矩阵计算矩阵X每一行向量之间的欧氏距离。每一行向量之间的欧氏距离。 pdist(X,cityblock)计算计算X每一行向量之间的绝对距离。每一行向量之间的绝对距离。 pdist(X,cosine)计算计算X每一行向量之间的夹角余弦。每一行向量之间的夹角余弦。 (注:实为(注:实为1-夹角余弦)夹角余弦) dist(X,Y)计算矩阵计算矩阵X每一行向量与矩阵每一行向量与矩阵Y的每一列的每一列
26、向量之间的欧氏距离。向量之间的欧氏距离。 mandist(X,Y)计算矩阵计算矩阵X每一行向量与矩阵每一行向量与矩阵Y的每一列的每一列 向量之间的绝对距离。向量之间的绝对距离。 sort(A):对列矩阵对列矩阵A的列元素从低到高排序。的列元素从低到高排序。例例3.1:2002年城镇居民家庭平均每人全年购买的主要商品数年城镇居民家庭平均每人全年购买的主要商品数据如表所示,试比较哪两年数据差异最小,哪两年差异最大。据如表所示,试比较哪两年数据差异最小,哪两年差异最大。项目项目19851990199519992000粮食粮食134.76130.729784.9182.31鲜菜鲜菜144.36138.
27、7116.47114.94114.74食用油食用油5.766.47.117.788.16猪肉猪肉16.6818.617.2416.9116.73牛羊肉牛羊肉2.023.282.443.093.33家禽家禽3.243.423.974.925.44鲜蛋鲜蛋6.847.259.7410.9211.21水产品水产品7.087.699.210.349.87食糖食糖2.522.141.681.811.70数据来源:数据来源:2002年中国统计年鉴年中国统计年鉴,数据单位:,数据单位:kgA=134.76,130.72,97,84.91,82.31;144.36,138.7,116.47,114.94,11
28、4.74;5.76,6.4,7.11,7.78,8.16;16.68,18.6,17.24,16.91,16.73;2.02,3.28,2.44,3.09,3.33;3.24,3.42,3.97,4.92,5.44;6.84,7.25,9.74,10.92,11.21;7.08,7.69,9.2,10.34,9.87;2.52,2.14,1.68,1.81,1.70; C=pdist(A,cosine); d1=pdist(A); d2=pdist(A,cityblock); B=C,d1,d2 P,i=sort(B)B = 0.0001 7.3999 15.1000 0.0029 47.11
29、82 74.5700 0.0090 58.1931 92.3200 0.0109 60.5658 96.0100 0.0026 40.5372 63.8700 0.0087 51.8723 80.9800 0.0107 54.3039 84.6500 0.0019 12.3734 18.6700 0.0029 15.0238 22.5000 0.0001 2.7608 4.9900夹角余弦夹角余弦 欧氏距离欧氏距离 绝对距离绝对距离P = 0.0001 2.7608 4.9900 0.0001 7.3999 15.1000 0.0019 12.3734 18.6700 0.0026 15.02
30、38 22.5000 0.0029 40.5372 63.8700 0.0029 47.1182 74.5700 0.0087 51.8723 80.9800 0.0090 54.3039 84.6500 0.0107 58.1931 92.3200 0.0109 60.5658 96.0100排序后的夹角余弦、欧氏距离、绝对距离排序后的夹角余弦、欧氏距离、绝对距离i = 10 10 10 1 1 1 8 8 8 5 9 9 9 5 5 2 2 2 6 6 6 3 7 7 7 3 3 4 4 4次序:次序:结论:结论:(1)1999年与年与2000年年的数据差异最小。的数据差异最小。(2) 1
31、985年与年与2000年年的数据差异最大。的数据差异最大。3. 数据属性的处理数据属性的处理(1)评价指标的无量纲化)评价指标的无量纲化评价指标通常分为效益型、成本型、固定型等,评价指标通常分为效益型、成本型、固定型等,效益型指标值越大越好、成本型指标值越小越好、效益型指标值越大越好、成本型指标值越小越好、固定型指标值既不能太大也不能太小为好。固定型指标值既不能太大也不能太小为好。 对方案进行综合评价,必须先进行指标的无量纲化对方案进行综合评价,必须先进行指标的无量纲化处理。常见的处理方法有极差变换、线性比例变换处理。常见的处理方法有极差变换、线性比例变换 nmnnmmaaaaaaaaaA21
32、2222111211设有设有m项评价指标的指标矩阵为项评价指标的指标矩阵为用用I1, I2, I3分别表示效益型,成本型和固定型指标集合,分别表示效益型,成本型和固定型指标集合, 用极差变换法建立无量纲的效益型矩阵用极差变换法建立无量纲的效益型矩阵B=(bij),: 321 ,|min|max|max ,minmaxmax ,minmaxminIaaaaaaaaaIaaaaaIaaaaabijjijjjijjjijjijjijijjijjijijjijijjijjijjijij用线性比例法建立无量纲的效益型矩阵用线性比例法建立无量纲的效益型矩阵D=(dij) : 321 ,|min ,min
33、,maxIaaaaaIaaaIaaadijjijjijjijijijjijijjijij例例3.2:(湖泊的水质的评价)近年来我国湖泊水质富营养化:(湖泊的水质的评价)近年来我国湖泊水质富营养化的问题日益严重,正确评价湖水的水质情况,有利于今后开的问题日益严重,正确评价湖水的水质情况,有利于今后开展对湖水的污染治理和保护工作。下表展对湖水的污染治理和保护工作。下表2所列为我国所列为我国12个湖泊个湖泊评价参数实测数据,表评价参数实测数据,表1所列为我国对湖泊水质评价标准,试所列为我国对湖泊水质评价标准,试建立模型对我国的建立模型对我国的12个湖泊的水质进行评价,确定各个湖水个湖泊的水质进行评价
34、,确定各个湖水质的等级。质的等级。极贫营养极贫营养贫营养贫营养中营养中营养富营养富营养极富营养极富营养总磷总磷/(mg/L) 660耗氧量耗氧量(mg/L)27.1透明度透明度/m37 12 2.4 0.55 0.17总氮总氮/(mg/L) 4.6表表1 1 湖泊水质评价标准湖泊水质评价标准总磷总磷/(mg/L)耗氧量耗氧量(mg/L)透明度透明度/m总氮总氮/(mg/L)杭州西湖杭州西湖13010.300.352.76武汉东湖武汉东湖10510.700.402.0青海湖青海湖201.44.50.22巢湖巢湖306.260.251.67滇池滇池2010.130.500.23鄱阳湖鄱阳湖1001
35、.51.250.9太湖太湖1398.69 0.8251.04洞庭湖洞庭湖1419.510.851.11洪泽湖洪泽湖1177.061.651.26阳澄湖阳澄湖409.71.3152.664洪湖洪湖457.831.651.33湖北武湖湖北武湖1078.11.521.075表表2 2:全国:全国1212个湖泊的实测数据个湖泊的实测数据问题分析:如何归类?问题分析:如何归类?以距离最近原则进行归类。以距离最近原则进行归类。指标的量纲不同,数据的大小级别不同。指标的量纲不同,数据的大小级别不同。对数据统一量纲,对数据统一量纲,使用线性比例变换使用线性比例变换 4 ,123 ,122 ,121 ,1224
36、23222114131211aaaaaaaaaaaaA(1212个湖泊的实测数据矩阵)个湖泊的实测数据矩阵) ijb,maxijjijaa,minijijjaa3 j3 jA=130,10.30,0.35,2.76;105,10.70,0.40,2.0;20,1.4,4.5,0.22;30,6.26,0.25,1.67;20,10.13,0.50,0.23;100,1.5,1.25,0.9;139,8.69,0.825,1.04;141,9.51,0.85,1.11;117,7.06,1.65,1.26;40,9.7,1.315,2.664;45,7.83,1.65,1.33;107,8.1,
37、1.52,1.075;B=A(:,1)./ max(A(:,1) , A(:,2)./ max(A(:,2) , min(A(:,3)./A(:,3), A(:,4)./ max(A(:,4)C=1,4,23,110,660;0.09,0.36,1.80,7.10,27.1;37,12,2.4,0.55,0.17;0.02,0.06,0.31,1.20,4.6;D=C(1,:)./ max(C(1,:) ; C(2,:)./ max(C(2,:); min(C(3,:)./C(3,:); C(4,:)./ max(C(4,:)mjd=mandist(B,D)px,i=sort(mjd);pp=
38、iB = 0.9220 0.9626 0.7143 1.0000 0.7447 1.0000 0.6250 0.7246 0.1418 0.1308 0.0556 0.0797 0.2128 0.5850 1.0000 0.6051 0.1418 0.9467 0.5000 0.0833 0.7092 0.1402 0.2000 0.3261 0.9858 0.8121 0.3030 0.3768 1.0000 0.8888 0.2941 0.4022 0.8298 0.6598 0.1515 0.4565 0.2837 0.9065 0.1901 0.9652 0.3191 0.7318 0
39、.1515 0.4819 0.7589 0.7570 0.1645 0.3895D = 0.0015 0.0061 0.0348 0.1667 1.0000 0.0033 0.0133 0.0664 0.2620 1.0000 0.0046 0.0142 0.0708 0.3091 1.0000 0.0043 0.0130 0.0674 0.2609 1.0000mjd = 3.5851 3.5523 3.3594 2.6003 0.4011 3.0805 3.0478 2.8548 2.0957 0.9057 0.3942 0.3614 0.1990 0.5907 3.5920 2.3891
40、 2.3563 2.1634 1.4043 1.5971 1.6581 1.6254 1.4324 1.0780 2.3281 1.3617 1.3289 1.1360 0.8387 2.6245 2.4640 2.4313 2.2383 1.4913 1.5222 2.5713 2.5385 2.3456 1.6164 1.4149 2.0839 2.0511 1.8581 1.4142 1.9024 2.3318 2.2990 2.1061 1.5849 1.6544 1.6705 1.6378 1.4448 1.0009 2.3157 2.0561 2.0233 1.8303 1.360
41、5 1.9302pp = 5 4 3 2 1 5 4 3 2 1 3 2 1 4 5 4 5 3 2 1 4 3 2 1 5 4 3 2 1 5 4 5 3 2 1 5 4 3 2 1 4 3 5 2 1 4 5 3 2 1 4 3 2 1 5 4 3 5 2 1等级等级杭州西湖杭州西湖5武汉东湖武汉东湖5青海湖青海湖3巢湖巢湖4滇池滇池4鄱阳湖鄱阳湖4太湖太湖4洞庭湖洞庭湖5洪泽湖洪泽湖4阳澄湖阳澄湖4洪湖洪湖4湖北武湖湖北武湖4每股收益每股收益( (元元) )每股净资每股净资产(元)产(元)每股现金每股现金流量流量净资产收净资产收益率(益率(% %)主营收入主营收入增长率增长率(% %)主
42、营利润主营利润增长率增长率(% %)资产负债资产负债比率(比率(% %)海尔海尔0.3960.3965.6605.6601.6501.6507.277.2723.0923.0946.2146.2147.7347.73海信海信0.3040.3046.8606.860-0.130-0.1304.544.54-4.50-4.5090.4090.4052.7952.79奥柯玛奥柯玛0.0150.0151.6701.6700.2300.2300.88560.885611.6811.68-46.59-46.5978.8578.85长虹长虹0.0360.0363.5103.510-0.330-0.3301.
43、04041.040419.4619.4626.5326.5367.5567.55苏泊尔苏泊尔0.2500.2504.4964.4960.1300.1305.615.6135.9535.9527.0527.0527.4727.47小天鹅小天鹅0.2100.2105.0505.050-1.160-1.1604.334.3349.0149.018.178.1759.7559.75TCLTCL0.0530.0532.4832.4830.1540.1542.142.1412.2312.23275.46275.4665.7365.73美的美的0.2200.2205.1205.1200.0400.0405.
44、045.0496.1396.13172.00172.0064.5564.55美菱美菱0.0720.0725.1955.195-0.790-0.7901.38311.383113.4113.41-50.03-50.0363.3663.36格力格力0.3320.3325.0605.0601.1201.1206.786.7868.9168.9154.8454.8475.4975.49例例3.3:(经营业绩的评价)下表为:(经营业绩的评价)下表为2011年第一季度年第一季度10家家电家家电类的上市公司的部分财务指标数据,要求根据这些数据对这类的上市公司的部分财务指标数据,要求根据这些数据对这10家公司
45、的经营业绩做出合理的综合排名。家公司的经营业绩做出合理的综合排名。 输入原始数据矩阵输入原始数据矩阵X(1)用极差变换法建立无量纲的效益型矩阵)用极差变换法建立无量纲的效益型矩阵B=(bij),: B=(X(:,1:6)-ones(10,1)*min(X(:,1:6),max(X(:,7)-X(:,7)./(ones(10,1)*range(X) 321 ,|min|max|max ,minmaxmax ,minmaxminIaaaaaaaaaIaaaaaIaaaaabijjijjjijjjijjijjijijjijjijijjijijjijjijjijij(2)求出理想最佳和最劣方案向量)求
46、出理想最佳和最劣方案向量U和和V U=max(X(:,1:6),min(X(:,7) V=min(X(:,1:6),max(X(:,7) (3)计算相对偏差矩阵)计算相对偏差矩阵R和和T R=abs(X-ones(10,1)*U)./(ones(10,1)*range(X) T=abs(X-ones(10,1)*V)./(ones(10,1)*range(X)(4)求客观权向量)求客观权向量w r0=normc(R) t0=normc(T) w=sum(r0.*t0)/sum(sum(r0.*t0)(5)计算得分、排序)计算得分、排序 df=B*(w) a,n=sort(df)X=0.396,
47、5.660,1.650,7.27,23.09,46.21,47.73;0.304,6.860,-0.130,4.54,-4.50,90.40,52.79;0.015,1.670,0.230,0.8856,11.68,-46.59,78.85;0.036,3.510,-0.330,1.0404,19.46,26.53,67.55;0.250,4.496,0.130,5.61,35.95,27.05,27.47;0.210,5.050,-1.160,4.33,49.01,8.17,59.75;0.053,2.483,0.154,2.14,12.23,275.46,65.73;0.220,5.120
48、,0.040,5.04,96.13,172.00,64.55;0.072,5.195,-0.790,1.3831,13.41,-50.03,63.36;0.332,5.060,1.120,6.78,68.91,54.84,75.49;B=(X(:,1:6)-ones(10,1)*min(X(:,1:6),max(X(:,7)-X(:,7)./(ones(10,1)*range(X)U=max(X(:,1:6),min(X(:,7)V=min(X(:,1:6),max(X(:,7)R=abs(X-ones(10,1)*U)./(ones(10,1)*range(X)T=abs(X-ones(10
49、,1)*V)./(ones(10,1)*range(X)r0=normc(R)t0=normc(T)w=sum(r0.*t0)/sum(sum(r0.*t0)df=B*(w)a,n=sort(df)aa=flipud(a)nn=flipud(n) 1 10 8 5 2 6 7 9 4 3 0.6942 0.6006 0.5989 0.5675 0.5158 0.3858 0.3418 0.2332 0.2195 0.1079得分得分排名排名1海尔海尔0.694212海信海信0.515853奥柯玛奥柯玛0.1079104长虹长虹0.219595苏泊尔苏泊尔0.567546小天鹅小天鹅0.3858
50、67TCLTCL0.341878美的美的0.598939美菱美菱0.2332810格力格力0.60062四、参数估计四、参数估计总体总体X的分布函数的分布函数去估计某些未知参数或数字特征。去估计某些未知参数或数字特征。参数估计问题:参数估计问题:),(21kXF (一一)点估计:点估计:构造统计量构造统计量),(21niXXX i 作为参数作为参数 的估计值。的估计值。1.矩估计法:用样本的矩估计法:用样本的k阶矩估计总体的阶矩估计总体的k阶矩,阶矩,得到得到k个方程求出个方程求出k个参数个参数k ,21例例4.1设总体设总体X的概率密度为:的概率密度为: )1 , 0( , 0)1 , 0(
51、 ,),(1xxxxf试求试求 的矩估计。的矩估计。 解:样本解:样本1阶矩:阶矩: niiXnX11总体的总体的1阶矩:阶矩: )(XE dxxxf),( 10dxx 1, 1XXX 12.极大似然估计法:极大似然估计法:设总体设总体X的概率密度为的概率密度为),(21kxf nXXX,21为总体为总体X的一组样本,的一组样本,nxxx,21为这组样本的观察值,构造似然函数:为这组样本的观察值,构造似然函数: nikixfL121),()(由由 求出求出)(max Lk ,21(二二)区间估计:求未知参数的范围,区间估计:求未知参数的范围,构造两个统计量构造两个统计量),(211niXXX
52、),(212niXXX 使得:使得:,1)(21 P则称随机区间则称随机区间),(21 为参数为参数的置信度为的置信度为1-的置信区间。的置信区间。 MATlAB统计工具箱中,参数估计的命令:统计工具箱中,参数估计的命令:fit 如:如:a=expfit(X): 指数分布参数的点估计值,指数分布参数的点估计值, a,b=expfit(x,alpha):指数分布参数的区间估计值。指数分布参数的区间估计值。 alpha:显著性水平显著性水平例例4.2 有一批糖果,从中随机抽取有一批糖果,从中随机抽取16代,称得其重量代,称得其重量(克)为:(克)为:506,508,499,503,504,510,
53、497,512,514,505,493,496,506,502,509,496。设袋装糖果的质量近似服。设袋装糖果的质量近似服从正态分布,试求总体均值和标准差的置信度为从正态分布,试求总体均值和标准差的置信度为0.95的置信区间。的置信区间。x=506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496; a,b,ar,br=normfit(x,0.05) 五、假设检验五、假设检验 对总体对总体X的分布律或分布参数作某种假设,的分布律或分布参数作某种假设,根据抽取的样本观察值,用数理统计的分析方法,根据抽取的样本观察值,用数理
54、统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝检验这种假设是否正确,从而决定接受假设或拒绝假设假设. (一)单个正态总体均值检验(一)单个正态总体均值检验1.已知总体已知总体X服从正态分布,方差服从正态分布,方差2已知,已知,对其均值对其均值的的检验。检验。 设设X1, X2, Xn为总体为总体X的一组样本,的一组样本,(1)双边检验:)双边检验: 原假设原假设:,:00 H备择假设:备择假设: ,:01 H构造统计量:构造统计量: )1 , 0(0NnXz 给定显著性水平给定显著性水平 , 由由 |2zzP计算临界值计算临界值 , 2 z得拒绝域得拒绝域2| zz(2)单边检验
55、:)单边检验: 原假设:原假设: ,:00 H备择假设:备择假设: ,:01 H(或(或 ) 01: H构造统计量:构造统计量: )1 , 0(0NnXz 给定显著性水平给定显著性水平 , 由由 zzP计算临界值计算临界值 , z得拒绝域得拒绝域 zz(或(或 ) zzh,p,ci,zval=ztest(x,m,sigma,alpha,tail) x:检验数据,检验数据, m:原假设中的均值:原假设中的均值 alpha:显著性水平:显著性水平 tail:确定假设的情况:确定假设的情况 tail=0:双边检验,:双边检验, tail=1:右边检验:右边检验(), tail=-1:左边检验:左边检
56、验() h=1:拒绝原假设,:拒绝原假设, h=0:不能拒绝原假设:不能拒绝原假设 p: 检验成立的概率检验成立的概率 ci: 均值的置信区间均值的置信区间 zval:统计量的值:统计量的值例例5.1 某车间用一台包装机包装奶粉,袋装奶粉的重某车间用一台包装机包装奶粉,袋装奶粉的重量是一个随机变量,它服从正态分布,当机器正常量是一个随机变量,它服从正态分布,当机器正常时,其均值为时,其均值为0.5kg,标准差为,标准差为0.015kg,假定标准差,假定标准差不变,某日开工后为检验包装机是否正常,随机抽不变,某日开工后为检验包装机是否正常,随机抽取该机所包装的取该机所包装的9袋奶粉,称得重量为:
57、袋奶粉,称得重量为:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512kg,问机器是否正常?(问机器是否正常?(=0.05)原假设原假设H0:=0.5,备择假设,备择假设H1 :0.5,显著性水平:显著性水平: =0.05x=0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512;h,p,ci,zval=ztest(x,0.5,0.015,0.05,0)得:得:h=1,p=0.0248,ci=0.5014,0.52210, zval=2.2444因此拒绝原假设,认为包装机不正常。因此拒绝
58、原假设,认为包装机不正常。 2.已知总体已知总体X服从正态分布,方差服从正态分布,方差2未知,对其未知,对其均值均值的的检验。检验。 使用的检验方法为使用的检验方法为t-检验。检验。构造统计量:构造统计量: )1(0 ntnsXt原假设原假设H0备择假设备择假设H1拒绝域拒绝域,:00 H,:01 H)1(|2 ntt,:00 H,:01 H,:00 H,:01 H)1( ntt)1( ntth,p,ci,zval=ttest(x,m,alpha,tail)例例5.2 某种电子元件,要求其使用寿命不得小于某种电子元件,要求其使用寿命不得小于225h,现随机抽取,现随机抽取16只该元件,测得其寿
59、命只该元件,测得其寿命(h)为为:159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170。若该批元件寿命服从正态分布,。若该批元件寿命服从正态分布,问在显著性水平为问在显著性水平为=0.05下,是否可认为该批元下,是否可认为该批元件合乎要求?件合乎要求?解:解: 检验方法为检验方法为t-检验检验原假设原假设H0:=225,备择假设,备择假设H1 :225,显著性水平:显著性水平: =0.05clcclearX=199,280,201,232,224,379,179,264,222,362,168,250,149,260,4
60、85,190;h,p,ci=ttest(X,225,0.05,-1)h = 0p = 0.8852ci = -Inf 291.5945接受原假设接受原假设H0原假设原假设H0成立的概率成立的概率 (二)两个正态总体均值检验(二)两个正态总体均值检验1.已知总体已知总体X与总体与总体Y服从正态分布,服从正态分布, 方差方差 已知,已知,2221, 对它们的均值对它们的均值1与与2的检验的检验原假设原假设H0备择假设备择假设H1拒绝域拒绝域,:210 H,:211 H2| uz,:210 H,:211 H uz,:210 H,:211 H uz)1 , 0(222121NnnYXz 统计量:统计量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第十人民医院临床用血审核制度
- 中国基金会行业志愿者管理与激励制度研究报告
- 公司高层年底奖惩制度
- 企业可以制定奖惩制度
- 小学生生活习惯奖惩制度
- 严格落实公务员奖惩制度
- 急救工作考核奖惩制度
- 出口企业奖惩制度范本
- 加油站仪容仪奖惩制度
- 医疗drg考核奖惩制度
- 考古发掘与保护技术规范
- 2026河北省公务员录用省市县乡四级联考8650人备考题库及1套参考答案详解
- 深度解析(2026)《HGT 3738-2004溶剂型多用途氯丁橡胶胶粘剂》(2026年)深度解析
- (2025年)(完整)《中华人民共和国妇女权益保障法》知识竞赛题库及答案
- 2026年及未来5年市场数据中国密闭式冷却塔市场竞争格局及投资战略规划报告
- 法庭安全教育培训课件
- 2026年鄂尔多斯职业学院单招职业技能测试模拟测试卷附答案解析
- 月结正式合同模板(3篇)
- 雨课堂学堂在线学堂云《研究生生涯发展与规划(山大 )》单元测试考核答案
- 2026年滁州职业技术学院单招职业适应性测试题库参考答案详解
- 春季养肝课件
评论
0/150
提交评论