数据模型公式_第1页
数据模型公式_第2页
数据模型公式_第3页
数据模型公式_第4页
数据模型公式_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章:人口差异:样本差异:样本协方差Sxy=总体协方差皮尔逊积矩相关系数:rxy=第五章:离散概率分布数学期望,变化F(x)是概率二项式概率函数:f(x)=5.5泊松概率分布F(x)=事件在时间间隔内发生x次的概率,是数学期望(不同于方差)第6章:连续概率分布6.1统一概率密度函数axbf(x)=0其他E(x)=,Var(x)=连续概率分布6.3二项式概率的正态近似取概率pp(x)时,均值=np,标准差,x-0.5。6.4指数概率分布F(x)=表示两个事件之间的时间间隔累积概率:不超过X0分钟P(xx0)=1-第八章:总体均值的区间估计8.1总体标准差已知,并得到总体均值的置信区间估计95%

2、置信水平、0.95置信系数和置信区间=,边缘误差=,=1-0.95=0.05,/2=0.025(上侧面积)总体均值的区间估计=8.2总体标准差未知,并得到总体均值的置信区间估计(T分布)用样本标准偏差S代替总体标准偏差,用t代替Z=,自由度df=n-18.3样品大小的确定N=,e是期望的总平均值的边际误差8.4整体比率:只有Z,没有t=,边际误差=E总体均值的区间估计=n=(2)p *(1-p *)/E2第九章:假设检验(1)总体均值 H0的假设检验:=0;Ha: 0,0为假设值p值,即z(上侧)或z -(下侧),则拒绝p(z1.96)=0.0259.3总体标准偏差已知,并且获得zZ=,是样本

3、平均值置信区间法:查看0是否在此区间内9.4总体标准差是未知的,并且获得t,df=n-19.5测试总体比率假设,并找到zH0:p=P0;哈:p p0,p0是假设值z=9.7计算第二种误差的概率(1)在显著性水平下,根据临界值方法确定临界值,并建立拒绝规则(例如,如果z,则拒绝);(2)根据,求解样本均值范围(根据z=或);(3)建立一个接受域,如A;(4)根据接受域(不变)和满足替代假设的新计算概率(z=)。第二种误差概率,即做出拒绝H0的正确结论的概率称为功效,其值为1-越接近原始假设均值,第二类误差的风险就越大。9.8确定总体均值假设检验的样本量n=是第一种误差概率,是第二种误差概率,0是

4、原始假设的总体均值,a是第二种误差的总体均值。在双边测试中,使用Z/2代替Z第10章:两个群体(两个)的平均值和比例的推断10.1两个总体(1-2)、总体方差1和2的平均值之间的差值的推断是已知的标准偏差=,误差幅度=1-2的区间估计;1-2假设检验;H0:1-2=D0;Ha: 1- 2 d0,双边,找到z:10.2两个总体(1-2)平均值之间差异的推断,总体方差1和2未知1-2的置信区间估计:Df=,自由度是一个小整数1-2的假设检验,发现t: t: t=10.3匹配样本H0: d=0,ha: d 0,双边T=,df=n-1,这是两组数值之间差值的平均值,d是总体数值之间差值的平均值(一般为

5、0),Sd是两组样本数值之间差值的标准偏差置信区间=10.4两个总体比例之间差异的推断H0:P1-p2=0;Ha:p1-p2D0,两个总体之间差异的置信区间=第十一章:总体方差2的统计推断11.1总体方差的区间估计:假设检验:双边检验df=n-1,取上侧作为另一个假设11.2两个总体方差的统计推断:双边检验F=,s1是一个大样本方差分子自由度=n-1,分母自由度=n-1值取自右侧,例如值越小,它就越大第十二章:拟合优度检验和独立性检验12.1拟合优度测试:啤酒偏好与啤酒饮用者的性别无关haa :啤酒偏好并不独立于啤酒饮用者的性别第十三章:实验设计和方差分析13.2方差分析和完全随机实验设计(单

6、因素)一个对应一个处理J列,多个比较它们是否相等,1=2=3)进程间估计处理平方和,处理均方MSTR=过程中估计误差平方和,误差均方k是进程数,N是每个进程中的样本数,nT是总数上侧检查;SST=SSTR上交所均方差=s2,s=13.3多重比较法费希尔最小二乘法(两 s比较)H0:I=j;ha:Ij,df=nT-k,双边第二种方法:H0:I=j;ha:Ij如果 迷幻药,H0被拒绝1-2=置信区间的估计13.4随机区组设计13.4.2方差分析方法a:治疗;b:地区小组;错误SST=SSTR SSBL SSE,SSE=SST- SSTR-SSBL,行是I,列是j,j对应于处理,I对应于块,检查上侧

7、以判断“处理”的平均值是否相等(多个,一个对应一个处理)k=处理次数,b=区块数,nT=总样本量(nT=kb)13.5析因实验SSE=SST-SSA-SSB-SSABf检验反映了每个因素的显著性行是I,列是j,a对应于I,b对应于j第14章:简单线性回归简单线性回归方程:;=,总平方和回归平方和误差平方和SST=SSR上交所,自由度:n-1=1 (n-2)判断系数等于,所以r2越接近1,越接近Y,拟合度越好。最小二乘直线占总平方和的74.6%。Rxy=(B1的符号),为正,表示正相关;负相关。均方误差,估计的标准误差t测试:h0:=0,ha: 0b1估计的标准偏差T=,自由度n-2,双侧检验置

8、信区间:f测试:H0:=0,高可用性:0上侧测试MSR均方回归;均方差MSR=SSR/自变量数量=,分子和分母的自由度分别是自变量的个数和n-2,上限检验y平均值的置信区间:置信区间自由度是n-2估计的标准偏差y的单个值的预测间隔:预测间隔,自由度是n-2:彝族与xi的回归分析回归方程是yi=0.20 2.60 xi独立变系数系数标准误差常数(b0)0.200 (sb0)2.132 0.09 0.931Xi(B1)2.6000(sb1)0.6429(t)4.04 0.027S=2.03306 R-Sq=84.5% R-Sq(调整后)=79.3%方差分析自由源码软件回归R 1 67.600 67

9、.600 16.35 0.027剩余误差E 3 12.400 4.133总计4 80 000新观测值的预测值新拟合值实测值拟合值标准误差的95%置信区间和95%预测区间1 10.600 1.114 (7.056,14.144) (3.223,17.977)新观测值的独立变量值新官测量值xi1 4.00标准化残差:=s杠杆比率大约95%的标准化残差在-2和2之间。简单线性回归,对于简单线性回归的情况,minitab认为如果hi 6/n或0,观测值具有高水平。99,这是较小的。第十五章:多元回归R2=SSR/SST显著性检验:f检验用于确定因变量和所有自变量之间是否存在显著关系,上位检验;t检验用

10、于确定每个独立变量是否是一个重要的独立变量。t检验:双侧15.8剩余分析标准化残差:=s杠杆比率与自变量x有关学生删除残差Df=(n-1)-p-1,异常值在t/2之外(t/2或-t/2)有影响的观察:多元回归杠杆比率,hi3(p 1)/n烹饪距离,Di1第16章:建模确定何时添加或删除变量上边检验,检验增加的自变量是否显著Df1=独立变量数量增加;df2=n-p-1第18章:时间序列分析和预测平均绝对误差MAE=预测误差绝对值的平均值均方误差均方误差=预测误差平方和的平均值平均绝对百分比误差MAPE=百分比预测误差绝对值的平均值指数平滑预测法:Ft 1= Yt (1-) FT,Yt实际值,Ft预测值,F2=Y1,从F3开始线性回归:季节估计的回归方程;时间序列分解方法:N个季度的移动平均值趋势 Yt/趋势=季节-常规值季度平均季节-常规值以获得季节指数(如有必要,调整季节指数)使Yt/季节指数=消除季节影响的值找到线性回归使预测季节指数=具有季节影响的值。第19章:非

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论