统计学贾俊平第六版课后思考题及答案_第1页
统计学贾俊平第六版课后思考题及答案_第2页
统计学贾俊平第六版课后思考题及答案_第3页
统计学贾俊平第六版课后思考题及答案_第4页
统计学贾俊平第六版课后思考题及答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章导论统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。、、、的的有序的。数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。。总体(的集合的总体了10所中学,则这10所中学。分类变量:一个变量由分类数据来记录就称为分类变量。顺序变量:一个变量由顺序数据来记录就称为顺序变量。数值型变量:一个变量由数值型数据来记录就称为数值型变量。的,()离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”。连续型变量,取之连续不断,不能一一列举,比如“温度”。国民经济核算与研究;市场调查分析;社会公共事业统计领域;金融市场领域等第二章数据的收集时间且使用时要注明数据来源。情况。试验式和观察式等压力。成本有压力。电话式优点:速度快;对调查员比较安全;对访问过程的控制比较容易。缺点:实施地区有限;调查时间不能过长;使用的问卷要简单;被访者不愿回答时,不易劝服。对于缩短的。对于,要。第三章数据的图表展示(:和:,筛选。分类作数表用(分整比值百比乘100比率环形图分析。,和和分组方法:单变量值分组和组距分组,组距分组又分为等距分组和异距分组。1(-15;23多少面积。时间纵轴0开0。的空洞。结构上下中间第四章数据的概括性度量分布的集中趋势:反映各数据向其中心值靠拢或集中的程度;分布的离散程度,反映各数据远离其中心值的趋势;分布的形状,反映数据分布的偏态和峰态。四分数一数排后于25和75位的值根未组据算四位数在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。从公式(𝟏+𝑮)=∏𝒏 𝑮)=∏

𝟏+𝑮𝒊中也可看出,G就是平均增长率。众数对全部对于。受和和。第五章概率与概率分布在n次,某事件A出现m次,则比值m/n称为事件A发生的频np波动稳定概率。互斥事件一定是相互依赖(不独立)的,但相互依赖的事件不一定是互斥的。不互斥事件可能是独立的,也可能是不独立的,但独立事件不可能是互斥的。第六章统计量及其抽样分布1.什么是统计量?为什么要引进统计量?统计量为什么不含任何未知参数𝑋1𝑋2𝑋𝑛XnT(𝑋1𝑋2𝑋𝑛)T(𝑋1𝑋2𝑋𝑛)集中设𝑋1𝑋2是从总体X中抽取的一个样本,𝑋(𝑖称为第𝑖个次序统计量,它是样本(𝑋1𝑋2𝑋𝑛)𝑥1𝑥2𝑥𝑛排序𝑥(1)≤𝑥(2)≤⋯≤𝑥(𝑖)≤⋯≤𝑥(𝑛中,第𝒊个值𝒙(𝒊)就作为次序统计量𝑿(𝒊)的观测值,而𝑋(1),𝑋(2),…,𝑋(𝑛)称为次序统计量。其中,𝑿(𝟏)和𝑿(𝒏)分别为最小和最大次序统计量。统计量加工过程中一点信息都不损失的统计量为充分统计量自由度指的是计算某一统计量时,取值不受限制的变量个数。通常𝑑𝑓=𝑛−𝑘。其中𝑛为样本数量,𝑘为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。自由度通常用于抽样分布中。𝟐𝒕分布、𝑭正态分布:Z=𝑋−𝜇~N(0,1),则X~N(μ,σ)𝜎2分布:设随机变量𝑋1,𝑋2,…,𝑋𝑛相互独立,且𝑋𝑖(i=1,2,…,n)服从标准正态分布N(0,1),𝑖=1𝑖则它们的平方和∑𝑛𝑋2服从自由度为n的2分布。𝑖=1𝑖𝑡分布:设随机变量X~N(0,1),Y~2(𝑛),且X与Y独立,则t=𝑋。其分布称为𝑡分布,√𝑌⁄𝑛记为𝑡(𝑛)。𝐹分布:设随机变量X与Z相互独立,且Y和Z分别服从自由度为m和n的2分布,随机变量X=𝑚=𝑛𝑌的𝐹𝐹(𝑚,𝑛。𝑍⁄𝑛

𝑚𝑍在总体X的分布类型已知时,若对任一自然数𝑛,都能导出统计量T=T(𝑋1,𝑋2,…,𝑋𝑛)的分布的数学表达式,这种分布成为精确的抽样分布。中心极限定理:设从均值为𝜇,方差为𝜎2的一个任意总体中抽取容量为n的样本,当n充分大时,本均值的抽样分布近似服从均值为𝜇、方差为𝜎2⁄𝑛的正态分布。意义:是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。第七章参数估计估计量:用于估计总体参数的随机变量。估计值:估计参数时计算出来的统计量的具体值。无偏性:估计量抽样分布的数学期望等于被估计的总体参数。有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。由样本统计量所构造的总体参数的估计区间。95用某方构的有间有95区包含体参的值。𝝈5.𝒛𝜶⁄𝟐√𝒏的含义是什么𝝈2𝑧𝛼⁄是标准正态分布上侧面积为𝛼⁄2的𝑧值,公式是统计总体均值时的边际误差(估计误2差。匹配样本:一个样本中的数据与另一个样本中的数据相对应。两个总体都服从正态分布;两个随即样本独立地分别抽自两个总体(𝑧𝛼⁄)2𝜎2𝑛= 2 𝐸2比。

样本量与置信水平成正比;与总体方差成正比;与估计误差的平方成反第八章假设检验𝜇𝜇检验这个假设是否成立。显著性水平是指当原假设正确时却被拒绝的概率和风险。统计显著等价拒绝𝑯𝟎,指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。假设检验的结果可能是错误的,所犯的错误有两种类型:一类错误是原假设𝑯𝟎为真却被我们拒绝了,犯这种错误的概率用𝜶表示,所以也称𝜶错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用𝛃表示,所以也称𝛃错误或取伪错误。在假设检验中,𝜶与𝛃是此消彼长的关系。如果减小𝜶错误,就会增大犯𝛃错误的机会;若减小𝛃错误,也会增大犯𝜶错误的机会。𝐏值𝐏值就是当原假设为真时所得到的样本观察结果或更极端结果(它的大小三)𝐏0.05𝐏假设检验依据的基本原理是“小概率原理”,即发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以作出是否拒绝原假设的决定。将研究者想收集证据予以支持的假设作为备择假设𝑯𝟏,将研究者想收集证据证明其不正确的假设作为原假设𝑯𝟎,先确立备择假设𝑯𝟏,备择假设的方向与想要证明其正确性的方向一致,原假设与备择假设是互斥的,等号总在原假设上。第九章分类数据分析构造:列联表是由两个以上的变量进行交叉分类的频数分布表。百分比

=𝑹𝑻×𝑪𝑻×𝒏=𝑹𝑻×𝑪𝑻𝒆 𝒏 𝒏 𝒏𝟐若用𝑓表示观察值频数,用𝑓表示期望值频数,2统计量可为:2=∑(𝑓𝑜−𝑓𝑒)2𝑜 𝑒步骤一:计算𝑓𝑜−𝑓𝑒步骤二:计算(𝑓𝑜−𝑓𝑒)2步骤三:计算(𝑓𝑜−𝑓𝑒)2𝑓𝑒

𝑓𝑒步骤四:计算2=∑(𝑓𝑜−𝑓𝑒)2𝑓𝑒𝛗𝐜系数、𝐕φ相关系数:是描述2×2列联表数据相关程度最常用的一种相关系数,计算公式为:φ=

√√⁄𝑛此时φ系数的取值是在0∼1之间,且φ的绝对值越大,说明变量的相关程度越大。但当列联表的行数R或列数C大于2时,φ系数将随着R或C的变动而增大,且φ值没有上限。列联相关系数:简称c系数,主要用于大于2×2列联表的情况,计算公式为:c=√2+𝑛相互独立时,系数为0,不可能大于1,其可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。根据不同的行和列计算的列联系数不便于比较,除非两个两个列联表中的行数和列数一致。V相关系数:克莱提V系数计公式:V=√ 2𝑛×min[(𝑅−1),(𝐶−1)]取值在0~1之间13.解释𝐑𝟐的含义和作用(第十章)含义:组间平方和(SSA)占总平方和(SST)的比例记为R2,即𝑅2=𝑆𝑆𝐴𝑆𝑆𝑇作用:其平方根R就可以用来测量两个变量之间的关系强度第十章方差分析方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是分类变量(自变量)对数值型变量(因变量)的影响。繁琐增加。类型:单因素方差分析和双因素方差分析。每个总体都应服从正态分布;各个总体的方差𝛔𝟐必须相同;观测值是独立的在方差分析中,所要检验的对象称为因素或因子,因素的不同表现称为水平或处理。是指𝒊与̿的。(MSA)指因素的不同水平(不同总体)下各样本之间的方差。𝐻0:𝜇1=𝜇2=⋯=𝜇𝑖=⋯𝜇𝑘(自变量对因变量没有显著影响)𝐻0:𝜇𝑖(𝑖=1,2,…,𝑘)不全相等(自变量对因变量有显著影响)计算各样本的均值,计算全部观测值的总均值,计算各误差平方和,计算统计量。将统计量的值F与给定的显著性水平α的临界值F𝛼进行比较,作出对原假设𝐻0的决策。通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异。交互作用是指几个因素搭配在一起会对因变量产生一种新的效应的作用。第十一章一元线性回归含义:变量之间存在的不确定的数量关系为相关关系xy的取。。两个变量之间是线性关系;两个变量都是随机变量公式:r= 𝑛∑𝑥𝑦−∑𝑥∑𝑦√𝑛∑𝑥2−(∑𝑥)2∙√𝑛∑𝑦2−(∑𝑦)2𝐫𝑥𝑦的及𝑥与𝑦之间线性关系的一个度量,不能用于描述非线性关系;r虽然是两个变量之间线性关系的一个度量,不意味着𝑥和𝑦一定有因果关系。的值有显著提出假设:𝐻0:𝜌=0;𝐻1:𝜌≠0计算检验的统计量:t=|𝑟|√𝑛−2~t(n−2)1−𝑟2进行决策:确定显著性水平α,若|𝑡|>𝑡𝛼⁄2,拒绝原假设。回归模型:描述因变量y如何依赖自变量x和误差项𝛆的方程称为回归模型。表示:y=𝛽0+𝛽1𝑥+𝜀回归方程:描述因变量𝐲的期望值如何依赖自变量x的方程称为回归方程。表示:E(y)=𝛽0+𝛽1𝑥估计的回归方程:根据样本数据求出的回归方程。01̂=̂+̂𝑥01因变量y与自变量x具有线性关系;在重复抽样中,自变量x的取值是固定的,即假定𝐱是非随机的;误差项𝜀是一个期望值为0的随机变量;对于所有的x值,𝜀的𝝈𝟐都相同;误差项𝜀是一个服从正态分布的随机变量,且独立,即𝜀~𝑁(0,𝜎2)。对于x和y的n对观察值,用距离各观测点最近的一条直线来代表x与y之间的关系与实际数据的误差比其它任何直线都小。根据这一思想求得直线中未知常数的方法称为最小二乘法,即使因变量的观察值与估计值之间的离差平方和达到最小来估计𝛽̂和𝛽̂的方法。0 1总平方和:对一个具体的观测值来说,变差的大小可以用实际观测值y与其均值之差(y−̅𝐓。xyy𝐱与𝐲之间的线性关系引起的y的变化部分,它是可以由回归直线来解释的变差部分,称为回归平方和(𝐒𝐒𝐑)。x对y对y𝐄。关系:SST=SSR+SSE.𝑅2=𝑆𝑆𝑅=̂𝑖−̅2𝑆𝑆𝑇 𝑦𝑖−̅2𝑅2[0,1]。越接近1,接近于拟就。𝐅𝐭F检验:线性关系检验t检验:回归系数检验线性关系检验提出假设:𝐻0:𝛽1=0;𝐻1:𝛽1≠0计算检验统计量:𝐅=𝑺𝑺𝑹⁄𝟏𝑺𝑺𝑬⁄𝒏−𝟐

=𝑴𝑺𝑹𝑴𝑺𝑬做出决策:确定显著性水平α,若𝐅>𝑭𝜶,拒绝原假设。回归系数检验提出假设:𝐻0:𝛽1=0;𝐻1:𝛽1≠0𝐭=̂𝟏𝒔̂𝟏做出决策:确定显著性水平α,若𝐭>𝒕𝜶⁄𝟐,拒绝原假设。̂𝟏的关系,那么所建立的回归方程也应该如此;回归模型在多大程度上解释了因变量y取值的差异,可以用判定系数𝑹𝟐来回答;考察关于误差项𝜀的正态性假定是否成立。置信区间估计:是对x的一个给定值𝑥0,求出𝐲的平均值的区间估计。预测区间估计:是对x的一个给定值𝑥0,求出𝐲的一个个别值的区间估计。𝑦̂

±

𝑠√1+(𝑥0−𝑥̅)2

()

±

1 (𝑥𝑠 √𝑠

(预测区间)0 𝛼⁄2𝑒

∑𝑛

(𝑥𝑖−𝑥̅)2

0 𝛼⁄2

𝑛

(𝑥𝑖−𝑥̅)2𝑖=1区别:预测区间要比置信区间宽一些。判断对误差项𝜀的假定是否成立。

𝑖=1第十二章多元线性回归多元回归模型:设因变量为y,k个自变量分别为𝑥1,𝑥2,…,𝑥𝑘,描述因变量y如何依赖于自变量𝒙𝟏,𝒙𝟐,…,𝒙𝒌和误差项𝛆的方程成为多元回归模型。表示:y=𝛽0+𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑘𝑥𝑘+𝜀多元回归方程:描述因变量𝐲的期望值与自变量𝑥1,𝑥2,…,𝑥𝑘之间关系的方程。表示:y=𝛽0+𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑘𝑥𝑘估计的多元回归方程:用样本统计量

去估计回归方程中的未知参数01 2 𝑘𝛽0,𝛽1,𝛽2,…,𝛽𝑘时就得到了估计的多元回归方程。̂=̂+̂𝑥+̂𝑥+⋯+̂𝑥0 11 22 𝑘𝑘误差项𝜀是一个期望值为0的随机变量;对于自变量𝒙𝟏,𝒙𝟐,…,𝒙𝒌的所有值,𝜀的方差𝝈𝟐都相同;误差项𝜀是一个服从正态分布的随机变量,且相互独立,即𝜀~𝑁(0,𝜎2)。占𝑅2=𝑆𝑆𝑅=1−𝑆𝑆𝐸𝑆𝑆𝑇 作用:是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。

2=1−(1−𝑅2)(𝑛−1)𝑛−𝑘−1)nk去调整𝑅2𝑅𝑎2的值永远小于𝑅2𝑅𝑎2而回归模型中两个或两个以上的自变量彼此相关时,称回归模型中存在多重共线性。变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途;可能对参数估计值的正负号产生影响;特别是𝛽𝑖的正负号有可能同预期的正负号相反;;(F检验)𝛽𝑖𝐭检验却;;容忍度(1−𝑅2)与方差扩大子(VIF=

。越严重,𝑖 1−𝑅𝑖2当小于0.1时,存在严重多重共线性。𝐕𝐈𝐅越大,多重共线性越严重,一般认为VIF大于10时,存在严重多重共线性。将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关;如果保留所有自变量,那就应该:避免根据t统计量对单个参数𝜷进行检验;对因变量y值的推断(估计或预测)限定在自变量样本值的范围内。。第十三章时间序列分析和预测Tred(SasoaltCclctIrrgarvratios)当时间序列中的观察值出现0或负数时,不宜计算增长率;不能单纯就增长率论增长率,要注意增长率与绝对水平的综合分析;大的增长率背后,其隐含的绝对值可能很小,小的增长率背后其隐含的绝对值可能很大。的波动随机的。确定时间序列所包含的成分,也就是确定时间序列的类型;找出适合此类时间序列的预测方法;对可能的预测方法进行评估,以确定最佳预测方案;利用最佳预测方案进行预测。t+1期的预测值等于t与第t期的的一越远的序列进行修匀,以消除随机波动,找出序列的变化趋势。确定并分离季节成分:计算季节指数,之后将各实际观察值分别初一相应的季节指数,将季节

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论