九抽样调查入门基础_第1页
九抽样调查入门基础_第2页
九抽样调查入门基础_第3页
九抽样调查入门基础_第4页
九抽样调查入门基础_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章抽样调查基础一、本章重点1. 抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。它是一 种非全面调查,其意义在于对总体的推断上,存在可控制性误差。是一种灵活快 捷的调查方式。2抽样调查有全及总体与样本总体之区分。样本容量小于30时一般称为小样本。对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量, 样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数, 是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。样本可能 数目与样本容量有关也与抽样的方法有关。 抽样方法可以分为考虑顺序的抽样与 不考虑顺序的抽样;重复抽样与不重复抽样。3. 大数定律

2、、正态分布理论、中心极限定理是抽样调查的数理基础。正态分 布的密度函数有两个重要的参数(x)。它有对称性、非负性等特点。中心极 限定理证明了所有样本指标的平均数等于总体指标如E(x)二X。推出了样本分卩亠呼布的标准差为:X;N。4抽样推断在逻辑上使用的是归纳推理的方法、 在方法上使用的是概率估计 的方法、存在着一定误差。无偏性、一致性和有效性是抽样估计的优良标准。抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而 抽样的平均误差是一个确定的值。抽样误差受总体标志值的差异程度、样本容量、 抽样方法、抽样组织形式的影响。在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本

3、容量巴=旦的平方根成反比即 X 、n ,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N。在通常情况下总体的方差是未知的,一般要用样本的方差来代替。把抽样调查中允许的误差范围称作抽样的极限误差x或八P。人二2,用抽样的平均误差来度量抽样的极限误差。把抽样估计的把握程度称为抽样估计的置 信度。抽样的极限误差越大,抽样估计的置信度也越大。抽样估计又可区分为点 估计和区间估计。按估计的指标不同又可分为总体平均数的估计、 总体成数的估 计和总体方差的估计。二、难点释疑1. 要区分样本可能数目与必要抽样数目。 样本可能数目是指从总体 N 中抽取 一个样本容量为n的子样最多有多少种抽法,

4、一般用 M表示。而必要抽样数目 则是为了使抽样误差控制在一定的范围内, 至少应抽取多少个单位作样本, 是样 本容量(n)的另一种表现形式。2. 大数定律、 正态分布理论、 中心极限定理都是假定从 N 中抽取一个样本容 量为 n 的子样,把所有的样本都抽到(有 M 种抽法)之后进行验证的,在实际 工作中不可能办到。 只能用样本的相应指标去推测总体的相应指标。 这些理论只 是为了验证抽样推断的科学性。3. 在实际工作中往往是以重复抽样的方法确定必要抽样数目,以不重复抽 样的方法来抽取调查单位, 进行计算估计, 而又用重复抽样的误差公式来计算误 差,一方面是计算公式简单,另一方面,这样计算的误差比实

5、际存在的误差大, 便于提高抽样推断的可靠性。4. 在抽样调查中总体的方差是未知的,一般都用样本的方差来代替。对于抽 样成数来说,当p = 0.5时,抽样成数的方差取极大值0.25。三、练习题(一)填空题1. 抽样调查是建立在()上的一种科学的调查方法。它是从研究对象中()部分单位进行调查, 以其达到对()的认识,并可对()进行计算和控制。2. 样本中所包含的总体单位数称为(),通常记为n,当n ()时称为大样本。3. 在抽样调查中总体指标是(),而样本指标则是随机的。4. 对确定的总体来说,可能的样本数目与()有关,也与()有关。5一般地说,用抽样指标估计总体指标应该有三个要求。这三个要求是(

6、 )、( )、( )。6.常用的抽样方法有()抽样和()抽样;()抽样和()抽样。7.常用的抽样组织形式有()、()、()、( )( )。8.抽样平均误差就是抽样平均数(或抽样成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。9. 抽样误差是一个( ),抽样平均误差是一个()。前者是在不考虑( )条件下,抽样估计值与被估计的真实总体参数之差;后者反映抽 样平均数(成数)与总体平均数(成数)的( )。10. 影响抽样误差大小的因素有:()(、 )、抽样方法和( )11. 对于同一种抽样组织形式来讲,重复抽样的平均误差()不重复抽样的平均误差。当( )很小时,可以用重复

7、抽样的平均误差公式来近似计 算不重复抽样的平均误差。12. 在其它条件不变的情况下,极限误差增大,则概率度(),可靠程度( )。13. 在缺少总体的方差时,可用()代替来计算抽样误差。14. 抽样极限误差是指抽样指标与总体指标之间抽样误差的 ( )。抽样极限误差通常以(二)名词解释)为标准单位来衡量291.随机性原则5.抽样极限误差2. 抽样误差3.样本4.抽样平均误差6.区间估计7.重复抽样8.不重复抽样三)判断题1. 抽样调查就是凭主观意识,从总体中抽取部分单位进行调查。 ( )2. 抽样法不仅是对被研究总体有关指标进行科学推算的方法, 而且是搜集统 计资料的方法。( )3. 抽样调查中的

8、随机误差是可以避免的。 ( )4. 所有可能的样本平均数的平均数等于总体的平均数。 ( )5. 抽样误差是不可避免的, 但人们可以调整总体的方差的大小来控制抽样误 差的大小。( )6. 缩小抽样的极限误差便会降低推断的把握程度。 ()7. 由于抽样调查中既有登记性误差又有代表性误差, 所以只有登记性误差的 全面调查准确性高。 ( )8. 重复抽样和不重复抽样是抽取样本的两种方法, 各抽样组织方式都可以使 用这两种方法。( )(四)单项选择题1. 随机抽样的基本要求是严格遵守()A、准确性原则B、随机性原则C、代表性原则D、可靠性原则2. 抽样调查的主要目的是()A、广泛运用数学方法B、计算和控

9、制抽样误差C、修正普查资料D、用样本指标来推算总体指标3. 抽样调查中()A、既有登记性误差,也有代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差4. 要使抽样误差减少一半(在其它条件不变的情况下),则抽样单位数必须( )。A、增加2倍 B、增加到2倍 C、增加4倍 D、增加到4倍5. 抽样平均误差反映了样本指标与总体指标之间的()。A、实际误差B、实际误差的绝对值C、平均误差程度 D、可能误差范围6. 反映样本指标与总体指标之间抽样误差可能范围的指标是()。A、样本平均误差B、抽样极限误差C、可靠程度D、概率度7. 在实际工

10、作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是()A、抽样单位数占总体单位数的比重很小时B、抽样单位数占总体单位数的比重很大时C、 抽样单位数目很少时D、抽样单位数目很多时8. 在其它条件不变的情况下,抽样单位数目和抽样误差的关系是()A、抽样单位数目越大,抽样误差越大B、抽样单位数目越大,抽样误差越小C、抽样单位数目的变化与抽样误差的数值无关D、 抽样误差变化程度是抽样单位数变动程度的1/29. 事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为()。A、分层抽样 B、简单随机抽样C、整群抽样 D、等距抽样10. 在总体内部情况复杂

11、,而且各单位之间差异程度较大,单位数目又多的情况下,宜采用()。A、简单随机抽样B、类型抽样 C、等距抽样 D、整群抽样11. 用考虑顺序的重置抽样方法,从 4 个单位中抽选 2 个单位组成一个样本,则样本可能数目为(A、 42 =164! .12 C、2!D、4!2=612. 无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( )。A、样本平均数等于总体平均数B、样本成数等于总体成数C、抽样指标等于总体指标D、抽样指标的平均数等于总体指标13. 在同样条件下,不重置抽样的抽样平均误差与重置抽样的抽样平均误差相比()。A、前者小于后者B、前者大于后者C、两者相等D、无法判断14. 当

12、可靠程度大于0.6828时,抽样极限误差()。A、大于抽样平均误差B、小于抽样平均误差C、等于抽样平均误差D、与抽样平均误差的大小依样本容量而定15. 在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将( )。A、保持不变B、随之扩大C、随之缩小D、无法确定16. 如果总体成数方差未知,计算必要抽样数目时,可用总体方差的最大值,最大值为()。A、0.24 B、0.25C、0.50 D、1(五)多项选择题1. 抽样调查适用于下列哪些场合()。A、不宜进行全面调查而又要了解全面情况B、 工业产品质量检查C、调查项目多、时效性强D、只需了解一部分单位的情况E、适用于任何调查2. 下列哪些调查

13、中存在系统误差()。A、抽查某车间产品质量时将两名徒工的产品排除在外B、某县用等距抽样调查农户收入时决定:如果中选户户主不在家,则以该 户下一户顶替,已知不在家的农户多为外出经商者C、为了了解学生健康情况而做的普查D、将学生按来自城乡分组后采取按比例抽样调查学生开支情况E、简单随机抽样3. 影响抽样误差大小的因素有()。A、抽样单位数的多少B、总体被研究标志的变异程度C、抽样组织方式D、登记误差大小E、抽到的样本如何4. 合理的或优良的抽样估计,要求用抽样指标估计总体指标时,应该满足如下标准,即()。A、无偏性B、代表性C、一致性D、时间性E、有效性5. 抽样推断中的抽样误差()。A、是不可避

14、免要产生的B、可以事先计算C、可通过不同的抽样方式消除D、 误差范围可事先控制E、只能事后进行计算6. 抽样平均误差是()。A、所有可能样本平均数的标准差B、所有可能样本平均数的平均差C、抽样推断中作为计算误差范围的衡量尺度D、反映抽样平均数与总体平均数的平均误差程度E、是一种系统性误差7. 区间估计的基本要素有(A、平均误差B、概率度E、误差范围8. 抽样调查的数理依据主要有(A、回归分析B、大数定律)。C、修正系数D、点估计值)。C、中心极限定理D、误差分布理论E、相关分析9、与典型调查相比较,抽样调查的特点有()A、理论基础是概率论大数法则B、按随机原则抽选调查单位C、抽样误差可以事先计

15、算和控制D、调查单位的选取方法不同E、排除主观因素的影响10. 抽样估计的特点是()A、在逻辑上运用演绎推理B、在逻辑上运用归纳推理C、在方法上运用不确定的概率估计法D、在方法上运用确定的数学分析法E、结论存在一定的抽样误差(六)简答题1.1. 什么是随机性原则?在抽样调查中为什么要坚持随机性原则?2.2. 什么是抽样估计?它有什么特点?3.3. 什么是抽样误差?影响抽样误差的因素有哪些?4.4. 什么叫点估计?什么叫区间估计?5.5. 什么是极限误差,它与概率度,抽样平均误差有什么关系?(七)论述题 重复抽样与不重复抽样有什么不同?为什么不重复抽样的误差总是小于重复抽样的误差?(八)计算题1

16、. 某商店有 20名职工,现从中抽取 5名职工进行调查。 采用简单随机抽样, 试计算各种抽样方法的样本可能数目。2. 对某产品进行重量测试,被抽中的10 袋产品其重量如下(单位:克) :48,47,49,50,51,48,46,45,46,49 试计算产品重量的抽样平均误差。3. 某灯泡厂生产一批灯泡共 8000 只,随机抽选 400 只进行耐用时间的试验。 测试结果平均寿命 5000 小时,总体标准差为 300 小时。求抽样误差。4. 某市在家庭平均人数调查中, 采用不重置简单随机抽样得到样本的每户平 均人数为 3.2 人,标准差为 1.378 人。 如果总户数为 1000 户,调查户数为

17、80 户,试计算抽样的平均误差; 在条件下,如果极限误差为 0.2956,试估计户平均人数; 在的条件下,如果可靠程度为 0.95,试计算户平均人数; 如果要求可靠程度为 95.45% ,极限误差为 0.35,试计算重置和不重置抽 样各需抽取多少户进行调查(总户数仍为 1000 户)。5. 某机械厂生产一批零件共 6000 件,随机抽查 300 件,发现其中有 9 件不 合格,求合格率的抽样误差。6. 某服装厂对当月生产的 20000 件衬衫进行质量检查,结果在抽查的 200件衬衫中有 10 件是不合格品,要求:(1)(1)以 95.45% 概率推算该产品的合格范围;(2)该月生产的产品是否超

18、过规定的 8%的不合格率(概率不变)7. 某地农村种植小麦150亩,在麦收前随机不重置抽取了 100个平方公尺 的小麦样本,测得每平方公尺小麦产量为 0.5公斤,标准差为0.05公斤。试计 算极限抽样误差,并以95.45%的概率保证,推断该地区小麦平均亩产量和总产 量。8. 某茶叶公司销售一批茗茶,规定每包规格重量不低于150克,现抽取1%检验,结果是:按每包重量分组(克)包数148 14910149 15020150 15150151 15220合计100试以99.73%的概率,评估这批茶叶平均每包重量的范围是否符合规定重量要求。9.某厂4500名职工中,随机抽取20%调查每月看电影次数,所

19、得资料如下:看电影次数02244668810职工人数(对总数的百分比)82240255试以95.45%的可靠性:(1 )估计平均每月看电影的次数;(2)确定每月看 电影在4次以上的比重,其误差不超过 3%。10.年终在某乡镇储蓄所中按定期储蓄存款账号进行抽样调查,得到如下资料:存款额抽查户数1000元以下581000 20001502000 30002003000 4000624000元以上14484(1 )试估计该储蓄所所有储户平均存款额的区间(概率为95.45% );(2)估计定期存款额在2000元以上的比重。11.工商部门对某超市经销的小包装休闲食品进行重量合格抽查,规定每包重量不低于3

20、0克,在1000包食品中抽1%进行检验,结果如下表:按重量分组(克)包数(包)26 27127 28328 29329 30230 311合计10试以95.45%概率推算:(1)( 1 )这批食品平均每包重量是否符合规定要求;(2)(2)若每包食品重量低于30克为不合格,求合格率的范围。12.对某居委会30户家庭的月收支情况进行抽样调查,发现平均每户每月用 于书报费支出为45元,抽样平均误差为2元,试问应以多少概率才能保证每户 每月书报费支出在41.08元至48.92元之间。第十章抽样组织一、本章重点1. 保证实现抽样的随机性的原则和保证实现最大的抽样效果的原则是抽样 方案设计的基本原则。代表

21、性的检查和准确性的检查是抽样方案检查的两个方 面。编制抽样框的目的是将总体所有单位置于可以被抽中的位置上,易于进行抽选工作,提高抽样调查的效果。2. 简单随机抽样是抽样调查的基本形式。 重点掌握重复抽样的必要抽样数目 的确定。等距抽样又称为机械抽样或系统抽样, 可分为随机起点等距抽样、 半距 起点等距抽样、 随机起点对称等距抽样。 它没有专门计算误差的公式, 只能用简 单随机抽样的公式来代替。但它比简单随机抽样的误差要小。3. 类型抽样又叫做分层抽样。是分组法和抽样原理的结合。在分组时要坚持 层内的齐一性和层间的差异性。必须掌握类型抽样的估计量的计算和推断步骤。 在同样的情况下它比简单随机抽样

22、的误差小。4. 整群抽样在进行分解时要注意群间的齐一性和群内的差异性。 由于抽选单 位比较集中,调查较为方便。掌握整群抽样的估计量和平均误差的计算。5. 在多阶段抽样中,前几个阶段的抽样都类似于整群抽样。每个阶段都会 存在抽样误差。 为提高抽样结果的代表性, 抽取的群数和抽样方式, 都应注意样 本单位的均匀分布。对于群间方差大的阶段,应适当多抽一些,反之,则可以少 抽一些。每阶段的抽样方式可用简单随机抽样或等距抽样。二、难点释疑1. 由于类型抽样对于各组来讲属于全面调查, 对于每组内部来说属于抽样调 查。所以,类型抽样的抽样误差仅与组内方差有关,与组间方差无关。与类型抽 样正好相反, 整群抽样

23、对于组与组之间来讲属于抽样调查, 对于中选群内部来讲 属于全面调查,因此,整群抽样与组内方差无关与组间方差有关。2. 必须澄清几个模糊认识。简单随机抽样最符合随机抽样的原则,但是其误 差不一定比其它调查方式小, 在具体组织时也有困难; 坚持随机原则照样存在着 代表性误差; 抽样误差最小的方案不一定是最好的调查方案, 必须和一定的调查 费用联系起来;多阶段抽样的阶段分得越多误差不一定就越小。三、练习题(一)填空题1. 抽样方案的检查主要体现在()检查和( )检查两个方面。2. 在计算抽样误差时,常常缺乏总体方差的资料,实际计算常用()来代替。3. 在其它条件不变的情况下,极限误差增大,则概率度(

24、 ),可靠程度 ( )。4. 整群抽样群内方差对抽样平均误差( )影响,类型抽样群内方差对抽 样平均误差()影响。5. 两阶段抽样中,群内方差对抽样平均误差( )影响,群间方差对抽 样平均误差()影响。6. 影响样本规模的主要因素有()、( )、( )、( )。7. 对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,样本容量必须( )倍,若误差范围扩大一倍, 则抽样单位数为原来的 ( )8. 分类抽样是()和( )相结合的抽样方式。9. 整群抽样是对被抽中群内的()进行( )的抽样组织方式。10. 抽样组织形式中,()是最基本的抽样组织形式。(二)名词解释1. 机械抽样2.分层抽样3

25、.整群抽样4.抽样框(三)判断题1. 各种抽样组织方式中,在条件相同的情况下,整群抽样总是误差较大的。 ()2. 一般而言,分类抽样的误差比纯随机抽样的误差小。 ()3. 不重复抽样的误差一定大于重复抽样的误差。 ( )4. 抽样误差产生的原因一定是违背了随机抽样的原则。 ()5. 抽样调查中误差最小的方案才是最好的调查方案。 ( )6. 抽样调查和典型调查的根本区别在于两种调查中选取调查单位的方法不 同。( )7. 如果抽取群数相同, 那么整群抽样的抽样平均误差一定小于二阶段抽样平 均误差。( )(四)单项选择题1. 有一批灯泡共 1000箱,每箱 200 个,现抽取 20箱并检查这些箱中的

26、全部 灯泡,此中检查属于( )。A、纯随机抽样B、类型抽样C、整群抽样 D、等距抽样2. 当单位数目不很多且各单位间差异较小时宜采用()。A、类型抽样B、纯随机抽样C、整群抽样D、两阶段抽样3. 先按某一标志进行分组, 然后在各组中按随机原则抽取一部分单位构成样本,这种抽样组织方式称为()。A、整群抽样B、简单随机抽样C、分类抽样D、机械抽样4. 事前将总体各单位按某一标志排列, 然后依排列顺序和按相同间隔来抽选调查单位的抽样称为()。A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样5. 在总体内部情况复杂,而且各单位之间差异程度较大,单位数又多的情况 下,宜采用( )。A、纯随机抽样B、

27、等距抽样C、整群抽样D、类型抽样)。B、登记性误差6. 抽样调查所特有的一种误差是(A、由于样本的随机性而产生的误差C、系统性误差7.在抽样设计中,最好的方案是(D、前三类都不是)。A、抽样误差最小的方案B、调查单位最少的方案C、调查费用最少的方案D、在一定误差要求下费用最少的方案8. 在连续生产的电子管厂,产品质量检查是这样安排的,在一天中,每隔 小时抽取 5 分钟的产品进行检验,这是()。A、简单随机抽样B、类型抽样C、等距抽样D、整群抽样(五)多项选择题)。B、类型抽样1. 将总体按主要标志进行分级,然后再按随机原则从各组中抽选出样本单 位,这种抽样方式是(C、分层抽样A、机械抽样D、简

28、单随机抽样E、整群抽样2.等距随机抽样(A、又称机械抽样C、常用有三种方法, 点对称等距抽样)。B、又称多阶段抽样即:随机起点等距抽样;半距起点等距抽样;随机起D、可以按有关标志排队和无关标志排队E、比整群抽样的误差要大3. 与典型调查相比较,抽样调查的特点有()A、理论基础是概率论大数法则B、按随机原则抽选调查单位C、抽样误差可以事先计算和控制D、调查单位的选取方法不同E、排除主观因素的影响4. 不重复抽样的平均误差()A、总是大于重复抽样的平均误差B、总是小于重复抽样的平均误差C、有时大于有时小于重复抽样的平均误差nD、在氏很小时,几乎等于重复抽样的平均误差E、在N - n N趋近于i时,

29、可采用重复抽样的平均误差的方法计算5抽样方案的检查主要包括以下几方面,即()C、全面性检查)C、系统误差A、准确性检查B、快速性检查D、可靠性检查E、代表性检查6. 影响整群抽样平均误差的因素有(A、群间方差B、群内方差D、群的划分方式E、中选群的结构7. 影响两阶段抽样平均误差的因素有()A、群间方差B、群内方差C、抽取群的多少D、各群中抽取单位数的多少E、样本容量的大小(六)简答题1.1. 抽样方案设计的基本原则是什么?2.2. 抽样方案的检查有哪几方面?33什么是简单随机抽样?有什么特点?44什么是分层抽样?分层抽样与简单随机抽样相比有什么特点?5.5.什么是整群抽样?简述其特点及适应性

30、。(七)论述题1类型抽样与整群抽样相比各有什么特点?2. 简述两阶段抽样与整群抽样、类型抽样有什么不同?(八)计算题1. 在2000名工人中,采取重复抽样方式,随机抽取144个工人的土方工程进行测量,测量结果为每一工人的平均工作量为5.32立方米。(1)试以95%的概率保证程度(t=1.96)来推算抽样极限误差;(2)根据上述条件,若要求极限 误差不超过0.1立方米,t=1,应抽多少个工人进行调查。2. 某日化工厂用机械大量连续包装洗衣粉,要求每袋按 1公斤包装,为保证 质量,生产过程中每隔8小时检查1小时的产品,共检验20次,算出平均重量 为1.005公斤,抽样总体各群间方差平均数为 0.0

31、02公斤。试计算:(1)抽样平 均误差;(2)要求概率99.73%,使产品重量不低于1-0.03公斤为标准,问上述检验的产品是否合格?3. 已知某企业职工的收入资料如下:不同收入类型职工人数(人)抽样人数(5%)月平均收入(元)各类职工收入的标准差(元)较高的20010132048一般的1600808043012006060045较低的合计3000150根据上表资料计算;(1)抽样月平均收入;(2)月平均收入的抽样平均误差;(3)概率为0.95时,职工月平均收入的可能范围。4. 某市有职工100000人,其中职员40000人,工人60000人。现拟进行职 工收入抽样调查,并划分职员和工人两类进

32、行选择。事先按不同类型抽查40名职员和60名工人,其结果如下表:职员工人平均每人收入(元)人数平均每入收入(元)人数6010602080208030100109010要求这次调查的极限抽样误差不超过 1元,概率保证程度95.45%,试按类 型抽样调查组织形式计算必要抽样数目。5. 某商店对购进的一批大衣的质量进行检查,抽样结果有1.2%的不合格品,若抽样平均误差为0.02%,试分别在以下各条件下估计不合格品率。(1)抽样极限误差为0.04%;(2)可靠程度为68.27%。6. 为调查农民的生活水平,在某地 5000户农民中采用不重复简单随机抽样 抽取了 400户进行调查,得知这400户中有彩色

33、电视机的为87户,试以95%的把握估计该区全部农户中拥有彩色电视机的农户所占的比率。又,若要求抽样允许误差不超过0.02,问至少应抽取多少户作样本?7. 要对全及总体1000个单位进行5%的机械抽样。(1)全及总体要划分为多少部分?( 2)每部分的单位数为多少? ( 3)中选单位间隔是多少?( 4)如果 第一组抽到第5号单位,其他中选单位的号码是多少?8.某工厂对1000箱入库产品进行抽检。现从中抽取 100箱(每箱装100个 产品),对这100箱进行全部检查,结果如下:废品率()122334箱数(箱)603010(1) ( 1)试在68.27%的把握程度下估计废品率的范围;(2) ( 2)试

34、以95%的把握估计这批产品的废品数为多少;(3) 生产车间称这批产品的不合格率在 1%以下,试根据抽样结果说明这一 说法是否可信?9. 某院有30个教学班,每班40名学生。从中抽取8个班,再从中选班中各抽10名学生检查教学效果,综合评分结果如下:平均得分6782736985788380方差4.53.24.43.84.04.35.23.4试以95%的把握估计全院平均成绩第一章 相关分析与回归分析一、本章重点1 相关系数的概念及相关系数的种类。事物之间的依存关系,可以分为函 数关系和相关关系。相关关系又有单向因果关系和互为因果关系; 单相关和复相 关;线性相关和非线性相关;不相关、不完全相关和完全

35、相关;正相关和负相关等类型。2 相关分析,着重掌握如何画相关表、相关图,如何测定相关系数、测定 系数以及进行相关系数的推断。相关表和相关图是变量间相关关系的生动表示, 对于未分组资料和分组资料计算相关系数的方法是不同的,一元线性回归中相关 系数和测定系数有着密切的关系,得到样本相关系数后还要对总体相关系数进行 科学推断。3 回归分析,着重掌握一元回归的基本原理方法,一元回归是线性回归的基础,多元线性回归和非线性回归都是以此为基础的。用最小平方法估计回归参数,回归参数的性质和显著性检验,随机项方差的估计,回归方程的显著性检验, 利用回归方程进行预测是回归分析的主要内容。4 应用相关与回归分析应注

36、意的问题。相关与回归分析都有它们的应用范 围,必须知道在什么情况下能用, 什么情况下不能用。 相关分析和回归分析必须 以定性分析为前提,否则可能会闹出笑话, 在进行预测时选取的样本要尽量分散, 以减少预测误差, 在进行预测时只有在现有条件不变的情况下才能进行, 如果条 件发生了变化,原来的方程也就失去了效用。二、难点释疑本章难点在于计算公式多, 不容易记忆, 所以更要注重计算的练习。 为了掌 握基本计算的内容, 起码应认真理解书上的例题, 做完本指导书上的全部计算题。 初学者可能会感到本章公式多且复杂,难于记忆,其实只要抓住Lxx 、Lxy 、Lyy这三个记号, 记住它们的展开式, 几个主要的

37、公式就不难记忆了。 如果能自己把 这些公式推证一下,搞清其关系,那就更容易记住了。三、练习题(一)填空题1 事物之间的依存关系,根据其相互依存和制约的程度不同,可以分为( )和( )两种。2相关关系按相关关系的情况可分为()和( );按自变量的多少分( )和( );按相关的表现形式分()和();按相关关系的密切程度分( )、( )和( );按相关关系的方向分( )。3回归方程只能用于由( )推算( )。 4一个自变量与一个因变量的线性回归,称为()5估计变量间的关系的紧密程度用()6在相关分析中,要求两个变量都是随机的,而在回归分析中要求自变量 是( ),因变量是( )。7已知剩余变差为 25

38、0 ,具有 12 对变量值资料, 那么这时的估计标准误差 是( )。8将现象之间的相关关系,用表格来反映,这种表称为(),将现象之间的相关关系用图表示称( )。9若两个变量完全不相关,则相关系数等于(),若两个变量完全相关,则相关系数等于( )。10在回归方程 y=a+bx 中,待定系数 a 为(), b 为()。11若已知 y 为每亩蔬菜产量(单位:百公斤) ,x 为每亩地施肥量(单位: 公斤),已知 y=9.964+0.891x 并已知每亩地最高施肥量为 70 公斤,最低施肥量 为 35 公斤,那么每亩地蔬菜产量的大致变动范围为()到( )。(二)名词解释1. 函数关系2.相关关系3.单项

39、因果关系4. 互为因果关系5.回归分析6.一元线性回归模型7. 估计标准误差(三)判断题1某一变量的每一个数值都有另一变量的确定的值与之对应,这种关系叫 相关关系。( )2任何两个有相关关系的现象,计算其相关系数一定是在-1 至 1 之间。()3当相关系数等于 1 或 -1 时,两个变量的关系是函数关系,当相关系数等 于零时,说明两个变量之间的关系不是相关关系。 ( )4计算相关系数时,首先要确定自变量和因变量。 ( )5积距相关系数的正负号主要取决于计算公式的分子符号。 ( )(四)单项选择题1相关分析研究的是()。A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D

40、、变量之间的线性关系2若变量 X 的值增加时,变量 Y 的值也增加,那么变量 X 和变量 Y 之间 存在着( )。A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系3若变量 X 的值增加时,变量 Y 的值随之下降,那么变量 X 和变量 Y 之 间存在着()。A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系4相关系数等于零表明两变量()。A、是严格的函数关系B、不存在相关关系C、不存在线性相关关系 D、存在曲线线性相关关系5相关关系的主要特征是()。A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是 确定的关

41、系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系6时间数列自身相关是指( )。A、两变量在不同时间上的依存关系B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7 .如果变量X和变量丫之间的相关系数为负1,说明两个变量之间()A、不存在相关关系B、相关程度很低C、相关程度很高D、完全负相关8. 若物价上涨,商品的需求量愈小,则物价与商品需求量之间()A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9. 相关分析对资料的要求是()。A、两变量均为随机的B、两变量

42、均不是随机的C、自变量是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10. 回归分析中简单回归是指( )。A、时间数列自身回归B、两个变量之间的回归C、变量之间的线性回归D、两个变量之间的线性回归(五)多项选择题1. 下列属于相关关系的有()。A、农作物收获量和施肥量之间的关系B、家庭收入与生活费支出间的关系C、圆面积和圆半径之间的关系D、身高与体重之间的关系E、美国人口数和加拿大粮食产量之间的关系2. 下述关系中属于负相关的有()。A、在合理限度内,农业中施肥量和平均亩产量之间的关系B、工业企业中生产用固定资产平均价值和产品总产量之间的关系C、商业企业的劳动效率和流通费用率之

43、间的关系D、单位产品成本和原材料消耗量之间的关系E、工业产品产量和单位产品成本之间的关系3. 现象间相互依存的类型有()。A、函数关系 B、相关关系C、回归关系 D、随机关系 E、结构关系4 下列语句中正确的有()。A、具有明显因果关系的两变量一定不是相关关系B、只要相关系数数值较大,两变量就一定存在密切的相关关系C、相关系数的符号可说明两变量相互关系的方向D、样本相关系数和总体相关系数之间存在着抽样误差E、不具有因果关系的变量一定不存在相关关系5 回归方程可用于()。A、根据自变量预测因变量B、给定因变量推算自变量C、推算时间数列中缺失的数据D、给定自变量推算因变量E、用于控制因变量6、直线

44、相关分析的特点有()。A、两变量不是对等的B、两变量只能算出一个相关系数C、相关系数有正负号D、两个变量都是随机的E、相关系数的绝对值是介于0 1之间的数(六)简答题1 什么是相关关系,相关分析有什么作用?2简述相关分析的特点。3 简述相关分析和回归分析的关系。(七)论述题试述相关与回归分析应注意的几个问题。(八)计算题1.某地生猪存栏数资料如下:单位(千头)年份1979198019811982198319841985存栏数52.064.982.6107.9146.2154.4172.2计算本期与前期存栏头数的相关系数;2. 生产某种产品的八个企业产量与单位成本资料如下:企业编号12345678产量(千件)2.51.83.22.33.64.21.22.9单位成本(万元)1.62.41.41.81.51.42.31.5 计算单位成本与产量间的相关系数; 列出正规方程组求单位成本倚产量的回归方程并解释回归方程中各系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论