




已阅读5页,还剩92页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学(第5版)贾俊平放学后的思考问题和练习问题的解答(最终完整版)第一部分思考问题第一章思维问题1.1什么是统计学统计学是一门关于数据的学科,对来自收集、处理、分析、各个领域的数据进行解释,并得出结论。1.2说明统计和估计统计研究了统计数据收集、处理、摘要、图表描述、摘要和分析等统计方法。估计统计是研究利用样本数据估计总体特征的方法的统计方法。1.3统计学类型和不同类型的特点根据采用统计数据的计量尺度进行区别(定性数据)分类数据:只能归属于某个类别的非数字数据,是对事物进行分类的结果,数据表现为类别,用文字表现(定性数据)顺序数据:只能归属于某个秩序类别的非数值型数据。 也有班级,但这些班级有秩序。(定量数据)数值型数据:用数字刻度测量的观测值,其结果表现为具体的数值。按统计数据统计数据按方法收集观测数据:通过调查和观测收集到的数据,这样的数据是在没有人为控制的情况下得到的。实验数据:实验中控制受试者收集的数据。统计数据根据所描述的现象和实践的关系来区分截面数据:在相同或类似的时刻收集的数据也称为静态数据。时间序列数据:按时间序列收集,用于描述现象随时间变化的情况,也称为动态数据。1.4解释分类数据、顺序数据、数值型数据答案与1.3相同1.5以整体、样本、参数、统计量、变量等概念为例进行说明对一千个灯泡进行寿命试验,一千个灯泡整体,从中抽取一百个进行检查。 该百个灯泡的集合是样本,描述千个灯泡寿命的平均值、标准偏差和合格率等特征的数值是参数,描述这百个灯泡寿命的平均值、标准偏差和合格率等特征的数值是统计量,变量是解释现象特征的概念。1.6变量的分类变量分为分类变量、顺序变量、数值型变量。变量也可以分为随机变量和非随机变量。 经验变量和理论变量。1.7给出离散型变量和连续性变量的例子离散型变量只能取有限个值。 值由整数位分隔。 例如“企业数量”连续型变量是连续取的,所以不能一一列举。 例如“温度”。1.8统计应用实例人口普查、百货公司的名义调查等。1.9统计应用领域经济分析和政府分析有物理,生物等各种各样的领域。第二章思维问题2.1什么是二手资料? 使用二手资料时应注意什么问题关于研究内容,通过别人的调查和实验已经存在,我们利用的资料是“二手资料”。 使用时进行评价,资料的原始收集者、收集目的、收集途径、收集时间使用时要注明数据源。2.2比较概率抽样和非概率抽样的特点,指出各自的应用情况概率抽样:抽样时按一定概率随机原则抽取样品。 当利用样本估计总目标量时,必须考虑提取每单位样本的概率。 技术含量和成本都很高。 如果调查的目的是把握对象整体的数量特征进行研究,得到整体参数的信赖区间,就使用概率抽样。非概率抽样:操作简单,时效快,成本低,且对抽样中统计学专业技术的要求不大。 这适用于探索性研究,调查结果发现了问题,为更深入的数量分析提供了准备。 也使用市场调查的概念测试(不需要将调查结果投影到整体上)。2.3除了自我填写式外,面试式和电话式还有什么收集数据的方法试验式和观察式等2.4自填式、面试式和电话式各自的优点和弱点自填式优势: 1调查组织者易于管理,2成本低,可进行大规模调查,对3个对象回答方便,减少对回答敏感的问题压力。 缺点: 1返回率低的2个结构不适合复杂的问卷调查,调查内容有限的3个调查周期长的4个数据收集中发生问题时,不能立即调整。采访式优势: 1回答率高2数据质量高3调查中发生问题时,可以立即调整。 缺点: 1成本较高的2数据采集方式对于调查过程的质量控制存在一定困难的3敏感问题,对访问者有压力。电话优势:速度快的双调查员比较容易控制安全的三访问过程。 缺点: 1实施地域有限的2个调查时间不能太长的3个使用了的问卷,4个访问者不想回答的时候很难说服。2.5老师说这个内容不说,实验数据应该不考试2.6如何控制调查中的答复误差要了解误差,就要学习心理学知识,尽量缩短记忆误差的时间,有意识的误差要做被调查者的心理工作,遵守职业道德,保守被调查者的秘密,尽量不要在问卷上处理敏感的问题。2.7如何减少无答复对于随机误差,只有提高样本容量,对于系统误差,采取准备和纠正措施。 例如,如果需要100份调查问卷,就要准备120130份调查问卷,面试时尽量说服不想回答的人,用小礼物提高回答率。第三章思维问题3.1数据预处理内容数据审计(完整性和准确性)适用性和实效性,数据筛选和数据排序。3.2分类数据和顺序数据的整理和图示方法分别是什么分类数据:制作度数分布表,按比例、百分比、比率等进行记述性分析。 可以用条形图、帕累托图和饼图进行图表分析。顺序数据:创建度数分布表,按百分比、百分比和百分比。 记述性地分析累计度数和累计频度等。 用条形图、帕累托图和饼图、累积频数分布图和甜甜圈图进行图表分析。3.3数据类型数据的分组方法和步骤分组方法:单变量值组和分组距离组、分组距离组又分为等间隔组和不同距离组。分组步骤:确定1组数确定2组的组间距离的每3组整理成度数分布表3.4直方图与条形图的区别单条图以图的长度表示各种度数的多少,其宽度一定,直方图以面积表示各组的度数,矩形的高度表示各组的度数和频度,宽度表示组的距离,双直方图的各矩形连续排列,条形分别排列,三条图主要表示分类数据3.5绘制线图要注意问题时间绘制在横轴上,观测值绘制在纵轴上。 通常是长宽比为10:7的矩形,纵轴的下端通常从0开始,如果数据与0之间的距离过大,则折线会折断。3.6饼图与环形图的区别饼图只能显示一个样本或整个样本的百分比。 饼图可以同时绘制多个样本或整个数据序列。 在图元的中心有一个“空洞”,每个样本或整个数据序列都是一个循环。3.7茎叶图比直方图的优越性,他们各自的应用场景茎叶图不仅可以表示数据的分布状况,还保存着各个原始数据,即原始数据的信息。 在应用方面,直方图通常应用于大量数据,而茎叶图则应用于少量数据。3.8识别图标优劣的标准p25有明确的答案,所以我不会写。3.9编制统计表应注意的问题1、合理定位统计表结构的第二头部,在使用统计表时,可以根据需要在下面注释以描述数据源,其中三个表的上下两条横线一般包括表号、总标题和表的数据单位等内容。公式:组的值=(上限下限)/2第4章数据的概要测量4.1一组数据的分布特征是从哪个方面来测量的?数据分布的特征可从三个方面进行测度和描述:一是分布的集中倾向,反映各数据接近或集中在其中心值的程度;二是分布的离散度,反映各数据远离其中心值的倾向;三是以分布的形式,反映数据分布的偏差和峰值状态。4.2如何理解平均在统计学中的地位?平均在统计学中具有重要的地位,是集中倾向的最主要的测度,主要应用于数值型数据,不应用于分类数据和顺序数据。4.3简述四分位数的计算方法。四分位数是数据排序后的25%和75%位置的值。 根据未分组的数据计算四分位数时,首先对数据进行排序,然后确定四分位数的位置。 这个位置的数值是四分位数。4.4为什么对比率数据的平均采用几何平均值?在实际应用中,比例数据的平均值与算术平均值相比采用几何平均值更合理。 从式子也可以看出,g是平均增长率。简述4.5大众数、中值和平均数的特点及应用场景。大众数是数据分布的高峰,不受极端值的影响,缺点是具有不一致性。 大众数据只在数据量多的情况下有意义,数据量少的情况下不使用。 主要适用于作为分类数据的集中倾向测度值。中央值是一系列数据的中间位置的代表值,不受极端值的影响。 当数据分布偏差较大时,可能最好使用中值。 主要适用于作为顺序数据的集中倾向测度值。平均对数值型数据进行计算,并利用所有数据信息进行实际应用最广泛。 如果数据对称或近似分布,且三个代表值相等或相近,则必须选择平均值。 但是,平均值容易受到极端值的影响,对于有偏差的分布的数据,平均值的代表性差,这时必须考虑中央值和最频值。4.6大众比例、四分位差、方差或标准偏差的应用情况简述如下关于分类数据,主要对于使用大众比率测定离散度的顺序数据,也可以计算异人比率,但主要对于使用四分位差测定离散度的数值型数据,可以计算异性比率和四分位差,但是主要使用方差和标准偏差测定离散度。4.7标准分数有哪些用途?标准得分表示数据集中每个数字的相对位置。 处理具有不同维度的多个变量时,往往需要将各变量规范化。 它还可用于确定数据组中是否存在脱离的数据。4.8为什么要计算离散系数?方差和标准偏差是反映数据方差程度的绝对值,另一方面,该数值的大小受到原变量值本身水平的高低的影响,也就是说与变量的平均大小有关,另一方面,它们与原变量的测量单位相同,采用不同测量单位的变量值时,其偏差程度的测量值也不同。 因此,为了消除变量值的等级的高低和计量单位的差异对离散度测度值的影响,需要计算离散系数。4.9测度数据分布形状的统计量是什么?分布形状的测度有偏差和尖度,测度偏差的统计量是偏差系数,测度尖度的统计量是尖度系数。第五章概率和概率分布5.1频率和概率有什么关系?在相同的条件下,进行n次随机测试,若某事件a出现m次,则比率m/n被称为事件a发生的频率。 随着n增大,该频率以某常数p为中心变动,变动幅度逐渐变小,倾向于稳定,该频率的稳定值为事件的概率。5.2独立性和排他性有什么关系?互斥事件必须相互依存(不独立),但相互依存的事件不一定是互斥的。非专用事件可以是独立的,也可以不独立的,但是独立事件不是专用的。5.3根据自己的经验,列举几个遵循泊松分布的随机变量的实例。例如,某个设备每月故障次数、书1页的印刷错误、某个医院某日的急救患者数等5.4根据自己的经验,列举几个遵循正态分布的随机变量的实例。某班考试成绩,某地区成年男性身高,某公司年销售额,同一职场产品质量等第六章思维问题当设为6.1统计量: X1,X2时,Xn是从整体x中提取出的容量为n的样本,当从该样本构成函数T(X1,x2xn )时,不依赖于未知的参数的函数T(X1,x2xn )为统计量。原因:为了使统计推断成为可能。6.2 T1和T2是6.3 P1596.4统计量加工中一点信息也不丢失的统计量是充分的统计量6.5自由度:独立变量的个数6.6 c2分布:假设f分布: u为按照自由度n1 c2分布即Uc2(n1 ),v为按照自由度n2的C2分布即Vc2(n2 ),如果u和v相互独立将f记为遵从自由度n1和n2分布6.7采样分布:采样统计量的概率分布是理论概率分布的概率变量之一是采样统计量6.8中心极限定理:从平均值为m、方差为s 2的任意总体中提取容量为n的样本,当n足够大时,样本平均值的样本分布遵循平均值、方差2/n的正态分布第七章思维问题7.1估计量:用于估计整体参数的随机变量估计值:估计参数时计算的统计量的具体值7.2评估估计量的标准:无偏差:估计量的样本分布的数学期望等于估计的总参数有效性:具有较小标准偏差的估计量对于同一整体参数的两个无偏差的估计量更有效一致性:随着采样容量的增大,估计量的值接近估计的整体参数7.3置信区间:由样本统计量构成的整体参数的估计区间7.4 95%的置信区间是指,用某种方法构筑的全部区间中,95%的区间包含全体参数的真实值。7.5意义: Za/2是标准正态分布的上侧面积为a/2的z值,式是统计总体平均时的极限误差。7.6独立样本:如果从两个总体中独立提取两个样本,即一个样本的元素与另一个样本的元素是独立的。匹配样本:一个样本的数据对应于另一个样本的数据。7.7 (1),两者均服从正态分布(2)、两个样本独立从两个总体中提取7.8样本量越大,可靠度越高,整体方差和极限误差越小第八章思维问题8.1假设检查和参数推定有什么共同点和不同点?答:参数估计和假设检验是统计估计的两个组成部分,它们全部用样本进行某种估计,但估计的角度不同。 参数估计研究了使用估计前未知的总体统计量来估计总体参数的方法。 在参数假设验证中,针对的值建立假设,使用样本信息验证该假设是否成立。8.2假设检查中的显着性水平是什么? 统计上弄清楚了是什么意思?答:显着性水平是统计上的固有名词,在假设验证中,是指原假设正确时被拒绝的概率和风险。 统计显着性等效排斥H0,求出的值在概率小的区间内,通常在0.05或比0.05小的显着性水准内。8.3假设检查中的2种错误是?a :假设检查的结果可能是错误的,犯的错误有两种类型。 一个错误假设H0为真而被拒绝,由于该错误的概率用来表示,因此也称为错误或舍弃真错误的另一种错误,假
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《商务英语听力2》课程简介与教学大纲
- 企业数字化运营平台渠道管理运营中心设计方案
- 老年人家庭护士培训课件
- 实数性质与实数运算(3大知识点+10大典例+变式训练+过关检测)解析版-2025年新八年级数学暑假提升讲义(北师大版)
- 肾结石5分钟止痛姿势
- 山东省银行柜面业务操作人员上岗证考试题库
- 期末专项:多选题-2026年高一数学下学期人教A版必修第二册(含解析)
- 碳单质和碳的氧化物-中考化学一轮总复习基础通关
- 酸和碳酸盐反应课件
- CN120198840A 结合视频诊断工具的化工园区安全评估方法及系统
- 2025年辽宁省沈阳市单招职业适应性测试题库完整版
- 市1地高标准农田建设项目验收报告
- 部编教科书语文一年级上册教师教学用书
- 思想政治教育专业导论
- 2025年八年级语文上册名著阅读《红星照耀中国》重要考点梳理+备考真题精练
- 临近既有线大型机械施工安全专项技术方案
- 人教版五年级道德与法治上册教学计划(及进度表)
- 膳食营养与体重管理试题及答案
- 《财务大数据分析》教案
- 供应链金融合作合同范本
- 医务人员职业防护暴露(针刺伤)防范与应急预案课件
评论
0/150
提交评论