



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1章 绪论1.1 什么是统计?1. “统计”一词与“国家”来自同一词源:status。2. 统计是用来处理数据的,从数据中找出信息,并做出结论。统计有三个基本含义:n 指统计数据的收集活动,统计工作。如人口普查。n 指统计活动的结果,指的是具体的数据,统计数据。如“56%的观众认为2005年春节晚会千手观手最好看”。n 指分析统计数据的方法和技术,即统计学。一般从第三个含义来定义统计,即统计是指一组方法,用来设计实验,获得数据,然后在这些数据基础上组织、概括、演示、分析、解释和得出结论。3. 统计数据的规律。实例一:人口的性别比。实例二:掷硬币。实例三:粮食作物与施肥量的关系。4. 总体与样本。这两术语是我们今后学习的核心。n 总体是指所有研究要素的全体汇总。汇总是全部的,它包含所有被研究的对象。n 样本是指从一个总体中抽出部分要素的汇总。如:测量华南理工大学本科生的身高。这里,华南理工大学全体本科生就是一个总体。若因为种种原因,只抽出了500个学生进行测量,以之来推断全体本科生的身高,这里抽出的500个学生就是样本。5. 看陈希孺院士的序。统计方法之正确使用有赖于三个方面:n 数据的取得必须符合随机性的要求。n 模型和方法的选择。n 在统计分析结果的解释上。1.2 统计学与相关学科1. 统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在规律性,以达到对观察事物的科学认识。2. 描述统计学:指的是统计数据的收集、整理、显示和分析的方法。一般对总体数据进行描述以认识总体数据数量规律性。推断统计学:在对样本数据描述的基础上,利用概率论知识对统计总体的求知数量特征进行推断。3. 相关学科:数学及在各学科中的应用。1.3 统计的使用与滥用在进入统计学的学习之前,我们看四个例子,运用统计能帮助我们解决实际问题。n 一灯泡厂每天大约生产50万只灯光,质量控制部门必须检验灯泡的次品率。这个任务可以通过检验每一只灯泡来完成,但这样做的花费巨大而且会造成每只灯泡价格的猛涨。另一方法是从每天生产的50万只灯泡中选 出1 000只,然后检验这1 000只灯泡。如果这1 000只灯泡是以正确的方式被选出来的,那么从中检测出的次品比例,可被用于估计全天所有产品的次品比例。n 为了调查研究“人在戒烟后体重会增加”这一断言,研究人员选择了一个由400个参与者构成的样本,他们都成功地参与了戒烟运动。每个人在活动开始前和一年后都称量了体重。参与者体重的平均变化是增加了5磅。研究人员由此总结说有证据表明这一断言是正确的。n 为了研究氮肥对小麦产量的影响,研究人员一共可以利用15块田地。他们随机地选择3块田分配给五种被考察的氮肥中的一种。在所有这15块田中种上同种小麦。所有这些田都以同样的方式耕作,直到收获的季节,记录下这15块田的亩产量。试验者想决定任何麦田的最佳氮肥施肥量,但显然他只能在有限的一些田块中做试验。当得出使试验田有最大产量所需要的氮肥量后,研究人员能断言,这个施肥量对于与试验田具有相同特征的麦田也适用吗?n 民意调查问题。统计的使用很多,这里我们重点对统计的滥用进行介绍。“有三类谎言:谎言、糟透的谎言和统计”。使用统计“就像喝醉酒的人使用街灯柱支撑的功能多于照明”。为什么会滥用?n 不好的样本。这是滥用统计的一个主要来源:不恰当的方法收集数据。问题一:ABC曾进行过一次民意调查,186000名参加者拨通900电话说出他们对将联合国总部保留在美国这件事情的看法。结果表明,那些打电话的人中,有67%的人赞成将联合国移出美国。另一个对500人进行的“科学的”民意调查表明,有72%的人希望联合国留在美国。哪一个更能真实地反映美国民众的一般观点?自选择调查(自愿回答样本)。回答者自己决定是否要被包括进样本中。n 小样本。基于非常小的样本而得出广泛的结论或推论。n 带有引导性的问题。调查中问题的措辞可能会引出想得到的回答。n 误导性的图表。夸大或缩小数据的真实含义。n 太精确的数据。n 局部描述。n 故意曲解数据。问题二:你能否说出下面这个事情中的4个主要缺陷?一家日报做了一项调查,让读者打电话来回答:“你是否支持开发能够杀害上千万无辜百姓的核武器?”调查的结果是20位读者回答了问题,其中87%说“不”,而13%说“是”。1.4 实验设计案例与活动一:小儿麻痹疫苗的检验实验一般来说,我们收集数据就是为了一个特定的目的,收集数据后对其进行分析以帮助我们达到目的。我们获得数据通常有两个主要来源:调查和实验。如,人口普查是调查;CCTV通过某种方式进行电话调查,以确定在晚上9点收看CCTV的人占整个群体的百分比也是调查。一个实验的例子是小儿麻痹疫苗的检验:1954年,20万儿童被实际注射了小儿麻痹疫苗,另20万儿童只是注射了一种安慰剂,不包括任何药物成分。这是一个设计得较好的实验,将进行处理的那一组的影响和没有进行处理的那一组影响进行比较,使用两个组就能够评价小儿麻痹疫苗在预防小儿麻痹方面的效果。为什么说这是一个比较好的实验呢?一般来说,设计一个能产生有效结果的实验时,应该遵循一些基本的步骤:1. 确认你的目的:确认要回答的准确问题,并且清楚地确认相关总体。在小儿麻痹疫苗检验实验中,目的是“小儿麻痹疫苗是否有效地降低了小儿麻痹症对儿童这个总体的影响”。2. 收集样本数据。样本数据收集方式对实验的成功是绝对重要的。样本数据必须是问题中样本的代表,样本必须足够大;以使处理的影响能够反映出来,问题的研究应该在没有额外因素干扰的情况下进行。在小儿麻痹疫苗检验实验中,样本容量是20万儿童,足够大,可以看出小儿麻痹疫苗的有效性。使用致盲技术来控制额外因素的影响。在这类试验中,经常会出现没有得到治疗的对象错误地相信他接受了治疗并且汇报改善了症状,这就是安慰剂效应。安慰剂效应可以通过致盲技术来处理,小儿麻痹疫苗检验实验中使用了双重致盲技术:接受注射的孩子不知道他们被注射了小儿麻痹疫苗还是安慰剂;进行注射和评价结果的医生也不知道孩子是被注射了疫苗还是安慰剂。3. 使用随机程序以避免偏向。在小儿麻痹疫苗检验实验中,孩子们通过一个被随机选择的过程被分为两组,使得这两组都有相似的对象组成。并在考虑基于孩子健康、年龄和居住地以及其他相关因素等方面对孩子进行分组。这里我们再强调一次,收集数据的方式非常重要,不仔细收集的数据是毫无用处的,没有什么统计方法可以拯救它。一般来说,有五种经常使用的抽样方式。n 随机抽样。随机样本中,总体中的每个成员都有相等的机会被选中。一个有n个对象的简单随机样本是以这样一种方式被选择的,即n个对象中的每个可能的样本都有相同的机会被选中。n 系统抽样。在总体中选择某个起点,然后选择每第K个元素。现在要对华南理工大学29500个学生的生活费用进行调查,我们可先按某种方式对这29500个学生进行排序(如按姓名的拼音进行升序排列)以组成一个花名册,然后选择每50个学生,得到590个学生组成的样本。这是一个非常简单常用的方法,如果我们随机地选择起点,就能得到一个随机样本,每个学生都有可能被抽中。问题三:这种方式能得到一个简单随机样本吗?n 方便抽样。仅使用那些容易获得的样本。方便抽样的结果可能很好,但在其他很多情况下它是严重有偏的。n 分层抽样。指将总体细分为至少两个小组(或称层)这些层都有某种相同的特征(如性别、年龄段),然后从每一个层中抽出一些样本。n 聚类抽样。指首先将总体分成一些类,然后在这些类中随机选择一些,再选择这些被选中的类中的全部成员。在实践中,专业人士经常使用这5种方法的某种组合来收集数据。4. 分析数据,形成结论。分析发现,小儿麻痹疫苗确实有效。这里要提醒大家的是,无论你将样本选择和实验设计及其实施得多么好,结果中仍然会出现一些错误。如你可能随机选择了1000个成年人,如果他们高中毕业,就让他们回答“是”,以记录一个样本比;如果你再选择另外一个由1000个成年人组成的样本,你可能会得到不同的样本比。抽样误差。是指样本结果和真实结果之间的差异;这种误差由偶然的样本波动引起的。当样本数据错误地收集、记录或分析时就会产生非抽样误差。问题四:在习题-中识别抽样的类型:随机、系统、方便、分层和聚类。电话调查。某公司计划对广州市市民进行一次民意调查,他们使用计算机随机生成电话号码,自动拨打。MTV调查。某MTV的营销专业正在进行一项调查,其中500个人将随机从1019,2029等年龄组中的每个组中选出。新闻报告。一名ABC新闻记者对在街上走过他身边的人进行民意调查。医学研究。中山大学的一名研究人员对30个随机选择的医院的每所医院所有的心脏病人进行了调查。汽车物主身份。GM公司的一名研究人员将所有登记在册的汽车分为微型、小型、中小型、中型和大型等各类。她对从每个类中随机选择的200名车主进行了调查。陪审员选择。某县陪审委员会获得了一个列有42763名车主的表,他们将表中每第100个人选出组成了一个陪审团。学生饮酒。工商管理学院对学生饮酒进行了一项调查,他们随机地选出10个班级,然后对每个班中的所有学生进行检查。游说议员。一个烟草工业的游说者将535个议员的名字写在一些个人索引卡片上,将它们放在一个盒子里,然后选出50个不同的人员,通过这种方式得到了由议会成员组成的样本。教育与工资。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年飞行汽车考试题及答案
- 2025年度调度规程考试题库及答案
- 高铁隧道施工劳务合同(3篇)
- 高速工程施工合同(3篇)
- 高频焊檩条采购合同模板(3篇)
- n3级级护士手考试试题及答案
- 航空航天单位员工航天技术聘用合同
- 互联网餐厅厨师承包服务与管理协议
- 2025公务员真实面试题及答案
- 深圳市绿色环保产业门面租赁及市场推广协议
- 第五章-近交系数与亲缘相关系数
- GB/T 42062-2022医疗器械风险管理对医疗器械的应用
- GB/T 30106-2013钟表防水手表
- GB/T 24432-2009假肢费用赔偿鉴定
- 厨房设备采购安装合同标准范本(2篇)
- 多模态语篇分析课件
- 前厅服务与管理课程标准
- 旧楼加装电梯安装合同范本
- 支气管舒张试验
- 道路工程安全技术交底记录大全
- 特种作业人员管理档案参考模板范本
评论
0/150
提交评论