数学精神思想方式_第1页
数学精神思想方式_第2页
数学精神思想方式_第3页
数学精神思想方式_第4页
数学精神思想方式_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学精神思想方式 数学精神思想方式 统计案例统计案例:辨识辨识 统计方法统计方法:数据数据 主题预告主题预告:主题四主题四,代数学代数学 体验感受对随机现象中蕴藏规律的探究精体验感受对随机现象中蕴藏规律的探究精 神、随机思想、实验方法。统计的力量神、随机思想、实验方法。统计的力量 精细化的研究(从细微处考究)精细化的研究(从细微处考究) 拓展性的思考:面试时先摆出弱点有可能说拓展性的思考:面试时先摆出弱点有可能说 服别人给你一份工作(华盛顿大学希金斯):服别人给你一份工作(华盛顿大学希金斯): 资格条件、工作经验。关键是应聘者看起来资格条件、工作经验。关键是应聘者看起来 是不是一个令人愉快的人

2、(兴趣的话题、保是不是一个令人愉快的人(兴趣的话题、保 持微笑、夸赞、眼神交流)持微笑、夸赞、眼神交流) 坦荡的表现坦荡的表现 在钱包里放婴儿照片,能让钱包丢失后被送回来在钱包里放婴儿照片,能让钱包丢失后被送回来 的几率高达的几率高达35%(60、70年代心理学家研究)年代心理学家研究) 数学精神思想方式 具体案例一:谁是具体案例一:谁是红楼梦红楼梦的作者的作者 我国有一部古典文学名著我国有一部古典文学名著红楼梦红楼梦,虽然书,虽然书 的封面上通常都印有曹雪芹和高鹦两位作家的名的封面上通常都印有曹雪芹和高鹦两位作家的名 字,但是,它的作者究竟是谁,现在还是一个字,但是,它的作者究竟是谁,现在还

3、是一个 谜一些专家正在试图用数学方法揭开这个谜谜一些专家正在试图用数学方法揭开这个谜 有一种研究方法是以计算机为工具,对这部名著有一种研究方法是以计算机为工具,对这部名著 的遣词造句进行统计和分析,看写作手法是否前的遣词造句进行统计和分析,看写作手法是否前 前后后完全一致,如果整本小说出自一人之手,前后后完全一致,如果整本小说出自一人之手, 那么不管翻到书的哪一部分,遣词造句的写作手那么不管翻到书的哪一部分,遣词造句的写作手 法应该极其相像法应该极其相像 给一个统计方案给一个统计方案 数学精神思想方式 两种方法结论不一两种方法结论不一: 统计统计红楼梦红楼梦的前的前80回中,丫环、佣人、老妈回

4、中,丫环、佣人、老妈 子等下人都自称为子等下人都自称为“小的小的”。到了后。到了后40回,则一般回,则一般 都自称为都自称为“奴才奴才”,说明前,说明前80回和后回和后40回的作者都回的作者都 不是同一个人。不是同一个人。 1987年年复旦大学学报复旦大学学报介绍说,李贤平先生将介绍说,李贤平先生将 红楼梦红楼梦120回看作一个整体,统计了回看作一个整体,统计了47个虚字个虚字 的出现频率,又提出了不能笼统的认为前的出现频率,又提出了不能笼统的认为前80回一人回一人 所写,后所写,后40回为另一个不相干的人所写的看法。那回为另一个不相干的人所写的看法。那 么么红楼梦红楼梦的作者究竟是曹雪芹一个

5、人呢,还是的作者究竟是曹雪芹一个人呢,还是 曹雪芹和高鹦两个人呢,还是它原本就是一部在几曹雪芹和高鹦两个人呢,还是它原本就是一部在几 本民间小说基础上合成的长篇小说呢?现在还没有本民间小说基础上合成的长篇小说呢?现在还没有 定论。定论。 数学精神思想方式 深化案例深化案例: 作者是谁?让数学来证明作者是谁?让数学来证明 红楼梦红楼梦是一人所作?此书成书是一人所作?此书成书200200多年前:曹雪芹、高鄂多年前:曹雪芹、高鄂 19811981年在首届年在首届红楼梦红楼梦研讨会上,美国威斯康星大学讲师研讨会上,美国威斯康星大学讲师 陈炳藻独树一帜,宣读了陈炳藻独树一帜,宣读了从词汇上的统计论从词汇

6、上的统计论红楼梦红楼梦作者作者 的问题的问题的论文。用计算机对字、词出现的频率进行统计处理、的论文。用计算机对字、词出现的频率进行统计处理、 分析,得出作者为一人。分析,得出作者为一人。 语体风格是人们在语言文字表达活动中的个人言语特征,是语体风格是人们在语言文字表达活动中的个人言语特征,是 人格在语言文字活动中的具体表现。这种风格在一定程度上通人格在语言文字活动中的具体表现。这种风格在一定程度上通 过数量特征来刻画。例如,句长和词长可以代表作者造词句的过数量特征来刻画。例如,句长和词长可以代表作者造词句的 风格,当然,反映作者风格的不是单个词的词长和单个句子的风格,当然,反映作者风格的不是单

7、个词的词长和单个句子的 句长,而是以一定数量的语料为基础的平均句长和平均词长。句长,而是以一定数量的语料为基础的平均句长和平均词长。 此外,字、词在作品中出现的频率也是个人风格的体现。利用此外,字、词在作品中出现的频率也是个人风格的体现。利用 计算机计算一部作品或作者平均词长和平均句长。对作品或作计算机计算一部作品或作者平均词长和平均句长。对作品或作 者使用的字、词、句的频率进行统计研究。从而了解作者的风者使用的字、词、句的频率进行统计研究。从而了解作者的风 格。这被称之为计算风格学。格。这被称之为计算风格学。 梳理出方法梳理出方法 数学精神思想方式 让佚名作者现身让佚名作者现身 “作者考证作

8、者考证”有时是一个很困难的问题有时是一个很困难的问题 计算风格计算风格 学可被应用来解决这种问题。我们看两个例子。学可被应用来解决这种问题。我们看两个例子。 出现于出现于16世纪世纪90年代的一部五幕剧年代的一部五幕剧爱德华爱德华 三世三世,表现了,表现了14世纪英王爱德华三世统治时期世纪英王爱德华三世统治时期 勇武的骑土精神、但该剧作者究竟是谁勇武的骑土精神、但该剧作者究竟是谁,戏剧界争戏剧界争 论了几百年。不久前通过电脑对该剧的语言风论了几百年。不久前通过电脑对该剧的语言风 格进行分析莎翁作品的权威机构格进行分析莎翁作品的权威机构阿顿公司正阿顿公司正 式确认式确认爱德华三世爱德华三世是莎士

9、比亚的一部早期作是莎士比亚的一部早期作 品。莎剧专家说、这部作品本身所表现出的深刻品。莎剧专家说、这部作品本身所表现出的深刻 人性、博大精神和文辞语言的华丽无可辩驳地人性、博大精神和文辞语言的华丽无可辩驳地 “用莎士比亚自己的声音用莎士比亚自己的声音”证明了它的来源。证明了它的来源。 数学精神思想方式 1964年年,美国统计学家摩斯泰勒和瑕莱斯考证了美国统计学家摩斯泰勒和瑕莱斯考证了12篇署篇署 名名“联邦主义者联邦主义者”的文章作者,可能的作者是两个人一的文章作者,可能的作者是两个人一 个是美国开国政治家汉密尔顿另一位是美国第四任总统个是美国开国政治家汉密尔顿另一位是美国第四任总统 安迪逊。

10、究竟是哪一位呢?统计学家在进行分析时发现汉安迪逊。究竟是哪一位呢?统计学家在进行分析时发现汉 密尔顿和麦迪逊在已有著作中的平均句长几乎完全相同。密尔顿和麦迪逊在已有著作中的平均句长几乎完全相同。 这使得这一能反映写作风格特征的数据此时失效了。于是这使得这一能反映写作风格特征的数据此时失效了。于是 统计学家转而从用词习惯上来找出这两位作者的有区别性统计学家转而从用词习惯上来找出这两位作者的有区别性 的风格特征,最后终于找到了两位作者在虚词的使用上有的风格特征,最后终于找到了两位作者在虚词的使用上有 明显的不同。汉密尔顿已有的明显的不同。汉密尔顿已有的18篇文章中,有篇文章中,有14篇使用篇使用

11、了了”enough”一词一词 而麦迪逊在他的而麦迪逊在他的14篇文章中根本未使用篇文章中根本未使用 “enough”一词。汉密尔顿喜欢用一词。汉密尔顿喜欢用“WHINLE” 而麦迪逊而麦迪逊 总是用总是用“whilst。汉密尔顿喜欢用。汉密尔顿喜欢用”“”“upon”而安迪逊很少而安迪逊很少 用、然后用、然后 再把两位可能的作者的上述风格特征指标与未再把两位可能的作者的上述风格特征指标与未 知的知的12篇署名篇署名“联邦主义者联邦主义者”的文章中表现出来的相应的的文章中表现出来的相应的 风格特征进行比较。结果发现那位署名风格特征进行比较。结果发现那位署名“联邦主义者联邦主义者”的的 作者就是美

12、国第四任总统麦迪逊。这样就了结了这一考据作者就是美国第四任总统麦迪逊。这样就了结了这一考据 学,长期悬而未决的公案、两位统计学家所使用的数学方学,长期悬而未决的公案、两位统计学家所使用的数学方 法也得到了学术界的认可。法也得到了学术界的认可。 数学精神思想方式 同静的顿河同静的顿河是不是抄袭是不是抄袭 长篇小说长篇小说静静的顿河静静的顿河是一部既磅磷壮观又委婉细是一部既磅磷壮观又委婉细 腻腻 扣人心弦的史诗性长篇小说是当代世界文学中流传扣人心弦的史诗性长篇小说是当代世界文学中流传 最广泛、读者最多的名著之一。他的作者肖洛霍夫因此获最广泛、读者最多的名著之一。他的作者肖洛霍夫因此获 得得1965

13、1965年诺贝尔文学奖、但小说出版后即有人说这本书是年诺贝尔文学奖、但小说出版后即有人说这本书是 肖洛霍夫从一位名不见经传的哥萨克作家克留柯夫那里抄肖洛霍夫从一位名不见经传的哥萨克作家克留柯夫那里抄 袭来的。俄国流亡在国外的一些作家加索尔仁尼琴、安德袭来的。俄国流亡在国外的一些作家加索尔仁尼琴、安德 维杰等认为维杰等认为静静的顿河静静的顿河的大部分内容是抄袭哥萨克作的大部分内容是抄袭哥萨克作 家克留柯夫的作品,理由是该书第一卷出版时、肖洛霍夫家克留柯夫的作品,理由是该书第一卷出版时、肖洛霍夫 年纪尚轻并无生活经历;另外年纪尚轻并无生活经历;另外 他以后未能写出具有同他以后未能写出具有同 样文学

14、价值的作品。肖洛霍夫充其量只是合作者罢了。样文学价值的作品。肖洛霍夫充其量只是合作者罢了。 为了弄清楚谁是为了弄清楚谁是静静的顿河静静的顿河的真正作者的真正作者. .捷泽等学捷泽等学 者采用计算风格学的方法进行考证。具体办法是把者采用计算风格学的方法进行考证。具体办法是把静静静静 的顿河的顿河四卷本同肖洛霍夫、克留柯夫这两人的其他在作四卷本同肖洛霍夫、克留柯夫这两人的其他在作 者问题上没有疑义的作品都用计算机进行分析,获得可靠者问题上没有疑义的作品都用计算机进行分析,获得可靠 的数据。并加以比较,以期澄清疑问,得出谁是真正作者的数据。并加以比较,以期澄清疑问,得出谁是真正作者 的结论。的结论。

15、 数学精神思想方式 案例二案例二:选举问题 在抽样调查中样本的选择是至关重要的样本能否代表在抽样调查中样本的选择是至关重要的样本能否代表 总体,直接影响着统计结果的可靠性下面的故事是一次著总体,直接影响着统计结果的可靠性下面的故事是一次著 名的失败的统计调查被称作抽样中的泰坦尼克事件它可名的失败的统计调查被称作抽样中的泰坦尼克事件它可 以帮助我们理解为什么一个好的样本如此重要以帮助我们理解为什么一个好的样本如此重要 在在1936年美国总统选举前,一份颇有名气的杂志年美国总统选举前,一份颇有名气的杂志 (Literary Digest)的工作人员做了一次民意测验调查兰)的工作人员做了一次民意测验

16、调查兰 顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将 当选下一届总统为了了解公众意向,调查者通过电话簿和当选下一届总统为了了解公众意向,调查者通过电话簿和 车辆登记簿上的名单给一大批人发了调查表(注意在车辆登记簿上的名单给一大批人发了调查表(注意在1936年年 电话和汽车只有少数富人拥有)通过分析收回的调查电话和汽车只有少数富人拥有)通过分析收回的调查 表显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中表显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中 获胜获胜 可是结果却相反,什么原因?可是结果却相反,什么原因? 数学精神思想方式

17、实际选举结果正好相反最后罗斯福在选举中获实际选举结果正好相反最后罗斯福在选举中获 胜,其数据如下:胜,其数据如下: 候选人候选人 预测结果预测结果 选举结果。选举结果。 罗斯福罗斯福 43 62 兰顿兰顿 57 38 像本例中这样容易得到的样本称为方便样本你像本例中这样容易得到的样本称为方便样本你 认为预测结果出错的原因是什么。认为预测结果出错的原因是什么。 简单随机抽样简单随机抽样 假设你作为一名食品卫生工作人员,要对某食假设你作为一名食品卫生工作人员,要对某食 品店内的一批小包装饼干进行卫生达标检验你准品店内的一批小包装饼干进行卫生达标检验你准 备怎样做?显然,你只能从中抽取一定数量的饼干

18、备怎样做?显然,你只能从中抽取一定数量的饼干 作为检验的样本(为什么?)那么,应当怎样获作为检验的样本(为什么?)那么,应当怎样获 取样本呢?取样本呢? 简单随机抽样:抽法、随机数法。简单随机抽样:抽法、随机数法。 数学精神思想方式 案例三:广告中数据的可靠性案例三:广告中数据的可靠性 今天已进入数字时代,各种各样的统计数字和图表充斥着今天已进入数字时代,各种各样的统计数字和图表充斥着 媒体,由于数字给人的印象直现具体,所以让数据说话是许多媒体,由于数字给人的印象直现具体,所以让数据说话是许多 广告的常用手法但广告中的数据可靠吗?广告的常用手法但广告中的数据可靠吗? 各类广告中,你会经常遇到由

19、各类广告中,你会经常遇到由“方便样本(样本没有代表方便样本(样本没有代表 性性”所产生的结论例如,某减肥药的广告称,其减肥的有效所产生的结论例如,某减肥药的广告称,其减肥的有效 率为率为75见到这样的广告你会怎么想?通过学习统计这部分见到这样的广告你会怎么想?通过学习统计这部分 内容,你会提出下面的问题吗?这个数据是如何得到的;该药内容,你会提出下面的问题吗?这个数据是如何得到的;该药 在多少人身上做过试验,即样本容量是多少;样本是如何选取在多少人身上做过试验,即样本容量是多少;样本是如何选取 的;等等假设该药仅在的;等等假设该药仅在 4个人身上做过试验,样本容量为个人身上做过试验,样本容量为

20、4, 用这样小的样本量来推断总体是不可信的用这样小的样本量来推断总体是不可信的 “现代研究证明,现代研究证明,99以上的人感染有螨虫以上的人感染有螨虫”这是一家化这是一家化 妆品公司的广告第一次听到此话的人会下意识地摸一下自己妆品公司的广告第一次听到此话的人会下意识地摸一下自己 的皮肤,甚至会感觉到有虫在里面蠕动,恨不得立即弄些药膏的皮肤,甚至会感觉到有虫在里面蠕动,恨不得立即弄些药膏 抹抹,广告的威慑作用不言而喻但这里抹抹,广告的威慑作用不言而喻但这里99是怎么得到的?是怎么得到的? 研究共检测了多少人?这些人是如何挑选的?如果检测的人都研究共检测了多少人?这些人是如何挑选的?如果检测的人都

21、 是去医院看皮肤病的人,这个数据就不适用于一般人群是去医院看皮肤病的人,这个数据就不适用于一般人群 数学精神思想方式 在理性的世界里在理性的世界里,所有的判断都是统计学所有的判断都是统计学 如何中让数据说话如何中让数据说话:数据需要收集、整理、描述、分析、判数据需要收集、整理、描述、分析、判 断。断。 形成一种好的统计思维(与确定性思维不同),它的基本形成一种好的统计思维(与确定性思维不同),它的基本 思维模式是归纳的,特征之一是通过部分的数据来推测全体数思维模式是归纳的,特征之一是通过部分的数据来推测全体数 据的性质,统计结果具有随机性,统计推断有可能犯错误。据的性质,统计结果具有随机性,统

22、计推断有可能犯错误。 日常生活:为老奶奶统计卖牛奶的数量、民意调查、药是日常生活:为老奶奶统计卖牛奶的数量、民意调查、药是 否有效、求职策略。否有效、求职策略。 社会生产:质量控制、产品验收、进出口检验、项目投资、社会生产:质量控制、产品验收、进出口检验、项目投资、 劳动保护、国民经济。劳动保护、国民经济。 自然科学:天王星光环、估计种群的数量、血样的分析自然科学:天王星光环、估计种群的数量、血样的分析 社会科学:文学著作权、考古社会科学:文学著作权、考古 体育艺术:评分的方法。体育艺术:评分的方法。 数学精神思想方式 如何得到得到敏感性问题的诚实反应如何得到得到敏感性问题的诚实反应 在统计调

23、查中,问卷的设计是一门很大的学问,在统计调查中,问卷的设计是一门很大的学问, 特别是对一些敏感性的问题。例如学生在考试中有特别是对一些敏感性的问题。例如学生在考试中有 无作弊现象,社会上的偷税漏税等,更要精心设计无作弊现象,社会上的偷税漏税等,更要精心设计 问卷,设法消除被调查者的顾虑,使他们能够如实问卷,设法消除被调查者的顾虑,使他们能够如实 回答问题。否则,被调查者往往会拒绝回答,或不回答问题。否则,被调查者往往会拒绝回答,或不 提供真实情况。下面是一个对敏感性问题的调查方提供真实情况。下面是一个对敏感性问题的调查方 法。法。 某地区公共卫生部门为了调查本地区中学生的吸某地区公共卫生部门为

24、了调查本地区中学生的吸 烟情况,对随机抽出的烟情况,对随机抽出的 200名学生进行了调查调名学生进行了调查调 查中使用了两个问题查中使用了两个问题 问题问题1:你的父亲阳历生日日期是不是奇数?:你的父亲阳历生日日期是不是奇数? 问题问题 2:你是否经常吸烟?:你是否经常吸烟? 数学精神思想方式 调查者设计了一个随机化装置,这是一个装有调查者设计了一个随机化装置,这是一个装有 大小、形状和质量完全一样的大小、形状和质量完全一样的50个白球和个白球和50个红个红 球的袋子每个被调查者随机从袋中摸取球的袋子每个被调查者随机从袋中摸取1个球个球 (摸出的球再放回袋中摸(摸出的球再放回袋中摸):摸到白球

25、的学生如:摸到白球的学生如 实回答第一个问题,摸到红球的学生如实回答第实回答第一个问题,摸到红球的学生如实回答第 二个问题,回答二个问题,回答“是是”的就往一个盒子中放一个的就往一个盒子中放一个 小石子,回答小石子,回答“否否” 的人什么都不要做由于的人什么都不要做由于 问题的答案只有问题的答案只有“是是”和和“否否”,而且回答的是,而且回答的是 哪个问题也是别人不知道的,因此被调查者可以哪个问题也是别人不知道的,因此被调查者可以 毫无顾虑地给出符合实际情况的答案毫无顾虑地给出符合实际情况的答案 请问:如果在请问:如果在200人中,共有人中,共有58人回答人回答“是是”, 你能估计出此地区中学

26、生吸烟人数的百分比吗?你能估计出此地区中学生吸烟人数的百分比吗? 数学精神思想方式 分析:由题意可知,每个学生从口袋中摸出分析:由题意可知,每个学生从口袋中摸出 1个白球或红球的概率都是个白球或红球的概率都是05,即我们,即我们 期望大约有期望大约有100人回答了第一个问题,另人回答了第一个问题,另 100人回答了第二个问题在摸出白球的人回答了第二个问题在摸出白球的 情况下,回答父亲阳历生日日期是奇数的情况下,回答父亲阳历生日日期是奇数的 概率是概率是186/365=051因而在回答第一因而在回答第一 个问题的个问题的 100人中,大约有人中,大约有51人回答了人回答了 “是是”所以我们能推出

27、,在回答第二个所以我们能推出,在回答第二个 问题的问题的100中,大约有中,大约有7人答了人答了“是是”即即 估计此地区大约有估计此地区大约有7的中学生吸烟的中学生吸烟 这种方法是不是很巧妙?这种方法是不是很巧妙? 数学精神思想方式 在问卷的设计中,不但要考虑在问卷的设计中,不但要考虑“难以启齿难以启齿” 问题本身对调查结果的影响,而且还要考虑其问题本身对调查结果的影响,而且还要考虑其 他因素例如,调查中问题的措辞会对被调查他因素例如,调查中问题的措辞会对被调查 者产生影响,举例来说,者产生影响,举例来说,“你在多大程度上喜你在多大程度上喜 欢吸烟欢吸烟”与与“你在多大程度上不喜欢吸烟你在多大

28、程度上不喜欢吸烟”两两 种问法中,前者会比后者给出更为肯定的答种问法中,前者会比后者给出更为肯定的答 案再如,问题在问卷中的位置也会对调查者案再如,问题在问卷中的位置也会对调查者 产生影响一般地,比较容易的、不涉及个人产生影响一般地,比较容易的、不涉及个人 的问题应当排在比较靠前的位置,较难的、涉的问题应当排在比较靠前的位置,较难的、涉 及个人的问题放在后面,等等及个人的问题放在后面,等等 请你设计一个关于青春期问题的调查问卷请你设计一个关于青春期问题的调查问卷 数学精神思想方式 英语中某些字母出现的频率远远高于另外一些字母,英语中某些字母出现的频率远远高于另外一些字母, 在运用统计方法进行了

29、深入的研究之后,在运用统计方法进行了深入的研究之后, 人们发现各个字母被使用的频率相当稳定,例如,人们发现各个字母被使用的频率相当稳定,例如, 下面就是英文字母使用频率的一个统计。下面就是英文字母使用频率的一个统计。 字母频率字母频率A:0.063;B:0.0105; C:0.023; D:0.035;E:0.105; F:0.0225; G:0.011; H:0.047; I: 0.055 字母频率字母频率J:0.001; K:0.003; L:0.029; M:0.021; N:0.059; O:0.0654; P:0.0175; Q:0.0001;R:0.054 字母频率字母频率S:0.

30、052; T:0.012; U:0.0225; V:0.008; W:0.012; X:0.002; Y:0.012;Z:0.001. EOANRISHDCLUMFPGWTYVKJZQ 数学精神思想方式 电脑键盘上的字母为何不按顺序排列?电脑键盘上的字母为何不按顺序排列? 不知你是否留意并发现,所有的打字机,电脑和排版设不知你是否留意并发现,所有的打字机,电脑和排版设 备用的键盘,其英文字母都是按以下一种奇特的方式排备用的键盘,其英文字母都是按以下一种奇特的方式排 列着:上端是列着:上端是QWERTYUIOP(10QWERTYUIOP(10个字母个字母) ),中端是,中端是 ASDFGHJKL

31、(9ASDFGHJKL(9个字母个字母) ),下端是,下端是ZXCVBNM(7ZXCVBNM(7个个) )。那么,它。那么,它 们为什么不按字母的先后顺序予以排列呢们为什么不按字母的先后顺序予以排列呢? ? 事实上,当初美国发明家肖尔顿于事实上,当初美国发明家肖尔顿于18731873年发明第一年发明第一 台打字机时,键盘确实是完全按字母顺序排列的。但他台打字机时,键盘确实是完全按字母顺序排列的。但他 随后便发现一个问题:由于当时机械工艺不够完善,使随后便发现一个问题:由于当时机械工艺不够完善,使 得字键在打击之后的弹回速度较慢,一旦打字员击键速得字键在打击之后的弹回速度较慢,一旦打字员击键速

32、度过快,就容易发生两键绞在一起的现象,必须用手很度过快,就容易发生两键绞在一起的现象,必须用手很 小心地把它们分开,从而严重影响了打字速度。为此公小心地把它们分开,从而严重影响了打字速度。为此公 司时常收到客户的投诉。肖尔顿请他的内弟,一位数学司时常收到客户的投诉。肖尔顿请他的内弟,一位数学 老师帮忙出个主意。这位数学家后来设计了一个方案:老师帮忙出个主意。这位数学家后来设计了一个方案: 在键盘上把那些常用的连在一块的字母分开,这样击键在键盘上把那些常用的连在一块的字母分开,这样击键 的速度就会稍稍减慢,也就减少了故障的发生。的速度就会稍稍减慢,也就减少了故障的发生。 数学精神思想方式 肖尔顿

33、照此办法改装了他的打字机,卡键问题迎刃肖尔顿照此办法改装了他的打字机,卡键问题迎刃 而解,于是也就有了现在这样一种奇特古怪的排列而解,于是也就有了现在这样一种奇特古怪的排列 方式。为了不让公众知道这种怪异的排列是为防止方式。为了不让公众知道这种怪异的排列是为防止 卡键,肖尔顿还想出一个欺骗性的促销花招,指出卡键,肖尔顿还想出一个欺骗性的促销花招,指出 键盘这样排列,是经过科学计算的,目的是为达到键盘这样排列,是经过科学计算的,目的是为达到 最快的打字速度,至于卡键问题却只字未提。最快的打字速度,至于卡键问题却只字未提。 这种这种“QWERTY”式的键盘诞生了,并且逐渐定型式的键盘诞生了,并且逐

34、渐定型 下来。后来由于材料工艺的发展,字键弹出速度远下来。后来由于材料工艺的发展,字键弹出速度远 远大于打字员击键速度,但是键盘字母的顺序却一远大于打字员击键速度,但是键盘字母的顺序却一 直没有改动。直没有改动。 一些专家分析,键盘这样排列,打字者几乎打每个英一些专家分析,键盘这样排列,打字者几乎打每个英 文单词时,手都要移动得更远,而不是更近。一位文单词时,手都要移动得更远,而不是更近。一位 研究打字机历史的权威人士指出:研究打字机历史的权威人士指出:“这可能是有史这可能是有史 以来最大的骗局。以来最大的骗局。” 数学精神思想方式 然而,肖尔顿的这种然而,肖尔顿的这种QWERT键盘却被人键盘

35、却被人 们普遍接受,即使是与他竞争的公司,们普遍接受,即使是与他竞争的公司, 也对之深信不疑。更令人不可思议的是,也对之深信不疑。更令人不可思议的是, 那些没有按肖尔顿键盘排列方式制造打那些没有按肖尔顿键盘排列方式制造打 字机的公司,都一家接一家地破产了。字机的公司,都一家接一家地破产了。 尽管科学研究已经证明,使用更加科学尽管科学研究已经证明,使用更加科学 的方法设计出来的键盘,打字速度会提的方法设计出来的键盘,打字速度会提 高很多,但是键盘的改动还是不为人们高很多,但是键盘的改动还是不为人们 所接受。这一点,不能不说是世界打字所接受。这一点,不能不说是世界打字 史上的一个奇迹。史上的一个奇

36、迹。 数学精神思想方式 案例给我们什么样的启示案例给我们什么样的启示: 普查是指对调查对象的全体一一进行调查。普查是指对调查对象的全体一一进行调查。 重点调查是指在所要调查的对象中,选择其中的一部分重重点调查是指在所要调查的对象中,选择其中的一部分重 点单位进行调查。所谓重点单位,指的是这些单位的标志总量点单位进行调查。所谓重点单位,指的是这些单位的标志总量 占总体全部单位标志总量的绝大部分。重点调查的作用在于花占总体全部单位标志总量的绝大部分。重点调查的作用在于花 较少的人力、财力、时间,便可获得代表对象绝大部分情况的较少的人力、财力、时间,便可获得代表对象绝大部分情况的 资料,但它不能完整

37、地反映对象总量,也不具备推断总体的条资料,但它不能完整地反映对象总量,也不具备推断总体的条 件。件。 典型调查是指在调查对象总体中选取少数具有代表性的典型典型调查是指在调查对象总体中选取少数具有代表性的典型 单位进行调查。例如,为了了解总体的一般数量表现,可选择单位进行调查。例如,为了了解总体的一般数量表现,可选择 中等的典型作为调查单位;为了研究成功的经验与失败的教训,中等的典型作为调查单位;为了研究成功的经验与失败的教训, 则可选择先进的典型与后进的典型进行调查、比较。则可选择先进的典型与后进的典型进行调查、比较。 抽样调查与重点调查、典型调查相比有以下特点:随机性,能抽样调查与重点调查、

38、典型调查相比有以下特点:随机性,能 从数量上推断总体。从数量上推断总体。 数学精神思想方式 1. 1. 我们经常需要了解某事物或现象的数量特我们经常需要了解某事物或现象的数量特 征与规律性,这就需要用统计方法。抽样调查是征与规律性,这就需要用统计方法。抽样调查是 最常用的统计方法之一。最常用的统计方法之一。 2. 2. 抽样是从要研究的对象全体中抽取一小部抽样是从要研究的对象全体中抽取一小部 分进行观察,从而对整体进行推断。它可以节省分进行观察,从而对整体进行推断。它可以节省 人力、财力、时间,与全面调查达到基本相同的人力、财力、时间,与全面调查达到基本相同的 效果。样本是总体的一部分,所以样

39、本的特性在效果。样本是总体的一部分,所以样本的特性在 某种程度上能反映整体的特性,但又不能准确无某种程度上能反映整体的特性,但又不能准确无 误地反映整体的特性,样本的抽取是否得当,直误地反映整体的特性,样本的抽取是否得当,直 接关系到对总体估计的准确程度。接关系到对总体估计的准确程度。 3. 3. 为了使抽取的样本具有代表性,即使样本为了使抽取的样本具有代表性,即使样本 的统计值近似总体的参数值,人们在实践中总结的统计值近似总体的参数值,人们在实践中总结 出一些抽样的方法,后面介绍几种比较常用的抽出一些抽样的方法,后面介绍几种比较常用的抽 样方法。样方法。 数学精神思想方式 几种常用的抽样方式

40、几种常用的抽样方式 抽样调查广泛应用于各个领域,但是由于研究对象的抽样调查广泛应用于各个领域,但是由于研究对象的 性质以及研究目的和工作条件的不同,抽样调查的方性质以及研究目的和工作条件的不同,抽样调查的方 式也应随之各异。常用的抽样方式有下面几种。式也应随之各异。常用的抽样方式有下面几种。 1. 简单随机抽样简单随机抽样 简单随机抽样又称纯随机抽样,它是按随机原则直接简单随机抽样又称纯随机抽样,它是按随机原则直接 从总体个单位中抽取从总体个单位中抽取n个单位作样本,这种抽样方式个单位作样本,这种抽样方式 能使总体中每一个单位有同等机会被抽中。简单随机能使总体中每一个单位有同等机会被抽中。简单

41、随机 抽样是抽样中最基本的,也是最简单的方式。当总体抽样是抽样中最基本的,也是最简单的方式。当总体 单位的内部差异很小,或者具有某种特征的单位均匀单位的内部差异很小,或者具有某种特征的单位均匀 地分布于总体各个部分时,用这种方式最适宜。地分布于总体各个部分时,用这种方式最适宜。 简单随机抽样的具体工作过程是,在确定总体范围以简单随机抽样的具体工作过程是,在确定总体范围以 后,对总体的各个单位进行编号,然后随机抽取。抽后,对总体的各个单位进行编号,然后随机抽取。抽 取时可用手工抽签或机械抽签,也可用取时可用手工抽签或机械抽签,也可用随机数表随机数表 进行抽取必要的单位数。进行抽取必要的单位数。

42、数学精神思想方式 2. 类型随机抽样(分层抽样)类型随机抽样(分层抽样) 这种抽样方式是先将总体单位按某一主要标志分类,然这种抽样方式是先将总体单位按某一主要标志分类,然 后再从各类中随机抽取样本单位,可见这是一种将分组法后再从各类中随机抽取样本单位,可见这是一种将分组法 与抽样法结合起来的方式。由于预先将总体单位分类,这与抽样法结合起来的方式。由于预先将总体单位分类,这 样可以把性质比较接近的归入同一类型,保证各组都有中样可以把性质比较接近的归入同一类型,保证各组都有中 选的机会,从而缩小了各单位之间的标志变异程度。因此,选的机会,从而缩小了各单位之间的标志变异程度。因此, 一般说来,选出的

43、样本具有较高的代表性,抽样误差较小,一般说来,选出的样本具有较高的代表性,抽样误差较小, 尤其在总体情况复杂,总体各单位之间标志差异程度大,尤其在总体情况复杂,总体各单位之间标志差异程度大, 单位数目多的情况下,其优点更为显著。单位数目多的情况下,其优点更为显著。 由于分类随机抽样是按有关的主要标志分组的,各组的由于分类随机抽样是按有关的主要标志分组的,各组的 单位数不同,在分配调查单位时有两种方法。一种是按各单位数不同,在分配调查单位时有两种方法。一种是按各 类型单位数占总体单位数的比例的大小分配,称为类型比类型单位数占总体单位数的比例的大小分配,称为类型比 例抽样。例如:某农场有三块地种有

44、玉米,其中平地种有例抽样。例如:某农场有三块地种有玉米,其中平地种有 150亩,河沟地种有亩,河沟地种有30亩,坡地种有亩,坡地种有90亩,估产时,可按照亩,估产时,可按照 5:1:3(即即150:30:90)的比例从各块地中抽取样本。另一种是的比例从各块地中抽取样本。另一种是 按各种类型标志变异程度大小分配,差异大者多分配,差按各种类型标志变异程度大小分配,差异大者多分配,差 异小者少分配,在实际工作中通常采用前者。异小者少分配,在实际工作中通常采用前者。 数学精神思想方式 3. 机械抽样(等距抽样或系统抽样)机械抽样(等距抽样或系统抽样) 当总体中个体数较多时,可将总体分成均衡的几个部分,

45、当总体中个体数较多时,可将总体分成均衡的几个部分, 然后按照预先定出的规则,从每一部分抽取相同个数的个然后按照预先定出的规则,从每一部分抽取相同个数的个 体,这种抽样叫做系统抽样。体,这种抽样叫做系统抽样。 例如,从例如,从1万名参加考试的学生成绩中抽取一个容量为万名参加考试的学生成绩中抽取一个容量为100 的样本,可按照学生准考证号的顺序每隔的样本,可按照学生准考证号的顺序每隔100个抽取个抽取1个,个, 假定在假定在1100的的100个号码中任取个号码中任取1个得到的是个得到的是37号,那么号,那么 从从37号起,每隔号起,每隔100个号码抽取一个号码所得到的个号码抽取一个号码所得到的10

46、0个号个号 码依次是码依次是37, 137, 237,., 9937. 一般,采用机械抽样方式抽取样本单位步骤如下:一般,采用机械抽样方式抽取样本单位步骤如下: 第一步,将总体单位第一步,将总体单位按一定标志排队,然后将按一定标志排队,然后将划分划分n 个单位相等的部分,每部分都包含个单位相等的部分,每部分都包含k个单位,即个单位,即/n=k; 第二步,在第一部分顺序为第二步,在第一部分顺序为1, 2, 3,., k的单位中,随机的单位中,随机 抽取一个单位抽取一个单位i(即第(即第i个单位),在第二部分中抽取第个单位),在第二部分中抽取第i+k 个单位,第三部分中抽取第个单位,第三部分中抽取

47、第i+2k个单位,如此类推,一直个单位,如此类推,一直 抽取共抽取共n个单位组成一个样本,而且每两个样本单位的间隔个单位组成一个样本,而且每两个样本单位的间隔 均为均为k。 数学精神思想方式 . 整群随机抽样整群随机抽样 整群随机抽样是先将总体分成若干群(组),整群随机抽样是先将总体分成若干群(组), 然后再从其中随机抽取一些群,并对抽中各群中然后再从其中随机抽取一些群,并对抽中各群中 的全部单位一一进行调查。各样本群中所包含的的全部单位一一进行调查。各样本群中所包含的 单位数可以相同也可以不同,这种抽样方法抽取单位数可以相同也可以不同,这种抽样方法抽取 的基本单位不再是总体而是群。例如,某工

48、厂大的基本单位不再是总体而是群。例如,某工厂大 量连续生产,为了掌握某月份某种产品的一级品量连续生产,为了掌握某月份某种产品的一级品 比率,确定抽出比率,确定抽出5%的产品,则可在全月连续生产的产品,则可在全月连续生产 的的720小时中,按每隔小时中,按每隔20小时抽取小时抽取1小时的全部产小时的全部产 品进行检查。整群抽样也常以地理区域划群,称品进行检查。整群抽样也常以地理区域划群,称 为区域抽样,这种抽样的工作要简便得多。为区域抽样,这种抽样的工作要简便得多。 数学精神思想方式 5. 阶段随机抽样阶段随机抽样(又称分级抽样又称分级抽样) 当总体很大,总体单位多时,如果直接抽选总当总体很大,总体单位多时,如果直接抽选总 体单位,技术上是有很大困难的,这时需采用多体单位,技术上是有很大困难的,这时需

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论