



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
如果我告诉你,中关村配置最高的电子计算机的计算精度还不如一个便利店卖的手持计算器,你一定会反驳我:又忘记吃药了吧你可以用最主流的编程语言计算 0.2 + 0.4 ,如果你使用的是 Chrome、FireFox、IE 8+,可以按F12 键,然后找到 控制台,输入上面的 表达式 0.2 + 0.4 ,回车。然后再用最简陋的计算器(如果你没有手持计算器没关系,手机、电脑都自带一个计算器,打开“运行”,输入calc ,回车) 再计算一下刚才的 算式 0.2 + 0.4。怎么样?同意我的观点了吧! 再简陋的计算器也比超级计算器的精度高,关键不在于它的频率和内存,而在于它是如何设计、如何表示、如何计算的。不能表示 VS 不能精确表示在上一章浮点数(从惊讶到思考)中我们讲到用浮点数表示 数 时出现的问题很多数都 不能表示。(注意 浮点数表示的是数,而不仅仅是小数。)如果你数学比较好,或者你确信你身体健康,没有心脏病、高血压,没有受过重大精神创伤,那我告诉你, 在浮点数的表示范围内,有多于 99.999% 的数在计算机中是 不能表示 的。 真的是太令人吃惊,也太令人遗憾了。 真相总是很残忍。请注意我使用的措辞,区别开 不能表示 和 不能精确表示。下面我从数量级分析一下,32bit 浮点数的表示范围是 10 的 38 次方,而表示个数呢,是 10 的10 次方。 能够被表示的数只有 1/100000000. (大概有30 个零),这个数多大呢?还记得那个国际象棋和麦子的故事吗?为了让你了解 指数的威力,我再举个例子:有一张很大很大的纸,对折 38 次,会有多高呢? 一米?一百米?比珠峰还高?再次考验你心脏承受能力的时刻到了:它不仅仅比珠峰高,其实它已经快到达月球了。回到原来的话题,还有更残忍的真相。 在剩下的可以表示的不到 0.0001% 的数中,又有多少不能精确表示呢?这就是我写这篇博客的目的。上一章中我还给出了一种用定点数精确表示小数的方法。 事实上,手持计算器、java 中的BigDecimal、C# 中的货币类型、MySQL 中的 NUMERIC 类型就是这么干的。 你还记得在数据库中添加字段时的 SQL 语句是如何写的吗?现在明白为什么我说 再简陋的计算器也比超级计算器的精度高 了吧。这篇博客我将为大家讲解为什么很多数 不能精确表示,本篇可能比较烧脑子,我会尽量用最通俗的语言,最贴近现实的例子来讲解,不在乎篇幅有多长,关键是要给大家讲明白。下一篇,你将了解到浮点数如何工作,以及为什么很多数 不能表示。热身 问:要把小数装入计算机,总共分几步?你猜对了,3 步。 第一步:转换成二进制 第二步:用二进制科学计算法表示 第三步:表示成 IEEE 754 形式在上面的第一步和第三步都有可能 丢失精度。十进制 VS 二进制下面我们讨论如何把十进制小数转换成二进制小数(什么?你不会?请自觉去面壁)。考虑我们将 1/7(七分之一) 写成小数的时候是如何做的?用 1 除以 7,得到的商就是小数部分,剩下的余数我们继续除以 7,一直除到什么时候结束呢?有两种情况:1. 如果余数为 0。yeah!终于结束了,洗洗睡吧2. 当除到某一步时,余数等于 1 停!stop!等一下,我发现有什么地方怪怪的。余数为 1,余数如果为 1 的话,再继续除下去,不就又是 1/7 了吗?绕了一个大弯,又回来了?对,你猜的很对,它永远不会结束,它循环了。注意我上面说的 情况2,我们判断他循环,并 不是从直观看感觉它重复了,而是因为在计算过程中,它又回到了开头。为什么这么说呢?当你计算一个分数时,它总是连续出现 5,出现了好多次,例如 0.5555555 你也无法断定它是无限循环的,比如 一亿分之五。记得高中时,从一本数学课外书学到了手动开平方的方法,于是很兴奋的去计算 2 的平方根,发现它的前几位是 1.414,哇,原来2 的平方根等于 1.414141。很多天以后,当我再次看到我的笔记时,只能苦笑了,2 的平方根不可能循环啊,它可是一个无理数啊。你可能不耐烦了,叽哩哇啦说这么多,有用吗?当然有用了,以后如果 MM 问你:你会爱我到什么时候?你可以回答她:我会爱你到 1/7 的尽头。难道我会把我的表白方式告诉你们吗? 我对你的爱就像圆周率,无限却永不重复。扯远了,现在会到主题。 你也许会说:我明白了,循环小数不能精确表示,放到计算机中会丢失精度; 那么有限小数可以精确表示吧,比如 0.1。对于无限小数,不只是计算机不能精确表示,即使你用别的办法(省略号除外),比如纸、黑板、写字板都无法精确表示。什么?手机?也不能,当然不能了。不,不,iPad 也不行,1 万买的也不行,真的,再贵的本子也写不下。哪些数能精确表示?那么 0.1 在计算机中可以精确表示吗?答案是出人意料的, 不能。在此之前,先思考个问题: 在 0.1 到 0.9 的 9 个小数中,有多少可以用二进制精确表示呢?我们按照乘以 2 取整数位的方法,把 0.1 表示为二进制(我假设那些不会进制转换的同学已经补习完了):(1) 0.1 x 2 = 0.2 取整数位 0 得 0.0(2) 0.2 x 2 = 0.4 取整数位 0 得 0.00(3) 0.4 x 2 = 0.8 取整数位 0 得 0.000(4) 0.8 x 2 = 1.6 取整数位 1 得 0.0001(5) 0.6 x 2 = 0.2 取整数位 1 得 0.00011(6) 0.2 x 2 = 0.4 取整数位 0 得 0.000110(7) 0.4 x 2 = 0.8 取整数位 0 得 0.0001100(8) 0.8 x 2 = 1.6 取整数位 1 得 0.00011001(9) 0.6 x 2 = 1.2 取整数位 1 得 0.000110011(n) .我们得到一个无限循环的二进制小数 0.000110011我为什么要把这个计算过程这么详细的写出来呢?就是为了让你看,多看几遍,再多看几遍,继续看 还没看出来,好吧,把眼睛揉一下,我提示你,把第一行去掉,从 (2) 开始看,看到 (6),对比一下 (2) 和 (6)。 然后把前两行去掉,从 (3) 开始看明白了吧,0.2、0.4、0.6、0.8 都不能精确的表示为二进制小数。 难以置信,这可是所有的偶数啊!那奇数呢? 答案就是:0.1 到 0.9 的 9 个小数中,只有 0.5 可以用二进制精确的表示。如果把 0.0 再算上,那么就有两个数可以精确表示,一个奇数 0.5,一个偶数 0.0。 为什么是两个呢?因为计算机二呗,其实计算机还真够二的。世界上有 10 种人,一种是懂二进制的,一种是不懂二进制的。其实答案很显然,我再领大家换个角度思考,0.5 就是一半的意思。 在十进制中,进制的基数是 10,而 5 正好是 10 的一半。 2 的一半是多少?当然是 1 了。 所以,十进制的 0.5 就是二进制的 0.1。如果我用八进制呢? 不用计算你就应该立刻回答:0.4;转换成十六进制呢,当然就是 0.8 了。(0.5)10 = (0.1)2 = (0.4)8 = (0.8)16如果你还想继续思考,就又会发现一个有趣的事实,我们称之为 定理A。 我们上面的数,都是小数点后面一位小数,因此,在十进制中,这样的小数有 10 个(就是 0 到 9); 同理,在二进制中,如果我们让小数点后面有一位小数,应该有多少个呢?当然是 2 个了(0 和 1)。哇,好像发现了新大陆一样,很兴奋是吧。那我再给你一棒,其实定理A 是错的。再重申一遍 尽信书,则不如无书。我写博客的目的 不是把我的思想灌输到你的脑子里,你应该有自己的思想,自己的思考方式,当我得出这个结论时,你应该立刻反驳我:“按照你的思路,如果是 16 进制的话,应该可以精确表示所有的 0.1 到 0.9 的数甚至还可以精确表示其它的 6 个数。而事实呢,16 进制可以精确表示的数 和 2 进制可以精确表示的数是一样的,只能精确表示 0.5。”那么到底怎么确定一个数能否精确表示呢?还是回到我们熟悉的十进制分数。1/2、5/9、34/25 哪些可以写成有限小数?把一个分数化到最简(分子分母无公约数),如果分母的因式分解只有 2 和 5,那么就可以写成有限小数,否则就是无限循环小数。为什么是 2 和5 呢?因为他们是 10 的因子 10 = 2 x 5。二进制和十六进制呢?他们的因子只有 2,所以十六进制只是二进制的一种简写形式,它的精度和二进制一样。如果一个十进制数可以用二进制精确表示,那么它的最后一位肯定是 5。备注:这是个必要条件,而不是充分条件。一位热心网友设计出了下面的解决精度的方案。我就不解释了,同学们自己思考一下吧。我有一个观点,针对小数精度不够的问题(例如 0.1),软件可以人为的在数据最后一位补 5,也就是 0.15,这样牺牲一位,但是可以保证数据精度,还原再把那个尾巴 5 去掉。请同学们思考一下。精度在哪儿丢失?一位热心网友 独孤小败 在 OSC 上回复了我上一篇文章,提出了一个疑问:在 java 中计算 0.2 + 0.4 得到的结果是/ 代码(a)double d = 0.2 + 0.4; / 结果是 0.6000000000000001但是当直接输出 0.6 的时候,确实是 0.6/ 代码(b)double d = 0.6; / 结果是 0.6好像很矛盾。很显然,通过代码(b)可以知道,在 java 中,可以精确 显示 0.6,哪怕 0.6 不能被精确表示,但至少能精确把 0.6 显示出来,这不是和代码(a)矛盾了吗?这又是一个 想当然的错误,在直观上认为 0.2 + 0.4 = 0.6 是必然成立的(在数学上确实如此),既然(a)的结果是 0.6,而且 java 可以精确输出 0.6,那么代码(a)的结果应该输出 0.6。其实在计算机上 0.2 + 0.4 根本就不等于 0.6 (为什么?可以查看本系列运算符),因为0.2 和 0.4 都不能被精确表示。 浮点数的精度丢失在每一个表达式,而不仅仅是表达式的求值结果。我们用数学中的概念类比一下,比如四舍五入,我们计算 1.6 + 2.8 保留整数。1.6 + 2.8 = 4.4四舍五入得到 4。我们用另一种方法先把 1.6 四舍五入为 2再把 2.8 四舍五入为 3最后求和 2 + 3 = 5通过两种运算,我们得到了两个结果 4 和 5。同理,在我们的浮点数运算中,参与运算的两个数 0.2 和 0.4 精度已经丢失了,所以他们求和的结果已经不是 0.6 了。后记上面一直在讨论小数,整数呢?在博客园,一位童鞋为下面的代码抓狂了:JSON.parse(status:1,id:9986705337161735,name:test).id;把这段代码复制到 Chrome 的 Console 中,按回车, 诡异的问题出现了 9986705337161735 居然变成了 9986705337161736!原始数据加了 1。99867053371617359986705337161736一开始以为是溢出,换了个更大的数:9986705337161738 发现不会出现这个问题。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度城市更新项目资产转让合同模板
- 2025版皮革材料贸易皮革原料采购合同模板
- 2025版新型蔬菜种植基地土地承包权转让及种植合作协议
- 2025房地产项目竣工验收补充协议
- 2025年度存量房买卖合同-老旧小区改造后交易合同
- 2025版虚拟现实技术应用合同范本下载
- 2025年光伏发电项目土地租赁合同范文
- 2025房地产代理销售协议书:特色小镇文旅地产代理服务
- 2025厂房及设备租赁合同协议书-重工业设备租赁
- 2025年高效节能变电所设备安装及维护服务协议
- 2025年注册核安全工程师执业资格考试(核安全专业实务·核技术)历年参考题库含答案详解(5套)
- 镇痛镇静指南解读
- 2025上海市中学生行为规范
- 养老规划师理论知识考核试题及答案
- DB54T 0498.3-2025 生态系统碳汇计量与监测体系建设技术规范 第3部分:湿地碳汇计量与监测方法
- 盆栽养护知识培训课件
- 师带徒培训计划和方案
- 应急预案评估管理办法
- 温室气体 产品碳足迹量化方法与要求 光缆
- 5.2.1分析人类活动对生态环境的影响课件-人教版生物八年级上册1
- 2025江苏苏州昆山国创投资集团有限公司第一期招聘17人笔试参考题库附带答案详解版
评论
0/150
提交评论