




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数 据 恢 复 技 术,计算机科学学院 郭果,数 据 恢 复 技 术,同 学 们! 上 午 好!,数据恢复技术,一、硬盘结构 目前存储方式基本上可以分为磁存储、电存储和光存储等几种。U盘及各种存储卡属于电存储方式,VCD、DVD盘等属于光存储方式,而应用最广的还是磁存储硬盘,而磁带存储也被广泛使用。各种存储方式除了介质上的物理特性不同外,逻辑层面上任然是基于文件系统结构的。故以后主要介绍硬盘的存储结构及其恢复思路。 1、硬盘的发展历史 1956 年 9 月, IBM 向世人展示了 IBM 350 RAMAC ( Random Access Method of Accounting and Co
2、ntrol ) 磁盘存储系统,成功地实现了随机存储,于是全世界第一台商用硬盘系统诞生了。它的总容量只有 5MB ,却使用了 50 个直径为 24 英寸的磁盘片。这些盘片表面都涂有一昙磁性物质,被叠起来固定在一起,绕着同一个轴旋转。虽然这还不是今天硬盘的原型,但它为硬盘的发展打下了坚实的基础。此款 RAMAC 在那时主要用在飞机预约、自动银行、医学诊断及太空领域内。,数据恢复技术,1968 年 IBM 提出了“温彻斯特/Winchester”技术,并于 1973 年制造出第一台采用该技术的硬盘。这种技术的精髓是让镀磁盘片经密封、固定并高速旋转,而磁头沿盘片径向移动,悬浮在高速转动的盘片上方,不与
3、盘片直接接触,读取数据。这也是现代绝大多数硬盘的原型。时至今日,个人电脑中的硬盘容量虽然已经高达几十 GB 甚至上百 GB ,但仍然没有脱离这种“温彻斯特”模式 IBM 公司于 1980 年在 IBM 一 XT 计算机上使用的 10MB 硬盘,如图 2 一 27 、图 2 一 28 所示,可以看出,除了外型略大,无论外观还是内部结构和现在最先进的硬盘并无大的差别。,数据恢复技术,图 2-27 IBM 10MB硬盘的内部结构,图2-28 IBM 10MB硬盘的外部结构,数据恢复技术,技术的前进,总是将电脑系统朝人们喜欢的方面发展,而体积更小、速度更快、容量更反、使用更安全就是广大用户对硬盘的最大
4、期望。 出于这样的目的,硬盘工程师们为其做出了许多努力,例如研究读写更灵敏的磁头、更先进的接口类型、存储密度更高的磁盘盘片及更有效的数据保护技术等。这些技术上的突破使得硬盘不仅越来越先进,而且也更加稳定,这些也就是现在的硬盘与图 2 一 27 、图 2 - 28 中所示硬盘的最大区别。,数据恢复技术,1979 年, IBM 再次发明了薄膜磁头,为进一步减小硬盘体积、增大容量、提高读写速度打下了基础。 20 世纪 80 年代末期, IBM 对硬盘的发展又做出了一项重大贡献,发明了 MR ( Magneto Resistive )磁阻磁头,这种磁头在读取数据时对信号变化相当敏感,使得盘片的存储密度
5、能够比以往的 20MB 每英寸提高了数十倍。 1991 年 IBM 生产的 3 . 5 英寸硬盘使用了 MR 磁头,使硬盘的容量首次达到了 IGB ,从此硬盘容量开始进入 GB 数量级。 1999 年 9 月 7 日, Maxtor 宣布了首块单碟容量高达 10 . 2GB 的 ATA 硬盘,从而把硬盘的容量引入到一个新的里程碑。 2000年 2 月 23 日,希捷发布了转速高达 l5 000RPM的CheetahX15(“捷豹”)系列硬盘,其平均寻道时间只有 3 . 9ms ,这可算是当时最快的硬盘了,同时它也是到目前为止转速最高为硬盘;其性能相当于阅读一整部 Shakespeare 只花
6、0 15 s 。此系列产品的内部数据传输速率高达 48MB/s ,数据缓存为 4 一 16MB ,支持 Ultra160/m SCSI 及 Fibre Channel (光纤通道), 这将硬盘外部数据传输速率提高到了160 -200 MB / s 。总的来说,希捷的此款 CheetahX15系列将硬盘的性能提高到了一个新的里程碑。 2000年 3 月 16 日,硬盘领域又有新突破,第一款“玻璃硬盘”问世,这就是 IBM 推出的 Deskstar75GXP 及 Deskstar40GV ,此两款硬盘均使用玻璃取代传统的铝作为盘片材料,这能为硬盘带来更大的平滑性及更高的坚固性,另外玻璃材料在高转速
7、时具有更高的稳定性。此外 DeskstarSGXP 系列产品的最高容量达 75GB ,而 Deskstar40GV 的数据存储密度则高达 143 亿数据位每平方英寸,再次刷新了数据存储密度世界纪录。 目前,已在大量推广固态硬盘。,数据恢复技术,2、硬盘的内外部结构、及控制电路 平时我们了解硬盘,多是从产品外观、产品特征及磁盘性能等方面去认识,而硬盘的内部到底是什么呢?相信许多用户都不是很清楚,因为了解硬盘内部结构的机会实在太少了。我们经常听说磁头、盘片、接口等,但它们都长怎么样我们却不是很清楚?还有所谓的玻璃盘片,主轴电机等又是什么呢?带着这些问题,接下来将对硬盘进行深入地了解。 总得来说,硬
8、盘主要包括:盘片、磁头、盘片主轴、控制电机、磁头控制器、数据转换器、接口、缓存等几个部份。 所有的盘片都固定在一个旋转轴上,这个轴即盘片主轴。而所有盘片之间是绝对平行的,在每个盘片的存储面上都有一个磁头,磁头与盘片之间的距离比头发丝的直径还小。所有的磁头连在一个磁头控制器上,由磁头控制器负责各个磁头的运动。磁头可沿盘片的半径方向动作,而盘片以每分钟数千转的速度在高速旋转,这样磁头就能对盘片上的指定位置进行数据的读写操作。硬盘是精密设备,尘埃是其大敌,所以必须完全密封。,数据恢复技术,数据恢复技术,A、外部结构 图3 所示的WD200BB硬盘是3.5英寸的普通IDE硬盘,它是属于比较常见的产品,
9、也是用户最经常接触的。除此,硬盘还有许多种类,例如老式的普通IDE硬盘是5.25英寸,高度有半高型和全高型。除此,还有体积小巧玲珑的笔记本电脑,块头巨大的高端SCSI硬盘及非常特殊的微型硬盘。 在硬盘的正面都贴有硬盘的标签,标签上一般都标注着与硬盘相关的信息,例如产品型号、产地、出厂日期、产品序列号等,图4 所示的就是WD200BB的产品标签。在硬盘的一端有电源接口插座、主从设置跳线器和数据线接口插座,而硬盘的背面则是控制电路板。从图5 中可以清楚地看出各部件的位置。 总得来说,硬盘外部结构可以分成如下几个部份: (1)、接口;(2)、控制电路板;(3)、固定面板;,数据恢复技术,图5:硬盘背
10、面及各部件名称,数据恢复技术, (1)、接口。接口包括电源接口插座和数据接口插座两部份,其中电源插座就是与主机电源相连接,为硬盘正常工作提供电力保证。数据接口插座则是硬盘数据与主板控制芯片之间进行数据传输交换的通道,使用时是用一根数据电缆将其与主板IDE接口或与其它控制适配器的接口相连接,经常听说的40针、80芯的接口电缆也就是指数据电缆,数据接口可以分成IDE接口、SCSI接口和SATA接口三大派系。 (2)、控制电路板。大多数的控制电路板都采用贴片式焊接,它包括主轴调速电路、磁头驱动与伺服定位电路、读写电路、控制与接口电路等。在电路板上还有一块ROM芯片,里面固化的程序可以进行硬盘的初始化
11、,执行加电和启动主轴电机,加电初始寻道、定位以及故障检测等。在电路板上还安装有容量不等的高速数据缓存芯片,在此块硬盘内结合有2MB的高速缓存。 (3)、固定面板。就是硬盘正面的面板,它与底板结合成一个密封的整体,保证了硬盘盘片和机构的稳定运行。在面板上最显眼的莫过于产品标签,上面印着产品型号、产品序列号、产品、生产日期等信息,这在上面已提到了。除此,还有一个透气孔,它的作用就是使硬盘内部气压与大气气压保持一致。,数据恢复技术,图6:硬盘面板,数据恢复技术,B、内部结构 硬盘内部结构由固定面板、控制电路板、磁头、盘片、主轴、电机、接口及其它附件组成,其中磁头盘片组件是构成硬盘的核心,它封装在硬盘
12、的净化腔体内,包括有浮动磁头组件、磁头驱动机构、盘片、主轴驱动装置及前置读写控制电路这几个部份。 将硬盘面板揭开后,内部结构即可一目了然,图7、8所示。,数据恢复技术,图7:揭开硬盘面板,数据恢复技术,图8:细看西数硬盘内部结构,数据恢复技术,(1)、磁头组件,图9:西数硬盘磁头及附属组件,数据恢复技术,图12:西数硬盘主轴组件,数据恢复技术,图12:磁头高度对比,数据恢复技术,C、控制电路 硬盘的控制电路位于硬盘背面,将背面电路板的安装螺丝拧下,翻开控制电路板即可见到控制电路。具体如图13、14所示。,图13:拆下硬盘控制电路后,图14:西数硬盘控制电路,数据恢复技术,D、着陆区( Land
13、ing Zone ) 如何保护硬盘 每个盘片的每个面都有一个读写磁头,磁盘盘面区域的划分如图 2 一 23 所示。与磁头接触的表面靠近主轴,即线速度最小的地方,是一个特殊的区域,它不存放任何数据,称为启停区或着陆区( Landing Zone ) ,启停区外就是数据区。在最外圈,离主轴最远的地方是“0”磁道,而硬盘数据的存放就是从最外圈开始的。,数据恢复技术,二、硬盘的接口 随着硬盘技术的发展,其接口模式也一起经历了风风雨雨,其简要历程如下。 现在的硬盘接口综合起来说可以分成如下几种: ST-506/412、 IDE ( ATA )、 SCSI 、 Serial ATA (串行ATA或SATA
14、)、 SAS、 其他如:FibreChalnnel (光纤)、IEEE1394(火线) USB . 等等。,数据恢复技术,A、IDE,数据恢复技术,IDE,也叫ATA。该接口发展至今,细分可以分成: ATA -1(IDE)、 ATA-2(EIDE Enhanced IDE/Fast ATA)、 ATA-3(Fast ATA-2)、 ATA-4(Ultra ATA/33、Ultra ATA/66)、 ATA-5(Ultra ATA/100)、 ATA-6(Ultra ATA/133)。,数据恢复技术,B、SCSI SCSI的英文全称为“Small Computer System Interfac
15、e”(小型计算机系统接口)。 SCSI接口具有:配置扩展灵活(在一块SCSI控制卡上就可以同时挂接15个设备)、高性能(具有很多任务、转速高达15000转/分、平均寻道时间更短、宽带宽及少CPU占用率仅仅在5%左右等特点)、应用广泛(具有外置和内置两种)等优点。其缺点主要体现为:价格昂贵、安装复杂。,数据恢复技术,C、Serial ATA 用于取代IDE接口!,Serial ATAlx 标准的产品,达到150MB / s 的数据传输速率,而 Serial ATA2x 标准,可达到 300MB / s 的数据传输速率。,数据恢复技术,D、SAS 用于取代SCSI! SAS(Serial Atta
16、ched SCSI)即串行连接SCSI,是新一代的SCSI技术,和现在流行的Serial ATA(SATA)硬盘相同,都是采用串行技术以获得更高的传输速度,并通过缩短连结线改善内部空间等。SAS是并行SCSI接口之后开发出的全新接口。此接口的设计是为了改善存储系统的效能、可用性和扩充性,并且提供与SATA硬盘的兼容性。SAS的接口技术可以向下兼容SATA。,数据恢复技术,数据恢复技术,SAS线缆既可以连接SAS硬盘驱动器(左),也能够连接SATA硬盘驱动器(右) 注意红色箭头所指处缺口的有无,以及硬盘驱动器接口连接器上引脚数量的差异,数据恢复技术,E、固态硬盘 请同学们自己查阅相关资料!,数据
17、恢复技术,F、硬盘传输模式 存取硬盘资料是通过主板上的芯片组实现的,它们大都支持多种模式以便使不同规格的硬盘工作正常。那么硬盘在各个工作模式下是怎样读取资料的呢?他们主要以PIO模式和DMA模式工作,这两种模式就是目前硬盘与主机进行数据交换的方式。PIO模式是一种通过CPU执行I/O端口指令来进行数据的读写的数据交换模式;而DMA则是不经过CPU而直接从内存了存取数据的数据交换模式。 a. PIO 传输模式 PIO的英文全称为“Programming Input/Output Model”,即“程序输入/输出”模式。这种模式使用PC I/O端口指令来传送所有的命令、状态和数据。 由 CPU 通
18、过 I / O 发出命令,经由芯片组再通过 IDE 控制器到硬盘中读取资料,当 CPU 得到数据后,会将它经由芯片组写到内存里,这样就完成了一次读取的动作。 Mode(模式)的数值越大越快。,数据恢复技术,数据恢复技术,b.DMA传输模式 DMA的英文全称为“Direct Memory Access”,即“内存直接存取”模式。它表示数据不经过CPU,而直接在硬盘和内存之间传送。 在多任务操作系统内,如OS/2、Linux、Windows NT等,当磁盘传输数据时,CPU可腾出时间来做其它事情,使服务器的数据性能大大提高。 而在DOS/Windows3.X环境里,CPU不得不等待数据传输完毕,所
19、以在这种情况下,DMA方式的意义并不大。,数据恢复技术,数据恢复技术,请同学们检查自己的电脑中的硬盘的模式和速度!,数据恢复技术,三、磁道、扇区与柱面(硬盘逻辑结构) 1. 盘面及磁头号 硬盘的每一个盘片都有两个盘面( side ) ,即上、下盘面,一般每个盘面都利用上,即都装上磁头可以存储数据,成为有效盘片,也有极个别的硬盘其盘面数为单数。 每一个这样的有效盘面都有一个盘面号,按顺序从上而下自“ 0 ”开始依次编号。 故,在硬盘系统中,盘面号又叫磁头号,就是因为每一个有效盘面都有一个对应的读写磁头。,数据恢复技术,2. 磁道或柱面 磁盘在低级格式化时被划分成许多同心圆,这些同心圆轨迹叫做磁道
20、(Track )。磁道从外向内自 0 开始顺序编号。 所有盘面上的同一磁道构成一个圆柱,通常称做柱面(Cylinder ) ,每个圆柱上的磁头,由上而下从“ 0 ”开始编号。,数据恢复技术,数据恢复技术,3. 扇区 信息以脉冲串的形式记录在这些轨迹磁道中,这些同心圆不是连续记录数据,而是被划分成一段段的圆弧,由于径向长度不一样,这些圆弧的角速度一样,而线速度不一样,外圈的线速度较内圈的线速度大,即在同样的转速下,外圈在同样时间段里,经过的圆弧长度要比内圈的圆弧长度大。 每段圆弧叫做一个扇区,扇区从“ l ”开始编号,每个扇区中的数据是作为一个单元同时读出或写入的。 每个扇区包括 512 字节的
21、数据和一些其他信息。一个扇区有两个主要部分:即存储数据地点的标识符和存储数据的数据段,如图 2 一 25 所示。,数据恢复技术,数据恢复技术,标识符就是扇区头标,包括有组成扇区三维地址的三个数字:扇区所在的磁头(或盘面)、磁道(或柱面号),以及扇区在磁道上的位置即扇区号。头标中还包括一个字段,其中有显示扇区是否能可靠存储数据,或者是否已发现某个故障因而不宜使用的标记。有些硬盘控制器在扇区头标中还记录有指示字,可在原扇区出错时指引磁盘转到替换扇区或磁道。最后,扇区头标以循环冗余校验( CRC )值作为结束,以供控制器检验扇区头标的读出情况,确保准确无误。 扇区的第二个主要部分是存储数据的数据段,
22、可分为数据和保护数据的纠错码( ECC )。 扇区头标包括有一个可识别磁道上该扇区的扇区号。有趣的是这些扇区号物理上并不是像我们想像的那样连续编号的,它们不必用任何特定的顺序指定。扇区头标的设计允许扇区号可以从 1 到某个最大值,某些情况下可达 255 。磁盘控制器并不关心上述范围中什么编号安排在哪一个扇区头标中。在很特殊的情况下,扇区还可以公用相同的编号。磁盘控制器甚至不管数据区有多大,它只管读出它所找到的数据,或者写入要求它写的数据。,数据恢复技术,4、分区粒度原理 数据的读写是按柱面进行的,即磁头在读写数据时首先在同一柱面内从“ 0 ”磁头开始进行操作,依次向下在同一柱面的不同盘面即磁头
23、上进行操作,只在同一柱面所有的磁头全部读写完毕后才移动磁头转移到下一柱面。 这是因为选取磁头只需通过电子切换即可,而选取柱面则必须通过机械切换。 电子切换相当快,比在机械上磁头向邻近磁道移动快得多,所以数据的读写是按柱面来进行的,而不是按盘面来进行的。 也就是说,一个磁道已写满数据,就在同一柱面的下一个盘面来写,一个柱面写满后,才移到下一个柱面,从下一个柱面的 1 扇区开始写数据。 而不是在同一盘面的下一磁道来写,一个盘面写满后再从下一个盘面的 0 磁道开始写,读数据也是按照这种方式进行,这样就提高了硬盘的读写效率。,数据恢复技术,这就是分区粒度原理,所以利用分区软件来对硬盘进行分区时,将分区
24、的最小单位设为柱面( cylinder ) ,也就是它将把一个离某柱面最近的值分配到该柱面上,也就是说用分区软件来分区时分配的实际容量不一定等于用户指定的分区容量。 可见,磁盘的柱面数与一个盘面上的磁道数相等。由于每个盘面都有自己的磁头,因此,盘面数等于磁头数。 所谓硬盘的CHS,就是指柱面C、磁头H、扇区S。,数据恢复技术,5、交叉因子 系统将文件存储到磁盘上时,是按柱面、磁头、扇区的方式来进行的,即最先是第 1 磁道的第一磁头下(也就是第 1 盘面的第一磁道)的所有扇区,然后是同一柱面的下一磁头,当一个柱面存储满了就推进到下一个柱面,直到把文件内容全部写入到磁盘。 系统也以相同的顺序读出数
25、据。读出数据时是通过告诉磁盘控制器要读出扇区所在的柱面号、磁头号和扇区号(物理地址的三个组成部分)来进行的。磁盘控制器则直接使磁头部件步进到相应的柱面,选通相应的磁头,并且等待要求的扇区移动到磁头下。在扇区到来时,磁盘控制器读出每个扇区的头标,并把这些头标中的地址信息与期待检出的磁头和柱面号作比较(即寻道) , 然后寻找要求的扇区号。待磁盘控制器找到该扇区头标时,就根据其任务是写扇区还是读扇区,来决定是转换写电路,还是读出数据和尾部记录。,数据恢复技术,找到扇区后,磁盘控制器必须在继续寻找下一个扇区之前对该扇区的信息进行后处理。如果是读数据,控制器就必须计算此数据的 ECC 码,然后把 ECC
26、 码与已记录的 ECC 码相比较。如果是写数据,控制器就必须计算出 ECC ,与数据一起储存。在控制器对此扇区中的数据进行必要处理期间,磁盘继续旋转。由于对信息的后处理需要耗费一定的时间,在这段时间内,磁盘己转了相当的角度。 当然,给扇区编号的最简单方法就是按照l 、 2 、 3 、 4 、 5 、 6 等的顺序来编号,这也十分的简单明了。如果扇区是按顺序绕着磁道依次编号,那么控制器在处理一个扇区的数据期间,磁盘旋转太远,超过了扇区间的间隔(这个间隔很小),控制器要读出或写入的下一扇区已经通过了磁头,也许是相当大的一段距离。在这种情况下,磁盘控制器就只能等待磁盘再次旋转几乎一周,才能使得需要的
27、扇区到达磁头下面。 显然,要解决这个问题,靠加大扇区间的间隔是不现实的,那会浪费许多磁盘空间。许多年前, IBM 的一位杰出的工程师想出了一个绝妙的办法,那就是扇区不是顺序编号,而是使用一个交叉因子编号。,数据恢复技术,数据恢复技术,交叉因子是一个比例值。 当设置 l : l 的交叉因子时,如果硬盘控制器处理信息足够快,那么读出磁道上的全部扇区只要求旋转一周,但如果硬盘控制器的后处理动作没有这样快,磁盘所转的圈数就等于一个磁道上的扇区数,才能读出每个磁道上的全部数据;将交叉因子设定为 2 : l 时,磁头要读出磁道上的全部数据,磁盘就只须转两圈;如果 2 : l 的交叉因子仍不够慢,磁盘也需转
28、一个磁道上的扇区数那么多的圈数,这时,可将交叉因子调整为 3 : 1 ,以此类推. 在上图中,最外圈的磁道( 0 号柱面)上的扇区用简单的顺序连续编号,相当于扇区交叉因子是1: 1的; 1 号磁道(柱面)的扇区按 2 : 1 的交叉因子编号,而 2 号磁道就按 3 :1 的扇区交叉因子编号。,数据恢复技术,交叉因子由系统来确定。一个特定硬盘驱动器的交叉因子取决于: 磁盘控制器的速度、主板的时钟速度、与控制器相连的输出总线的操作速度等。 如果磁盘的交叉因子值太高,就需多花一些时间等待数据在磁盘上存入和读出。而如果交叉因子值太低,就会大大降低磁盘性能。 在大多数硬盘中,所有磁道都有相同的交叉因子。
29、但有时因为操作上的原因,也可能导致各磁道有不同的扇区交叉因子。这种不一致对计算机不会产生不利影响,只是有最佳交叉因子的磁道要比其他磁道工作速度更快而已。,数据恢复技术,6、硬盘的固件区 固件又称FIRMWARE,它是存储于设备中的EEPROM(电可擦除可编程存储非只读芯片)芯片中,可由用户通过特定的刷新程序进行升级的程序。它的作用相当于主板的BIOS,里面装的是用汇编语言编写的,协调设备各个内部部件之间相互工作用的装有软件的硬件! 对硬盘的固件来说,好比硬盘是一台电脑主机,(实际上算是单片机了)固件相当于BIOS和操作系统和程序,因为固件里包括了引导命令,控制语句,和执行语句等。 虽然磁道编号
30、是“由外向内从0开始进行编号”,但是这并不意味着“0”磁道是位于磁盘片的最外沿的。要让硬盘能正常工作,硬盘有相应的初始化和管理程序。在硬盘出厂前,会在盘片上写入“伺服信息”,将硬盘的盘面划分成一个一个的同心圆,叫磁道,多个盘片的相同位置的磁道形成了一个同心圆柱,就是柱面,在每个磁道上又划分出相同存储容量的扇区作为存储数据的最小单位。这部分事先写入的管理程序叫“固件(Firmware)”,一部分写入电路板的芯片内,另一部分则写在盘片的特定区域,就是常常说的硬盘“固件区”。 这部分的内容一般的软件是不能读取的(必须要用专门的软件来读写!),这样成本可以大大降低。,数据恢复技术,对于不同的硬盘,固件
31、区的物理位置是不同的,有的位于比“0”磁道更靠近磁盘片外缘的磁道上,即常常说的“负磁道”。有的位于磁盘片的中部,所记录的程序的数量和功能也有差别。由于生产过程中不可能保证整个盘片都完全一致,必然有小部分扇区无法稳定读写数据,这就是所说的“坏道”。 大多数的硬盘出问题 是出在这命令语句,信息上(固件),因为每次硬盘引导,都要读这些语句,久而久之就会出错,我们知道硬盘用长了就会出错,要么是逻辑坏道,要么是物理坏道,要么分区表丢了,总之是一大堆的问题 ,同样负磁道 也会出这样的问题,如果不是负磁道物理坏道,那么硬盘修复的成功率将是很高的,只要用专门的工具把那固件写一遍就可以了。 在每个硬盘出厂前都要
32、进行检测,将坏道的位置写入硬盘的固件区的工厂坏道表(P-List)中。同时在硬盘使用过程中,有小量的扇区由于种种原因可能也无法正确读写数据,这些坏道的位置也可以写入到硬盘固件区的增长坏道表(G-List)中。 这一切都必须使用专用工具软件来完成,如效率源智能数据指南针(DataCompass)专业设备或PC3000等。,数据恢复技术,7、硬盘的容量计算 硬盘的容量由柱面数、盘面数(磁头数)、扇区数来决定,其计算公式为: 硬盘容量柱面数 x盘面数(磁头数) x 扇区数 x 512 字节 关于硬盘容量的大小,经常有人感到迷惑,为什么同一块硬盘,有时显示或报为 40GB , 有时却只有 37GB 。
33、 这是因为采用的1MB 的单位不同,有时是 1 000 000字节,有时是1 048 576 字节。 在商业上主要采用前者,进入二进制系统后就采用后者。 各种单位之间的换算关系如下: 1KB=210B=1024Byte 1MB=210KB=220B=1048576Byte 1GB=210MB=220KB=230B=1073741824Byte 扩展单位有:KB(KiloByte)、MB (MegaByte)、GB (GigaByte)、 TB (TeraByte)、 PB ( PetaByte)、 EB ( ExaByte)。,数据恢复技术,8、几个主要的硬盘性能指标 1、硬盘的转速(Spin
34、dle Speed) 转速是指驱动硬盘盘片旋转的主轴电机的旋转速度,目前硬盘常见的转速为: 5400r/min; 7200r/min; 10000r/min; 15000r/min等等。 例如,监控硬盘一般用5400r/min的! 2、硬盘的数据传输率(Data Transfer Rate) a.内部数据传输速率(Internal Transfer Rate) 内部数据传输速率,也叫持续数据传输速率(sustained transfer rate ) ,单位为 Mb/s (注意与 MB / s 之间的差别, 1MB/s = 8Mb/s )。它指磁头至硬盘缓存间的最大数据传输速率,一般取决于硬盘
35、的盘片转速和盘片数据线密度(指同一磁道上的数据间隔度)。注意,在这项指标中常常使用 Mb/s 或 Mbps 为单位,这是兆位/秒的意思,如果需要转换成 MB /s (兆字节/秒),就必须将 Mb/s 数据除以 8 (一字节 8 位数)。例如, WD36400 硬盘给出的最大内部数据传输速率为 131Mb/s,但如果按 MB/s 计算就只有 16 . 37MB/s ( 131/8 )。,数据恢复技术,b.外部数据传输速率(External Transfer Rate) 外部数据传输速率,通称突发数据传输速率(burst data transfer rate ) ,指从硬盘缓冲区读取数据的速率,在
36、广告或硬盘特性表中常以数据接口速率代替,单位为 MB / s 。 内部传输速率是指硬盘磁头将盘片上的数据读取到硬盘上的缓存中的速度,通常这个速度都大大低于接口速度。即使是拥有 8MB 数据缓存的 WD1200JB ,其内部传输速率也只能达到 525Mb/S,换算成字节也仅 65.6MB/ s。 这个数字别说 SATA ,就是早已过时的 Ultra ATA/66 的 66MB / s 也还达不到,更何况这仅仅只是理论速度。 因此,无论如何,选择内部传输速率大的硬盘是肯定没错的。这也是在连续拷贝数据时感觉硬盘速度没有标称的那么快的真正原因,因为连续拷贝数据需要的是内部数据传输速率,是即时读取数据,
37、而不是突发的从缓存中读取数据。 注意:不要理所当然地将厂商标注的外部传输速率(即接口速率)与硬盘的数据传输速率等同起来,因为外部传输速率只是表明该硬盘与系统之间的数据通道带宽,而硬盘真正的数据传输性能只能从内部传输速率这个指标看出来。,数据恢复技术,内部数据传输速率与外部数据传输速率的关系请参见图:,数据恢复技术,3、硬盘缓存 缓存英文名为 Cache ,单位为 KB 或 MB ,是硬盘内部的高速存储器。目前硬盘的高速缓存一般都大于8MB。 大缓存的硬盘在存取零散文件时具有很大的优势。缓存的大小也是影响硬盘性能的重要因素之一。硬盘的缓存主要起三种作用。 一是预读取,当硬盘受到 CPU 指令控制
38、开始读取数据时,硬盘上的控制芯片会控制磁头把正在读取的簇的下一个或者几个簇中的数据读到缓存中(由于硬盘上数据存储时是比较连续的,所以读取命中率较高),当需要读取下一个或者几个簇中的数据的时候,硬盘就不需要再次读取数据了,只需直接把缓存中的数据传输到内存中就可以了,由于缓存的速度远远高于磁头读写的速度,所以能够达到明显改善性能的目的。 二是对写入动作进行缓存。当硬盘接到写入数据的指令之后,并不会马上将数据写入到盘片上,而是先暂时存储在缓存里,然后发送一个“数据已写入”的信号给系统,这时系统就会认为数据已经写入,并继续执行下面的工作,而硬盘则在空闲(不进行读取或写入的时候)时再将缓存中的数据写入到
39、盘片上。虽然这样做对于写入数据的性能有一定提升,但也不可避免地带来了安全隐患 如果数据还在缓存里的时候突然掉电,那么这些数据就会丢失。对于这个问题,硬盘厂商们自然也有解决办法:掉电时,磁头会借助惯性将缓存中的数据写入零磁道以外的暂存区域,等到下次启动时再将这些数据写入到目的地。 第三个作用就是临时存储最近访问过的数据。有时候,某些数据会是经常需要访问的,硬盘内部的缓存会将读取比较频繁的一些数据存储在缓存中,再次读取时就可以直接从缓存中传输。,数据恢复技术,硬盘缓存的大小决定了可存放数据的多少,但并不是说缓存越大性能就一定越好。 目前主流硬盘的缓存多在 8MB-32MB之间,没有配备更大容量的缓
40、存主要是出于缓存算法的考虑,更大容量的缓存需要更有效率的算法,否则性能不会有多大提升。 当然,更大的缓存也是未来硬盘的一个发展方向。,数据恢复技术,4、平均寻道时间(Average Seek Time) 平均寻道时间,指硬盘磁头移动到数据所在磁道时所用的时间,单位为毫秒( ms )。注意它与平均访问时间的差别,平均寻道时间当然是越小越好,现在选购硬盘时应该选择平均寻道时间低于9ms 的产品。寻道时间由硬盘寻道马达速度决定。目前硬盘产品无论主轴转速是多少,一般都控制在 10ms以下,在购买时只要认准选择该指标更小的型号就行了。但这个参数对硬盘性能的影响不像单碟容量和转速那么明显,而且变化也较难于
41、感知,因此很多用户都将它忽略了。 寻道时间不仅影响硬盘的磁道定位速度和硬盘的整体性能,它还对硬盘的噪音产生影响。硬盘的寻道马达为步进电机,它运动时产生的噪音其频率和“穿透力”都比主轴电机转动产生的噪音高得多。其实,硬盘的噪音绝大多数就来自它。为此,目前硬盘都具有静音技术,且部分厂商的硬盘(如 Seagate Barracuda ATA-IV)出厂默认设置就处在启动状态。通过专用的软件,用户就可以自行将寻道时间人为降下来,从而减小硬盘的噪声。当然,硬盘的性能也会因此下降。,数据恢复技术,5、平均潜伏期(Average Latency Time) 平均潜伏期,指当磁头移动到数据所在的磁道后,等待所
42、要的数据块继续转动(半圈或多些、少些)到磁头下的时间,单位为毫秒( ms ),也就是说,这个时间与盘片的转速有关,平均潜伏期一般指盘片旋转一周所用时间的一半。平均潜伏期当然也是越小越好了,潜伏期小代表硬盘读取数据的等待时间短,这就等于具有更高的硬盘数据传输速率。可以很容易换算出硬盘转速和平均潜伏期的一一对应关系。换算公式为: (60*1000)/(硬盘转速*2)=平均潜伏期,数据恢复技术,6、平均访问时间(Average Access Time) 平均访问时间,指磁头找到指定数据的平均时间,单位为毫秒( ms )。通常是平均寻道时间和平均潜伏时间之和。注意:现在不少硬盘广告中所说的平均访问时间
43、大部分都是用平均寻道时间所代替的,也就是说这项指标在官方技术文档中一般不会出现。 7、柱面切换时间(Cylinder Switch Time) 柱面切换时间也叫道至道时间(Track to Track Time),指两个相邻的柱面进行切换所用的时间,具体到磁道上是指磁头从当前磁道上方移动道相邻磁道上方所用的时间,单位是毫秒(ms)。注意与平均寻道时间的差别。,数据恢复技术,四、数的存储格式 在各种计算机体系结构中,对于字节、字等存储机制有所不同。对于同一个数值,在不同的计算机体系中会以相反的顺序来记录。例如,十六进制数值12 34 56 78H,在一种计算机架构下存储为12 34 56 78H
44、,而在另一种计算机架构下会被存储为78 56 34 12H。这就是按照不同的字节序进行存储的。所以所谓的字节序指的就是长度跨越多个字节的数据的存储形式。 目前的存储器,多为字节为访问的最小单元,当一个逻辑上的单元必须分割为物理上的若干单元时(即对于使用多字节表示数值的情况时!),就存在了先放谁后放谁的问题了,于是,Endian的问题应运而生了。对于不同的存储方法,就有Big-endian和Little-endian两种描述。 注意:字节是存储信息的最小单位!字节不可分割!如12H于21H是完全不同的两个数!,数据恢复技术,数的存储格式,也就是数字的存储顺序。在表示数值的大小时,一个字节(Byt
45、e,等于8位二进制)最大只能表示到255(0*FF),这是远远不够的。为了满足实际使用的需要,通常会使用2个、4个、或8个字节来表示数值的大小。 Big-endian格式:也叫大头位序。字节由最高位向最低位依次存放,高位在前,低位在后; Little-endian格式:也叫小头位序。字节由最低位向最高位依次存放,低位在前,高位在后。 要注意的是,在不同的文件系统中,数的存储格式也会有所不同,对一个文件系统进行分析时,必须清楚他所使用的数值存储格式,否则是无法得到正确的数值大小的。 例如,有一个十六进制数“23 48 BA 4C”,使用Big-endian格式存储形式就是“23 48 BA 4C
46、”;而使用Little-endian格式的文件系统,上面的数值的存放形式就是“4C BA 48 23”,即低位在前,高位在后。 微软的操作系统就是采用Little-endian格式来存放数值的。 另外,字节序与CPU架构又是有直接的关系的。,数据恢复技术,五、CHS与LBA寻址方式 对寻址方式的理解:当我们想要从一本书内找到一个指定的字时,就需要知道这个字存放在什么位置,也就是它的“地址”。那么,用什么方式来定位这个字的位置呢?方法可以有多种,但以下两种是最常用的。 一是:使用页数、行数以及列数对其进行定位。以后只要知道这个字位于第几页、第几行、第几列,就能够找到这个字了。这就是一种三维地址寻
47、址方式; 二是:还可以将书中所有的字由前向后进行编号,只要知道一个字的编号就能够找到它了。这就是一种线性地址寻址方式。 如果对硬盘上的数据进行访问,也可以采用以上提供的思想方法来寻址数据。目前硬盘的寻址方式主要有以下两种方式:一是C/H/S寻址方式;二是LBA寻址方式。,数据恢复技术,1. CHS寻址方式 在过去,硬盘的容量还很小的时候(小于8GB),人们采用与软盘类似的结构生产硬盘。也就是硬盘盘片的每一条磁道都具有相同的扇区数。由此产生了所谓的3D参数(Disk Geometry)。既磁头数(Heads), 柱面数(Cylinders),扇区数(Sectors),以及相应的寻址方式,也就是C
48、HS方式。其中: 磁头数(Heads)表示硬盘总共有几个磁头,也就是有几面盘片, 最大为 255(用8个二进制位存储); 柱面数(Cylinders) 表示硬盘每一面盘片上有几条磁道,最大为 1023(用10 个二进制位存储); 扇区数(Sectors) 表示每一条磁道上有几个扇区, 最大为 63(用 6个二进制位存储)。 每个扇区一般是 512个字节。 所以磁盘最大容量为: 255 * 1023 * 63 * 512 / 1048576 = 8024 GB ( 1M =1048576 Bytes ) 或硬盘厂商常用的单位: 255 * 1023 * 63 * 512 / 1000000 =
49、8414 GB ( 1M =1000000 Bytes ) 在CHS寻址方式中, 磁头, 柱面, 扇区的取值范围分别为 0到 Heads - 1,0 到 Cylinders - 1, 1 到 Sectors (注意是从 1 开始)。 这就是通常的8GB硬盘的CHS限制。,数据恢复技术,2. LBA寻址方式 LBA全称为Logic Block Address(即扇区的逻辑块地址),也叫线性寻址模式。系统把所有的物理扇区都按照某种方式或规则看做是一线性编号的扇区,即从 0 到某个最大值方式排列,并连成一条线,把LBA 作为一个整体来对待,而不再是具体的实际的 C/H/S值,也就是说硬盘不再有柱面、
50、磁头、扇区的三维定义了,这样只用一个序数就确定了一个惟一的物理扇区,这就是线性地址扇区的由来,显然线性地址是物理扇区的逻辑地址。 因为随着硬盘容量的增大(大于8GB),CHS将无法表示。但是由于基本 Int13H 的制约, 使用 BIOS Int 13H 接口的程序, 如 DOS (FAT 16)等还只能访问8GB以内的硬盘空间,为了打破这一限制, Microsoft 等几家公司制定了扩展 Int 13H 标准(Extended Int13H), 采用线性寻址方式存取硬盘, 所以突破了8G的限制。,数据恢复技术,显然,LBA是相对硬盘扇区三维物理地址而言的。扇区的三维物理地址与硬盘上的物理扇区
51、一一对应(小于8GB),即三维物理地址可完全确定硬盘上的物理扇区,这些通常用来表示硬盘的物理地址 。 目前,LBA地址被定义为48位的大小,所以能够管理的扇区总数为248-1=281 474 976 710 655个扇区,也即是144 115 188 075 855 872字节=144PB(1PB=1000 000GB)。,数据恢复技术,3. CHS转换为LBA 如果硬盘容量小于8GB,就可以把CHS转换为LBA。 转换公式: LBA = ( C - Cs ) * PH * PS + ( H - Hs ) * PS + ( S - Ss) 其中:C表示当前柱面号,H表示当前磁头号,S表示当前扇
52、区号, Cs表示起始柱面号,Hs表示起始磁头号,Ss表示起始扇区号, PS 表示每磁道有多少个扇区, PH 表示每柱面有多少个磁道。 一般情况下, Cs = 0 , Hs = 0 , Ss = l , PS = 63 , PH = 255 。 例如: C/H/S=0/0/1,代入上述公式中得到LBA=0 C/H/S=0/0/63,代入上述公式中得到LBA=62 C/H/S=1/0/1,代入上述公式中得到LBA=63 C/H/S=220/156/18,代入上述公式中得到LBA=3544145,数据恢复技术,4. LBA值转换为CHS 对任意大小容量的硬盘,都可以将LBA转换为CHS。 转换公式:
53、 第一套公式: C=LBA DIV (PH*PS) + Cs H=(LBA DIV PS) MOD PH + Hs S=LBA MOD PS + Ss 第二套公式: C= LBA DIV (PH*PS) + Cs H=LBA DIV PS (C-Cs) * Ps + Ss S=LBA- (C-Cs) * PH * PS - (H-Hs) * PS + Ss 注意:两种运算DIV和MOD。DIV做整除运算, MOD是余运算;以上公式常用于程序开发中。 例如:LBA=0,相应地C/H/S=0/0/1;LBA=62,相应地C/H/S=0/0/63 LBA=63,相应地C/H/S=1/0/1; LBA
54、=3544145,相应地C/H/S=220/156/18.,数据恢复技术,六、数据编码方案: 磁盘是用来记录“ 0 ”、 “ l ”这样的二进制信息数据的。读写数据时,这些“ 0 ”、“ l (也即“位”)必须用某种方法转换成磁盘表面的磁信号。 如果能把各个信息位沿着磁道一个接一个地存放,并且根据二进制位是“ 0 ”还是, “ 1 ”来安排每个位取两种磁场方向中的一种,这样一个信息位只要一个磁翻转长度来储存。但实际上这种方案是行不通的。因为要想在线圈两端有一个电压,则线圈中的磁场必须发生变化。假如记录的信息位都是相等的(例如是全“0”或全“1”) ,采用上述编码方案就不会有磁场变化,也就不会有
55、信号供磁头读出。为保证驱动器能可靠地读出信息,需要有更复杂的数据记录方案。,数据恢复技术,一种简单的脉冲方案通常是通过对磁性介质进行“磁化翻转”的编码方式将数据存放在磁性介质上。 所谓磁化翻转就是“正的变成负的”或“负的变成正的”。当读数据时,翻转就像一个脉冲,因此我们将翻转称为脉冲磁盘上就是用有无脉冲来表示数据的。 在简单的脉冲方案中,把每个二进制“l”转变成一个双向的脉冲,每个二进制“ 0 ”转变成相同长度的无脉冲状态。然后,在每个信息位之间布置一个伪脉冲,即时钟信号。被记录下来的翻转在以后驱动器读信息时就会在磁头上产生相应的电压脉冲(通过从负到正的一个磁化翻转时,电压升高到某个正值后再返
56、回到零,这就是一个正脉冲。通过从正到负的一个磁化翻转时,读磁头上的电压就下降到某个负值后再返回到零,这就是一个负脉冲)。,数据恢复技术,这种方案下,“1”脉中在磁头下通过时能清楚地显示出来,而“ 0 ”脉冲就不能,因为这时没有磁场变化。 但是,脉冲始终是显示的,而且使磁头能检测到更长的一串“ 0 ”位。这种方法虽能简单地读写数据,但如果有一长串的“ 0 ,就会很长时间没有脉冲,使控制器失控,出现控制器与数据不同步的现象。 因此需要一种编码机制来保证不会出现长时间没有脉冲的情况。为解决这个问题,就诞生了 FM ( Frequency Modulation ,调频制)编码、 MFM ( Medif
57、ied Frequency Modulation , 改进型调频制)编码和 RLL ( Run Limited,受限长度)编码等编码方案,这些是更底昙的细节,包括误差检测及数据纠错等措施,这里不再详述,感兴趣的读者自己找书看看。,数据恢复技术,七、硬盘上的数据保护技术 ASMART 技术 使用 SMART (自动检测、分析及报告)技术,可以有效地保护硬盘。硬盘出现故障,是一件十分令人懊恼的事情,为此,将冒丢失重要数据的危险。不过,现在有一种对硬驱故障发出报警的方法,它就是自我监视、分析和报告技术 SMART 。 可预测的硬驱故障是由硬驱性能逐渐恶化引起的。实际上,硬驱故障的 60都是机械性质的
58、,对此类故障, SMART 可一显身手。 SMART 可以对数据提供有效的廉价保护,使用 SMART 技术的驱动器有助于减少数据丢失的风险,亦即避免了金钱和时间的损失,并且预先报警能让你安排更换驱动器所需的停工时间。尽管 SMART 能有这样的帮助,但保护数据最好的方法仍是不断地定期备份,实际上,将二者结合起来是最好的保护方案。 SMART 技术是硬盘厂商提供的一个规范,主要目的是预防某些设备失败,提高硬盘可靠性和确保数据的连续性,已成为工业标准,因此,目前的硬盘基本上都支持 SMART 技术。,数据恢复技术,BSPS 技术 SPS ( Shock Protection System ) ,震动保护系统,由昆腾公司开发,使硬盘在受到撞击时,保持磁头不受震动,磁头和磁头臂停泊在盘片上,冲击能量被硬盘其他部分吸收,这样能有效地提高硬盘的抗震性能,使硬盘在运输、使用及安装的过程中最大限度地免受震动的损坏。目前第二代保护系统(SPS II)也已推出,可以更有效地防止由于外界的震动所引起的硬盘损坏。,数据恢复技术,CDPS数据保护系统 DPS ( Data Protection system )可快速自动检测硬盘的每一个扇区,并在硬盘的前 300MB 空
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤炭分质分级利用模式的区域差异与实施策略
- 2025至2030中国电影监视器行业产业运行态势及投资规划深度研究报告
- 2025至2030中国田径场地吸水器行业市场深度研究及发展前景投资可行性分析报告
- 2025至2030中国生态厕所行业市场深度调研及发展趋势与投资策略报告
- 2025至2030中国现代模块化沙发行业市场深度研究及发展前景投资可行性分析报告
- 食品质量管理问题识别评估、临床措施、根本原因、影响、纠错措施等要点总结
- 2025至2030中国特殊标志信标浮标行业发展趋势分析与未来投资战略咨询研究报告
- 智慧教育在医疗健康领域的应用前景
- 全球学习者的在线支持系统教育平台的国际化建设探讨
- 打造健康生活中医养生知识在日常教育中的推广
- 有限空间作业安全全告知牌
- 华为经营管理-华为的研发管理(6版)
- 法拍房后申请住房补贴申请书
- 苏教版译林初中英语词汇表(七年级至九年级)
- 《外科学》课程基本要求与教学大纲本科生
- 工作销项计划表
- 抑郁病诊断证明书
- 典型振动频谱图范例
- 维克多高中英语3500词汇
- 石化质检员试题
- GB/T 6417.1-2005金属熔化焊接头缺欠分类及说明
评论
0/150
提交评论