新编导论-第7章 数据组织与数据存储_第1页
新编导论-第7章 数据组织与数据存储_第2页
新编导论-第7章 数据组织与数据存储_第3页
新编导论-第7章 数据组织与数据存储_第4页
新编导论-第7章 数据组织与数据存储_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

周苏教授QQ:81505050ZS,在这一章中,我们来学习使用计算机管理数据的基础知识,例如:数据存储,创建合法文件名,使用资源管理器工具组织磁盘文件等等。,数据、信息和文件资源管理器存储文件数据存储设备,7.1,7.2,7.3,7.4,7.1数据、信息和文件7.1.1基本概念7.1.2文件命名规范7.1.3通配符7.1.4可执行文件7.1.5数据文件7.1.6配置文件、程序模块和其他文件,7.1数据、信息和文件作为专业术语,“数据”、“信息”和“文件”都有着专门的定义,理解这些定义,将有助于进行专业性的交流,理解诸如“数据输入、信息输出”等的内涵。,7.1.1基本概念虽然人们在日常交谈中经常混用术语“数据”和“信息”,但它们是有明确区分的。所谓“数据”就是描述人、事件、事物和思想的词语、数字和图形等。当使用数据作为行动或决策的依据时,数据就成为信息。“信息”是作为人们行动和决策依据的词语、数字和图形等。,例如:CA4199Beijing9:59Hangzhou11:09。这些字母、数字和符号描述了一个事件航班时刻表,这是计算机系统中常用的数据存储形式。如果你决定从北京(Beijing)到杭州(Hangzhou)进行一次旅行,在旅行社的计算机屏幕上会看到如下信息:航班航班号出发地起飞时间目的地抵达时间CA4199Beijing9:59Hangzhou11:09这里,屏幕上的字母、数字和符号被认为是信息,因为旅行社用它们来制定你的旅行日志。,由于“CA4199Beijing9:59Hangzhou11:09”既是数据又是信息,所以有时数据和信息的区别非常小。通常来说,如果字母、数字和符号存储在计算机中,称它们为数据;如果字母、数字和符号被某人用来完成某个动作或做出决策,那么就称它们为信息。数据是计算机使用的,而信息是人使用的。,计算机文件通常简称为文件,是存放在存储介质(例如硬盘、光盘或U盘)中的数据的有名字的集合。文件可以包含程序或者数据,比如文档、图形、数字视频,或者数字化声音等。,7.1.2文件命名规范文件名是字母和数字的惟一性集合,用于标识一个文件,并且通常描述了文件的内容。例如,Microsoft画图软件的文件名是Pbrush。文件名后面一般还有文件扩展名(简称“扩展名”),它进一步描述了文件内容。在文件名Pbrush.exe中,Pbrush是文件名,.exe是扩展名。扩展名与文件名之间用“.”隔开。,当创建文件时,必须按照特定规范来设置该文件的有效文件名,该规范被称作文件命名规范。每个操作系统都有自己的命名规范集。通常,文件扩展名说明文件所属的类别。计算机文件基于其包含的数据、创建该文件的软件,以及使用该文件的方式进行分类。了解文件分类的特征可以提高访问文件的效率。,7.1.3通配符文件有惟一的名字,但有时候可能要用到多个文件。例如,假设想列出磁盘上所有扩展名为.exe的文件,这时可以用*.exe(读作“星点exe”)来指定。星号是一个通配符,在文件名或扩展名中用于替代一组字符。*.exe表示所有扩展名为.exe的文件。“?”号是另一个文件名通配符,在文件名或扩展名中用于替代一个字符。可以使用通配符字符来定位或者删除磁盘上的文件组。,当操作磁盘、CD或者DVD上的成百上千文件并且不需要逐个浏览时,使用通配符是很方便的。大多数操作系统都允许使用通配符来方便操作文件集合。甚至可以在图形化用户界面下使用通配符。,例如,假设某磁盘包含如下9个文件:Word.exeWord.cfgSam.bmpSpell.exeRecruits.docSilver.exeReport.docMail.datMiddle.batWord.*的含义是文件名必须是Word,但扩展名随意。在本例中,有两个文件符合这模式:Word.exe和Word.cfg;*.doc意味着具有.doc扩展名的任意文件。在本例中,有两个文件符合这一模式:Recruits.doc和Report.doc;S*意味着任何以字母“S”开头的文件名。在本例中,Spell.exe、Sam.bmp和Silver.exe都符合这一模式。*.*(读作“星点星”)意味着所有文件。,7.1.4可执行文件可执行文件包含了告诉计算机执行特定任务的程序指令。例如,控制计算机显示和打印存储在磁盘上的文本的字处理程序就是可执行文件(例如Word.exe),其他可执行文件还有操作系统程序、工具软件和应用软件程序等。一般可以根据扩展名来识别出可执行文件,大多数可执行文件的扩展名都是.exe,有的也使用.com扩展名。可以通过执行操作来使用可执行文件。,7.1.5数据文件数据文件含有可以查看、编辑、存储、发送和打印的文本、数字和图片等。可以把数据文件想象成是被动的数据不会要求计算机做事情,而可执行文件是主动的存储在文件中的指令会要求计算机完成某些动作。通常在使用应用软件时可以创建数据文件。例如,当要存储一份使用字处理软件写的文档或使用图形处理软件绘制的图形时就会创建一个数据文件。当存储电子表格、图片、声音剪辑或视频时,也会创建数据文件。,数据文件都是与应用软件一起使用的,应用软件处理文件中的数据。通常,可以使用创建该文件的软件来查看、修改和打印数据文件中的信息。例如,可以使用MicrosoftWord软件来编辑使用由Word创建的(.doc)数据文件。为了查看或者编辑某个数据文件,需要将它“打开”。打开数据文件的标准方法是先启动应用程序,然后使用应用程序提供的“打开”命令,该方法在各种操作系统中都类似。通常,使用字处理软件打开文档,使用电子表格软件打开工作表,使用画图软件打开图形,等等。通过查看文件扩展名可以了解数据文件的内容,以及用于打开该文件的软件。,一般来说,没有必要记住特定的数据文件的扩展名。当创建数据文件时,所使用的软件会在文件名后面自动加上正确的文件扩展名。比如,当使用MicrosoftWord创建文档时,只需输入主文件名,比如“Report”,Word软件会自动追加.doc扩展名,组成完整的文件名,即Report.doc。,7.1.6配置文件、程序模块和其他文件除了可执行文件和数据文件之外,计算机通常还包含对硬件或者软件操作很必要的其他文件。这些文件具有诸如.bat、.sys、.cfg、.dll、.ocx、.ini、.mif、.hlp,以及.tmp等扩展名。由于这些文件甚至所谓的“临时”文件对于计算机系统的正确操作是很关键的,请不要随意删除它们。,文件类型描述文件扩展名批处理文件当计算机启动时自动执行的操作系统命令系列.bat配置文件有关程序的信息,计算机使用该信息为程序运行分配必要的资源.cfg,.sys,.mif,.ini帮助文件在线帮助显示的信息内容.hlp临时文件当程序运行时生成的数据文件,在程序正常终止时会被删除.tmp程序支持模块与程序的主.exe文件一起运行的程序指令.ocx,.vbx,.dll,7.2资源管理器7.2.1设备驱动器号7.2.2目录和文件夹7.2.3存储模型7.2.4资源管理器操作,7.2资源管理器在用户计算机系统的磁盘和其他存储设备中存储着成千上万的文件。为了跟踪这些文件,计算机操作系统提供了“资源管理器”(也前身即为“文件管理器”)操作功能,它们有助于定位、重命名、移动、复制和删除文件。操作系统不同,资源管理器也可能有所不同,但是所有的资源管理器都基于相似的概念。,7.2.1设备驱动器号大多数计算机都拥有多个存储设备,比如软盘驱动器、硬盘驱动器,以及CD-ROM、DVD驱动器等。一般情况下,知道文件位于哪个存储设备中,则查找起来就要容易得多。存储设备通常是由设备驱动器号来标识的,设备驱动器号提供了保存或者打开文件时引用特定存储设备的简洁方式。软盘驱动器通常被分配设备驱动器号为A,主要的硬盘驱动器通常被称作驱动器C。其他存储设备可以分配从D到Z之间的驱动器号。设备驱动器号有时后跟一个冒号,例如C:指的是计算机硬盘驱动器。,7.2.2目录和文件夹操作系统为每个磁盘、CD-ROM或者DVD维护着一个文件列表,称为目录。查找文件的一种方式是搜索目录列表。目录中包含了存储设备上每个文件的有关信息,包括文件名、文件扩展名、文件被创建的日期和时间,以及文件大小等。可以使用操作系统的资源管理器操作来查看计算机存储设备的目录(图7-1)。,图7-1WindowsXP资源管理器,磁盘上的主目录有时又称为根目录。如果根目录中包含的文件很多,在其中查找所需文件将会是很困难的。为了更好地组织文件,大多数操作系统允许将目录分成“子目录”或“文件夹”的更小列表。比如,可以创建一个文件夹存放自己的所有文档,创建另外一个文件夹存放图形文件。文件夹可以进一步细分为其他文件夹,有时被称作“子文件夹”。,文件夹名因为有一个特殊的符号,所以不同于设备驱动器号和文件名。在DOS和Windows操作系统中,该符号是反斜线符号“”。比如,驱动器C的根目录包含一个名为Graphics的文件夹,则该文件夹的名称为“C:Graphics”。文件路径包括设备驱动器号、文件夹、文件名,以及标识文件的扩展名。例如:“E:机械工业出版社新编计算机导论第7章数据组织与数据存储.doc”。,7.2.3存储模型操作系统的资源管理器提供了计算机存储文件的符号和比喻视图。目录结构的比喻视图有时被称作逻辑模型,其原因是它们表示目录结构的逻辑设想(而非实际物理存储)。资源管理器实用工具经常使用多种文件存储比喻法,包括“文件夹”和“树结构”等。,在“树结构”比喻中,一棵树用来代表一个存储设备。树干是根目录,树的分支代表文件夹,这些分支可以细分为更小的分支或者子文件夹,分支顶端的叶子代表单个文件。借助于树结构比喻,可以清楚地理解文件夹和文件的组织方式。但作为用户界面。可以设想把树图表扩展显示为更加实际的包含成百上千文件的文件夹集合。,7.2.4资源管理器操作资源管理器的目的是帮助用户查找、重命名、复制、移动,以及删除文件或者文件夹,实现有效的文件管理。其主要文件操作包括:1)查找。在可以打开或者操纵文件或者文件夹之前,有必要了解该文件或者文件夹位于何处。资源管理器实用工具可以帮助查看存储设备的目录结构来定位文件夹,然后通过浏览文件夹来查找特定的文件。,2)重命名。重命名文件时,通常应该保证文件扩展名不变,以便必要时可以使用正确的应用软件来打开。3)复制。可以把文件或者文件夹复制到软盘或U盘中。复制操作可以建立文档的副本,以保证文件的安全或者方便文件的转移等。4)移动。可以将文件从一个文件夹移到另一个文件夹,或从一个存储设备移到另一个存储设备。当移动操作时,文件将脱离原始位置,因此,要确保记住它的新位置;也可以将文件夹从一个存储设备移到另一个存储设备,或者将它移到另一个文件夹中。,5)删除。当不再需要某个文件时,可以删除它,也可以删除文件夹。删除文件夹时一定要小心,因为大多数资源管理器也会同时删除该文件夹所包含的所有文件和子文件夹。,7.3存储文件数据7.3.1存储的概念7.3.2磁技术和光技术7.3.3磁道、扇区和簇7.3.4闪存技术7.3.5文件分配表,7.3存储文件数据用户在资源管理器中看到的文件夹和文件的概念模型与计算机在磁盘上数据的实际存储之间没有多大关联。计算机通常并不会为每个文件夹单独标识出特定的磁盘区域,也不会把文件存储为一个单元。事实上,一个文件的数据很可能会散布在某个磁盘的任何地方。,7.3.1存储的概念计算机在磁盘上实际存储数据的方式被称作“物理存储”。相对地,文件和文件夹的概念模型被称作“逻辑存储”。通常,一般用户没有必要理解与物理存储相关的所有细节。,数据存储系统包含两个主要部分:存储介质和存储设备。存储介质是磁盘、磁带、CD-ROM、DVD、纸张,或者包含数据的其他物质;而存储设备是对存储介质进行数据记录和检索操作的机械设备。存储设备包括软盘驱动器、硬盘驱动器、CD驱动器、DVD驱动器、磁带驱动器以及U盘等。所谓“存储技术”指的是存储设备和它所使用的介质。,存储数据的过程通常称为“写数据”或者“保存文件”,检素数据的过程通常称为“读数据”、“加载数据”,或者“打开文件”。读和写数据通常与主机应用有关,而保存和打开则是标准的Windows术语。,7.3.2磁技术和光技术可以把计算机内存中所保存的文档看作是l和0的长序列,这些位被发送到存储设备中,存储设备把数据写到存储介质中。显然数据不会被存储为1和0,相反,1和0必须被转换为存储介质表面的变化,具体实现这种转换取决于存储技术。比如,软盘与CD-ROM存储数据的方式不同。微型机存储设备通常既使用磁存储技术,也使用光存储技术。,硬盘、软盘和磁带存储都是磁存储技术,磁存储通过磁化磁盘或者磁带表面上细小的粒子来存储数据。在数据没有变化时,粒子方向不会变化,这使得磁盘和磁带成为长期的、但是可以更改的存储介质。磁盘驱动器中的读写头设备可以读取和写入表示数据的磁化粒子。磁化方式存储的数据可以很容易地被改变或者删除,这只需要改磁盘表面粒子的方向即可。磁存储的这种特性使我们可以灵活地编辑数据,以及复用存储介质中各个区域。,另一方面,在磁场环境下,存储在磁介质上的数据容易受磁场、灰尘、潮湿、烟尘、高温,以及存储设备机械问题的影响而改变。磁介质的磁性也会随着时间的流逝而慢慢降低,最终导致数据丢失。一般认为存储在磁介质上的数据可靠的生命期是三年,所以建议每隔两年就应该重新备份数据。,CD和DVD都采用光存储技术。光存储技术采用光学方法读写数据,一般情况下使用激光作为光源,所以也称为激光存储。光盘是集光、机、电三者为一体的信息存储技术,它利用光学方法在记录介质上进行信息读写。光盘的特点是容量大、寿命长、价格低、携带方便是永久存储多媒体信息的理想媒体。,光存储技术的基本物理原理是:改变一个存储单元的某种性质使其性质的变化反映被存储的数据,识别这种存储单元性质的变化,就可以读出存储的数据。光存储单元的性质(如反射率、反射光极化方向等)可以改变,它们对应于存储二进制数据0、1,光电检测器检测出光强和光极性的变化,从而读出存储在光盘上的数据。,为了识别数据,光盘上定义激光刻出的小坑(转折处)代表二进制的“1”,而平坦处代表二进制的“0”。DVD盘的记录凹坑比CD-ROM更小,最小凹坑长度仅为0.4m,而且非常紧密,其螺旋储存凹坑之间的距离也更小,每个坑点间的距离只是CD-ROM的50%,并且轨距只有0.74m。由于高能量的激光束可以聚焦成约1um的光斑,因此它比其他存储技术存储容量更高。,7.3.3磁道、扇区和簇计算机在存储介质上存储数据之前,它会创建等价的电子存储“柜子”,称为磁道。光技术在盘片上从里到外螺旋式的磁道中存储数据。在计算机磁带上,磁道与磁带的边界平行。在磁盘上,磁道按照同心圆安排,同心圆进一步被细分为楔形磁道和扇区,并被编号以便于提供数据存储的访问地址,编号方案取决于存储设备和操作系统。比如,在Windows环境下,软盘的每一面都有80个磁道和18个扇区。,磁道和扇区可以分别或者成组处理。为了提高读写数据的过程的速度,磁盘驱动器通常处理扇区组,也称为簇。根据磁盘容量和磁盘驱动器的技术规范不同,组成簇的扇区数也不同。,7.3.4闪存技术闪存技术是近年来新兴的半导体存储技术,采用闪存存储介质(FlashMemory)。闪存可反复读写。与传统电磁存储技术相比,闪存有许多优点:1)在存储过程中没有机械运动,因此运行非常稳定,从而提高了抗震性能,使它成为所有存储设备里面最不怕震动的设备;2)由于闪存不存在类似软盘、硬盘、光盘等的高速旋转的盘片,所以它的体积往往可以做得很小。现在的MP3播放器可以做得很小的原因就是因为采用了这种存储技术。,7.3.5文件分配表操作系统通过创建类似于每个存储介质上内容表的文件来确定所存储文件的位置。介质类型不同,内容表的结构也不同。比如,CD-ROM的内容表与软盘或者硬盘的内容表稍有区别。当计算机在磁盘上存储文件时,操作系统在文件分配表(FAT)中记录存放该文件的起始簇号码。FAT是非常重要的操作系统文件,记录了磁盘上的文件和它们在硬盘上的物理位置。如果FAT被磁头故障或其他故障破坏了,就不能对存储在磁盘上的数据进行存取。这也是要备份硬盘数据的原因之一。,当存储文件时,操作系统首先在FAT表中寻找空簇。找到后,操作系统就将数据放在空簇中,并在FAT表中记录下该簇的编号。新文件的名字和包含该文件数据的首簇编号记录在目录中。如果一簇放不下一个文件,就将该文件分割,存放在相邻的空簇中。如果相邻的簇有数据,操作系统就会将该文件存放在不连续的簇中,并建立指针用来连接。指针指向了文件的每一片。,如果想读文件,操作系统通过目录找到文件名和包含文件数据的首簇编号。FAT表给出了哪些簇包含该文件的数据。操作系统将读写头移动到文件首簇的位置,读出数据。如果文件存储在多个簇中,读写头还要移动到其他簇上读出多个文件。如果文件存放在不连续的簇中,读取文件花费的时间要比读取存放在连续簇中的文件花费时间多,这是因为磁盘和读写头要移动多次才能找到文件的后续部分的缘故。,当删除一个文件时,操作系统会改变FAT表中相应簇的状态。例如,如果文件存储在簇5、7、9和11中,当删除它的时候,操作系统把这四个簇的状态改变为“空”。这些簇的数据并没有在物理上移动或清除。相反,这些数据仍然保存在簇中,直到有新的数据将它覆盖。这种方式就使得我们在错误删除了一个文件后,仍然能够通过回收站的还原特性来恢复。当然,这只有在没有写入新的数据时才可以恢复。因此,一旦发现误删除文件,就要立刻恢复。,很多文件通常会被存放在许多不连续的簇中。当驱动器定位含有部分文件数据的簇比较困难的时候,驱动器的性能也就变得很差。要重新获得驱动器的峰值性能,可以使用“磁盘碎片整理”工具来重新组织磁盘上的文件,使它们存放在连续的簇中。,图7-2WindowsXP磁盘碎片整理程序,7.4存储设备7.4.1存储设备的评价标准7.4.2U盘存储7.4.3硬盘存储,7.4存储设备现在的计算机可以使用多种类型的存储设备,每种存储设备都有其独特的优缺点。当需要从众多的存储设备中进行选择时,理解这些设备的特性是很有帮助的。,7.4.1存储设备的评价标准微型机的存储技术主要包括软盘、硬盘、磁带、CD、DVD和U盘等6种。我们使用4个标准,即多功能性、持久性、容量和速度,来比较存储设备。1)多功能性。有些存储设备可以访问多种类型介质上的数据(例如DVD)。2)持久性。大多数存储技术容易受到错误存放或者其他环境因素(比如热和潮湿)的破坏,有些技术则不容易受影响。持久性强的,就是不容易出现数据丢失等破坏的技术。,3)容量。人们通常更喜欢选择容量大的存储设备。存储容量是该存储设备上可以存储数据的最大数量,通常使用干字节(KB,kilobyte)、兆字节(MB,megabyte)、吉字节(GB,gigabyte)和太字节(TB,terabyte)等来衡量。1KB就是1024个字节,但是通常省略后面的零头。4)速度。快速访问数据是很重要的,所以人们喜欢速度快的存储设备。存储设备的速度是由访问时间和数据传输速率决定的。,访问时间是计算机定位存储介质上的数据并读取它的平均时间。微机上存储设备(如磁盘驱动器)的访问时间一般使用毫秒来衡量。随机访问(也称“直接访问”)设备的访问时间是最好的。随机访问是指设备直接“跳到”包含所请求数据的磁道或者扇区的能力,软盘、硬盘、CD和DVD驱动器都是随机访问设备;。另外,磁带驱动器必须使用速度较低的顺序访问,每次访问数据时都要从磁带的开始处定位数据。,数据传输速率是存储设备在每秒时间内从存储介质传输到计算机的数据量。数字越大说明数据传输速率越快。,7.4.2U盘存储U盘是USB盘的简称,又称“优盘”,它是采用闪存技术来存储数据信息的可移动存储盘,因此也叫闪盘。U盘小巧便携而存储容量大、价格便宜,是目前常用的移动存储设备之一。U盘的容

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论