




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学习汇编前应该知道的知识第一讲 学习汇编前你应该知道的知识1、汇编需要什么工具和程序?目前阶段,汇编程序仅需要两个程序就够了。 masm.exe,link.exe。前者是汇编程序,后者是链接程序。另外,还需要编辑程序edit.exe,验证和调试程序debug.exe,这两个程序由windows本身提供。建议:将以上4个文件放到一个目录中,如可以建一个“D:Masm”目录,并建议此后的程序都放这个目录,此后称这个目录为汇编目录。2、学习汇编需要有哪些编程方面的知识。没有任何编程方面的知识,学习此语言等于缘木求鱼,所以请放弃学习的想法。一般来说至少要知道如下几点: *)程序的运行逻辑结
2、构有顺序(按语句依次执行)、分支结构(IF.THEN.ELSE.),循环结构(FOR.NEXT)三种结构。 *)知道什么是子程序,什么是调用。 *)汇编程序员的视角。不同编程视角编程要求是不一样的。比如删除文件, >>用户的视角是找到“删除”按钮或菜单,然后单击一下即可。 >>高级程序员的视角是知道删除的文件,并发出删除命令。这些通过API实现。 >>汇编程
3、员的视角是得到要删除的文件名,找到该文件所在位置,通过调用删除“中断命令”进行删除。 >>操作系统开发人员的视角则是接到删除命令后,先找到系统根目录区,由根目录区的链接依次找到子目录区,直到找到要删除的文件,然后按照操作系统删除文件的规则对该文件名进行修改。比如DOS,只把第一个字符改成"?"。 按程序语句等价的角度看,一行VB的打印语句,用汇编实现大约需要一百二十多行。知道汇编语言的视角后就要知道,前面的道路是坎坷的,没有耐心是不行的。想通过几分钟几行程序就完成很复杂的操作不是件容易的事。
4、3、学汇编有什么用?² 汇编产生于DOS时代或更早,而现在是Windows时代,所以可能遗憾地说:尽管还有批牛人在用汇编开发核心级程序,但我们几乎没什么用,除了必要时能拿来分析一两个程序的部分代码之外,别的也就没什么用了。并且并不是所有的汇编命令都能在windows下使用。而泛泛地追求“时髦”而学本语言。这是大错特错的。不要忘记我们是计算机专业学生!² 劝那些为了当“黑客”而学汇编的人就此止步。第二讲 预备知识1 一个汇编程序的编译过程是怎么样的。 1)首先你需要找一个编辑器,编辑器用任何“纯文本”编辑器都可以。比如记事本。编好以后保存到汇编目录中。扩展名为as
5、m,比如myfirst.asm。但这里建议你找一个能显示出当前行的编译器。这样出错后排错很容易。 2)然后在DOS下进入D:Masm目录中,输入“masm myfirst.asm",如果有错系统会提示出错的行位置和出错原因。 3)然后再输入“link myfirst.obj”,即可看到当前目录下有一个myfirst.exe程序。2 宏汇编和汇编有什么区别吗? 二者的区别在于前者提供宏,后者不提供。后者已找不到了,所以你可以认为二者没有区别。3 机器语言、汇编语言、高级语言的关系 最早的计算机采用机器语言,这种语言直接用二进制数表示,通过
6、直接输入二进制数,插拔电路板等实现,这种“编程”很容易出错,每个命令都是通过查命令表实现,既然是通过“查表”实现的,那当然也可以让计算机来代替人查表实现了。于是就产生了汇编语言,所以不管别人怎么定义机、汇语言,我就认为,二者是等价。后来人们发现,用汇编语言编某一功能的时候,连续一段代码都是相同或相似,于是就考虑用一句语言来代替这一段汇编语言,于是就产生了高级语言。因此,所有高级语言都能转化成汇编语言,而所以汇编语言又可转化成机器语言。反之,所有机器语言可以转成汇编语言(因为二者等价)。但并不是所以汇编语言都能转成高级语言。4 计算机的组成 通常都把计算机定义成五部分:运算器、控制器
7、、存储器、输入系统、输出系统。 为了简单其间,我们如此理解:运算器+控制器=CPU。存储器=内存(暂不包括外存,永不包括CACHE)。输入系统=键盘(不包括鼠标),输入系统=显示器(不包括打印机,绘图仪)。5 寄存器和内存的区别 寄存器在CPU中。内存在内存条中。前者的速度比后者快100倍左右。后面的程序要求每条指定要么没有内存数据,要么在有一个寄存器的参与下有一个内存数据。(也就是说,不存在只访问内存的指令)。6 汇编语言的计数 与生活中的计数不一样,汇编中的计数是从0开始的。比如16个计数,则是从015,而不是生活中的116。这一点看起来简单,真运算起来
8、就不是件容易的事了,不信等着瞧。7 进制问题 又与生活中不一样的地方是进制。切记下面的常识: *)计算机内部存储都用二进制。 *)我们的汇编源程序默认都用十进制。(除非你指明类型) *)我们用的调试程序debug默认的都是十六进制。(无法指明其他类型) 其中十六进制的十六个个位数依次是:0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F。8 进制转换 一个比较简单的方法是查表法。 十进制 十六进制 二进制 0
9、0; 0 0000 1 1 0001 2 2 0010 3 &
10、#160; 3 0011 4 4 0100 5 5 0101 6
11、0; 6 0110 7 7 0111 8 8 1000 9 &
12、#160; 9 1001 10 A 1010 11 B 1011 12 C
13、; 1100 13 D 1101 14 E 1110 15 F 1111 好了,结合6,7,8三条。大家来
14、算一个“题”。某一组数据显示时,每个数据占了四个位置,每行共十六个。问:十六进制的13位置在哪里(第几行,第几列)。 格式如下:m m m m n n n n o o o o p p p p '注:之所以没用ABC是怕与上面十六进制弄混。 r r r r s s s s t t t t u u u u第一讲 基础知识1 访问内存 程序在内存中,访问内存是几乎每一程序都要进行的操作,计算机对内存编址是线性的,也就是说是一维的,比如25
15、6M的内存,地址就应该是从0(256M-1),这个地址称为物理地址或绝对地址。1.1 地址表示 但从汇编程序员的角度看,内存却是二维的,要说明一个地址,需要给出两个值,就象你在平面上指定一点需要说出(X,Y)坐标一样,汇编程序员的内存视角也需要两个“坐标”,前一个称为段地址(Segment),后一个称为偏移地址(Offset),该地址称为逻辑地址。 比如“1234:3DF5”就是一个地址。“1F3F:”不是一个地址,因为他只有段地址,没有编移地址。注意此后的地址都用十六进制表示。1.2 地址计算 前面提到,计算机编址是一维的,汇编程序员是二维的,那么二者怎么
16、换算呢?由后者到前者的换算方法是,“段地址串”后面加个“0”,然后再加上偏移地址。 比如“1234:3DF5”(十六进制的加减运算参见相关资料)12340 串后加了一个03DF5-16135 注意此串仍然是十六进制。 所以,汇编程序员眼中的地址“1234:3DF5”就是物理地址(计算机编址):16135。 知道了由后者向前者的转换,那么由前者向后者的转换呢? “不知道”,为什么不知道,继续往下看。1.3 到底哪个地址对。 知道了1.2的地址算法后,我又
17、发现一个问题: “1000:6135”的物理地址是多少呢? 10000+6135=16135。 “1001:6125”的物理地址呢? 10010+6125=16135。 . 那么到底哪个对呢?问题的回答是这样的:假设我现在让你按一下“L”键,我可以告诉你如下几种方法中的一种或几种。1 请按一下“L”键; 2请按一下键盘上第四行第十个键;3 请按一下第十列中的第四个键;4 请按一下“K”右边的键;5 按标准指法单击一下右手无名指。
18、 举上面的例子也就是说,同一个地址有很多种表示方式,具体用哪一种,要看实际使用时的情况。但无论用哪种方式,只要能达到目的即可。(实际中该问题一般不会受此问题困扰,但初学时突然想不通)。1.4 有多少内存可以访问 无论是段地址还是偏移地址都是四位十六进制(如果不够四位,前面补0)。也就是说:总共可以访问的地址说是:0000:0000FFFF:FFFF。 总共FFFF0+FFFF+1=10FFF0个地址。也就是不到1M的空间。 记住如下结论: *)不管你实际内存有多少,目前我们只能访问不到1M的空间。 *)而实际上连这1M也用不完。其中上
19、端的384K的址只能读不能写,只能读,一般称为ROM。 *)低端的640K可以读写。但这640K的低端100多K也不能随便写,因此DOS系统使用该区。 *)原来1024M的内存,汇编程序只能使用其中400多K。这段内存的容易相当于一个普通文档的大小。不过这就足够了。2 DEBUG的使用先记住以下两个命令:D命令和Q命令。前者是显示内存内容,后者是退出DEBUG命令。-以下为抄别的人内容-DEBUG.EXE程序是专门为分析、研制和开发汇编语言程序而设计的一种调试工具,具有跟踪程序执行、观察中间运行结果、显示和修改寄存器或存储单元内容等多种功能。它能使程序设计人员或用户触及
20、到机器内部,因此可以说它是80X86CPU的心灵窗口,也是我们学习汇编语言必须掌握的调试工具。 1)DEBUG程序使用在DOS提示符下键入命令: C>DEBUG 盘符:路径文件名.EXE参数1参数2 这时屏幕上出现DEBUG的提示符“-”,表示系统在DEBUG管理之下,此时可以用DEBUG进行程序调试。若所有选项省略,仅把DEBUG装入内存,可对当前内存中的内容进行调试,或者再用N和L命令,从指定盘上装入要调试的程序;若命令行中有文件名,则DOS把DEBUG程序调入内存后,再由DEBUG将指定的文件名装
21、入内存。2)DEBUG的常用命令(1)退出命令 Q 格式:Q 功能:退出DEBUG,返回到操作系统。(2)显示存储单元命令 D格式1:D起始地址 格式2:D起始地址结束地址|字节数 功能:格式1从起始地址开始按十六进制显示80H个单元的内容,每行16个单元,共8行,每行右边显示16个单元的ASCII码,不可显示的ASCII码则显示“·”。格式2显示指定范围内存储单元的内容,其他显示方式与格式1一样。如果缺省起始地址或地址范围,则从当前的地址开
22、始按格式1显示。例如: -D 200 ;表示从DS:0200H开始显示128个单元内容 -D 100 120 ;表示显示DS:0100-DS:0120单元的内容 说明:在DEBUG中,地址表示方式有如下形
23、式: 段寄存器名:相对地址,如:DS:100段基值:偏移地址(相对地址),如:23A0:1500-小抄结束-3 验证第一节里的内容运行“开始/程序/附件/MS-DOS命令提示符”(这是win2000,win98下自己找吧)在“_”下输入D,显示-d1398:0100 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1398:0110 00 00 00 00 00 00 00 00-00 00 00 00 34 00 87 13 .4.1398:0120
24、; 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1398:0130 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1398:0140 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1398:0150 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1398:0160 00 00 00 00 00
25、 00 00 00-00 00 00 00 00 00 00 00 .1398:0170 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .-我们记下:1398:011C的值是个34。1389:011C的物理地址应该是:13A9C。那么1000:3A9C的物理地址也应该是13A9C,他的内存也应该是34,(因为本来就是一个地址吗,就象第三行第十列和第十列第三行当然应该是同一个位置)。-d 1000:3A9C1000:3A90
26、160; 34 00 87 13 4.1000:3AA0 00 00 00 00 0
27、0 00 00 00-00 00 00 00 00 00 00 00 .1000:3AB0 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1000:3AC0 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1000:3AD0 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1000:3AE0 00 00 00 00 00 00 00 00-00 00
28、 00 00 00 00 00 00 .1000:3AF0 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1000:3B00 00 00 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .1000:3B10 00 00 00 00 00 00 00 00-00 00 00 00 .-
29、果然如此,同样你可以验证:13A9:000C也肯定是指这一个地址,不信试试。4 DEBUG命令-继续小抄-前面已学过:显示存储单元命令 D再学一个命令(1)修改存储单元命令 E格式1:E起始地址 内容表格式2:E地址功能:格式1按内容表的内容修改从起始地址开始的多个存储单元内容,即用内容表指定的内容来代替存储单元当前内容。例如:E DS:0100 'VAR' 12 34表示从DS:0100 为起始单元的连续五个字节单元内容依次被修改为'V'、'A'、'R'、12H、34H。格式2是逐个修改指定地址单元的当前内容。如:E DS:00
30、10156F:0010 41.5F其中156F:0010单元原来的值是41H,5FH为输入的修改值。若只修改一个单元的内容,这时按回车键即可;若还想继续修改下一个单元内容,此时应按空格键,就显示下一个单元的内容,需修改就键入新的内容,不修改再按空格跳过,如此重复直到修改完毕,按回车键返回DEBUG“-”提示符。如果在修改过程中,将空格键换成按“-”键,则表示可以修改前一个单元的内容。-小抄结束-5 使用DOS时,汇编用户可以从DOS操作系统中得到什么? 现在编程,通常很多功能都是通过调用系统API。很多高级语言都直接把这些API包装起来,以系统接口或函数的方式提供给用户,那么汇编函
31、数都能得到什么呢? 首先,汇编用户有很多东西可以调用。他们主要是: 5.1 BIOS提供的接口。现在硬件与软件的区分已越来越不明显,很多硬件不仅仅是电路,而还要提供一些固化写入硬件的一部分“程序”,这些程序以ROM的方式出现,汇编用户最大的好处就是可以直接使用这些“程序”,这些使用不仅功能强大,而且效率非常高。 5.2 DOS功能调用,作为操作系统也象BIOS一样向用户提供了相应的“程序”。这些程序在很大程序上扩充了BIOS。与BIOS不同的是,这部分程序放在内存中,它可以被修改。而BIOS中不能再修改。 = 以上两种接口都通过一种相
32、同的格式调用,这些程序统称为“中断”,现在先不要理解中断的本意,你现在可以认为是系统提供给你的函数。 = 5.3 系统共享数据区。编过程序的人都知道全局变量的好处,全局变量方便之外在于任何函数、过程都可以调用、读取、修改。全局变量不足之处是危险性,有一个过程改了这个变量值,其它的也得跟着改变了。DOS操作系统同样也提供了这样的共享数据区,该区是整个系统的共享区,任何程序都可以查找、修改。当然,修改某处必然会对其它程序造成影响。6 再谈中断 前面5.2已提到中断了,现在问题是不同硬件不一样,即使相同硬件的ROM,不同版本,各个BIOS中断程序所处的位置也不一样
33、,DOS中断也一样,不同版本、不同配置,在内存位置也不一样。那么你使用某一个中断,系统怎么知道你使用的那个中断程序在哪呢? 为了解决这一问题,DOS会在启动的时候,把所有这些(BIOS和DOS)中断的首地址保存到一个地址。这个地址很容易记,这段地址是内存的绝对零地址(0000:0000)。前面已讲过,每个地址在汇编程序员角度来看是二维的,也就是分为段地址和偏移地址。每个地址各占两个字节,所以要表示这个二维地址需要4个字节。所以每个中断首地址由4个字节表示。一共256个中断,占用了1024个字节的位置。 另外需要注意的是,这4个表示地址的字节,数据是由低向高的。比如12
34、34 56 78所表示的地址是:7856:3412。一般用INT M表示中断M,如果M是十六进制,则在后面加上一个H。比如19号中断,十六进制应该是13H。所以该中断就是INT 13H。7 再谈系统共享数据区 该共享数据区在绝对地址:0040:0000开始。8 验证我上面说的内容 8.1 找中断 运行DEBUG后。输入D 0000:0000。显示绝对零地址的内容。 C:>debug-d 0:00000:0000 68 10 A7 00 8B 01 70 00-16 00 9B 03 8B 01 70 00 h.p.p
35、.0000:0010 8B 01 70 00 B9 06 0E 02-40 07 0E 02 FF 03 0E 02 .p.0000:0020 46 07 0E 02 0A 04 0E 02-3A 00 9B 03 54 00 9B 03 F.:.T.0000:0030 6E 00 9B 03 88 00 9B 03-A2 00 9B 03 FF 03 0E 02 n.0000:0040 A9 08 0E 02 99 09 0E 02-9F 09 0E 02 5D 04 0E 02 .0000:00
36、50 A5 09 0E 02 0D 02 DC 02-B8 09 0E 02 8B 05 0E 02 .0000:0060 02 0C 0E 02 08 0C 0E 02-13 0C 0E 02 AD 06 0E 02 .0000:0070 AD 06 0E 02 A4 F0 00 F0-37 05 0E 02 71 84 00 C0 .7.q.-u 0070:018B0070:018B 1E
37、 PUSH DS0070:018C 50 PUSH AX0070:018D B84000 MOV AX,00400070:0190 8ED8 MOV
38、0; DS,AX0070:0192 F70614030024 TEST WORD PTR 0314,24000070:0198 754F JNZ 01E90070:019A 55 PUSH BP0070:019B 8BEC
39、60; MOV BP,SP0070:019D 8B460A MOV AX,BP+0A0070:01A0 5D POP BP0070:01A1 A90001 &
40、#160; TEST AX,01000070:01A4 7543 JNZ 01E90070:01A6 A90002 TEST AX,02000070:01A9 7422
41、 JZ 01CD首先,D命令把中断首地址显示出来。每4个表示一个地址。其中INT 0的中断首地址为:00A7:1068,INT 1的中断地址为:0070:018B.0070:018B是中断3的首地址。后面那个U命令就表示显示该地址的“中断程序”的内存。 你们可以试着找找INT 13H的位置在哪。 8.2 验证系统共享数据区 系统共享数据区内容极为丰富,我实在记不住哪么多了。我曾记在一个本上,可惜那个本早在N年前(3<N&l
42、t;6)就丢了。兄弟们谁找到这个地址的内容,一定要贴上来,这里有东西可以让大家眼界大开。 前几年,我用的286计算机是黑白显示器(555555,别嫌我老、旧、慢呀),可当时有个游戏非要彩显,不是彩显不让运行。我就是改了这个区的某一个位,让哪游戏“以为”我用的是彩显,于是游戏能用了。虽然不好看,但总能用。 在DOS下,你每按一个键,系统都会记下来,下面我们一起找找这个键盘缓冲区的地址。知道这个地址,你就可以作一个“虚拟”键盘,通过发命令来模拟某个人在按键。这个地址位于:0040:001E。 其中每个键有两个字节,一个字节是A
43、SCII码,一个是扫描码。共16个。C:>debug-d 40:00040:0000 F8 03 F8 02 E8 03 E8 02-BC 03 78 03 78 02 80 9F .x.x.0040:0010 22 C8 00 80 02 28 00 00-00 00 2A 00 2A 00 20 39 ".(.*.*. 90040:0020 34 05 30 0B 3A 27 30 0B-0D 1C 64 20 20 39 34 05 4.0.:'0.d 94.0040:0030
44、160; 30 0B 3A 27 30 0B 0D 1C-71 10 0D 1C 64 20 00 00 0.:'0.q.d .0040:0040 A2 00 C3 00 A2 AF 09 E1-C8 03 50 00 00 10 00 00 .P.0040:0050 00 18 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .0040:0060 0F 0C 00 D4 03 29 30 7F-03 00 C0 00 A1 B7 11 00 .)0.0040:007
45、0 00 00 00 00 00 00 00 00-14 14 14 00 01 01 01 01 .-d 0040:00000040:0000 F8 03 F8 02 E8 03 E8 02-BC 03 78 03 78 02 80 9F .x.x.0040:0010 22 C8 00 80 02 28 00 00-00 00 2A 00 2A 00 3A 27 ".(.*.*.:'0040:0020 30 0B 30 0B 30 0B 30 0B-0D 1C 64 20 20 39 30
46、0B 0.0.0.0.d 90.0040:0030 30 0B 30 0B 30 0B 08 0E-08 0E 34 05 30 0B 00 00 0.0.0.4.0.0040:0040 1F 00 C3 00 A2 AF 09 E1-C8 03 50 00 00 10 00 00 .P.0040:0050 00 18 00 00 00 00 00 00-00 00 00 00 00 00 00 00 .0040:0060 0F 0C 00 D4 03 29 30 7F-03 00 C0
47、 00 24 B8 11 00 .)0.$.0040:0070 00 00 00 00 00 00 00 00-14 14 14 00 01 01 01 01 .-既然是键盘缓冲区,每个输入的键都会显示在该区中,第一次我只输入了“d 40:0”,所以你可以在此后显示数据右边字符中找到这些字符,注意是间隔开的。第二次我输入“d 0040:0000”,则右边显示的是“d 0040:0000”的内容。你可以找找。 第二讲 内存映象 之所以把这个内存单独放一章,是为了说明它的重要性,后面的几乎很多程序都需要你对这一章的理解。这里的内存映象就是指当你把一个
48、可执行文件(EXE或COM文件)放到内存后,整个内存“看”起来是什么样子的。 前面讲过,这里汇编程序只能访问1M的内存空间,所以下面就以1M内存为例。并且以DOS操作系统作为讲解对象,所以所编出来的程序也仅是DOS程序。事实上,通过winasm可以访问远远超过1M的空间,并且可以编出FOR windows的程序。但那是另外的话题。我们暂且不说那些。2.1 内存映象 首先,这1M内存如果我们不再以二维的方式看,而是一维的,线性地看(二维和一维的转化方式参见前面章节)。但描述还是以二维的方式描述,从最底端到最高端依次是: 1 中断向量区:该区由0000:0000
49、0000:03FF。这里存着系统的所有中断的中断向量表,对于中断向量表,你现在先理解为一些程序的首地址。由这个地址你就能找到该程序。 2 系统数据区:该区由0040:00000040:XXXX(不好意思,忘了),这里存着整个系统中,DOS操作系统要用的数据,由于这个区的数据对用户是开放的,所以用户当然也可以从这里读出来用。 3 DOS操作系统区:操作系统常驻内存,你向计算机发的每个命令其实都是操作系统执行的。这个区的大小主要是由操作系统的版本和用户的配置大小决定,如果是驱动程序配置,就放到根目录下的config.sys里,如果是程序,就放到autoexec.bat里。这
50、里设置在现在的windows 95/98/nt/me/2000/xp/2003中仍然有,所以我就不多说了。 4 用户程序,这个当然就是你执行的程序了,这种程序分两种,一种是扩展名为com文件,一种是exe文件,从程序内部看,前者程序的四个段重合(后面要讲这四个段),所以最大长度只等于一个段,用前面段地址的理解就是com文件最大只能是64K,所以com文件只适合小的程序。而exe,四个段可任何分配,并可扩充段,而且每个段的段地址可以任何改动,因此exe的访问内存能力大多了。这种格式访问能力只受地址结构的限制了。 用户程序所占的内存大小完全由程序本身
51、决定,但最大,只能到640K。这一点,怪不得别人,只能怪当前计算机软硬件设置高手高手高高手们(包括比尔盖茨)们的失误了,60年代的超级计算机只有36K的内存,所以他们就在80年代得到一个结论:640K的内存足够了。 如果用户程序大于由操作系统所占内存的顶底到640K之间的内存量,就会显示:内存不够,因而程序不能执行。这种现象对于一开始就用windows的人来说,几乎没见过,但对于一开始用DOS并打汉字的人来说,再正常不过。如果小于这段内存,多余部分就空着。 5 从640K到1M-64K,这段内存就很难说清了。这段内存中有一部分被硬件占有,有一部分
52、是显示缓冲区点有,还有一部分是系统ROM占有。 6 从1M-64K到1M之间的这段64K的内存叫作HMA。这段内存是小孩没娘,说来话长,我们先不说他。 2.2 验证上面的理论2.2.1 中断向量表 中断向量表就是所有中断向量首地址表,这里保存着每个中断程序的首地址,几乎所有的汇编书都把中断后面后面的章节中,并且对中断的解释也仅从字面意思解释,所以导致大学对中断的不重要和误解。没耐心的没到这个章节就不学汇编了,有耐心的到这里才豁然开朗。我现在不讲中断的原意。我直接告诉你,你把中断当成API也许更合适。也就是说,别
53、人把很多已作好的功能放到了内存中。并且把调用这一功能的号告诉了你,你只要调用这些功能号,系统就自动从这个中断向量表中找到对应的中断,然后执行你的功能。 首先让你感受一下中断的魅力一下吧。比如中断21H的2A功能调用是读取系统的日期,这个调用的规则是,调用前AH寄存器置为2A。调用后年在CX中,月在DH中,DL在日中,星期在AL中。-a139D:0100 mov ah,2a139D:0102 int 21139D:0104 int 3139D:0105-g=100AX=2A05 BX=0000 CX=07D4 DX=0C18
54、 SP=FFEE BP=0000 SI=0000 DI=0000DS=139D ES=139D SS=139D CS=139D IP=0104 NV UP EI PL NZ NA PO NC139D:0104 CC INT 3-可能上面的程序你目前还看不懂。不过没关系,“mov ah,2a”表示调用功能号是2a号。“int
55、 21”表示调用十六进制21号中断,“int 3”表示3号中断,表示程序运行到这一句时停一下。“g=100”表示从“139D:0100 ”开始执行。AX=2A05 BX=0000 CX=07D4 DX=0C18 SP=FFEE BP=0000 SI=0000 DI=0000DS=139D ES=139D SS=139D CS=139D IP=0104 NV UP EI PL NZ NA PO NC表示执行的结果。其中CX是年,这个年是由CX中存。07D
56、4十进制就是2004年。DH+DL=DX,所以DH=0C,DL=18。二者转化为十进制就是DH=12,DL=24,也就是今天了。AX=AH+AL=2A05,所以AL=05。那就是今天是星期五。上面可能你们现在还看不懂,不过通过解说你应该可以知道,仅仅两行命令,就读到了现在的值。现在需要作的就是把这些值提取出来用作他用了。 从中断的作来与中断向量表又有什么关系呢?原来你在汇编里运行int 21时,系统就在上面的中断向量表中找到int 21的中断地址,该中断的地址应该位于:0000:00840000:0087,具体算法前面已说明了。-d 0000:0084 00
57、870000:0080 7C 10 A7 00 |.-找到内容是:00A7:107C。然后系统就
58、转到这个地址执行int 21。2.2.2 系统数据区前面都已说明过。不再多说。系统区,很多DOS中断程序实现部分就在这个区。程序运行区依不同的程序而不用。2.2.3 640K1M之间,这期间有些地方是ROM,有些地方是硬件的BIOS区。我仅以两个例子说明这一区。 ROM区:ROM区就是只读内存,也就是说这个区的数据只能读不能写。比如F000:0000开始的内存是ROM。我们来写一下,然后再看看效果。-d f000:0000 0005 '显示由F000:0000到F000:0005的六个字节值。F000:0000 04 E8 A2 FF F9 C3
59、160; .-e f000:0000 '修改命令F000:0000 04.00 E8.00 A2.00 FF.00 F9.00 C3.0
60、0'注意,.后面的是我改的,把这几个值都改成0了。-d f000:0000 0005 '再次显示这个区的数据。F000:0000 04 E8 A2 FF F9 C3 .-通过上面测试,发现该区数据仍然
61、未改变。但你要是试别的RAM区的,肯定会变。如果想试你自己试试吧。 显示缓冲区:在文本方式下,B800:0000开始的地址保存着屏幕上每个字符位置的值。在文本方式下,屏幕被分为80 X 25。每个位置有两个值,一个值是ASCII字符,一个值是该ASCII的属性值(主要是颜色)。所以一个屏幕共有80X25X2=400个字符。我们来改:-d b800:0000 0010 '显示屏幕缓冲区的内容,注意此时本行最左边的“-”是屏幕左上角。B800:0000 2D 07 64 07 20 07 62 07-38 07 30 07 30 07 3A 07 -.d
62、. .b.8.0.0.:.B800:0010 30
63、; 0-看上面的命令,屏幕最上边一行是“-d b800:0000 0010”,所以他的内容就是“2D 07 64 07 20 07 62 07-38 07 30 07 30 07 3A 07”其中,2D是“-”的ASCII值,07是“-”的属性值。64是“d”的ASCII值,07是“d”的属性值。现在修改这些值。我把左上角的字改成黄颜色的“-”,那当然是改b800:0001的属性值了。-e b800:0001 0e是不是左上角的颜色变成黄色了吗?好了,把第二个字符变成绿色的“-”吧?-e b800:0002 2d 0b变了吗?可执行文件内存映象DOS下可执行
64、文件有两种(BAT是批处理文件,他只是简单调用DOS内部命令或其它程序,所以此处不认为它是可执行文件),一种是COM文件,一种是EXE文件,前面提到,COM文件一般小于64K。EXE文件则可以任意大。为什么呢?说到这里,还要提到段。每个段64K。段的作用就是数据组织单位。段的类型有三种:代码段(Code Segment,简称CS)、数据段(Data Segment,简称DS)、栈段(Stack Segment,简称SS),另外还有一个附加数据段(Extra Segment,简称ES),它的用与数据段DS可以认为完全一样,当数据段的64K不够用,或你就需要把数据放到两个段中以便移动、复制、比较时
65、,才用到附加数据段ES。(当然,移动、复制、比较操作在一个段中也可以完成)。1 段的作用。1.1 代码段(CS),程序装入内存中,DOS怎么知道是从哪里执行呢?答案就是系统自动从代码段指定位置开始执行,并且始终在代码段中执行。内此代码段CS的作用就是保存所有的指令。这里所说的代码也就是汇编指令了。所以编写汇编程序也就主要是编写代码段中的代码。1.2 数据段(DS)、附加段(ES),顾名思义,数据段中存的就是数据,这些数据供代码段的程序调用。附加段就是附加数据段。作用与数据段相同。1.3 栈段(SS),这个段非常重要,但实际上,你在使用中,似乎用不着这个段,但实际上,这是黑客编程中最重要的一部分
66、,而且系统会不停地“偷偷地”使用这个段,正是这个偷偷地用,使得系统的很多动作被记录到这个段中。还有两点,你必须记住:一是如果你使用了这个栈,比如你把数据存到这个栈中,则必须有相应的出栈命令,并且入几个数据,就得出几个数据,多一个或少一个,你的程序就可能导致死机或异常;二是你要把握操作时机,比如你不能在系统使用栈的前后使用栈,比如你在调用子程序之前入栈,而在子程序中出栈,而在系统调用子程序时,系统也要使用栈,这种也将导致出错。栈就是一种先入后出(也有称为后入先出)的结构,有地址由小到大的增加栈,有地址由大到小的逆向减栈。2 段重叠从上面,我们可以看到,CS,DS,SS三者作用各不相同,内存就是象
67、录音磁带,录新歌,则旧歌被删,带子上存的始终是最后录的那段音乐。因此,如果重叠则必然相互冲突。那还能重叠吗?这里所说的重叠不是指内容重叠,而是指概念上的重叠,即数据相互放到一个段中,但相互可以区分开。比如某一段既有数据也有代码,则代码在每要执行到数据之前加一个跳转指令跳过这段代码。这个跳转指令要求用户在编程的时候加上。而栈段呢?栈段有自己的特殊性,特殊就在于系统也会自动地使用,而用户则又在不知道系统在使用的情况下使用。避免这种冲突的方法就是采用逆向的栈段。2 COM文件内存映象。 COM文件被读到内存中后,该文件的前100H个字节被操作系统使用,操作系统使用这256个字节保存一些系
68、统要使用的数据,汇编语言编程者不能在这里存自己的数据,但在知道这此数据的作用后可以使用其中的数据。从100H开始,就是程序的开始了。COM文件之所以最大只能有64K,其原因是COM文件的四个段是相互重叠的。也就是说,CS,DS,SS,ES四个段的地址都指向这个COM文件的100H处。程序代码、数据、栈都在由100H到64K的区域内。如何把三者分开呢?栈段采用逆向栈,这个栈由64K开始,随着数据入栈,则地址就减小。这样作的好处是,栈段由高端向低端进展,可以详细与数据、代码分开;坏处也不言而喻,假如一个COM程序大量用到栈(比如是个递归程序)因此栈就不停地降低,而程序代码本身也很多,甚至不停地申请
69、新空间,这样数据和栈就会在中间碰头,导致程序被破坏。 区分开数据代码段与栈段后,下面讨论把数据段和代码段也分开。这个简单的多,只要逻辑上分开就可以。不过一般的方法就是:在100H处放一个跳转指令,随后放数据,然后再放置其它的代码。而100H处的跳转指令就跳到这里。因此,COM文件内存映象就是:CS:0000 (由于COM的CS,DS,SS,ES三段重叠,因此此行前CS,写成DS,SS,ES都一样)。 CS:0100 一个跳转到YYYY地址的跳转指令。CS:0101 本程序所需要用到的数据CS:XXXX 数据结束处。CS:YYYY 程序代码保存处。CS:ZZZZ 程序代码结束处。CS:FFFF 栈段开始处(注意栈是地址越来越小,所以这里是开始而不是结束处),也是程序的结束处。另外,此处FFFF与前面XXXX,YYY
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 质控知识培训简报课件
- 象棋摆棋课件
- 2025带地下室独立别墅出售合同范本
- 2025版地质灾害监测土石方运输服务合同
- 2025版新一代生物识别门禁系统采购安装合同
- 2025版速记服务与法律文件翻译保密合同-聚法通专业保密
- 2025标准养老院物业服务合同样本
- 2025版大数据分析委托管理服务合同范本
- 语音干货知识培训内容课件
- 2025企业细饲料买卖合同
- 2025玉溪市公安局公开招聘警务辅助人员(120人)笔试参考题库附答案解析
- 职业院校实习生考核评价标准
- 纪念中国人民抗日战争暨世界反法西斯战争胜利80周年
- 南京大学课程《普通地质学》教学大纲及教案
- 2025年临床危急值报告管理制度测试题(附答案)
- 胃癌疼痛的个案护理
- 2025年金钥匙科技知识竞赛试题及答案
- 居家养老服务方案投标文件(技术方案)
- 2025年山西辅警面试题及答案
- AI 智能体运行安全测试标准(英文)
- 缺血性脑血管病护理常规
评论
0/150
提交评论