(计算机系统结构专业论文)综合邮件过滤系统的设计与实现.pdf_第1页
(计算机系统结构专业论文)综合邮件过滤系统的设计与实现.pdf_第2页
(计算机系统结构专业论文)综合邮件过滤系统的设计与实现.pdf_第3页
(计算机系统结构专业论文)综合邮件过滤系统的设计与实现.pdf_第4页
(计算机系统结构专业论文)综合邮件过滤系统的设计与实现.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

综台邮件过滤系统的设计与实现 摘要 综合邮件过滤系统的设计与实现 电子邮件系统中,对非请求邮件的过滤技术一直在不断地发展,尤其是近几年出现了一些比 较优秀的技术成果。目前,对于病毒邮件一般采用反病毒的方法进行过滤,而对于垃圾邮件的处 理涉及邮件内容的语义处理,需要进一步的研究和发展。现有的对垃圾邮件常用的过滤方法主要 包括黑名单过滤方法、规则过滤方法和贝叶斯过滤方法等。这些方法虽然能够发挥一定的过滤作 用,但是在实际使用环境中,任何- :f e e 单一的方法都有其自身缺陷,过滤效率均不够好,并且缺 乏自学习的能力,不能提供友好的用户交互功能,因此不能满足用户的实际需求。 论文采用了对非请求邮件的常用过滤方法,通过对各种方法进行研究和比较,分析它们在中 文环境中存在的问题,并根据各个方法的优缺点,对它们进行改进和相互结合,从而最终设计并 实现一个基于服务器端的,可同时过滤病毒邮件和垃圾邮件的综合邮件过滤系统,并对其中的关 键技术进行研究和实现。 论文的主要内容包括以下几个方面: ( 1 ) 介绍邮件传输系统中的安全问题,以及由此引起的非请求邮件的产生及其影响。综述 现有的非请求邮件的过滤技术,通过分析它们的优缺点和存在的问题,给出论文需要 研究的唇标和内容。 ( 2 ) 论文详细介绍了综合邮件过滤系统的总体结构设计,并按照功能划分分别介绍各个部 分的设计和相关的关键技术研究成果。针对现有过滤技术存在的问题,分别给出解决 方案设计,使系统能够在中文邮件环境中达到较好的过滤性能,并具备良好的自学习 功能,方便用户的实际使用。 ( 3 ) 论文介绍了综合邮件过滤系统的实现模型,以及各个子系统的实现机制和功能结构。 论文通过综合邮件过滤系统的具体实现,完成了各个功能设计的应用和体现,使之能 够在实际的使用环境中发挥良好的过滤作用,最终为用户提供一个洁净的自日件服务环 境。 ( 4 ) 论文最后给出了详细的系统测试方法和流程,将综合邮件过滤系统的实际过滤效果作 为标准,通过实际环境中的数据分析,显示系统的真实效果。 【关键词】1 e 请求m 口件病毒邮件垃圾m 口件正常邮件黑自名单规则过滤贝n i 斯过滤 综台邮件过滤系统的设计与实现 a b s t r a c t t h ed e s i g na n di m p l e m e n t a t i o no f a ni n t e g r a t e dm a i lf i l t e r i n gs y s t e m o v e rt h ee l e c t r o n i cm a i ls y s t e m ,t h eu n s o l i c i t e dm a i lf i l t e r i n gt e c h n o l o g i e sh a v eb e i n gd e v e l o p e d , a n de s p e c i a l l yi nt h e s ey e a r s ,s o m eg o o dt e c h n o l o g i e sh a v ea p p e a r e d u n t i ln o w , v i r u sm a l l sa r eo f t e n f i l t e r e db ya n t i v i r u sm e t h o d s b u tf o rs p a mm a i l sh a n d l i n g ,b e c a u s ei ti n v o l v e st h em a i l s c o n t e n t ,a d i f f e r e n tw a yi sn e e d e d u pt on o w , t h ec o m m o n l yu s e ds p a mm a l l sf i l t e r i n gm e t h o d si n c l u d eb l a c kl i s t s f i l t e r i n g ,r u l e - b a s e df i l t e r i n g ,b a y e s i a nf i l t e r i n g ,e t c a l t h o u g h a l lt h e s em e t h o d sw o r k , b u ti nt h e p r a c t i c a le n v i r o n m e n t , a n ys i n g l em e t h o dh a si t so w ns h o r t a g e :u n s a t i s f i e df i l t e r i n ge f f i c i e n c y , l a c k i n g s e l f - l e a r n i n ga b i l i t y , o rn os u i t a b l ei n t e r a c t i o nw i t i lu s e r s s ot h a ti ti ss t i l lh a r dt om e e tu s e r s n e e d si n p r a c t i c e i nt h i st h e s i s ,s e v e r a lp o p u l a rm e c h a n i s m sf o rf i l t e r i n gs p a r em a i l sa r es t u d i e da n dc o m p a r e d ,a n d s o m ep r o b l e m si n v o l v e dw h e nt h e ya r ee m p l o y e di nc h i n e s ee m a i le n v i r o n m e n ta r ea n a l y z e d t h i s t h e s i sp r o p o s ea ni n t e g r a t e di m p l e m e n t a t i o nm o d e lo f t h e s em e c h a n i s ma c c o r d i n gt ot h e i ra d v a n t a g ea n d d i s a d v a n t a g e ,t op r o v i d e sas e r v e r - b a s e di n t e g r a t e dm a i lf i l t e r i n gs y s t e mw h i c hc a r lf i l t e rv i r u sm a i l sa s w e l la ss p a mm a i l s t h ek e yt e c h n o l o g i e st ot h i sm o d e la r es t u d i e da n di m p l e m e n t e d t i f f st h e s i si n c l u d e st h ef o l l o w i n gc o n t e n t s : ( 1 ) t h es e c u r i t yp r o b l e m si nt h em a i ld e l i v e r i n gs y s t e ma r ed i s c u s s e d ,a sw e l la st h e a p p e a r a n c ea n di m p a c to fu n s o l i c i t e dm a i l sc r e a t e db e c a u s eo ft h e s ep r o b l e m s t h e a v a i l a b l e u n s o l i c i t e d m a i l f i l t e r i n gt e c h n o l o g i e s a r e i n t r o d u c e d t h e i r a d v a n t a g e d i s a d v a n t a g ea r ea n a l y z e d t h e nt h eg o a la n dc o n t e n t so ft h i s t h e s i sa r e i n t r o d u c e d ( 2 ) ( 3 ) ( 4 ) t h ea r c h i t e c t u r eo ft h ei n t e g r a t e dm a i lf i l t e r i n gs y s t e mi sd e f i n e d a n de v e r yp a r to ft h e s y s t e md e s i g na n dt h er e l e v a n tk e yt e c h n o l o g i e sa r ed e s c r i b e di nd e t a i la c c o r d i n gt ot h e s y s t e mf u n c t i o n s t h et h e s i sp r o v i d e st h es o l u t i o na c c o r d i n gt ot h ep r o b l e m so ft h e a v a i l a b l ef i l t e r i n ga l g o r i t h m sr e s p e c t i v e l y , t om a k et h e mw o r kb e r e ri nc h i n e s ee m a l l e n v i r o n m e n t ,a n dt oh a v eag o o ds e l f - l e a r n i n ga b i t i t yf o rp r a c t i c a lu s a g e t h ei m p l e m e n t a t i o nm o d e lo f t h ei n t e g r a t e dm a l lf i r e r i n gs y s t e ma n dt h ei m p l e m e n t a t i o n m e t h o d so fe v e r ys u b - s y s t e ma r ep r e s e n t e d b yt h er e a l i z a t i o no ft h i ss y s t e m ,t h et h e s i s m a k e sa l lt h ef u n c t i o n a ld e s i g n sa p p l i c a b l ea n du s e f u li nt h ep r a c t i c a le n v i r o n m e n t , s oa s t op r o v i d eu s e r sac l e a nm a i ls e r v i c e t h em e t h o da n dp r o c e s so ft e s t i n gf o rt h ef i l t e r i n gs y s t e ma r ei n t r o d u c e da tl a s t t a k i n g t h ep r a c t i c a lf i l t e r i n ge f f e c ta st h es t a n d a r d ,t h er e a ld a t ai su s e db yt h et h e s i st oe v a l u a t e t h ee f f i c i e n c yo ff i l t e r i n gs y s t e m k e yw o r d s u n s o l i c i t e dm a i l ,v i r u sm a i l ,s p a r em a i l ,h a mm a i l ,w h i t ea n db l a c kl i s t sf i l t e r i n g , r u l e b a s e df i l t e r i n g ,b a y e s i a nf i l t e r i n g i l l 综合邮件过滤系统的设计与实现 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示了谢意。 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文 的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档 的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借 阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东 南大学研究生院办理。 研究生签名:i 金数导师签名:日期:苎三盘i 旦塑 综台邮件过滤系统的设计与实现 第一章引言 随着i n t e m e t 的发展,电子邮件已成为一种常用的通信方式。由丁二电子邮件的使用成本低廉、 传播速度很快,i n t e m e t 上出现了越来越多的不被请求的电子邮件,包括垃圾邮件和病毒邮件两类。 垃圾t l j , f l b 主要传播广告、色情等内容,使用户不得不花费大量的时间和精力来处理它们,严重影 响了用户对电子邮件的正常使用;而病毒邮件则以传播附带的病毒文件为手段,侵害用户的个人 系统。与此同时,垃圾邮件的过滤技术也在不断地发展,尤其是近几年出现了一些优秀的技术成 震。但是,在实际使用环境中这些技术不能满足用户的实际要求,非请求邮件的过滤问题有待进 一步的研究。 本章主要进行相关背景知识介绍,包括电子邮件的基础知识和非请求邮件的基本情况,并给 出论文的研究背景、主要研究内容和论文的组织结构。 1 。1 电子邮件系统 1 1 1 电子邮件的基本概念 电子i t l l j , l 牛是最早产生的网络应用之一,目前它也是i n t e m e t 上非常受用户欢迎的一种应用。电 子m s 件系统类似于现实世界中的邮政系统,通过i n t e r n e t 网络帮助用户将电子形式的邮件发送到收 信人的屯子m 口箱中,收信人可以随时读取邮件。并且,随着多个标准的出台,现在的电子邮件系 统不仅可以传送文字信息,而且还可以传送声音、图像等多种类型的数据,得到了越来越广泛的 应用。 一个邮件系统主要包括两个部分:邮件传输代理( m t a ) 和用户代理( m u a ) 。邮件传输代 理是指在计算机之间进行邮件传输的代理软件,它负责将用户的电子邮件递交给收信人所在的邮 件服务器,以及接收发送来的电子邮件并等待用户读取。用户代理是指为方便用户阅读和撰写邮 什,提供邮件编辑环境和邮件提交功能的代理软件。邮件系统的基本结构可参见图l ,整个i t t r i , f , b 系统与i n t e m e t 相连,通过i m e m e t 网络传送用户的电子邮件。 邮件发送方 噼固日 m u a 传输代理 m t a 邮件接收方 时黜 图11 1 1 1 ;件系统的基本结构 传统的电子邮件信息由a s c i i 文本组成,包括两个部分,中间用一个空行分隔。第一部分是 信头( h e a d e r ) ,它记录了与邮件有关的各种信息,例如邮件的发送方地址、接收方地址、邮件发 送的日期、邮件主题、l l j f b 的格式等;第二部分是信体( b o d y ) ,是邮件的内容主体部分。 根据r f c 2 8 2 2 标准的定义,邮件的信头部分是一组遵循一定格式的属性值对:每则信头 综合邮件过滤系统的设计与实现 信息以一个关键字打头,比如t o ,f r o m ,s u b j e c t ,后面跟着一个冒号和该则信头信息的具体内容。 除了在r f c 2 8 2 2 中定义的标准信头以外,用户也可以自定义一些信头,以增加需要的信息量。自 定义的信头需要以“x 一”打头,这样该条信息会被邮件系统忽略,只能由用户自己加以辨析。信 头的内容可以在传输过程中被用户代理或者传输代理添加,由此还可以记录邮件的传输情况。例 如,从f 面的例子中可以获知,一位名为“t e s tu s e r ”,邮件地址为u s e 畈2 s e n d e r t o m 的用户,给 邮件地址为h s e r r e c e i v e e c o m 的用户发了一封主题为t e s tm a i l 的邮件,该封邮件直接从 s e n d e n c o m 域的邮件服务器上传递给了r e c e i v e l c o m 域的邮件服务器。 r e t u r n - p a t h : r e c e i v e d :f r o ms e n d e l c o m ( 1 9 2 1 6 8 0 1 】) b yr e c e i v e n c o m ( 8 1 2 5 8 1 2 5 ) m e s s a g e - l d : f r o m :t e s tu s e r s u b j e c t :t e s tm a i l t o :u s e r r e c e i v e n e o m c o n t e n t - t y p e :t e x t h t m l ;c h a r s e t = ”g b 2 31 2 ” d a t e :f r i 5n o v2 0 0 41 2 :5 5 :5 0 + 0 9 0 0 一- 一b o d yo f t h em e s s a g e 一- - - 电子邮t l :中的接收方地址,或者发送方地址,是标识用户的重要信息,也是邮件系统寻址的 主要依靠。i n t e r n e t 中电子邮件地址( e m a i la d d r e s s ) 的格式规定如下: 接收方用户名 接收方邮件服务器所在的域名 其中符号 读作a t ,表示“在”的意思。接收方用户名在所在的邮件服务器上应当是唯一的, 接收方用户名与邮件服务器所在域名组合在一起应当是全球唯一的,这样才能保证电子邮件在覆 盖全球的i n t e r a c t 中准确地被投递。 1 1 2 电子邮件的相关协议 与电子邮件相关的协议主要有简单邮件传输协议s m t p 、邮局协议p o p 、i n t e m e t 报文存取协 议i m a p ,它们是电子邮件进行正常发送、接收和传递的基本支撑。另外,为了支持多种数据类 型,i e t f 在1 9 9 3 年制定了多用途i n t e m e t 邮件扩充标准m i m e 。由于该协议与邮件的传输无关, 而只与邮件本身的编写有关,因此将在1 1 4 节中作详细介绍。 邮件传输协议s m t p 早在2 0 世纪8 0 年代初,在最早的计算机网络a r p a n e t 上,就出现了电子邮件的基本标准: 简单邮件传输协议s m t p ( s i m p l em a i lt r a n s f e rp r o t o c 0 1 ) r f c 8 2 1 1 【“l 。它不仅定义了邮件的报 文格式而且定义了邮件传输时的具体交换协议,为电子邮件的广泛应用打下了基础。另外,著 名的c c i t t 和o s i 也参与了电子邮件标准的制定工作。c c i t t 曾制定了x 4 0 0 建议书,o s i 又制 定了一个面向报文的电子交换系统m o t i f ( m e s s a g eo r i e n t e dt e x ti n t e r c h a n g es y s t e m ) 的标准。 尽管目前世界上广泛使用的是基于s m t p 协议的i n t e m e t 电子邮件系统,而m o t i f 和x 4 0 0 未能 广泛使用,但它们提出的一些概念,如用户代理( u s e r a g e n t ) 和报文传送代理( m e s s a g et r a n s f e r a g e n t ) 等已被广泛接受和采用。 s m t p 基于t c p 协议,使用客户一服务器的模式进行交互。发送邮件一方为客户方,负责发 起t c p 连接请求,而接收邮件一方为服务器方,等待客户方的请求并接收邮件。建立了t c p 连 接之后,邮件传输双方开始按照s m t p 协议的要求进行交互,并完成邮件数据的传输。 s m t p 规定了1 4 条命令和2 1 种应答信息。每条命令用几个字母组成,每一种应答信息由一 2 综台i 唯件过滤系统的设计与实现 个3 位数字的代码开始,后面可以附上( 或不附) 简单的文字说明。图2 中给出了一次成功的s m t p 交互,运用了h e l o 、m a i l f r o m 、r c p t t o 、d a t a 、q u i t 等基本交互命令。其中“d a t a c o g e n t ” 的内容为需要发送的邮件内容,包括部分信头和全部信体内容,并在邮件结尾以只有“”的一行 作为传输结束标记。 邮件服务器 发送方 h e l os e n d e r c o m + 一2 5 0 h e l l os e n d e r i p a d d r ,p l e a s e dt om e e ty o p m a i lf r o m :u s e r ( 参e n d e r c o m + 2 5 0s e n d e r o k r c f r t o :u s e 响r e c e i v er c o 叶 一2 5 0r e c i p i e n to k 一 d a t a + 一3 5 4e n t e rm a i l e n dw i t h “”o nal i n eb yj 乜e l f 一 d a t ac o n t e n t - _ + 一2 5 0m e s e t g ea c c e p t e d f o rd e l 讯口y _ 一 一quit+ 一2 2 lc l o s i n gc o n n e c t i o r p 一 图2s m t p 交互过程举例 邮件服务器 接收方 邮局协议p o p 由于支持s m t p 的m 口件传输代理软件必须昼夜不停遣不问断运行,并始终保持网络通畅,才 能够保证从外面发来的邮件不会丢失,通常个人的计算机很难做到这一点,因此邮件传输代理 般是运行在一个公共邮件服务器上,而用户在需要的时候才登陆邮件服务器查询并收取自己的邮 件。这种情况与现实世界中的邮政系统很相似,即邮局专门负责接收自己管辖范围内的所有信件, 并提交到相应用户的m 口箱中,而用户只是在需要的时候去查看一r 信箱内是否有信。这时,用户 主动去查看并收取信箱的行为就对应了p o p 协议定义的过程。 邮局协议p o p ( p o s t o f f i c e p r o t o c 0 1 ) r f c l 9 3 9 1 1 是一个对电子邮件信箱进行访问和下载邮 件的协议,现在普遍采用它的第三个版本p o p 3 。 p o p 协议也是基于t c p 协议,使用客户一服务器的模式进行交互。用户代理一方为客户方, 负责发起t c p 连接请求,而存放用户邮件的邮件服务器一方为服务器方,等待客户方的请求。建 立了t c p 连接之后,用户代理按照p o p 协议从服务器上下载邮件到本机。 i n t e r n e t 报文存取协议i m a p 有一些时候,用户并不需要将邮件下载到本机中,而只是希望远程访问和操作一下。为了满 足用户的这种需要。出现了i m a p 协议。 i n t e r n e t 报文存取协议i m a p ( i n t e r a c t m e s s a g e a c c e s sp r o t o c 0 1 ) f r f c l 7 3 0 1 7 3 3 也是一种邮件 访问协议,现在普遍采用它的第四个版本i m a p 4 。它与前面的协议一样也是基于t c p 协议,使用 客户一服务器的模式。 i m a p 协议在投递邮件时每次只投递条消息而不是发送全部,这对于网络性能的要求降低 了很多。并且,对于邮件中携带的附件来说,i m a p 可以保证用户在接收大的附件之前首先查看 信头中的相关信息,而不用直接下载附件,直到用户已经准备好接收为止。 1 1 。3 电子邮件的工作过程 由幽1 中邮件系统中的基本结构可见,一般情况下,一封电子邮件的发送、传输和接收需要 涉及4 个基本过程: 1 ) 用户在邮件艄户代理( m u a ) 提供的编辑环境中撰写、回复或转发封新邮件。当用户 综合邮件过滤系统的设计与实现 点击“发送”后,用户代理软件通过s m t p 协议向邮件服务器提交新邮件。 2 ) 邮件服务器( 即邮件传输代理m t a ) 接收到用户的请求后,需要根据邮件中收件人的地 址信息,通过d n s 查询,找到收件人所在的邮件服务器的i p 地址,并向其发起s m t p 连接的请求。如果连接成功,则按照s m t p 协议的要求与接收方邮件服务器交互,并完 成邮件的传输。有些情况下,在一些大型的邮件管理机构中,邮件服务是由多个服务器 完成的,或者有些邮件服务器需要对邮件进行转发等功能,则邮件有可能被多次传输, 直至被投递到接收方所在的邮件服务器为止。邮件服务器之间的传输均是按照s m t p 协 议交互进行的。 3 ) 接收方的邮件服务器( 即邮件传输代理m t a ) 接收到某用户的一封邮件后,会将邮件以 文件的形式存放到相应的邮箱位置,等待用户下载或查看岣件。有些邮件服务器在用户 许可的情况下,还会对接收到的邮件作一些辅助处理,例如进行适当的扫描或者过滤, 以保证用户的利益。 4 ) f l ;j 户根据自己的习惯,不定期地可以查看服务器上的邮件情况。对于需要将邮件下载到 本机的用户,一般采用邮件用户代理( m u a ) 提供的功能进行邮件的接收。用户只需要 点击“接收”,用户代理软件会自动以p o p 3 协议与邮件服务器交互并下载邮件至本地邮 箱中,并提供友好的界面显示邮件内容。而对于上网环境不定或者上网速度较慢的用户, 可以选择一些提供在线管理邮件的服务。用户以w e b 方式登陆服务器,而该服务器负责 以i m a p 协议与邮件服务器交互获得邮件的内容,并按照用户的意愿显示。这样用户实 际上是在远程操纵服务器上的邮箱,而不是将邮件本身下载到本地,方便用户异地管理。 1 1 4 电子邮件中的编码 原先使用由r f c 8 2 2 定义的s m t p 协议传输邮件,只能支持a s c i i 码的文本信息。为了能够 传送多种类型的数据,在1 9 9 3 年i e t f 又制定了一个新的扩充标准:多用途i n t e r a c t 邮件扩展m i m e ( m u l t i p u r p o s ei n t e r n e tm a i le x t e n s i o n s ) r f c l 5 2 1 。它是当前广泛应用的一种电子邮件技术规 范。 m i m e 对r f c 8 2 2 定义的信头进行了扩充,增加了有关m i m e 的关键字,例如m i m e v e r s i o n 、 c o n t e n t - t y p e 、c o n t e n t - t r a n s f e r - e n c o d i n g 等等。以下是一个简单的m i m e 邮件的信头: f r o m :u s e r s e n d e r c o r n t o :u s e r r e c e i v e r c o m s u b j e c t :t e s tm a i l m i m e - v e r s i o n :1 0 c o n t e n t - t y p e :i m a g e g i f c o n t e n t - t r a n s f e r - e n c o d i n g :b a s e 6 4 其中“m i m e - v e r s i o n ”关键字指明了该邮件使用m i m e 协议版本1 0 编写邮件,“c o n t e n t t y p e ” 关键字指明了邮件内容是g i f 图像,“c o n t e n t - t r a n s f e r - e n c o d i n g ”关键字指明了该图像是用b a s e 6 4 的编码方法转换为a s c i i 文本形式的。这样接收方的用户代理软件会跟据这些信息将邮件内容进 行解码后显示山来。 m i m e 中增加的关键字列在表1 中: 表1m i m e 中增加的关键字 域名 含义 c o n t e n t - t y p e 段体的类型 c o n t e n t - t r a n s f e r - e n c o d i n g 段体的传输编码方式 4 综合邮件过滤系统的设计与实现 c o n t e n t d i s p o s i t i o n 段体的安排方式 c o n t e n t i d段体的i d c o n t e n t - l o c a t i o n段体的位置( 路径) c o n t e n t b a s e 段体的基位置 其中的c o n t e n t t y p e 都是“主类型子类型”的形式。主类型有t e x t ,i m a g e ,a u d i o ,v i d e o , a p p l i c a t i o n ,m u l t i p a r t ,m e s s a g e 等,分别表示文本、图片、音频、视频、应用、分段、消息等形式。 每个主类型都可能有多个子类型,如t e x t 类型就包含p l a i n ,h t m l ,x m l ,c s s 等子类型。以x 一开头的 主类型和子类型,同样表示自定义的类型,未正式注册,但大多已经约定成俗了,如 a p p l i c a t i o n x z i p c o m p r e s s e d 是z i p 文件类型。对于多个文件的形式,m i m e 通过c o n t e n t - t y p e 的 设定,将信体划分为多个段,每个段又包含段头和段体两部分,两部分之间也以空行分隔。 c o n t e n t - t r a n s f e r - e n c o d i n g 定义了内容的编码方式。对邮件进行编码最初的原因是因为i n t e m e t 上的很多网关不能正确传输8b i t 内码的字符,比如汉字、图像等。编码的原理就是把8b i t 的内 容转换成7b i t 的形式以能正确传输,接收方收到之后,再将其还原成8b i t 的内容显示。 m i m e 中定义的内容编码方式共有b a s e 6 4 、q u o t e d - p r i n t a b l e 、7 b i t 、8 b i t 和b i n a r y 等几种,目 前最常见的是b a s e 6 4 和q u o t e d - p r i n t a b l e 方式。 b a s e6 4 编码 它是晟通用的一种方法,其原理很简单。它将三个8 b i t 的字节转换为四个6 b i t ( 3 + 8 = 4 6 = 2 4 ) ,然后将每个6 b i t 再添两位高位0 ,组成四个8 b i t 的字节,转换后的字符串理论上将比原来 的氏三分之一。 q u o t e - p r i n t a b l e 编码 其原理是把一个8b i t 的字节用两个1 6 进制数值表示,然后在前面加“= ”。因此经过 q u o t e p r i m a b l e 编码后的文件通常是: = b 3 = c 2 = b f = a 】= c 7 = e 5 = a 3 = a c = c 4 = f a = - b a = c 3 = a 3 = a 1 1 1 5 电子邮件代理软件 电子邮件代理软件包括邮件传输代理( m t a ) 和邮件用户代理( m u a ) 两类。比较常见的邮 件传输代理主要包括s e n d m a i l 、p o s t f i x l 2 6 1 、q m a i l 2 7 1 、e x i m l 2 8 1 等。常用的用户代理软件主要有 微软的o u t l o o k 2 9 1 、网景的m e s s e n g e r t 3 ,和f o x m a i l ”1 等产品。 s e n d m a i l 是常用的邮件传输代理软件,它最初被集成在加州大学开发的电子邮件系统中。对 于大型系统的应用来说,s e n d m a i l 可以获得较好的性能。它包括了邮件传输中需要的各种基本功 能:邮件传递处理、积存邮件处理、以及退信处理等,并且还包含了一些其他的常用功能,如自 动转发、别名机制等a 在电子邮件刚开始发展的时候,可以选择的免费邮件传输代理软件只有 s e n d m a i l ,因此它得到了最广泛的应用,并一直占据着重要的地位。但是s e n d m a i l 也有一些缺点, 特别是由于它的功能过多而导致配置文件的复杂性很高。 p o s t f i x 是一个在i b m 资助下由w i e t s ev e n e m a 负责开发的一个自由软件工程产物,其目的是 为用户提供除s e r t d m a i l 之外的邮件服务器选择。p o s t f i x 力图做到快速、易于管理,提供较高的安 全性,同时尽量做到和s e n d m a i l 邮件服务器保持兼容性以满足用户的使用习惯。由于p o s t f i x 结 构上是由十多个小的子模块组成,每个子模块完成特定的任务,因此其灵活性和安全性相对提高。 q m a i l 是由d a nb e r n s t e i n 开发的,其第一个b e t a 版本o 7 0 7 发布于1 9 9 6 年1 月2 4 日。q m a i l 要比s e n d m a i l 精简可以完成邮件传输的主要功能,但缺乏一些现今邮件服务器所具有的特色功 能a 例如t q m a i l 不支持f o r w a r d 转发功能,也不能直接拒收接收人不存在的邮件。并且,q m a i l 的配置方式与s e n d m a i l 不一致,不太容易让用户尽快习惯使用。 5 综合自# 件过滤系统的设计与实现 e x i m 是由c a m b r i d g e 大学开发的邮件传输代理软件,它的晟大特点就是配置简单,易于使用 但是其安全性不如q m a i l 及p o s t f i x 。 表2 是对几种m t a 的比较: 表2 几种常见m t a 的比较 名称成熟性安全性性能与s e n d m a i l 兼容性模块化设计 s e n d m a i l 高低低否 p o s t f i x 低 高 高兼容是 q m a i l 由 高高 需要增加相应部件是 e x i m 由 低 中兼容 否 1 2 非请求邮件 非请求邮件是指未经用户请求而产生的邮件,主要包括病毒邮件和垃圾邮件两类。随着 i n t e m e t 的普及,它的使用人群迅速扩大,各种利益冲突显现,非请求邮件正是在这样的背景下产 生,并给正常的邮件用户带来了严重影响。 1 2 1 邮件传输中的安全问题 简单邮件传输协议s m t p 是最早产生的网络应用协议之一。由于最初的网络环境是相对简单 纯沽的,用户之间的交流建立在互相信任的基础之上,因此简单邮件传输协议的制定是以方便性、 高效陉为准则,而忽略了对交互双方的身份认证功能和其他一些安全问题。 方面,邮件系统中缺乏使用者身份认证的能力。由图2 中显示的s m t p 交互过程可以看出, 邮件发送方会在每一条命令中告知接收方一条信息,而接收方只要在网络通畅的情况下均会给予 廊答,对发送方声明的信息完全信任,不做任何验证,存在着明显的安全隐患。总结起来,s m t p 可以被利用进行虚假报告的漏洞有:h e l o 命令中虚报自己的域名信息,m a i lf r o m 命令中虚 报自己的邮件地址信息,d a t a 命令中可以伪造多个信息,如日期、邮件主题、发送工具等。其 中最关键的是m a i l f r o m 命令中伪造发送方地址的行为,使接收方难以定位对方的真实身份。 另一方面,邮件的内容是以a s c i i 码文本形式在网络中明文传送的,而且没有任何内容完整 性验证的机制,因此邮件传送路径上所有监听者都可以轻易地获取邮件的内容,甚至篡改m b 件内 容。目前,有一些用户代理软件在邮件撰写时增加了对邮件内容加密的功能,以满足邮件的安全 性要求,但是由于进行加密的数字证书本身还没有普及到个人,因此邮件内容的加密还没有得到 广泛支持,而只是在局部有少量应用。 病毒邮件和垃圾邮件的产生主要是由于邮件系统缺乏身份认证这方面的原因。邮件服务器不 能识别发送方的身份和位置,因此无法判定对方发送的邮件是否是被请求的,而只能全盘遗接收。 这样,恶意的邮件发送者可以轻意地发送大量邮件且不易被阻止。 1 2 2 病毒邮件的产生和影响 随着邮件系统的普及,计算机病毒中的邮件病毒开始大行其道,给社会带来越来越大的经济 损失,它不但产生非请求m e 件,而且还能感染电脑、阻塞网络,造成很大的损失。 虽然世界上最早的邮件系统出现在七八十年代,而晟早的病毒则出现在6 0 年代,但是,病毒 6 综合邮件过滤系统的设计与实现 与邮件真正的结合是在w i n d o w s 操作系统出现并大量应用以后发生的。当操作系统进入 w i n d o w s 时代,微软公司为程序员提供了一个功能强大的a p i 编程接口,该接口将一些复杂的 网络、图形处理完全屏蔽起来,使程序员不用熟悉复杂的内部机理即可编制出些功能强大的程 序。正是技术上的这种进步,导致了越来越多的人开始编制一些复杂的网络病毒,邮件病毒就是 在这种背景下出现并发展的。 对于大多数个人电脑用户来说,对邮件病毒破坏性的感觉并没有像c i h 病毒这样强烈,认为 邮件病毒是一种只会发送病毒邮件的温和的病毒。其实,邮件病毒的破坏要远大于此。 首先,邮件病毒会对主干网的流量造成影响。病毒通常会被首先释放到一台病毒种机中,种 机中有大量的公开邮件地址;然后病毒会通过网络以邮件的形式从一台计算机感染到另一些计算 机。由于邮件病毒在每感染一台计算机后就会搜索该计算机上的所有邮件地址,再向这些地址发 送病毒邮件,因此会迅速传播开来。而且被感染的计算机不但会向一些未感染病毒的计算机发送 病毒邮件,还会进行邮件互发,从而在全球泛滥的同时大量占用网络带宽资源,使整个主干速度 变慢,例如“求职信”就是这样的一种邮件病毒。如果邮件病毒又同时具备了黑客攻击的手段,那 么这种破坏性就更明显了。例如“s c o 炸弹( m y d o o m ) ”病毒,它不但会进行邮件传播,还会在 特定时间对s c o 、微软等网站发起d d o s ( 分布式拒绝服务) 攻击。该病毒的意图很明显,就是 要集结全球所有被感染计算机,统一向某个网站发起攻击,全球范围内的超量非法请求,不但会 使该网站瘫痪,还会使整个主干网阻塞。 其次,邮件病毒还会对企业和电子邮件服务商造成影响。对于拥有自己独立的内部网络和邮 件服务器的企业、学校来说,由于一个邮件服务器的吞吐量和邮件并发数是有限的。当邮件病毒 泛滥时,大量的病毒邮件会随时从外部网络涌入,如果内部感染了邮件病毒,那么同时也会有大 量的病毒邮件从内部网络经由邮件服务器而发送出去,则会导致邮件阻塞,严重时会使邮件服务 器系统崩溃,从而拒绝服务。对于邮件服务商来说,虽然他们的邮件服务器吞吐量很大,但他们 接受的是整个互联删的邮件请求,因此在邮件病毒大量泛滥时仍然会产生邮件阻塞及拒绝服务的 情况。曾经“求职信”病毒爆发时,在病毒的泛滥高峰期,用户几乎是无法收取任何邮件的。 最后,邮件病毒会产生大量的非请求邮件,影响用户正常使用。当邮件病毒泛滥时,用户的 邮箱会收到大量的病毒邮件,一些病毒5 件会使用迷惑性的标题来诱导用户中毒。即使一些邮件 服务器采用了病毒邮件过滤的技术,但些产生的病毒警告信也会如同垃圾邮件一样,占用用户 的邮箱空间、浪费用户的精力和时间。 1 2 3 垃圾邮件的产生和影响 电子邮件的出现,取代了以往传统的邮件传递方式。在传统的邮件处理中,发送者必须交纳 一定的费用,并且需要在邮件递出后,等待邮件经过邮箱、邮局、交通工具、邮差的层层传递, 才能将邮件送达接收方。然而,通过电子邮件,发送者只需要配有电脑并连上网络,便可以通过 i n t e r n e t 将各种类型的文件送出,使电子邮件在几秒钟之内就可以到达接收方,而且不用耗费额外 的资费。因此,这种低成本、高产出、覆盖范围广、发送不受限制、追查难度大的信息传递载体 就被各种含有恶意宣传目的的人利用,并且衍生成为互联网上的公害之一。利用垃圾邮件进行宣 传的目的包括; 商业目的:为了营销传播,散发广告; 政治目的:为了传播非法或异端的政治思想; 犯罪工具:诱骗接收者访问,骗取钱财或机密信息; 其中最主要的是商业目的。互联网上最早的用于商业目的的垃圾邮件产生于1 9 9 4 年4 月1 2 日。 荚国弧利桑那州两位从事移民签证咨询服务的律师劳伦斯坎特( l a u r e n c ec a n t e r )

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论