




已阅读5页,还剩47页未读, 继续免费阅读
(计算机软件与理论专业论文)基于数字认证的垃圾邮件过滤系统的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山末师范大学硕士学位论文 基于数字认证的垃圾邮件过滤系统的研究 摘要 随着i n t c m e t 应用的普及,电子邮件凭着其方便、快捷、成本低廉的特点逐渐取代 了传统的通信方式,成为了人们通信的越来越重要的手段,但是随之而来的垃圾邮件也 越来越猖獗。垃圾邮件占用了服务商大量网络资源、系统资源、存储资源虽然人们在 技术和法律方面都进行了不断的努力,垃圾邮件已经得到了一定的控制。但是,在国内 由于技术和立法还没有达到一个足够的程度,导致国内已经日益成为世界垃圾邮件新的 源头在这种情况下甚至发生过国外的大型i s p 封锁国内的多数i p 地址的邮件的情况。 因此,如何解决好垃圾邮件的过滤问题已经成为有着重大现实意义的课题。 本课题正是在这样的背景下展开,倍此来重整互联网环境,还给人们一个干净整洁 的网络空间。本课题对现有的各种过滤技术进行了深入地分析与研究,并针对当前过滤 技术存在的问题和困难,设计了基于数字认证的垃圾邮件过滤系统。本文的主要内容如 下: 1 电子邮件格式、传输原理与传输协议分析分析电子邮件系统协议、原理才能更 好的了解垃圾邮件的生成、传输、接收的整个流程,更准确的从众多的邮件中识别出垃 圾邮件来与反垃圾邮件有关的协议主要有s m r p 和m b 伍等协议 z 垃圾邮件过滤技术研究现状分析。在此基础上提出了一种新的基于内容的垃圾邮 件过滤技术s v m 和b p 相结合的邮件过滤技术。该技术将支持向量机的推广能力和 神经网络的学习能力巧妙地结合和利用起来。并克服了b p 神经网络的过学习问题,在 很大程度上抵消了支持向量机内积函数和参数选取的主观性和随机性所带来的不良后 果。实验证明该技术具有较强的学习和推广能力。 3 现行的邮件过滤的技术方案都属于被动的过滤,如果仅仅使用这些技术,还远不 能抑制因特网上垃圾邮件的泛滥情况。为此,本文提出了一个反垃圾邮件的新方案 基于数字认证的垃圾邮件过滤系统。该系统结合传统的邮件过滤技术对垃圾邮件进行主 动和被动相结合的过滤 4 在邮件过滤中引入了个人信用信息数据库,为每一位用户建立信用档案,如实记 录用户的信用信息,通过制度约束提高用户的信用意识,促使其诚实守信、不发送垃圾 邮件 在本过滤系统中,邮件服务器为本地用户发送邮件前先对用户进行身份认证,认证 通过则为用户发送邮件,否则拒绝发送,大部分垃圾邮件发送者没有合法身份,这样从 源头挡住了垃圾邮件的发送,减轻了网络的负荷,减少了用户的负担。当服务器接收到 发往本地的邮件时,验证其数字证书,证书合法再利用传统的邮件过滤技术判断接收到 的邮件是否为垃圾邮件发现垃圾邮件则撤销其数字证书,并在用户个人信用信息数据 山东师范大学硕士学位论文 库中为其记过,当用户的信用信息低到一定的程度就拒绝为用户继续发送邮件。 关键字:垃圾邮件,过滤,数字证书,支持向量机 中图分类号:t p 3 9 3 山东师祀人学硕士学位论文 r e s e a r c ho ns p a mf i l t e rs y s t e mb a s e do i ld i g i t a la u t h e n t i c a t i o n w i 也t h ep o p u l a ro fh 他m c t ,t h et r a d i t i o n a lm a i ls e i c ei sl a r g e l yr e p l a c e db ye - m a i l s e r v i c ew h i c hi sp r o v i d e db yi n t e m c t e m m li sb e c o m i n gm o r ea n dm o r eo fa ni m p o r t a n t m e a n si np e o p l e sc o m m u n i c a t i o n s h o w e v e r , w i t hi t , t h es p a ma l s oh a sf l o o d e di n i tt a k e st l p al a r g en u m b e ro fn e t w o r k s o u r c e s s y s t e mr e s o u r c e sa n ds t o r er e s o u r c e so ft h ee m a i l s e r v i c ep r o v i d e r a l t h o u g hw cd e v o t eo u r s e l v e st 0t h et a s ko fa n t i s p a i nb yt h ew a yo ft e c h n o l o g i e sa n d l a w s ,t h es p a i nh a sb e e no u to f o u rc o n 打0 1 e s p e c i a l l yi no u rc o u n t r ym a n ym a l ls e r v e ro f o u r c o u n n yh a sb e e nb e c o m i n gt h es o r r c eo fs p a mb e c a u s eo fa n t i - s p a mt e c h n o l o g ya n dp o l i c y a b o u ts p a r e n 地m o r es e r i o u si st h a ta b r o a di s pb l a n ko f f i po f o u rc o u n t r y s oh o w t of i l t r a t e s p a mp r o p e r l yh a sb a 7 , o l n cas i g n i f i c a n ta n dp r a c t i c a lt o p i c t h ew o r k r a sd o n ei nt h i ss i t u a t i o n i ta i m sa tr e t r i e v i n gc l e a nn e t w o r k i tt o o ka p e n e t r a t i n gs t u d yo nt h ev a r i o u sp r e s e n tf i l t e rt e c h n i q u e s b yt h es t u d yo fq u e s 矗o na n d d i f f i c u l t yo f s i t u a t i o n as y s t e mo f f i l t e r i n gs p a r eb a s e do nd i g i t a la u t h e n t i c a t i o nw a sd e s i g n e d t h em a i nc o n t e n ti s : 1 w ea n a l y s i st h ef o r m a t , p r o t o c o l sa n dp r i n c i p l 懿o fe - m a i ls y s t e mi no r d e rt ok n o w l i f e c y c l eo fs p a m sb i r t h , t r a n s m i s s i o na n di t sr e c e i v i n g , s ow cc a ni d e n t i f yt h es p u ma n d c a p t u r ei te x a c t l y 2 t 1 1 er e s e a r c ho fc u r r e n ts i t u a t i o nt h a tt h ep r e s e n td o m e s t i ca n di n t e r n a t i o n a ls p a m f i l t e r sh a sb e e na n a l y z e d i no r d e rt of i l t r a t i n gs p a r e se f f e c t i v e l y , w h e nc o n t e n tr l t m f i o n , w e c o m b i n e ds v m sa n db pn e t w o r ki nav e r yt a c t f u lw a yt oa c h i e v ee x c e l l e n tl e a r n i n ga n d g e n e r a l i z a t i o np e r f o r m a n c e 3 p r e s e mt e c h n o l o g ya n ds o l u t i o nc a l l tc o n t r o lt h ef l o o do f s p a mo ni n t e m e ts oan e w a n t i - s p a ms o l u t i o n - r e s e a r c ho fs p a r ef i l t e rs y s t e mb a s e do nd i g i t a la u t h e n t i c a t i o nw a sp u t f o r w a r di nt h i sp a p e r 1 1 l cs y s t e mc a r r i e do nf i l t r a t i o nt ot h es p a mw h i c hi n i 在a l i v ea n dp a s s i v e u n i f i e s 4 t h i sp a p e ri n t r o d u c e dm d i “d u a lc r e d i ti n f o r m a t i o nd a t a b a s ei nt h em a i lf i l t r a t i o n s y s t e m 1 1 地d a t a b a s er e c o r d st h e u s e r sc r e d i ti n f o r m a t i o nt h r o u g ht h es y s t e mr c s t r a m t , e g h a l l c e st h eu s e r sc r e d i tc o n s c i o u s n e s s a n du r g e st h eu s e r sh o n e s tc o d eo fh o n o r s ot h e u s e rw i l ln o tt ot r a n s m i tt h es p a m i i lt h i sf d t r a t i n ns y s t e m , b e f o r es e n de - m a i lf o rl o c a lu s e l 3 ,t h es o l v e rf i r s tc a r f i c so nt h e s t a t u sa u t h e n t i c a t i o n i ft h r o u g ha u t h e n t i c a t i o nt h a nf o ru s e rt r a n s m i s s i o nm a i l ,o t h e r w i s e n l 山东师范大学硕士学位论文 r e f u s e st ot r a n s m i t t h u s ,t h e $ o t t r o fs p a me m a i l sw a sb l o c k e d , s ot h eb u r d e no fn e t w o r k s w a sa l l e v i a t e d ,u s e r sa f r e e d w h e nr e c e i v e de - m a i l 。t h e $ a g v c rv e r i f yi t sd i g i t a lc e r t i t l c a r e t o o t h e nu s i n gt r a d i t i o n a la n t i - s p a mt e c h n o l o g i e st oj u d g et h ee - m a i l w h e nd i s c o v e r e dt h e s p a r e ,t h es g t v l i a b o l i s h e di t sd i g i t a lc e r t i f i c a t ea n dm a r k e dm i s c o n d u c ti nt h eu s e ri n d i v i d u a l c r e d i ti n f o r m a t i o nd a t a b a s ef o ri t w h e nu s e r sc r e d i ti n f o r m a t i o ni si nt h el o wt oa c e r t a i n e x t e n t , t h es y s t e mr e f u s e dt oc o b t i n u et os e r v ef o rt h eu s e r k e ,w o r d s :s p a m , f i l t e r , d i g i t a lc e r t i f i c a t e ,s v m c l a s s i f i c a t i o n :t p 3 9 3 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得( 注:如 没有其他需要特别声明的,本栏可空) 或其他教育机构的学位或证书使用过的材 一躲写风云字:印膨 学位论文版权使用授权书 本学位论文作者完全了解堂撞有关保留、使用学位论文的规定,有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。 本人授权堂撞可以将学位论文的全部或部分内容编入有关数据库进行检索,可 以采用影印、缩印或扫描等复制手段保存、汇编学位论文。( 保密的学位论文在 解密后适用本授权书 学位论文作者签名:马石己云 导师签字: j 签字日期:动叼年q 月匀日签字日期:动d 7 年牛月z 7 日 山东师范大学硕l 学位论文 1 1 研究背景 第一章绪论 随着i n t e r a c t 应用的普及,电子邮件凭着其方便、快捷、成本低廉的特点逐渐取代 了传统的通信方式,成为现代社会主要通讯方式之一和互联网上最重要最普及的应用之 一,极大方便了人们的生活、学习和工作。据调查显示【l 】,我国互联网上用户中8 4 的 人经常使用电子邮箱,这成为他们在网上进行沟通的最主要渠道。其中每位用户平均拥 有e - m a i l 帐号1 5 个,平均每周收到电子邮件4 6 封( 不包含垃圾邮件) ,发出邮件4 3 封。6 0 的人使用电子邮件与同事或有工作关系的人联络,5 2 的人通过这种方式与朋 友交流。但在人们享受电子邮件带来的方便、快捷的同时,也在不断的忍受着垃圾邮件 的骚扰几乎每个人的信箱都充斥着大量来历不明的邮件,垃圾邮件像瘟疫一样蔓延、 污染网络环境,影响网络的正常通信。垃圾邮件泛滥成灾,不仅极大地浪费了网络资源, 占用用户的邮箱空间,降低了网络使用效率,影响了互联网的正常使用,还侵犯了用户 的个人权利,甚至影响到青少年的健康生长 垃圾邮件已经成为世界各国共同面临的棘手问题,美国 信息周刊杂志2 0 0 6 年 1 1 月2 8 日发表的数据显示:过去一年,在美国这个垃圾邮件最多的国家,垃圾邮件的 数量增长了1 2 0 0 , 4 。业内分析公司i r o n p o r t 的另一项调查则发现,一个普通的美国职 业人士,每天所收的电子邮件中垃圾邮件占了4 2 。而在欧盟,垃圾邮件占到了人们所 收邮件总量的5 0 到8 0 左右中国网民也面临同样的问题在我国,根据中国互联网 协会反垃圾邮件中心的调查,其中以“传播病毒”、“浪费时间”和“浪费电脑和网络资 源”三项影响最大该中心2 0 0 6 年的一个专业调查表明,从2 0 0 5 年1 1 月到2 0 0 6 年2 月,中国互联网用户收到的垃圾邮件比例由6 1 5 3 上升到6 3 9 7 ;每人每周收到的1 9 3 3 封垃圾邮件,也比2 0 0 5 年1 0 月的1 7 2 5 封增加了2 0 8 封平均每人每周需要花1 3 1 5 分钟来处理垃圾邮件。经过综合计算,垃圾邮件给中国国民经济每年造成6 0 6 9 亿元人 民币的损失 垃圾邮件跟踪机构s p a m h a u s 日前评出了2 0 0 6 年度垃圾邮件最多的国家,截至2 0 0 6 年1 1 月1 7 日,美国是全球垃圾邮件最多的国家,已发现的垃圾邮件形式多达1 9 8 5 种 中国位居第二,已发现的垃圾邮件形式为3 0 5 种。此外,日本排名第三,俄罗斯位居第 四,加拿大排名第五。韩国位居第六,英国排名第七 中国的垃圾邮件状况经常被国外机构和组织误解,其实我国不是垃圾邮件出口大国 和受益国,而是垃圾邮件的重灾区和受害国尽管从中国发出的垃圾邮件数量在美国后 居世界第二位,但实际上这主要是境外垃圾邮件发送者为逃避本国法律制裁单独或与我 境内人员勾结所为,也有很大一部分垃圾邮件是境外垃圾邮件发送者利用黑客技术控制 我国境内不设防计算机所发出的一些主要针对境外用户的垃圾邮件受益网站也利用我 山东师范大学硕士学位论文 国的互联网管理技术漏洞在我国境内接入。根据国际著名反垃圾邮件组织s p a m h u a s r 2 1 最新统计数据,全球2 0 0 个长期专业垃圾邮件组织名录中,中国仅有5 个。同样,据美 国的反垃圾邮件组织m a p s 的曾经一份统计表明,其所收集的应该防范的2 8 0 0 个电子 邮件或者服务器中,只有5 来自中国但是一些国家的互联网服务企业和反垃圾邮件 组织由于缺乏对中国的了解,误认为中国是世界垃圾邮件的主要源头之一,所以为防止 收到发自中国的垃圾邮件,对我国的一些i p 地址段采取了一些极端的封堵方式,往往 发现一个垃圾邮件制造者就对整个l p 段进行封杀据检测结果显示,基本每个月都有 上百个i p 段被国际反垃圾邮件组织s p a m h u a s 列入黑名单。众所周知,中国是i p 地址 资源极其匮乏的发展中国家,这些垃圾邮件黑名单常常牵连大量无辜的i p 地址,导致 我国大量用户无法与国外进行正常通信。因此,对垃圾邮件的研究与分析,加强邮件过 滤准确率,保障广大计算机用户不受垃圾邮件的骚扰、维护邮件服务器系统安全已经成 为刻不容缓的重要课题。 另外,电子邮件在电子政务和电子商务中也逐渐得到应用,但是电子邮件虽然是一 个很方便的信息交换工具,但其易受攻击、无法鉴别身份、无法辨别信息的真伪等安全 性缺点阻碍了电子邮件在电子政务和电子商务中的应用目前全国各地政府正在大力发 展电子政务。开展政府上网工程。网上政府同样体现出权威性,网上政令的发布、公文 的传递都需要高安全的电子邮件系统来保证。有关专家认为,中国电子政务发展重点己 从网络基础建设向功能应用和社会服务转变。因此,有效整合信息资源,强化电子政务 的续效已成为当前急需解决的问题之一【3 】。 1 2 垃圾邮件的定义 垃圾邮件( s p a m 或j u n km a i l ) ,也称为u c e ( u n s o l i c i t e dc o m m e r c i a le - m a l l 即不 请自来的商业邮件) 或u b e ( u n s o l i c i t e d b u l k e - m a i l 即不请自来的大量电子邮件) ,一 般被概括为:向新闻组或他人电子信箱发送的未经用户准许、不受用户欢迎的、难以退 掉的电子邮件或电子邮件列表。从事此类活动的人员叫做垃圾邮件制造者( s p a m m c :r ) 。 随着垃圾邮件问题不断发展,市场上已经出现了很多可以从网络上收集邮件地址、发送 大量邮件的专业软件。同时也出现了一些反垃圾邮件的组织和站点,如著名的s p a m h a u s , 以及专门从法律角度与垃圾邮件斗争的c a u c e 组织。1 9 9 8 年4 月i n t e m e t 协会i s o c 召开了专门会议专门讨论垃圾邮件1 9 9 2 年3 月发布了r f c 2 5 0 2 ,a n t i s p a m r e c o m m e n d a t i o n sf o rs m t pm t a s ,这标志着垃圾邮件也正式成为i n t e m g t 关注的问题。 目前,对“垃圾邮件”存在很多种说法,至今在全世界范围内尚未形成一个统一、 明确的定义中国互联网协会在2 0 0 3 年3 月制定的反垃圾邮件规范中,给出了一个明 确的垃圾邮件范畴,以下四种情况属于垃圾邮件: ( 1 ) 收件人事先没有提出要求或者同意接收的广告、电子刊物、各种形式的宣传 品等宣传性的电子邮件; ( 2 ) 收件人无法拒收的电子邮件; 2 山东师范大学硕士学位论文 ( 3 ) 隐藏发件人身份,地址、标题等信息的电子邮件; ( 4 ) 含有虚假的信息源、发件人、路由等信息的电子邮件 4 1 。 垃圾邮件一般具有以下特性:同样的内容多次重复发送;同一发件人特定时间段内 非正常通讯;非法地址;来自国际公开的l m l 列表的i p 请求。 1 3 垃圾邮件的类型与反垃圾邮件技术对策 垃圾邮件从内容上分,主要有广告、色情、反动政治言论、病毒传播等几种类型。 从发送形式上分,有直接发送和第三方转发两种类型直接发送指发送者使用自己 的服务器、i p 地址、自己的网络传送这些邮件。接收者如果经常收到这种邮件,可以将 它加人黑名单屏蔽或者过滤掉该i p 地址即可,而如果只是偶尔收到一封,可以采取内 容过滤,如果还是过滤不掉就很难找到其它有效的方法了。第三方转发大多是在未经该 服务器管理员同意的情况下利用第三方服务器转发垃圾邮件,其目的是隐蔽自己,逃避 查处,对于这种垃圾邮件,只要关闭相关服务器的o p e nr e l a y 功能即可。 针对以上各种类型的垃圾邮件,垃圾邮件的过滤技术可以分为基于规则的过滤、基 于内容的过滤和法律约束三类基于规则的过滤又包含基于黑名单、白名单的过滤、基 于手写规则过滤。基于黑单、白名单的过滤实现起来比较容易,但是效率很低。基于手 写规则过滤的过滤,虽然有时候是比较有效的,但是手工编写过滤规则需要消耗大量的 时间,而且也很难扩展,准确率很低并且不安全。基于内容的过滤在一定的领域可以起 到比较好的效果,比如针对具有一定特征垃圾邮件( 如具有反动信息的垃圾邮件) 。但 是还有很多垃圾邮件没有什么特征,对这样的垃圾邮件,基于内容的过滤就起不了多少 作用时至今日,还没有一种过滤机制能令接收者在反垃圾方面感到满意,因为这些过 滤机制大多都存在副作用。尽管一般的接收者和接收主机会决定采用某一种过滤方法, 但是垃圾邮件的发送者只要稍微努力一点就可以绕过过滤器而获得成功。垃圾邮件在因 特网上的发展已经给电子邮件的使用带来了极大的负面影响。到目前为止,垃圾邮件的 发送者还没有任何停止活动的迹象,电子邮件的接收者还缺乏足够的工具来反垃圾邮 件,因此,邮件的过滤技术还需要进一步的发展 总体来说,以上这些过滤方法都是被动地对垃圾邮件进行过滤,即当垃圾邮件出现 时它们才进行过滤,而当垃圾邮件的特征变化时,过滤方法也要跟着做出相应的变化, 这极其被动。为此,本文提出了主动的垃圾邮件防御技术,即对垃圾邮件进行主动的过 滤。 1 4 论文的主要内容 在防火墙出现以前,网络安全还是很难控制的。有了防火墙以后,人们就可以比较 好地控制网络安全了邮件系统可以借鉴类似的经验。 防火墙是利用t c p 端口来控制和管理网络服务的。由于防火墙外部的用户存在着 潜在的不安全性。所以除了允许外部用户使用有限的几种服务以外,其他服务都是禁止 3 山东师范大学硕士学位论文 使用的。如果内部人员在防火墙外面要使用内部的特定服务。必须通过防火墙的认证才 允许使用。 为了对邮件进行控制,必须在邮件中使用类似t c p 端口的特征信息。一个邮件有 很多特征信息,如发送者的i p 地址、域名、信件头部的各种属性信息等但是,从前 面的讨论可以看出对于不诚实的垃圾邮件发送者,这些信息都是可以很容易伪造的。从 目前的网络安全技术来看,只有使用数字签名的证书才能使某些特征信息无法伪造。例 如,可以考虑对信件发送者的身份发放证书。这样就可以很容易地将身份不明者的信件 过滤掉,从而大大减少了可能接收到的垃圾邮件。据此,本文提出了基于数字认证的垃 圾邮件过滤系统。 本文的主要内容如下: ( 1 ) 垃圾邮件现状及其危害的分析。 ( 2 ) 电子邮件格式、传输原理与传输协议分析。只有分析电子邮件系统协议、原 理才能更好的了解垃圾邮件的生成、传输、接收的整个流程,更准确的从众多的邮件中 识别出垃圾邮件来 ( 3 ) 数字认证的关键技术的阐述和分析。数字认证的概念、认证系统中的密码学 理论包括消息摘要、数字签名等。 ( 4 ) 垃圾邮件过滤技术研究现状分析,并在此基础上提出了一种新的基于内容的 垃圾邮件过滤技术s v m 和b p 相结合的邮件过滤技术。该技术将支持向量机的推广 能力和神经网络的学习能力巧妙地结合和利用起来,具有较强学习和推广能力。 ( 5 ) 提出了一个反垃圾邮件的新方案基于数字认证的垃圾邮件过滤系统。对 垃圾邮件过滤系统的结构及该结构每一部分进行了具体介绍。该系统结合传统的邮件过 滤技术对垃圾邮件进行主动和被动相结合的过滤。 ( 6 ) 在邮件过滤中引入了个人信用信息数据库,为每一位用户建立了信用档案, 如实记录用户的信用信息,通过制度约束提高用户的信用意识,促使其诚实守信、不发 送垃圾邮件。 ( 7 ) 对系统进行了仿真测试,结果证明该系统具有良好的适应性,并在这个基础 上总结了本文的主要内容。 4 山东师范大学硕士学位论文 第二章电子邮件及过滤技术 电子邮件是计算机用户用来相互发送邮件的一组机制。一个用户写好一封邮件,提 供一个或多个收件人的地址,然后将邮件发送出去。收信人使用某个程序就可以看到邮 件的内容。从概念上看,这个过程比较简单,但实际上却涉及了一系列比较复杂的协议、 标准和约定。 2 1 系统组成与工作模式 电子邮件服务通过“存储转发”的方式来为用户传递信件。对比于传统的邮件投 递服务,在i n t e m e t 上充当“邮局”这个角色的,是被称为邮件服务器的计算机用户 使用的电子邮箱就建立在这类计算机上,借助它提供的服务,用户的信件通过i n t e r n e t 被送到目的地它的工作模式如图2 1 所示 终端上 、的用户 、 发送方 ,。、 终端上 的用户 、。一一 接收方 用户代理 u a 要发送的 邮件队列 肿u a 佃i 一用户邮箱 ll ”o 图2 1 电子邮件服务工作模式 报文传送 代理m t a lt c p j 连接 报文传送 代理m t a 在图2 1 中,。用户代理”( u s e ra g e n t ,u a ) 负责与用户打交道。它接收用户输入 的指令,传送用户给出的信件报文。而“报文传送代理”( m e s s a g e t r a n s f e r a g e n t ,m t a ) 则完成邮件交换的工作,用户通常不和m t a 打交道。 , 当用户试图发送一封电子邮件的时候,他并不是直接将信件发送到对方的机器上, 而是由用户代理去寻找一个报文传送代理,把邮件提交给它报文传送代理得到了邮件 后,首先将它保存在自身的缓冲队列中。然后,根据邮件的目标地址,找到应该对这个 目标地址负责的服务器,并且通过网络将邮件传送给它。对方的服务器接收到邮件之后, 将其缓冲存储在本地,直到电子邮件的接收者查看自己的电子信箱。 显然,邮件传输是从服务器到服务器的,而且每个用户必须拥有服务器上存储信息 的空间( 称为信箱) 才能接收邮件。报文传送代理的主要工作是监视用户代理的请求, 根据电子邮件的目标地址找出对应的邮件服务器,将信件在服务器之间传输并且将接收 5 山东师范大学硕士学位论文 到的邮件进行缓冲或者提交给最终投递程序。 2 2 邮件格式与协议介绍 、为了让邮件能顺利地在n 啪e t 上传送,能够被不同的邮件服务器正确识别,并且 在各种各样的终端上显示出来,就需要遵循一定的格式。电子邮件系统主要涉及的协议 和标准如下: s m t p ( s i m p l e m a i lt r a n s f e rp r o t o c o l ,简单邮件传输协议) p o p 3 ( p o s t 0 衢c ep r o t o c o l - v e r s i o n3 ,邮局协议版本3 ) i m a p 4 ( i n t e r a c t m e s s a g e a c c e s s p r o t o c o l - v e r s i o n 4 ,i n t e r n e t 消息访问协议一版本4 ) l 江c 8 2 2 ( s t a n d a r df o rt h ef o r m a to f a r p ai n t c r n e tt e x tm e s s a g e s ) m i m e ( m u l t i p u i p o s c m e tm a i le x t e n s i o n s ,多用途i n t e m e t 邮件扩展协议) h 1 r r p ( h y p e r t e x tt r a n s f e rp r o t o c o l ,超文本传输协议) h t m l ( h y p e r t e x tm a r k u pl a n g u a g e ,超文本标识语言) 邮件的格式在r f c 8 2 2 中加以定义,为了支持多媒体文档的传输1 9 9 6 年又发表了 一系列关于m i m e ( m u l t i p u r p o s eh 1 把m e tm a i le x t e n s i o n s ) 格式的定义 r f c 2 0 4 5 :m i m e 第一部分慨c t 信体格式川 i 江c 2 0 4 6 :m i m e 第二部分媒体类型嘲 灯c 2 0 4 7 :m i m e 第三部分非a s c i i 文件信体的扩展【9 】 r f c 2 0 4 8 :m i m e 第四部分注册过程【1 0 1 r f c 2 0 4 9 :m i m e 第五部分符合标准和举例i 】 r f c 8 2 2 在2 0 0 1 年4 月更新为r f c 2 8 2 2 ,以反映近年来的实践。了解信件的基本格 式会帮助我们理解邮件的传输和邮件的信头,这里主要是讨论基于r f c 8 2 2 的基本信件 格式信件由信头、信件体和它们之间的空行组成。信头有确定的格式,这样使m t a 、 m d a 和m u a 能对它进行程序分析。信头是必须要有的,信件体是可选的r f c 8 2 2 为 信头定义了2 0 多个标准的字段,包括d a t e ,f r o m ,3 0 ,c c 等一些必须和非必须的字 段。另外,在信件的传输过程中,m u a 和m t a 还会在信头上加入一些路径信息,它们 合在一起构成了收到的邮件的信头部分【1 2 1 。下面是一些关键字段的含义: ( 1 ) f r o m : f r o m :m a r y 1 6 3 c 0 1 表示生成该信的人。 ( 2 ) t o :t o :s h u i d i h o t m a i l c o m 指出收件人 ( 3 ) s u b j e c t :邮件的主题。 ( 4 ) r e l a yt o : 标识发件人希望回复的地址。 ( 5 ) m e s s a g e i d : 唯一地表示一个信件,该字段由m u a 或者第一个 m t a 产生。 ( 6 ) r e c e i v e d :r e c e i v e d 字段含有信件的一个特定的m t a 处理记 录。处理信件的每个m t a 必须在每个信件头的上面加入这个字段,这个信息对于跟踪 信件非常有用。 6 山东师范大学硕j :学位论文 ( 7 ) 其中以x 开头的字段不是r f c 8 2 2 中要求的字段,是s m t p 服务器扩展的字 段,由软件厂商自行定义。 r f c 8 2 2 文档明确指出,用户可以发明新的消息头以供自己私人使用,只要这些消 息头以字符串x 开头即可。r f c 9 2 2 保证将来的消息头不会使用以x 作为开头的名字, 以避免官方的消息头与私用消息头之间发生冲突嘲。 2 3s m t p 协议 2 3 1 概述 简单邮件传输协议( s m t p ) 的目标是可靠高效地传送邮件,它独立于传送子系统 而且仅要求一条可以保证传送数据单元顺序的通道。 s m t p 的一个重要特点是能够接力传送邮件,传送服务提供了进程间通信环境 ( 口c e ) ,此环境可以包括一个网络、几个网络或一个网络的子网。传送系统( 或i p c e ) 不是一对一的,进程可能直接和其它进程通过己知的i p c e 进行通信。邮件是一个应用 程序或进程间通信,邮件可以通过连接在不同i p c e 上的进程跨网络进行邮件传送。更 特别的是,部件可以通过不同网络上的主机接力式传送【6 】。 2 3 2 模型 s m t p 设计基于以下通信模型t 针对用户的邮件请求,发送s m t p 与接收s m t p 之 间建立一个双向传送通道。接收s m t p 可以是最终接收者也可以是中间传送者。s m r p 命令由发送s m t p 发出,由接收s m t p 接收,而应答则反方向传送 一旦传送通道建立,s m t p 发送者发送m a i l 命令指明邮件发送者。如果s m t p 接 收者可以接收邮件则返回o k 应答s m t p 发送者再发出r c p t 命令确认邮件是否接收 到如果s m t p 接收者接收,则返回o k 应答:如果不能接收到,则发出拒绝接收应答 ( 但不中止整个邮件操作) ,双方将如此重复多次。当接收者收到全部邮件后会接收到 特别的序列,如果接收者成功处理了邮件,则返回o k 应答。s m t p 使用的模型如图2 2 所示。 s m t p 提供传送邮件的机制,如果接收方与发送方连接在同一个传送服务下时,邮 件可以直接由发送方主机传送到接收方主机。或者,当两者不在同一个传送服务下时, 通过中继s m t p 服务器传送。为了能够对s m t p 服务器提供中继能力,它必须拥有最终 目的主机地址和邮箱名称。 m a i l 命令参数是回复路径,它指定邮件从何处而来;而r c p t 命令的参数是转发 路径的,它指定邮件向何处去向前路径是源路径,而回复路径是返回路径( 它用于发 生错误时返回邮件) 当同一个消息要发往不同的接收者时,s m r p 遇到了向不同接收者发送同一份数据 的复制品的问题,邮件命令和应答有一个比较奇怪的语法,应答也有一个数字代码。在 下- - b 节的例子中可以看到使用哪些实际的命令和应答。 7 山东师范人学硕l :学位论文 匝) 一 s m t p 命令 s m t p 应答 发送 s m t p 邮件 接收 s m t ps m t p 阱至 发送接收 图2 2s m t p 使用模型 命令与应答对大小写不敏感,也就是说,命令和应答可以是大写、小写或两者的混 合,但这一点对用户邮件名称却不一定是对的,因为有的主机对用户名大小写是敏感的。 这样s m t p 实现中就将用户邮箱名称保留成初始时的样子,主机名称对大小写不敏感。 命令与应答由a s c i i 字母表组成,传送服务提供8 位字节传送通道,每7 位字符正 确传送,而最高位被填充为0 。当指定一般的命令或应答格式后,参数会由一些类似子 语言的字符串表示出来,例如“ ”或“ ”,这里尖括号表示这是一 种类似于语言的变量。 2 3 3 命令 s m t p 命令定义了邮件传输或由用户定义的系统功能,它的命令是由 结束 的字符串。而在带有参数的情况下,命令本身由 和参数分开,如果未带参数可以直 接和 连接。邮箱的语法格式必须和接收站点的格式一致 发送邮件操作涉及到不同的数据对象,它们是由不同的参数相互连接的回复路径 就是m a i l 命令的参数,而转发路径则是r c p t 命令的参数,邮件日期是d a t a 命令的 参数。这些参数或者数据对象必须跟在命令后,这种模式也就要求有不同的缓冲区来存 储这些对象。也就是说,有一个回复路径缓冲区,一个转发路径缓冲区,一个邮件内容 缓冲区。特定的命令产生自己的缓冲区,或使一个或多个缓冲的内容被清除。 s m t p 命令见表2 1 所示 8 山东师范大学硕士学位论文 表2 1s m t p 命令 命令名 说明 h e l o m a i l f r o m : 告诉服务器在邮件中继的过程中,消息已经 从此点的信源中取出反向路径。此消息作为m a i l 命令中的一部分出现,而不是在消息首部,s m r p 服务器必须以转接它到最终传送路程上的下一个 s m 1 _ p 。 r c p t t 0 :在典型的s m t p 交换中,r c p t 命令跟着 m a i l 命令r c p t 命令指定一个消息地址。如果 消息必须发送到多个人,在序列中可以提供多个 r c p t 命令。 d a t a 一旦消息接收方都已经使用r c p t 命令指定, 实际可以开始数据传送。客户发送给服务器d a t a 命令来通知它,它是要发送消息,一旦服务器指 示它准备数据传送,客户按行发送r f c 8 2 2 消息数 据。 r s e t c r u b 指示当前邮件传送应当忽略。所有正在运行 的传送都会忽略所有数据都被放弃,而且所有 表格和状态都被清除在发出此命令后,客户个 人服务器的状态应当与刚发出h e l o 命令后的状 态相当。 v r f y 由客户使用,由服务器来验证用户名。客户 提供一个串,如果服务器知道这个用户,服务器 便用应答代码响应。如果不知道,便用否定应答 代码来响应。 e x p n 用来要求服务器确认其邮件表别名的信息。 如果确认,就返回成员表。如果服务器不知道此 表,便发送否定应答代码。如果服务器确实知道 此列表,它发送多行的应答,应答中带有青定应 答代码。每行都包含列表成员的地址。 h e l p 用于从服务器请求帮助。典型情况下,此命 令用来查询服务器支持的命令,而且,可以由客 户使用来获取有关服务器的附加信息。 n 0 0 p , 可以在任何时候发送,而且在s m t p 会话中 在任何处理中都无效。n o o p 命令指示请求服务 器用肯定应答代码来响应。 q u i t 告诉服务器,客户正在结束会话。根据此命 令的接收,服务器用肯定应答来响应,并关闭t c p 连接。 9 山东师范大学硕士学位论文 2 3 4 典型s m t p 示例 这个例子显示邮件如何由在u s c - i s i f 和主机上的s m i t h 发送到b b n - u n i x 主机上 的j u d y 、a l i c e 和s o p h i a 的。这里假设u s c - i s i f 主机直接和b b n - u n i x 主机联系。j u d y 和s o p h i a 接收邮件,而a l i c e 在b b n u n i x 上没有邮甜1 4 1 。 r :2 2 0b b n u n i x a r p as i m p l em a i lt r a n s f e rs e r v i c er e a d y s :h e l 0u s c i s i e a r p a r :2 5 0b b n - u n a r p a s :m a i lf r o m : r :2 5 0 0 k s :r c p t t o : r :2 5 0 0 k s :r c p tt o : r :5 5 0n os u c hu s e rh e r e s :r c p tt o : r :2 5 0 0 k s :d 蛆a r :3 5 4s t a r tm a i li n p u t ;e n dw i t h s :b l a hb l a bb l a h 。 s :e t c e t c e t c r :2 5 0 0 k s :q u i t r :2 2 1b b n - u n a r p as e r v i c ec l o s i n gt r a n s m i s s i o nc h a n n e l 2 3 5s m t p 协议安全性分析 i n t c m e t 上,服务器间的邮件交换是通过s m t p 协议来完成的。s m t p 服务器接收 邮件,该邮件可能来自外部主机上的s m t p 服务器,也可能来自本地s m t p 服务器所服 务的用户代理。然后服务器检查邮件地址,以便决定在本机发送该邮件还是将它转发到 其它一些主机由于s m t p 没有身份认证,伪造电子邮件就很容易。如果某个服务器允 许连接到s m t p 端口,那么任何人都能连接到这一端口,并且发出一些命令,这些命令 将发送一些看似来自合法用户的电子邮件【”】。 对于s m t p 的种种命令而言,其不安全性主要有: ( 1 ) 在发送邮件的过程中,m a i l 和r c p t 命令都可能被监听通过分析这两个 命令及其参数,就可以获知邮件的来源和去向而攻击者一旦掌握了这些信息,就可能 采取假冒攻击,对发送者和接收者都造成影响; (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学英语实践活动设计案例
- 建筑设备维护保养记录表格式模板
- 工业设备ISA-358G备自投系统使用说明
- 餐饮业节能降耗实践案例分享
- 旅游行业安全管理规范手册
- 电商企业客户关系管理系统应用指南
- 2024年建设行业施工员继续教育资料
- 小学语文阅读理解强化练习册
- 中考物理重点难点题型训练八套
- 三年级平均数问题专项训练题
- 幼儿园合胞病毒知识培训
- 《凯勒战略品牌》课件
- 手术室的器械护士
- 2023年广东省中学生天文知识竞赛初赛(高年组)
- 【教科2017课标版】小学科学六年级上册全册教学设计
- 面瘫(面神经炎)课件
- 畜禽粪污资源化利用培训
- 女生穿搭技巧学习通超星期末考试答案章节答案2024年
- 2024年大学试题(政治学)-比较政治制度考试近5年真题集锦(频考类试题)带答案
- 厉害了我的国
- 动物生理学智慧树知到期末考试答案章节答案2024年浙江大学
评论
0/150
提交评论