



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、南京邮电大学毕业设计(论文)开题报告题目 基于程序切片的网页过滤方法研究学生姓名班级学号专业信息安全一、 对课题任务的学习与理解1. 课题产生背景互联网的高速发展已经使其成为世界上覆盖面最广、范围最大、内容最为丰富的资源库。人们在充分享受信息共享所带来的便利的同时,却也饱受着大量“垃圾信息”的困扰。特别是对于广大青少年学生,一些“有害信息”正在威胁着他们的身心健康。另外,企业员工的上网行为亟待规范。因此网页过滤应运而生。程序切片技术已经发展成为一门成熟的技术,并已应用于软件开发中的调试、测试和维护等阶段中。所以我们要实现基于程序切片的网页过滤方法的研究。2. 课题实现目标本课题要求结合网页脚本
2、语言(如Javascript、XML等)的程序切片相关技术,研究并实现一种网页过滤方法。成果形式:1 给出基于网页脚本语言程序切片的网页过滤方法;2 提交毕业设计报告及其相关电子文档。二、 文献调研综述1. 程序切片概述程序切片技术是由Weiser在1979年首先提出的,他描述了一种使用程序依赖图来实现过程内切片的技术。此后,在他的基础上又有许多人提出了不同的程序切片的定义和用于切片的算法,其中包括Horwitz提出的程序切片算法,他将程序依赖图(PDG)扩展为系统依赖图(SDG),解决了Weiser提出的算法中无法解决过程调用的问题;以及由Korel和Laski提出的动态切片的概念和Canf
3、ora提出的条件切片技术等等。程序切片技术的发展经历了从静态到动态,从前向到后向,从单一过程到多个过程,从面向过程的程序到面向对象的程序,从非分布式到分布式的程序的发展过程。随着软件开发技术的不断进步,程序切片技术也会随之一同发展。顾名思义,程序切片就是指将一个程序中用户所感兴趣的代码都抽取出来组成一个新的程序,这个新的程序就是源程序的切片,根据切片规则的不同,生成的切片也各不相同。程序切片可以用 S(V, N) 的形式表示,其中 V 表示程序中的某一个变量或是变量的集合,N 表示在程序中的某一个位置 ( 变量 V 所在的语句) 。S(V, N) 的含义是“一个程序切片是由程序中的一些语句所组
4、成的集合,这些语句可能会影响到在程序的某个位置 N 处所定义或引用的变量或变量的集合 V 的状态”。S(V, N)是程序切片最基本的形态,任何形式的程序切片都可以通过对这个标准进行扩展而得到。2. 静态程序切片和动态程序切片(1)静态程序切片静态程序切片是指在构造程序切片的时候使用静态的数据流和控制流的分析方法。从静态程序切片的定义 S(V, N) , 我们可以看出使用这种切片标准分析程序的时候,变量 V 的当前状态是无关紧要的, 其值不会影响切片的结果。静态切片所作的分析完全是依赖于程序的静态信息。静态切片方法需要对变量 V 所有的状态进行考虑,需要遍历程序中相应的所有轨迹,所以使用这种方法
5、分析程序时工作量会非常的大。因此,由于静态切片技术的这些局限性,它主要应用于程序理解和软件维护领域。(2)动态程序切片动态程序切片技术使用的是动态的数据流和控制流分析方法, 它依赖与程序中某个变量的具体输入, 其输入的不同可能会导致切片结果的不同。静态切片技术强调的是在可以遍历到的所有轨迹中, 对程序中某一点的变量状态造成影响的所有语句; 而动态切片技术则是强调程序在一次特定的执行中, 会影响变量在程序中某一点的状态的所有语句。可以看出, 动态程序切片是相应的静态程序切片的一个子集, 因此使用动态程序切片时的工作量要比使用静态程序切片的工作量来的小, 更适合使用于程序测试与调试等本身工作量就比
6、较大的工作中。动态循环切片是动态切片的一种, 它可以定义为: S(V, N, X, I)。它表示程序在输入为 X 时, 会影响到变量 V 在第 I 次执行语句 N 后的状态的所有语句的集合。(3)条件切片条件切片技术是介于静态切片技术与动态切片技术之间的一种切片技术,它既不是仅仅局限与只对程序的静态信息进行分析,也不是仅仅局限于只依赖外部的输入来获得程序的信息。在构造条件切片时, 只有那些满足切片条件的语句才会被提取出来。条件切片的定义可以表示为 S(V, N, X, W) ,它表示当输入 X使得条件 W 为真的时候, 所有影响变量 V 在 N 处状态的语句的集合。如果将程序中从满足一个切片条
7、件的任何一个初始状态出发都不可能触发的语句除去,那么剩下的语句就是满足这个条件的一个切片。3. XML文档的程序切片技术XML(extensible Markup Language)可扩展标记语言是一种可以用来创建自己标记的标记语言,XML是一种具有数据描述功能、高度结构性以及可验证性语言,XML数据是以纯文本格式存储的,提供一种与软件和硬件无关的共享数据方法,因而成为目前应用于保存数据最普遍的格式之一。一个XML文档必须是格式正确的,即符合“XML基本语法”。DDT或XML模式可以规定文档中存在的元素的类型、元素具有的属性、在元素内部子元素的层次结构以及元素在整个文档中出现的顺序次数。通常在
8、应用中会定义DTD(Document Type Definition)或者XML模式,使XML文档符合规范,符合DTD或XML模式定义的文档称为有效文档。用户可以根据应用来确定DTD或XML模式文档规范,文档规范是不同系统之间进行数据交换的基础。图1切片规则树对XML文档进行切片即从文档中选取特定信息,而省略其他不相关内容。切片文档所使用的依赖图,可利用文档本身的树型结构特点。切片过程分为两个阶段:切片规则生成阶段、切片文档生成阶段。切片规则生成阶段是利用选择节点逆向遍历文档树,获取切片规则树路径(规则树即切片规则节点构成的树)。切片文档生成阶段是深度优先遍历规则树,从文档中获取满足条件的元素
9、信息,添加到新文档中。通过对XML文档的切片操作,用户可以很快地从文档信息量较大的复杂文档中抽取出自己所感兴趣的信息,根据切片规则不同获取不同层次的信息。4. 基于程序切片的网页过滤方法随着网络技术的不断应用,越来越多的企事业单位允许员工对因特网进行内容访问。目前因特网鱼龙混杂,存在着大量不健康或者反动的站点,有效的管理对因特网的访问势在必行。网页过滤由此应运而生。网页过滤就是在网络的不同地点部署访问策略,通过一定的技术手段,根据对网页内容合法性的判断来禁止用户访问不良内容。家长不想让孩子沉溺在网络游戏当中;老板不希望员工在上班时间浏览娱乐新闻;政府不允许任何人传播浏览反动和色情信息,这些需求
10、都在网页过滤的范畴之内。现在市场上已经有不少网页过滤功能的软件,根据用户数据的规模,主要分成个人应用级和企业级两类。(1)个人应用级的网页过滤软件即在个人的终端上安装软件,或者嵌套于用户的浏览器中。但是在个人的实际使用中,更多的用户使用此类软件过滤掉某类特定危害的网站,如钓鱼网站和恶意网站,对于主动访问不良网站的行为,这类软件无能为力。而且随着移动互联网的高速发展,上网的终端越来越多样化,很难在所有的移动终端上都安装此类客户端。广大的互联网用户,也没有主动安装此类过滤软件的意识。因此,个人应用级的网络过滤系统作用极为有限。(2)企业级的网页过滤系统可以实现强制性的过滤,一般部署于企业的网关。但
11、是此类过滤系统一般都是和硬件绑定在一起,当企业网内用户数量增加,此类系统无法进行有效的扩展。而且过滤的用户只限于企业的内部用户,对网络环境的净化作用也比较有限。而我们对程序切片和网页过滤技术有了一定的了解后,就可以把xml文档切片技术即网页脚本语言的程序切片技术运用到网页过滤中,从而研究基于程序切片的网页过滤。通俗地讲,过滤有两种:只要感兴趣的东西,其他删除;去除不感兴趣的,其他保留。而我们只需要利用切片技术来提取有用的或切除需过滤的就行了。主要参考文献:1李文豪.程序切片技术浅析J.电脑知识与技术,2006(8):11-13.2张静,林淑飞. XML文档切片技术J.科学技术与工程,2007,
12、7(9).3王伟,陈平.程序切片技术综述J.微电子学与计算机,2002(8):25-27.4王磊.基于程序切片的软件测试研究D.河北工业大学,2007.5钱巨,陶彬贤.Slithice:一个基于系统依赖图的Java程序切片工具J.计算机工程与应用,2014(2).6蒋文.一种网页过滤系统设计与实现D.北京邮电大学,2013.7刘辉.网页信息过滤系统的研究与设计D.苏州大学,2009.8司德睿.基于文本内容的网页过滤技术研究D.兰州大学,2008.9刘沛旻.网页过滤技术的比较研究D.上海交通大学,2007.10Weiser M.Program slicing. IEEE Transactions on Software EngineeringJ,1984,16(5):498-509.11Binkley,D&K.B.Gallagher.Program slicing. Advances in ComputersJ,1996,43:1-50.三、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 内审员考试试题及答案 (三)
- 海洋数字金融服务创新
- 2025年上海松江区天马山学校招聘教师考试笔试试题(含答案)
- 老班长介绍课件
- 老年疼痛患者护理课件
- 老年护理课件模板
- 老年护理图文课件
- 老年人心理健康咨询课件
- 老师的视频课件制作
- 《建筑项目合同约定场地估值争议处理协议》
- 工程总承包管理制度
- 2025年云南新华印刷五厂有限责任公司招聘笔试参考题库含答案解析
- 汽车实训室安全课件
- 临时施工出入口交通疏导方案
- 《OPPLE欧普照明》课件
- 国家开放大学电大专科《建筑工程项目管理》期末试题及答案
- 医疗设备器材供货安装、调试及售后服务方案
- 部编版语文三年级上册第四单元教材解读大单元集体备课
- 10kV小区供配电设计、采购、施工EPC 投标方案(技术方案)
- 2024-2025学年初中物理八年级下册苏科版(2024)教学设计合集
- 中外广告史(第三版) 课件全套 何玉杰 第0-11章 绪论、中国古代广告的发展- 日本广告的发展
评论
0/150
提交评论