




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1基于WEB过程模拟的动态WEB信息获取收藏摘要介绍了分析相关WEB页面的方法和经验,实现了自动提交HTML表单获得所需页面。采用性能优异的WEB信息获取组件CURL,对大量科技文献网站的网页进行信息获取,实验表明CURL具有优异的处理速度,并成功应用到甘肃省科技文献共享平台的统一检索系统中。关键词WEB过程模拟;动态WEB信息获取;CURL中图分类号TP393随着INTERNET的快速发展,WEB资源已经成为一种人们获取信息的主要来源。但是对于需要查询的信息,很多网站必须经过注册登录后方可使用提供服务的页面,而且各个网站的信息表示具有很大的异构性,给用户带来很大不便。为了访问WEB上大量有用的信息,动态异构的WEB信息获取方法就成为了一个研究的热点。对于动态异构的WEB资源,首先需要分析其网页表单,模拟用户点击行为找到结果页面,这些都是获取动态WEB资源的难点问题;此外,WEB网站的动态变化对于保持信息抽取的准确性也是一个挑战,有待研究者去解决。文献12介绍了基于WEB过程模拟的异构数字文献统一检索系统设计与实现,但对基于WEB过程模拟的动态WEB信息获取原理及实现没有详细阐述。本文以获取科技文献资源网站的动态WEB信息为例来说明问题。21基于WEB过程模拟的动态WEB信息获取原理现在很多网站提供的页面往往并不是可以通过一个简单的URL就可以访问的,而必须经过注册并登录后方可使用提供服务的页面。不同的资源对于登录有不同的限制。由于与WEB交互的细节需要人们自己来实现,这就需要人们对访问WEB资源的细节进行模拟和描述,得到所需结果页面。源数据站点分析模拟是指对资源站点的页面结构进行分析,通过分析获取其请求参数用来模拟HTTP请求。其分析结果包括如何得到查询结果页面及其规律等。网页源数据站点分析与提取技术是实现和WEB资源自动交互的基础,也是对所需网页提取数据的基础。一方面,与WEB资源的交互过程中,有些参数和数据是通过网页分析与提取获得的;另一方面,得到的所需网页是通过网页分析和提取获得的。用户通过浏览器来访问WEB资源时,浏览器为用户隐藏了与WEB资源交互的具体细节,用户看到的只是结果。对于需要查询的信息,一般需要通过WEB浏览器登录到一个WEB服务器,输入查询条件,提交查询请求,服务器返回查询结果。由于用户与WEB资源的交互是以HTTP协议为基础进行的,这种交互可以由程序模拟出浏览器向远程WEB服务器发送HTTP请求的过程。用户每查询一次信息,就是向服务器发送一次HTTP请求的过程。HTTP协议3是基于请求/响应模式的。HTTP请求信息由请求行3、请求头部域和请求实体三部分组成。请求行中的方法描述指定资源中应该执行的动作。常用方法有GET、POST和HEAD。请求头部域是关于该次请求的一些附加信息。请求实体则是该次请求所需传递的一些参数信息。HTTP响应信息由响应行、响应头部域和响应实体三部分组成。响应行主要显示HTTP版本,以及此次响应结果的状态码;响应头部域为该次响应的附加信息;响应实体则为该次响应结果的详细信息。由于可以通过程序模拟发送HTTP请求的过程,对于HTTP请求信息的获取是模拟成功的关键。有些WEB服务程序的设计要求浏览器端通过脚本技术,对检索项进行预处理,在浏览器端生成一个检索表达式,再将此表达式以HTTP请求的方式传递给服务器进行检索。在此情况下,需要分析HTML文件中的脚本代码,构造出正确的检索表达式。有些请求信息参数是动态变化的。这需要人工仔细分析,找出其中规律,才能实现实时请求、实时响应,以及对查询页面的翻页等功能。这些参数信息都不能有丝毫差错。可以借助已有的一些网络通信拦截工具软件,如SNIFFEM、EHSNIFFER、HTTPWATCH、HTTPTRACER等。这些软件可以捕获并解码浏览器发出的HTTP请求的数据,分析HTTP通信的网络活动等。这样就可以正确获取HTTP请求通信所需的参数。2WEB信息获取工具通过程序模拟访问网页的方法有SOCKET通信方式、FOPEN方式、第三方组件如LIBCURL等。当网页文件很大或者网页根本不存4在的时候,使用FOPEN的方法经常会出现超时。在实际工程应用中,必须考虑系统的性能及可移植性。WEB信息获取工具是系统性能好坏的一个最重要的技术环节,不论是采用PHP中的SOCKET通信方式还是FOPEN方式都不能胜任如此频繁的文件获取时间要求。系统采用性能优异的CURL访问组件,该组件远程访问速度比传统方式速度快了近200倍,采用FOPEN方式对于100个HTTP文件请求每分钟只能打开10个,而采用CURL组件方式对于2000个HTTP文件请求每分钟可以打开2000个4。该组件支持FTP,FTPS,TFTP,HTTP,HTTPS,TELNET,DICT,FILE和LDAP协议的访问,极大地提高了WEB会话的速度和协议范围。此外,该组件支持多种开发语言工具的驱动,主要包括C、C、PHP、PERL、JAVA、NET等,支持广泛的操作系统,包括SOLARIS、NETBSD、FREEBSD、OPENBSD、HPUX、IRIX、AIX、TRU64、LINUX、UNIXWARE、WINDOWS等,具有广泛的可移植性,为程序开发打造了良好的接口。3实现及应用实例基于CURL的动态WEB信息获取方法已应用于甘肃省科技文献共享平台5的统一检索系统。该系统采用PHP50作为开发工具,APACHE20作为WEB服务器。以下是模拟检索重庆维普中文科技期刊数据库题录信息的简单实现以检索题名为CAD,年限为20022007的数据为例。5首先用网络通信拦截工具软件SNIFFEM捕获请求,结果如下POST/CSTJ/SEARDLLSEARCHZKHTTP/11ACCEPTIMAGE/GIF,IMAGE/XXBITMAP,IMAGE/JPEG,IMAGE/PJPEG,APPLICATION/XSHOCKWAVEFLASH,APPLICATION/XSILVERLIGHT,APPLICATION/VNDMSEXCEL,APPLICATION/VNDMSPOWERPOINT,APPLICATION/MSWORD,/REFERERHTTP/VIPGSINFONETCN/CSTJ/SEARDLLSEARCHZKACCEPTLANGUAGEZHCNCONTENTTYPEAPPLICATION/XWWWFORMURLENCODEDUACPUX86ACCEPTENCODINGGZIP,DEFLATEUSERAGENTMOZILLA/40COMPATIBLE;MSIE70;WINDOWSNT51;POTURR2706261605064085;TENCENTTRAVELERHOSTVIPGSINFONETCNCONTENTLENGTH215CONNECTIONKEEPALIVECACHECONTROLNOCACHECOOKIEGTZ480;ASPSESSIONIDAQQSSRRSIKDLFENCMFAIGAMBEJFIMMKL;WEBSITEYW0;CSID7BDAF86D4312D845D2D4B0F2D9F492DEEC550C0438F7D0612E1782E0202E160;VIPCSID7BDAF8D4312D845D2D4B0F2D9F492DEEC550C0438F7D;USERYR19892C2016UN1YWBROWSE0USERID1URZZALLLIST1NAMEGUESTE3C12C43E3A2828TITLE_C3DCAD29YEARS3D2820022B20032B20042B20052B20062B20072929S1N20P1C0H28CCE2C3FB3DCAD29YEAR3D20022007MKMGXCSID7BDAF8D431845D4B0F9F49EEC550C0438F7DHTTP/11200OKCONNECTIONCLOSEDATESUN,23MAR2008022435GMTSERVERMICROSOFTIIS/60XPOWEREDBYASPNET可以看到,这个请求使用了POST命令,向HTTP/VIPGSINFONETCN/CSTJ/SEARDLLSEARCHZK发出请求,后面几行是这个请求的一些附加字段信息,倒数第五行是这个请求的HTTPBODY,其内容就是POST命令所要附带的数据,是经过HTML编码的一个字符串,解码后为ETITLE_CCADYEARS200220032004200520062007S1N20P1C0H题名CADYEA7R20022007MKMGXCSIDDAF8D431845D4B0F9F49EEC550C0438F以下是用CURL组件实现这个请求的PHP代码START;/计时开始BENCHSETMARKERSTARTOFTHESCRIPT;URL“HTTP/VIPGSINFONETCN/CSTJ/SEARDLLSEARCHZK“;PARAM“E3C12C43E3A2828TITLE_C3DCAD29YEARS3D2820022B20032B20042B20052B20062B20072929S1N20P1C0H28CCE2C3FB3DCAD29YEAR3D20022007MKMGXCSID7BDAF8D431845D4B0F9F49EEC550C0438F7D“;/指定POST数据OB_START;/打开输出缓冲区CHCURL_INIT6;/初始化会话CURL_SETOPTCH,CURLOPT_URL,URL;/设定目标URLCURL_SETOPTCH,CURLOPT_POST,1;/设定表单发送方式为POST8CURL_SETOPTCH,CURLOPT_POSTFIELDS,PARAM;/POST数据CURL_EXECCH;/发送请求RETRIEVEDHTMLOB_GET_CONTENTS;/返回内部缓冲区的内容OB_END_CLEAN;/删除内部缓冲区的内容并关闭内部缓冲区CURL_CLOSECH;/会话结束BENCHSTOP;/计时结束RESPBENCHGETPROFILING;ECHORESP2DIFF“S“;/输出计时时间现在获取的信息就在RETRIEVEDHTML中,然后就可以对获取的信息进行分析,得到元数据。用CURL组件实现这个请求的平均时间是062S以下是用FOPEN方式实现这个请求的PHP代码START;/计时开始BENCHSETMARKERSTARTOFTHESCRIPT;URL“9HTTP/VIPGSINFONETCN/CSTJ/SEARDLLSEARCHZK“;PARAM“E3C12C43E3A2828TITLE_C3DCAD29YEARS3D2820022B20032B20042B20052B20062B20072929S1N20P1C0H28CCE2C3FB3DCAD29YEAR3D20022007MKMGXCSID7B7CC87A4E5D7841D7B8D9289746EFA53E7D“;/指定POST数据FPFOPENURLPARAM,“R“;/发送请求RETRIEVEDHTML“;DO/读取返回的信息DATAFREADFP,8192;IFSTRLENDATA0BREAK;RETRIEVEDHTMLDATA;WHILETRUE;FCLOSEFP;BENCHSTOP;RESPBENCHGETPROFILING;ECHORESP2DIFF“S“;10用FOPEN方式实现这个请求的平均时间是1S虽然通过这个例子不能说明用CURL组件实现动态WEB信息获取的优越性能,但经过大量的实验,如通过访问清华同方CNKI数据库、万方数据库、NSTL数据库等文献资源网站,表明,用CURL组件实现动态WEB信息获取的性能远优于用FOPEN方式。4技术难点和重点41检索选项到检索表达式的转换对于要传递给WEB服务器的检索选项,根据WEB服务器设计的不同,需要做相应的处理,有的WEB服务器只需要浏览器端直接返回选项值,由服务器端程序进行逻辑处理后返回结果;有些WEB服务程序的设计要求浏览器端通过脚本技术,对检索选项进行预处理,在浏览器端生成一个检索表达式,再将此表达式以HTTP请求的方式传递给服务器进行检索,在这种情况下,开发人员需要分析HTML文件中嵌入的脚本代码或引用的脚本文件,理清各个检索选项到检索表达式的转换关系,才能构造出正确的检索表达式。例如,有些网站的翻页链接或全文链接是JAVASCRIPT写成的脚本命令,在HTML源代码中的静态文本是固定的,但实际指向的真正链接,却需要在脚本函数中动态生成。42连接状态的管理目前的检索系统都应用了SESSION如上例中POST数据中的C11SID7BDAF8D431845D4B0F9F49EEC550C0438F7D技术,为了解决SESSION过期和各文献数据库限制并发访问数的问题,采用了检索时一次性释放检索系统SESSION会话的机制,当翻页时再次建立检索系统SESSION会话。此外,各文献数据库都限制了并发访问数,通过这个方法能很好解决这个问题。43多任务开发尽管PHP的优势主要在于优异的字符运算处理速度和可靠性,通过与APACHE20WEB服务器的组合使得统一检索系统具备了良好的稳定性和性能,但它本身不支持多线程,而统一检索系统需要对多个数据库同时进行检索,如果是普通的单线程程序,处理速度会慢得让人无法忍受,本文使用AJAX技术实现多任务编程技术,以提高程序的运行效率、避免程序界面出现“假死”状态。AJAX对WEB服务的通信调用过程分为同步调用和异步调用,同步调用好处是一次性将用户的所有请求并发处理,但对于统一检索系统来说,多个资源数据库的检索响应将受限于耗时最长的资源数据库,用户等待时间较长,服务器端并发处理的压力较大。采用异步调用方式可很好的解决这一问题,用户按需发出请求,用户发出的多个资源数据库的检索在服务器端是按线程处理的,用户请求的响应以服务器处理结果为准,检索处理过程互不影响,大大缩短了用户的总体响应时间,降低了服务器的并发处理压力,在用户端等待数据处理结果时,可进行其它资源库的检索,实现了多任务检索处理和操作。5结语12本文针对动态WEB信息获取问题,介绍了基于WEB过程模拟的解决方法。该方法主要用于如何得到查询页面和实现信息抓取。如何提高对多种网页结构的适应性,以及感知WEB信息和网页结构的更新变化,同时减少其复杂性,提高其自动化和智能性,需要作进一步研究和探讨。参考文献1曹方,施韶亭基于WEB过程模拟的异构数字文献统一检索系统设计与实现J情报学报,2006,2555755792王权,施韶亭基于PHP的统一检索系统的设计与实现J兰州理工大学学报,2008,34(1)91943HYPERTEXTTRANSFERPROTOCOLHTTP/11EB/OL20080319HTTP/WWWW3ORG/PROTOCOLS/RFC2616/RFC2616HTML4PHP/CURLUSINGLIBCURLWITHPHPEB/OL20080319HTTP/CURLHAXXSE/LIBCURL/PHP5甘肃科技文献资源共享平台EB/OL20080319HTTP/WWWGSSTDCN6XVIIICURLCLIENTURLLIBRARYFUNCTIONSEB/OL20080319HTTP/CNPHPNET/MANUAL/ZH/REFCURLPHP补充13用CURL吧,速度比FILE或FOPEN都快,参考HTTP/CURLHAXXSE/LIBCURL/简单点的复杂点的通过程序模拟访问网页的方法有SOCKET通信方式、FOPEN方式、第三方组件如LIBCURL等。当网页文件很大或者网页根本不存在的时候,使用FOPEN的方法经常会出现超时。在实际工程应用中,必须考虑系统的性能及可移植性。WEB信息获取工具是系统性能好坏的一个最重要的技术环节,不论是采用PHP中的SOCKET通信方式还是FOPEN方式都不能胜任如此频繁的文件获取时间要求。系统采用性能优异的CURL访问组件,该组件远程访问速度比传统方式速度快了近200倍,采用FOPEN方式对于100个HTTP文件请求每分15钟只能打开10个,而采用CURL组件方式对于2000个HTTP文件请求每分钟可以打开2000个4。该组件支持FTP,FTPS,TFTP,HTTP,HTTPS,TELNET,DICT,FILE和LDAP协议的访问,极大地提高了WEB会话的速度和协议范围。此外,该组件支持多种开发语言工具的驱动,主要包括C、C、PHP、PERL、JAVA、NET等,支持广泛的操作系统,包括SOLARIS、NETBSD、FREEBSD、OPENBSD、HPUX、IRIX、AIX、TRU64、LINUX、UNIXWARE、WINDOWS等,具有广泛的可移植性,为程序开发打造了良好的接口。14大学本科生毕业设计(论文)撰写规范本科生毕业设计(论文)是学生在毕业前提交的一份具有一定研究价值和实用价值的学术资料。它既是本科学生开始从事工程设计、科学实验和科学研究的初步尝试,也是学生在教师的指导下,对所进行研究的适当表述,还是学生毕业及学位资格认定的重要依据。毕业论文撰写是本科生培养过程中的基本训练环节之一,应符合国家及各专业部门制定的有关标准,符合汉语语法规范。指导教师应加强指导,严格把关。1、论文结构及要求论文包括题目、中文摘要、外文摘要、目录、正文、参考文献、致谢和附录等几部分。11题目论文题目应恰当、准确地反映论文的主要研究内容。不应超过25字,原则上不得使用标点符号,不设副标题。12摘要与关键词121摘要本科生毕业设计(论文)的摘要均要求用中、英两种文字给出,中文在前。摘要应扼要叙述论文的研究目的、研究方法、研究内容和主要结果或结论,文字要精炼,具有一定的独立性和完整性,摘要一般应在300字左右。摘要中不宜使用公式、图表,不标注引用文献编号,避免将摘要写成目录式的内容介绍。122关键词关键词是供检索用的主题词条,应采用能覆盖论文主要内容的通用技术词条(参照相应的技术术语标准),一般列35个,按词条的外延层次从大到小排列,应在摘要中出现。13目录目录应独立成页,包括论文中全部章、节的标题及页码。1514论文正文论文正文包括绪论、论文主体及结论等部分。141绪论绪论一般作为论文的首篇。绪论应说明选题的背景、目的和意义,国内外文献综述以及论文所要研究的主要内容。文管类论文的绪论是毕业论文的开头部分,一般包括说明论文写作的目的与意义,对所研究问题的认识以及提出问题。绪论只是文章的开头,不必写章号。毕业设计(论文)绪论部分字数不多于全部论文字数的1/4。142论文主体论文主体是论文的主要部分,要求结构合理,层次清楚,重点突出,文字简练、通顺。论文主体的内容要求参照大学本科生毕业设计(论文)的规定第五章。论文主体各章后应有一节“本章小结”。143结论结论作为单独一章排列,但不加章号。结论是对整个论文主要成果的归纳,要突出设计(论文)的创新点,以简练的文字对论文的主要工作进行评价,一般为4001000字。15参考文献参考文献是论文不可缺少的组成部分,它反映了论文的取材来源和广博程度。论文中要注重引用近期发表的与论文工作直接有关的学术期刊类文献。对理工类论文,参考文献数量一般应在15篇以上,其中学术期刊类文献不少于8篇,外文文献不少于3篇;对文科类、管理类论文,参考文献数量一般为1020篇,其中学术期刊类文献不少于8篇,外文文献不少于3篇。在论文正文中必须有参考文献的编号,参考文献的序号应按在正文中出现的顺序排列。产品说明书、各类标准、各种报纸上刊登的文章及未公开发表的研究报告(著名的内部报告如PB、AD报告及著名大公司的企业技术报告等除外)不宜做为参考文献引用。但对于工程设计类论文,各种标准、规范和手册可作为参考文献。引用网上参考文献时,应注明该文献的准确网页地址,网上参考文献不包含在上述规定的文献数量之内。1616致谢对导师和给予指导或协助完成论文工作的组织和个人表示感谢。内容应简洁明了、实事求是,避免俗套。17附录如开题报告、文献综述、外文译文及外文文献复印件、公式的推导、程序流程图、图纸、数据表格等有些不宜放在正文中,但有参考价值的内容可编入论文的附录中。172、论文书写规定21论文正文字数理工类论文正文字数不少于20000字。文管类论文正文字数1200020000字。其中汉语言文学专业不少于7000字。外语类论文正文字数800010000个外文单词。艺术类论文正文字数30005000字。22论文书写本科生毕业论文用B5纸计算机排版、编辑与双面打印输出。论文版面设置为毕业论文B5纸、纵向、为横排、不分栏,上下页边距分别为25CM和2CM,左右页边距分别为24CM和2CM,对称页边距、左侧装订并装订线为0CM、奇偶页不同、无网格。论文正文满页为29行,每行33个字,字号为小四号宋体,每页版面字数为957个,行间距为固定值20磅。页眉。页眉应居中置于页面上部。单数页眉的文字为“章及标题”;双数页眉的文字为“大学本科生毕业设计(论文)”。页眉的文字用五号宋体,页眉文字下面为2条横线(两条横线的长度与版芯尺寸相同,线粗05磅)。页眉、页脚边距分别为18CM和17CM。页码。页码用小五号字,居中标于页面底部。摘要、目录等文前部分的页码用罗马数字单独编排,正文以后的页码用阿拉伯数字编排。23摘要中文摘要一般为300字左右,外文摘要应与中文摘要内容相同,在语法、用词和书写上应正确无误,摘要页勿需写出论文题目。中、外文摘要应各占一页,编排装订时放置正文前,并且中文在前,外文在后。24目录目录应包括论文中全部章节的标题及页码,含中、外文摘要;正文章、节题目;参考文献;致谢;附录。正文章、节题目(理工类要求编写到第3级标题,即。文科、管理类可视论文需要进行,编写到23级标题。)25论文正文251章节及各章标题论文正文分章、节撰写,每章应另起一页。各章标题要突出重点、简明扼要。字数一般在15字以内,不得使用标点符号。标题中尽量不用英文缩写词,对必须采用者,应使用本行业的通用缩写词。18252层次层次以少为宜,根据实际需要选择。层次代号格式见表1和表2。表1理工类论文层次代号及说明层次名称示例说明章第1章章序及章名居中排,章序用阿拉伯数字节11条111题序顶格书写,与标题间空1字,下面阐述内容另起一段款1111题序顶格书写,与标题间空1字,下面阐述内容在标题后空1字接排项1题序空2字书写,以下内容接排,有标题者,阐述内容在标题后空1字版心左边线版心右边线表2文管类论文层次代号及说明章节条款项一、(一)1(1)居中书写空2字书写空2字书写空2字书写空2字书写版心左边线版心右边线各层次题序及标题不得置于页面的最后一行(孤行)。26参考文献正文中引用文献标示应置于所引内容最末句的右上角,用小五号字体。所引文献编号用阿拉伯数字置于方括号“”中,如“二次铣削1”。当提及的参考文献为文中直接说明时,其序号应该与正文排齐,如“由文献8,1014可知”。经济、管理类论文引用文献,若引用的是原话,要加引号,一般写在段中;若引的不是原文只是原意,文前只需用冒号或逗号,而不用引号。在参考文献之外,若有注释的话,建议采用夹注,即紧接文句,用圆括号标明。不得将引用文献标示置于各级标题处。19参考文献书写格式应符合GB77141987文后参考文献著录规则。常用参考文献编写项目和顺序应按文中引用先后次序规定如下著作图书文献序号作者书名(版次)出版地出版者,出版年引用部分起止页第一版应省略翻译图书文献序号作者书名(版次)译者出版地出版者,出版年引用部分起止页第一版应省略学术刊物文献序号作者文章名学术刊物名年,卷(期)引用部分起止页学术会议文献序号作者文章名编者名会议名称,会议地址,年份出版地,出版者,出版年引用部分起止页学位论文类参考文献序号研究生名学位论文题目出版地学校(或研究单位)及学位论文级别答辩年份引用部分起止页西文文献中第一个词和每个实词的第一个字母大写,余者小写;俄文文献名第一个词和专有名词的第一个字母大写,余者小写;日文文献中的汉字须用日文汉字,不得用中文汉字、简化汉字代替。文献中的外文字母一律用正体。作者为多人时,一般只列出前3名作者,不同作者姓名间用逗号相隔。外文姓名按国际惯例,将作者名的缩写置前,作者姓置后。学术会议若出版论文集者,可在会议名称后加上“论文集”字样。未出版论文集者省去“出版者”、“出版年”两项。会议地址与出版地相同者省略“出版地”。会议年份与出版年相同者省略“出版年”。学术刊物文献无卷号的可略去此项,直接写“年,(期)”。参考文献序号顶格书写,不加括号与标点,其后空一格写作者名。序号应按文献在论文中的被引用顺序编排。换行时与作者名第一个字对齐。若同一文献中有多处被引用,则要写出相应引用页码,各起止页码间空一格,排列按引用顺序,不按页码顺序。参考文献书写格式示例见附录1。27名词术语科技名词术语及设备、元件的名称,应采用国家标准或部颁标准中规定的术语或名称。标准中未规定的术语要采用行业通用术语或名称。全文名词术语必须统一。一些特殊名词或新名词应在适当位置加以说明或注解。文管类专业技术术语应为常见、常用的名词。采用英语缩写词时,除本行业广泛应用的通用缩写词外,文中第一次出现的缩写词应该用括号注明英文全文。28计量单位20物理量计量单位及符号一律采用中华人民共和国法定计量单位(GB310031021993,见附录2),不得使用非法定计量单位及符号。计量单位符号,除用人名命名的单位第一个字母用大写之外,一律用小写字母。非物理单位(如件、台、人、元、次等)可以采用汉字与单位符号混写的方式,如“万TKM”,“T/(人A)”等。文稿叙述中不定数字之后允许用中文计量单位符号,如“几千克至1000KG”。表达时刻时应采用中文计量单位,如“上午8点45分”,不能写成“8H45MIN”。计量单位符号一律用正体。29外文字母的正、斜体用法按照GB310031021986及GB71591987的规定使用,即物理量符号、物理常量、变量符号用斜体,计量单位等符号均用正体。210数字按国家语言文字工作委员会等七单位1987年发布的关于出版物上数字用法的规定,除习惯用中文数字表示的以外,一般均采用阿拉伯数字(参照附录3)。211公式原则上居中书写。若公式前有文字(如“解”、“假定”等),文字顶格书写,公式仍居中写。公式末不加标点。公式序号按章编排,如第1章第一个公式序号为“(11)”,附录2中的第一个公式为(1)等。文中引用公式时,一般用“见式(11)”或“由公式(11)”。公式中用斜线表示“除”的关系时,若分母部分为乘积应采用括号,以免含糊不清,如A/BCOSX。通常“乘”的关系在前,如ACOSX/B而不写(A/B)COSX。212插表表格不加左、右边线。表序一般按章编排,如第1章第一个插表的序号为“表11”等。表序与表名之间空一格,表名中不允许使用标点符号,表名后不加标点。表序与表名置于表上,居中排写(见附录4)。表头设计应简单明了,尽量不用斜线。表头中可采用化学符号或物理量符号。全表如用同一单位,将单位符号移到表头右上角,加圆括号(见附录4中的例2)。表中数据应正确无误,书写清楚。数字空缺的格内加“”字线(占2个数字宽度)。表内文字和数字上、下或左、右相同时,不允许用“”、“同上”之类的写法,可采用通栏处理方式(见附录4中的例2)。表内文字说明不加标点。文管类的插表在表下一般根据需要可增列补充材料、注解、附记、资料来源、某些指标的计算方法等。21表内文字说明,起行空一格,转行顶格,句末不加标点。表题用五号字,表内文字及表的说明文字均用五号字,中文用宋体。表格容量较大,必要时表格也可分为两段或多段(这只能发生在转页时),转页分段后的每一续表的表头都应重新排字,重排表头的续表上方右侧应注明(续表)字样。213插图插图应与文字紧密配合,文图相符,技术内容正确。2131制图标准插图应符合技术制图及相应专业制图的规定。机械工程图采用第一角投影法,应符合附录5所列有关标准的规定。电气图图形符号、文字符号等应符合附录6所列有关标准的规定。流程图符合国家标准。对无规定符号的图形应采用该行业的常用画法。2132图题及图中说明每个图均应有图题(由图号和图名组成)。图号按章编排,如第1章第一图的图号为“图11”等。图题置于图下。有图注或其他说明时应置于图题之上。图名在图号之后空一格排写。引用图应说明出处,在图题右上角加引用文献编号。图中若有分图时,分图号用A、B等置于分图之下。图中各部分说明应采用中文(引用的外文图除外)或数字项号,各项文字说明置于图题之上(有分图题者,置于分图题之上)。图题用五号字,图内文字及说明均用五号字,中文用宋体。2133插图编排插图与其图题为一个整体,不得拆开排写于两页。插图应编排在正文提及之后,插图处的该页空白不够排写该图整体时,则可将其后文字部分提前排写,将图移到次页最前面。2134坐标单位有数字标注的坐标图,除无单位者(如标示值)之外,必须注明坐标单位。2135论文中照片图及插图毕业论文中的照片图均应是原版照片粘贴(或数码像机图片),照片可为黑白或彩色,应主题突出、层次分明、清晰整洁、反差适中。照片采用光面相纸,不宜用布纹相纸。对金相显微组织照片必须注明放大倍数。毕业论文中的插图不得采用复印件。对于复杂的引用图,可采用数字化仪表输入计算机打印出来的图稿。214附录22理工类论文附录的序号采用“附录1”、“附录2”等,附录顺序为开题报告、文献综述、外文文献的中文译文及外文复印件等。文管类论文附录序号相应采用“附录一”、“附录二”等。3、论文排版要求31纸张要求及页面设置名称格式要求纸张B5(182257),幅面白色页面设置上下页边距25CM和2CM,左右页边距24CM和2CM,页眉、页脚分别为18CM和17CM,对称页边距、左侧装订并装订线为0CM、奇偶页不同、无网格页眉宋体字五号居中页码宋体字小五号居中32封面详见模版、B5纸单面打印名称格式要求本科毕业设计/论文宋体字小二号,行距固定值25磅,间距段前、段后分别为05行,要求字体居中论文题目黑体字二号,行距固定值25磅,间距段前、段后分别为05行。论文题目中文字数不得超过25字,要求字体居中填写姓名宋体字小三号,行距固定值20磅,间距段前、段后分别为05行,要求字体居中大学楷体字小二号,行距固定值20磅,间距段前、段后分别为05行。每字间空1格,要求字体居中年月宋体字小三号,行距固定值20磅,间距段前、段后分别为05行。数字用阿拉伯数字,日期为论文提交日期,要求字体居中33封面2详见模版、B5纸单面打印名称格式要求本科毕业设计/论文宋体字小二号,行距固定值25磅,间距段前、段后分别为05行,要求字体居中论文题目黑体字二号,行距固定值25磅,间距段前、段后分别为05行。论文题目中文字数不得超过25字,要求字体居中学院(系)宋体字四号,行距固定值20磅,间距段前、段后分别为05行,字体左对齐专业同上学生姓名同上学号同上指导教师同上答辩日期同上34本科毕业设计/论文任务书单面打印本科毕业设计/论文B5纸,单面打印,不编页码2335中、英文摘要名称中文摘要英文摘要标题摘要黑体字小二居中,行距固定值20磅,间距段前、段后分别为1行ABSTRACTTIMESNEWROMAN体小二号居中,行距固定值20磅,间距段前、段后分别为1行段落文字宋体字小四号,行距固定值20磅TIMESNEWROMAN体小四号,行距固定值20磅关键词同上,“关键词”三字加粗同上,“KEYWORDS”两词加粗页码罗马大写数字,TIMESNEWROMAN体小五号字罗马大写数字,TIMESNEWROMAN体小五号字36目录名称示例格式要求标题目录黑体字小二号居中,行距固定值20磅,间距段前、段后分别为1行各章目录格式范例黑体字小四号,行距固定值20磅,两端对齐,页码右对齐节标题目录格式范例宋体字小四号,行距固定值20磅,两端对齐,页码右对齐,左缩进2字符条标题目录格式范例宋体字小四号,行距固定值20磅,两端对齐,页码右对齐,左缩进3字符(条标题目录文科左缩进2字符)页码格式范例罗马大写数字,TIMESNEWROMAN体小五号字37正文示例名称理工论文文科论文格式要求各章标题第1章一、黑体字小二号居中,行距固定值20磅,间距段前、段后分别为1行,理工类章序号与章名间空一个汉字节标题11(一)黑体字小三号,行距固定值20磅,间距段前、段后分别为05行,理工类题序与题名间空一个汉字条标题1111、黑体字四号,行距固定值20磅,间距段前、段后分别为05行,理工类题序与题名间空一个汉字款标题1111(1)黑体字小四号,行距固定值20磅,理工类题序与题名间空一个汉字正文段落文字宋体字小四号,段落首行左缩进2个汉字。行距固定值20磅(段落中有数学表达式时,可根据表达需要设置该段的行距)38其它名称格式要求结论标题要求同各章标题,正文部分宋体字小四号,行距固定值20磅,段落首行左缩进2个汉字参考文献标题要求同各章标题,正文部分宋体字小四号(英文用TIMESNEWROMAN体小四号),行距固定值20磅致谢标题要求同各章标题,正文部分宋体字小四号,行距固定值20磅,(英文用TIMESNEWROMAN体小四号)附录标题要求同各章标题,正文部分宋体字小四号(英文用TIMESNEWROMAN体小四号),段落首行左缩进2个汉字。行距固定值20磅,(段落中有数学表达式时,可根据表达需要设置该段的行距),装订时附录内容加封面大学毕业设计/论文评审意见表B5纸,单面打印,不编页码24大学毕业设计/论文答辩委员会评语表B5纸,单面打印,不编页码注1毕业设计/论文模版用WORD2003文档排版,详见教务处网页“文档下载”“实践教学用表”中毕业设计/论文模版,下载的模版文档会变形需要进行整理。2未注明事宜,请查看撰写规范有关要求。4、论文打印输出要求41输出样式计算机双面打印输出。42字体字号论文正文字体为宋体,小四号字。第一层次(章)题序和标题用小二号黑体字。题序和标题之间空1个字。第二层次(节)题序和标题用小三号黑体字。题序和标题之间空1个字。第三层次(条)题序和标题用四号黑体字。第四层次(款)题序和标题用小四号黑体字。第五层次(项)题序和标题用小四号宋体字。页码用小五号字,在底线下居中。论文的中文和外文摘要属二次文献置于目录前,并编入目录,按第一层次(章)的编辑要求处理。参考文献、致谢、附录同样按第一层次(章)的编辑要求处理,另起新页,与正文一起顺序用阿拉伯数字编页。43摘要及关键词中文摘要题头用小二号黑体字居中排写,然后隔行书写摘要的文字部分,摘要正文用小四号宋体,行距20磅。英文论文摘要另起一页,其内容及关键词应与中文摘要一致。英文选用字体TIMESNEWROMAN,字号与中文摘要相同。摘要的中、外文示例见附录7和附录8。摘要正文后下空一行打印“关键词”三字,关键词题头用小四号宋体字字体加粗顶格书写,然后空一格书写有关关键词,各关键词之间加标点符号“;”最后一词之后不加标点符号。44目录目录题头用小二号黑体字居中排写。目录中各章题序及标题用小四号黑体,其余用小四号宋体,行距为20磅。目录的打印实例见附录9和附录10。45正文层次正文层次的编排理工类论文应采用表3的格式,文管类可采用表4的格式。表3理工类论文层次代号打印说明25层次名称示例说明章第1章小二号黑体节11小三号黑体条111四号黑体款1111项1小四号黑体正文用小四号宋体表4文管类论文层次代号打印说明章节条款项一、(一)1(1)小二号黑体居中排空2字,小三号黑体空2字,四号黑体空2字,小四号黑体空2字,小四号宋体正文的示例参见附录11和附录12。46公式公式序号的右侧符号靠右边线顶边排写。公式较长时最好在等号“”处转行,如难实现,则可在、运算符号处转行,转行时运算符号仅书写于转行式前,不重复书写。公式中第一次出现的物理量应给予注释,注释的转行应与破折号“”后第一个字26对齐,格式见下例式中MF试样断裂前的最大扭矩(NM);F试样断裂时的单位长度上的相对扭转角,F(RAD/MM)。公式中应注意分数线的长短(主、副分线严格区分),长分线与等号对齐,如213NX附录1参考文献示例参考文献1崔忠圻金属学及热处理北京机械工业出版社,1989,36452张安峰,邢建东,陆文华高铬铸铁的氧化行为金属学报,1993,29(6)2632683周敬跃,李伟文利用基元叶片理论单级跨音速轴流压气机特性见中国工程热物理学术讨论会北京工程热物理研究所,1985,1811964王连东镦粗新理论及新工艺的研究硕士学位论文齐齐哈尔东北重型机械学院,1992,126134DDL275JOHNKT,GEORGESAALLOYANDMICROSTRUCTURALDESIGNLONDONACADEMICPRESSINCLTD1993,1252362386SISLERHHELECTRONICSTRUCTUREPROPERTIESANDTHEPERIODICLOW,SELECTEDTOPICSINMODERNCHEMISTRYREINHOLDPUBLISHINGCORPORATION,1963,10278897CAIANQIUANANALYSISOFTHECRFEMOCSYSTEMANDMODIFICATIONOFTHERMODYNAMICPARAMETERSISIJINTERNATIONAL,1992,3210111711278LEEBJ,LEEDNATHERMODYNAMICEVALUATIONOFTHEFECRVTISYSTEMJOURNALOFPHASEEQUILIBRIA,1992,134349364附录2中华人民共和国法定计量单位中华人民共和国法定计量单位(GB3310031021993)我国的法定计量单位(以下简称法定单位)包括1国际单位制的基本单位见表21;2国际单位制的辅助单位见表22;3国际单位制中具有专门名称的导出单位见表23;4国家选定的非国际单位制单位见表24;5由以上单位构成的组合形式的单位;6由词头和以上单位构成的十进倍数和分数单位词头见表25。法定单位的定义、使用方法等,由国家计量局另行规定。表21国际单位制的基本单位量的名称单位名称单位符号28长度质量时间电流热力学温度物质的量发光强度米千克(公斤)秒安培开尔文摩尔坎德拉MKGSAKMOLCD表22国际单位制的辅助单位量的名称单位名称单位符号平面角立体角弧度球面度RADSR表23国际单位制中具有专门名称的导出单位量的名称单位名称单位符号其它表示实例29频率力;重力压力,压强;应力能量;功;热量功率;辐射通量电荷量电位;电压;电动势电容电阻电导磁通量磁通量密度;磁感应强度电感摄氏温度光通量光照度放射性活度吸收剂量剂量当量赫兹牛顿帕斯卡焦尔瓦特库仑伏特法拉欧姆西门子韦伯特斯拉亨利摄氏度流明勒克斯贝可勒尔戈瑞希沃特HZNPAJWCVFSWBTHLMLXBQGYSVS1KGM/S2N/M2NMJ/SASW/AC/VV/AA/VVSWB/M2WB/ACDSRLM/M2S1J/KGJ/KG表24国家选定的非国际单位制单位量的名称单位名称单位符号换算关系和说明时间分小时天(日)MINHD1MIN60S1H60MIN3600S1D24H86400S30平面角角秒角分度1/648000RAD为圆周率160/10800RAD160/180RAD旋转速度转每分R/MIN1R/MIN1/60S1长度海里NMILE1NMILE1852M只用于航程速度节KN1KN1NMILE/H1852/3600M/S只用于航程质量吨原子质量单位TU1T103KGLU166056551027KG体积升L,L1L1DM3103M3能电子伏EV1EV160218921019J级差分贝DB线密度特克斯TEX1TEXLG/KM表25用于构成十进倍数和分数单位的词头所表示的因数词头名称词头符号101810151012109106艾可萨拍它太拉吉咖兆EPTGM31103102101101102103106109101210151018千百十分厘毫微纳诺皮可飞母托阿托KHDADCMNPFA注1周、月、年(年的符号为A)为一般常用时间单位。2内的字,是在不致混淆的情况下,可以省略的字。3()内的字为前者的同义语。4角度单位度、分、秒的符号不处于数字后时,用括号。5升的符号中,小写字母L为备用符号。6R为“转”的符号。7公里为千米的俗称,符号为KM。8104称为万,108称为亿,1012称为万亿,这类数词的使用不受词头名称的影响,但不应与词头混淆。说明法定计量单位的使用,可查阅1984年国家计量局公布的中华人民共和法定计量单位使用方法。附录3数字用法示例数字用法示例按关于出版物上数字用法的规定(1995年国家语言文字工作委员会等7个单位公布),除习惯用中文数字表示的以外,一般数字均用阿拉伯数字。(1)公历的世纪、年代、年、月、日和时刻一律用阿拉伯数字,如20世纪,80年代,4时3刻等。年号要用四位数,如1989年,不应用89年。(2)记数与计量(含正负整数、分数、小数、百分比、分数等)一律用阿拉伯数字,如3/4,45,10个月,500多种等。(3)一个数值的书写形式要照顾到上下文。不是出现在一组表示科学计量和具有统计意义数字中的一位数可以用汉字,如一个人,六条意见。星期几一律用汉字,如星期六。邻近两个数字并列连用,表示概数,应该用汉字数字,数字间不用顿号隔开,如三五天,七八十种,四十五六岁,一千七八百元等。32(4)数字作为词素构成定型的词、词组、惯用语、缩略语等应当使用汉字。如二倍体、三叶虫,第三世界,“七五”规划,相差十万八千里等。(5)5位以上的数字,尾数零多的,可改写为以万、亿为单位的数。一般情况下不得以十、百、千、十万、百万、千万、十亿、百亿、千亿作为单位。如345000000公里可改写为345亿公里或34500万公里,但不能写为3亿4500万公里或3亿4千5百万公里。(6)数字的书写不必每格一个数码,一般每两数码占一格,数字间分节不用分位号“,”,凡4位或4位以上的数都从个位起每3位数空半个数码(1/4汉字)。“3000000”,不写成“3,000,000”,小数点后的数从小数点起向右按每三位一组分节。一个用阿拉伯数字书写的多位数不能从数字中间转行。(7)数量的增加或减少要注意下列用词的概念1增加为(或增加到)过去的二倍,即过去为一,现在为二;2增加(或
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 服装设计品牌文化传承推广手册规划
- 地方师范院校小学教育专业学生教学技能培养的现状、挑战与突破
- 地形分解视角下气象要素局地分布规律的深度剖析与模型构建
- 地基气辉观测下中层顶区大气重力波与Na层气辉辐射特性研究
- 安全生产技能培训的心得体会
- 情感分析在股票情绪预测中的应用-洞察及研究
- 生物材料促进软组织重塑-洞察及研究
- 神牡安神胶囊在认知功能改善中的作用机制研究-洞察及研究
- 仿生高强纸张制备-洞察及研究
- 星系形成与演化机制-第5篇-洞察及研究
- 儿科常用急救技术
- IT运维服务合同(模板)7篇
- 猫咖设计案例解析与方案模板
- 《模拟电子技术(第三版)》全套教学课件
- 子宫破裂护理常规课件
- (2025年)国家能源集团笔试试题(+答案)
- DB34∕T 4010-2021 水利工程外观质量评定规程
- 精神专科护士工作汇报
- 客户设备大修方案(3篇)
- 【01-暑假复习】初高衔接点03 因式分解含答案-2025年新高一数学暑假衔接讲练 (通)
- 2025年国有企业管理岗竞聘笔考试试题库及答案
评论
0/150
提交评论