




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方法教的方法:采用循序渐进地比较系统地介绍网站建设与网页制作的过程和方法,主要讲解环境的部署、文档的代码结构以及教材中学生不易理解的内容、制作网页要用到的而教材中未涉及的或教材中出现的但没有具体讲解的概念内容。由于内容太多,时间有限,教学过程主要采用用到哪儿,学到哪儿,而不是墨守成规地讲一大堆理论,有时还会错误地介绍已学过知识,看看同学们对已学知识的掌握程度,然后和同学们一起纠正来促进和加深同学们理解和记忆;一些较细节或通用的方法只详细介绍一类,而其他能触类旁通的内容,主要以学生课外自学、老师答疑的方式来完成。教师在教学中的作用一是“传道,授业,解惑”。“传道”就是传给学生一条道路,指明一个方向。 “授业”就是教给学生在这个方向,这条道路上行走的方法与技巧, “解惑”就是当学生在行走的实践过程中,遇到了大雾迷茫,遇到了河流隔断,天堑相横等这样阻挠的时候,老师给以点拨、提醒,或是帮助。另一个就是帮学生把书读薄。学的方法:开始学习时多读、多写(录入),掌握结构,掌握使用方法,能看懂别人的网页代码。自己制作网页的方法是下载你喜欢的与你的功能设计较接近的别人的网页来做修改(模仿)模仿是学习的关键一步,也是有效的一步。在模仿的过程中体会并研究技术知识,要比按照书中的代码输入几段程序有效得多。这就要求学生首先能看得懂别人的代码才能进入模仿阶段,这也是学习HTML的目的。而网页中出现的一些代码或术语都可在网上查阅。我们的教学不仅要知其然,还要知其所以然,因为我们是计算机专业的学生。内容一 构建网页开发环境一. 运行环境与软件要求Windows 2000 以上 (不包括Windows XP Home版)IIS 4.0 以上Microsoft Access 2000及以上Dreamweaver 8.0及以上 或frontpage2000及以上二. IIS的安装与配置1. 安装IIS若操作系统中还未安装IIS服务器,可打开“控制面板”,然后单击启动 “添加/删除程序”, 在弹出的对话框中选择 “添加/删除Windows组件”,在Windows组件向导对话框中选中“Internet信息服务(IIS)”,然后单击“下一步”,按向导指示,完成对IIS的安装。(图例如下图1、图2)此主题相关图片如下:图2windows组件向导2如果在安装过程中出现如下界面(服务器版的,如Windows 2003 Server不会出现)则将Windows安装光盘插入,并确保安装光盘根目录中的i386文件夹下的STAXMEM.DLL和ADMXPROX.DLL两个动态组件被安装(将出现两次选择(用“浏览”按钮分别找到这两个组件,并安装(找到后,按“打开”按钮),因有两个组件)。如下图:2. 启动Internet信息服务(IIS)Internet信息服务简称为IIS,单击Windows开始菜单-所有程序-管理工具-Internet信息服务(IIS)管理器,即可启动“Internet信息服务”管理工具(如图3)此主题相关图片如下:图3Internet信息服务(IIS)管理器3. 配置IISIIS安装后,系统自动创建了一个默认的Web站点,该站点的主目录默认为C:Inetpubwww.root。用鼠标右键单击“默认Web站点”,在弹出的快捷菜单中选择“属性”,此时就可以打开站点属性设置对话框,(如图4)在该对话框中,可完成对站点的全部配置。此主题相关图片如下:图4默认Web站点属性主目录与启用父路径“开启父路径”是在WINDOWS 2003开始的,之前的WINDOWS XP 和WINDOWS 2000自带的IIS是没有这个说法的,其主要作用是:ASP页面中如果使用到include=./header.asp这样的代码,即使用.表示法来引用一个父目录,则必需“启用父路径”,./表示上级目录下的header.asp页面,是用相对路径来表示的,如果IIS设置中没有开启父路径,在WINDOWS 2003服务器下正常的网站程序,在WINDOWS2003下,访问时就会报错“HTTP 500-内部服务器错误”。允许相对于当前目录的路径(使用./表示),./表示源文件所在目录的上一级目录,././表示源文件所在目录的上上级目录,以此类推。这样,可能会造成潜在的安全风险,因为包含路径可以访问应和程序根目录外的重要或机密文件,出于安全考虑,可不开启父路径,建议路径指向的时候写绝对路径,即完整地址。单击“主目录”标签,切换到主目录设置页面,(如图5)该页面可实现对主目录(默认主目录为C:Inetpubwww.root)的更改或设置。注意检查启用父路径选项是否勾选,如未勾选将对以后的程序运行有部分影响。(如图6),主目录配置-选项。此主题相关图片如下:图5默认Web站点主目录设置此主题相关图片如下:图6默认Web站点启用父路径设置设置主页文档单击“文档”标签,可切换到对主页文档的设置页面,(如图7)主页文档是在浏览器中键入网站域名,而未制定所要访问的网页文件时,系统默认访问的页面文件。常见的主页文件名有index.htm、index.html、index.asp、index.php、index.jap、default.htm、default.html、default.asp等IIS默认的主页文档只有default.htm和default.asp,根据需要,利用“添加”和“删除”按钮,可为站点设置所能解析的主页文档。启动与停止IIS服务在Internet信息服务的工具栏中提供有启动与停止服务的功能。单击 可启动IIS服务器;单击 则停止IIS服务器。三. 设置虚拟目录一般说来,Internet站点的内容都应当维持在一个单独的目录结构内,以免引起访问请求混乱的问题。特殊情况下,网络管理人员可能因为某种需要而使用除实际站点目录(即主目录)以外的其他目录,或者使用其他计算机上的目录,来让Internet用户作为站点访问。这时,就可以使用虚拟目录,即将想使用的目录设为虚拟目录,而让用户访问。 处理虚拟目录时,IIS把它作为主目录的一个子目录来对待;而对于Internet上的用户来说,访问时并感觉不到虚拟目录与站点中其他任何目录之间有什么区别,可以像访问其他目录一样来访问这一虚拟目录。设置虚拟目录时必须指定它的位置,虚拟目录可以存在于本地服务器上,也可以存在于远程服务器上。多数情况下虚拟目录都存在于远程服务器上,此时,用户访问这一虚拟目录时,IIS服务器将充当一个代理的角色,它将通过与远程计算机联系并检索用户所请求的文件来实现信息服务支持。1. 从“控制面板”里打开“管理工具”2. 从中选择“Internet信息服务”3. 在弹出的窗口中右击“默认网站”,选择“新建虚拟目录”4. 弹出虚拟目录创建向导5. 填写别名,如myasp或c等6. 再下一步,在“目录”区:浏览到E:myasp即可(这里应是IIS非主目录下的网页所在的实际路径)注:5和6中的myasp不是同一个东西,5中的myasp是我们自已取的名字,而6中的myasp是一个文件夹,所有的网页内容都放在其中。7. 访问的权限一定要把所有的权限都打勾8. 点击“完成”9. 启动IE浏览器在地址栏输入/myasp点“转到”按钮,就可打开主页了四. Dreamweaver8.0本地站点的搭建与管理要制作一个能够被大家浏览的网站,首先需要在本地磁盘上制作这个网站,然后把这个网站传到互联网的web服务器上。放置在本地磁盘上的网站被称为本地站点,位于互联网web服务器里的网站被称为远程站点。Dreamweaver 8提供了对本地站点和远程站点强大的管理功能。1、规划站点结构网站是多个网页的集合,其包括一个首页和若干个分页,这种集合不是简单的集合。为了达到最佳效果,在创建任何 Web 站点页面之前,要对站点的结构进行设计和规划。决定要创建多少页,每页上显示什么内容,页面布局的外观以及各页是如何互相连接起来的。我们可以通过把文件分门别类的放置在各自的文件夹里,使网站的结构清晰明了,便于管理和查找。2、创建站点在Dreamweave 8中可以有效的建立并管理多个站点。搭建站点可以有两种方法,一是利用向导完成,二是利用高级设定来完成。(1)选择菜单栏站点管理站点,出现“管理站点”对话框。点击“新建”按钮,选择弹出菜单中的“站点”项。 在打开的窗口上方有“基本”和“高级”两个标签,可以在站点向导和高级设置之间切换。下面选择“基本”标签用向导的创建。在文本框中,输入一个站点名字以在 Dreamweaver8.0中标识该站点。这个名字可以是任何你需要的名字(可以是汉字)。单击“下一步”。出现向导的下一个界面,询问是否要使用服务器技术。建立静态页面,选择“否”。建立动态页面选择“是”。点下一步,在文档框设置本地站点文件夹的地址,与服务器程序“主目录”位置相同。点下一步,进入站点定义,在站点建设完成后在与FTP链接,这里选择“无”。单击“完成”按钮,结束“站点定义“对话框的设置。单击“完成”按钮,文件面板显示出刚才建立的站点。到此,我们完成了站点的创建。3、搭建站点结构站点是文件与文件夹的集合,下面我们根据前面对xmweb网站的设计,来新建xmweb站点要设置的文件夹和文件。新建文件夹,在文件面板的站点根目录下单击鼠标右键,从弹出菜单中选择“新建文件夹”项,然后给文件夹命名。这里我们创建新建8个文件夹,分别命名为:img、med、swf、txt、css、js、moan和fy。创建页面,在文件面板的站点根目录下单击鼠标右键,从弹出菜单中选择“新建文件”项,然后给文件命名。首先要添加首页,把首页命名为IIS中默认的文档,一般为index.html,再分别新建01.html、02.html、03.html、04.html和05.html等页面。4、文件与文件夹的管理对建立的文件和文件夹,可以进行移动、复制、重命名和删除等基本的管理操作。单击鼠标左键选中需要管理的文件或文件夹,然后单击鼠标右键,再弹出菜单中选“编辑”项,即可进行相关操作。内容二 HTML基础HTML是WWW的描述语言,1988年由ISO(International Standardization Organization)国际标准化组织批准的SGML(Standard Generalized Markup Language)标准通用标记语言(为电子文档交换制订标准,即为标题、段标题、段落和代码示例等规定起始位置和结束位置)是HTML的基础,其设计目的是为了能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其它电脑上。我们只需使用鼠标在某一文档中某处点击,Internet就会马上转到与该点相关的内容上去,而这些信息可能存放在网络的另一台电脑中。这个过程是通过一种称为超链接的技术实现的;另外, HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等;再加上下面马上要介绍的概念“标记”,同学们就知道了HTML全称叫法了,即HTML(Hyper Text Mark-up Language)超文本标记语言。我们在学习一种语言时需要学习该语言的规则,即语法,否则其语句将没有任何意义。即然HTML是一种语言,那它与任何其他语言一样,也有自己的语法规则。W3C通过不断完善HTML规范,于是在1998年1月XML(Extensible Markup Language,可扩展标记语言)被批准诞生了。XML允许用户定义自己的标记(灵活性)、允许用户在网页外部定义变量,使得XML更像一种编程语言(功能强大)。当然,灵活性带来的是负担,必须在文档类型定义(DTD,document type declaration)中准确定义每一个标记。功能强大带来的是复杂性,一般的Web开发人员还没有足够的能力来编写这样的程序,因为目前还没有一种编程语言与HTML相似。XHTML是一个XML的应用,是在XML的基础上添加一个特殊的文档类型定义(DTD),是HTML的一个比较严格的执行(在HTML中可以不管某些错误,浏览器会更正其中的大多数错误,但这已不适用于XHTML了),它没有比HTML多增加任何新标记,却有可扩展性和可移植性两个特殊性质。HTML4.01是HTML的最终版本,XHTML1.0是HTML4.01的后续版本。一HTML文档的结构先看两个例子:我的第一个HTML文档网页中要显示的内容放置在这里!或在Dreamweaver cs4k 我的第一个HTML文档网页中要显示的内容放置在这里!从上面两个例子可以知道一篇有效的HTML文档包括:1.版本信息:也被称为该文档的文档类型声明(DTD,document type declaration)。2.文件类型 (放在文档的开头与结尾) 3. 文件头 (描述性资料,像是主题)。HEAD元素中可以包含标题和元数据(meta data)。4.元数据:元(即“基本”的意思)数据是关于网页信息的信息,可以告知浏览器网页的作者姓名、编制网页所使用的软件、语言、字符集、网页内容何时到期、何时刷新网页、公司名称以及联系信息等,还有,搜索引擎使用META元素来正确地指向网页。它是一个比较独特的元素,它不是在开始标记和结束标记之间写内容,而是拥有一个CONTENT属性。它没有结束标记,且内容在网页上是不可见的。常用的有以下几种形式。,关键字列表是一个由逗号分隔的列表,大多数搜索引擎使用元数据中提供的关键字为网页建立索引。注意:某些搜索引擎对大小写字母是有区别的。其中,http-equiv(equivalence,等值;相等;等价):超文本传输协议标题信息;HTTP响应的标题头;HTTP的头部协议,它回应给浏览器一些有用的信息,以帮助正确和精确地显示网页内容。如,http-equiv= Content-Type或Content-Language 表示显示字符集的设定。4.文件主题 (必须放在文头区块内),HTML文档的标题(即标题栏上显示的内容,也称作网页标题)被添加在其中。 两种主要的浏览器所支持的标题长度最多96或100个字符。搜索引擎要使用网页标题作为网页的入口信息。所以,在HTML中,缺少标题是一种语法错误。同时,具有描述性的标题是很重要的。5.文件体 (文件本体),要添加到HTML文档中的任何内容。 HTML整个结构大致上可分为头部(Head)和主体(Body)两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。而组成HTML语句的基本成分,包括元素、属性和实体,在其结构中还具有嵌套和注释的功能。.元素(element):在HTML中,元素用来定义网页中的文档结构、文档的显示外观以及与其它文档的链接等。在W3C(World Wide Web Consortium)万维网联盟。W3C于1994年10月在麻省理工学院计算机科学实验室成立。拥有来自全世界40个国家的400多个会员组织。W3C组织是对网络标准制定的一个非赢利组织,像HTML、XHTML、CSS、XML的标准就是由W3C来定制)中,元素一词被用于两种情况:一是“标记”意义的元素;另一个指的是如“标题、段落”等表示文档结构的元素(element of structure)。本节只介绍第一情况。如HEAD、BODY、P等都称为元素、要将元素插入到文本中,需要用“”将它们括起来,像这样、,此时、等也不再称为元素,而被叫做标记(tag),并称其为开始标记,而在开始标记的元素名前加上一个“/”,如、,则称其为结束标记。绝大多数元素都有开始标记和结束标记。在HTML文档中,要在浏览器(主要的有Netscape公司的Netscape Navigator和Microsoft 公司的Internet Explorer两种)上显示的内容必须包含在开始标记和结束标记之间,并且在实际操作中,总是先写内容,然后再放置开始标记和结束标记。当浏览器看到一个开始标记时(相当于给浏览器下的命令),它就会知道要怎样显示随后的文本,直到它找到一个结束标记。注意:有些元素可以没有结束标记,如LI和P等;有些元素后没有要在浏览器上显示的内容。元素可以划分为两类:块元素,常用的有P、HTML、BODY、BLOCKQUOTE等和内联(inline)元素,常用的有B(黑体)、I(斜体)、Q(引用)和A(锚点)。.属性(property):是每个元素特有的性质。属性都有值,它们是成对出现的,属性的值总是包括在双引号之中,其写法有两种如:align(属性)=center(属性的值)或width33%。注意:表示颜色的属性即可用颜色的名称(只有16种命名的颜色),如color=黑色,也可用十六进制的值,如 COLOR=#000000至COLOR=#FFFFFF来表示”(前两位表示红色的数量、其后两位表示绿色、最后两位表示蓝色,用十六进制表示时需要在数值前加#),老版本的HTML还可用十进制值RGB(0-255,0-255,0-255)来表示。元素一般用大写字母表示,而属性值对一般用小写字母表示。当一个元素有多个属性时,属性之间用空格分隔。.实体(entities):实体是W3C中的另一个学术名词,是指键盘上没有的一些特殊字符,如(版权符号)、(注册商标符号)以及(商标符号)等。同一个实体代码有三种书写方式,但都以 “&”号开始,以分号“;”结束,如版权符号可为©(字符方式)、(十进制方式) 和&xA9;(加一个小写x的十六进制方式)。HTML中最常用的实体是 (不可分的空格或不间断空格)。实体是区分大小写的。.注释(annotation):在HTML中,注释以。注释可以跨越多行。嵌套(nesting):如,例中HEAD元素和BODY元素都被嵌套在HTML元素之中。注意:在有嵌套的HTML文档中,首先结束内层元素,然后再结束外层元素。另外,有些元素是不能嵌套的,如链接中不能嵌套链接。小结:1.HTML的基本构建组件是元素、元素都有属性、属性都有值,且其值都应被双引号括起来。2.绝大多数元素都有开始标记和结束标记。这些标记将实际内容包在其中。3.正确使用元素嵌套的原则是:应该先结束内层元素,再结束外层元素。内容三 开始编写BODY部分一. 为网页不同部分添加一个明显的标题绝大多数网页在其BODY中都包含一些标题(heading),使用heading元素的H1、H2、H3、H4、H5、H6元素为网页内容添加标题(它们分别代表1-6级标题)。其格式顺序是要显示的标题内容。二. 文本的录入和编辑文本内容是网页的主要内容,有两种类型:一是段落(paragraph)另一个是块引用(blockquote)。在HTML中段落是P元素的开始标记和结束标记之间的内容。默认有半英寸的的缩进。块引用是网页引用了其他人的文本内容1. 换行并开始新段落添加额外的空白空间,而不自成一个段落,即换行不成段(如果是文字,首行不会缩进)可用BR标记。BR(break row)只有开始标记,没有内容和结束标记。与换行相对应的就是防止换行,即一串串词在同一行中。如要保证March 2012不自动换行,可在March和2012之间插入一个不可打印字符不可分的空格实体,如March & nbsp; 2012或March 2012。2. 添加水平线水平线能够使网页增色,常用于页面和脚注文本(footer text)之间,而且它与网页内容没有特别联系。水平线HR(Horizontal Rule)元素也只要开始标记,没有内容和结束标记。3. 创建列表列表就是带项目符号编号内容,在HTML中存在三种类型的列表u 带加重号列表(bulleted list),也称为无序列表(Unordered list)u 编号列表,也称为有序列表(Ordered list)u 自定义列表(Definition list)一个无序列表由UL元素创建,列表中的每个项目由LI元素实现,如:/*项目符号有:disc(实心圆) circl(空心圆) square(方块)*/项目一项目二项目三 注意:UL元素有开始标记和结束标记,之间的内容是列表的每个条目;LI元素有开始标记,结束标记是可选的。列表可以嵌套。编号列表使用OL元素(有序列表)如下:项目一项目二项目三 其中,Type:设置列表的序号类型,常用序号如下:n=1:用数字作为序号。n=A;用大写字母作为序号。n=a:用小写字母作为序号。n=I:用大写罗马数字作为序号。n=i:用小写罗马数字作为序号。Start:为可选参数,用于设置序号的起始数值。如不添加“start”则从每类序号的第一个序号开始。自定义列表用得不多,它由三部队组成:自定义列表(definition list, DL)元素、自定义术语(definition term, DT)元素和自定义描述(definition description, DD)元素三. 添加链接链接是超文本的具体实现,可以用A元素(Anchor,即锚(mo)元素),即有开始标记,也有结束标记。对于链接,热文本(即点击之后能够跳到其它地方去的文本)内容是必需的。而链接目标(要跳转到的位置),即锚点是可选的,但最好有。1. 添加内部链接:即同一个网页上的跳转。必须先建立一个锚点(即链接目标点)(光标先定位在那儿)如下:这是书签的位置这里name属性的值是我们赋给它的(锚点bookmarklet中间不能有空格)。现在,我们就可以创建从同一网页的其他地方跳转到前面已命名的锚点上了:在本页HTML文档中这里是热点处单击这个高亮度显示的词“这里是热点”就会跳转到那个书签位置。这里href(hypertext reference,超文本引用、超链接)属性的值是被链接资源,即目的地,在这里,其值是前面定义的书签名前加一个磅符号#,在其值之前加“#”符号,表示所使用的映像位于当前文档内。2. 添加外部链接:链接到网页之外的地方,如其它网站,其它文件和电子邮件地址等,如:链接到网站:这里是热点“这里是热点”还可用图片来代替,即热点可以是图形、图片。如添加mailto链接:Contact me at ,这样将弹出一个邮件窗口,就可以发邮件了。四. 添加多媒体(图形、图像)在网页中加入多媒体的方式有两种:内联(inline)(嵌入式)和非内联产(out-of-line),能够确保访问者可以看到或听到多媒体的惟一方式是内联。访问网页的人可以不采取任何附加的操作就可以看到或听到内联元素;需采取额外的操作,如单击一个图片或启动一个插件(plug-in)才能看或听的元素称为非内联元素。Web支持的图像格式一般有GIF(Graphic Interchange Format,可交换的图像文件或Graphic Interface Format,图形接口格式)、JPEG(Joint Photographic Experts Group,联合图象专家组)、PNG(Portable Network Graphic,可移植的网络图象文件格式)三种,所以我们对图片处理后要保存为这三种格式中的任何一种,这样才可以在浏览器中看到。插入嵌入式图象的标签是,其格式为:src(source s:s 来源;原始资料;水源)属性指明了所要链接的图像文件地址,这个图形文件可以是本地机器上的图形,也可以是位于远端主机上的图形。IMG还有两个属性是height和width,分别表示图形的高和宽。通过这两个属性,可以改变图形的大小,如果没有设置,图形按原大显示:例,或图形与文字的对齐排列:由IMG中的align属性来设置,有以下几种:top、middle、buttom、textop、abeline、left、right。图文之间的距离设置:图形水平位置的配置,可由hspace属性来完成,其垂直位置的配置,由vspace来完成。图形链接:图形链接就是使用者通过在图形上单击,就能连接到某个地址上去。其基本格式如下:。这里alt(alter :lt 改变,更改,修改。键盘上也是这个单词,在网页中译成“替换”)属性的作用是,万一图像不可见,则可以用文字来说明该图像。另外,不推荐使用这种格式,而最好是使用样式表。五. 添加音频1. 添加要被下载的音频(链接到音频文件):下载十面埋伏2. 在网页中嵌入音频文件:3. 在网页加入背景音乐:或(不一定成功)六. 添加视频:同五。添加背景图片格式为:七. 添加Flash:用OBJECT元素,请参考在Frontpage或dreamweaver的插入情况。补充内容一.HTML中BASE基地网址标记是什么意思? 定义及用法标签的作用是为页面上的所有链接定义默认地址或默认目标。即定一个全局的样式,后面的相对路径会以这个地址为基准。标签应放在里。比如:这里的href,有些用url(Uniform Resource Locator,统一资源定位符:简单地讲就是网络上的一个站点、网页的完整路径)来代替。W3Schools注意:我们仅为这个图像指定了相对地址。因为我们已经在中指定了基准URL,所以浏览器将去/images/stickman.gif读取图像。注意:虽然这个链接没有定义target=_blank,但仍将在新窗口中打开。这是因为元素的“target”属性为“_blank”。即创建不离开主页的链接。二.Robots.txt文件当一个搜索引擎自动机试图指向一个站点时,它要查找一个名为robots.txt文件。这个文件名是区分大小写的,而且必须是小写的。如果搜索引擎自动机找到这个文档,它就在这个文档中查找指令,这些指令是用来说明在那个它有指示权限的站点上有哪些文档。robots.txt文件可以禁用某个特定的搜索引擎,也可以保护特殊目录不被指示。robots.txt文件中以编号符号(#)开头的条目是给人看的(不是必须的);星号(*)表示跟在后面的文本适用于所有搜索引擎;“Disallow:”命令告诉自动机它不能指向跟在后面的内容,可以是整个文件夹或者是网页(要拦截的网页);User-Agent是搜索引擎程序的名称。在robots.txt文件中,空白行只允许出现在记录之间。robots.txt文件必须保存在顶级目录(根目录),因为它是很多搜索引擎将要寻找的第一个网页文件。robots.txt文件的格式如下: User-agent: 定义搜索引擎的类型 Disallow: 定义禁止搜索引擎收录的地址 Allow: 定义允许搜索引擎收录的地址 我们常用的搜索引擎类型有: (User-agent区分大小写) google蜘蛛:Googlebot 百度蜘蛛:Baiduspider yahoo蜘蛛:Yahoo!slurp alexa蜘蛛:ia_archiver bing蜘蛛:MSNbot altavista蜘蛛:scooter lycos蜘蛛:lycos_spider_(t-rex) alltheweb蜘蛛:fast-webcrawler inktomi蜘蛛: slurp Soso蜘蛛:Sosospider Google Adsense蜘蛛:Mediapartners-Google 有道蜘蛛:YoudaoBot robots.txt文件的写法User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符 Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录 Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录 Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录 Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以.htm为后缀的URL(包含子目录)。 Disallow: /*?* 禁止访问网站中所有的动态页面 Disallow: /jpg$ 禁止抓取网页所有的.jpg格式的图片 Disallow:/ab/adc.html 禁止爬去ab文件夹下面的adc.html文件。 Allow: /cgi-bin/这里定义是允许爬寻cgi-bin目录下面的目录 Allow: /tmp 这里定义是允许爬寻tmp的整个目录 Allow: .htm$ 仅允许访问以.htm为后缀的URL。 Allow: .gif$ 允许抓取网页和gif格式图片 robots.txt文件用法举例例1. 禁止所有搜索引擎访问网站的任何部分 User-agent: * Disallow: / 实例分析:淘宝网的 Robots.txt文件 User-agent: Baiduspider Disallow: / User-agent: baiduspider Disallow: / 很显然淘宝不允许百度的机器人访问其网站下其所有的目录。 例2. 允许所有的robot访问 (或者也可以建一个空文件 “/robots.txt” file) User-agent: * Allow: 例3. 禁止某个搜索引擎的访问 User-agent: BadBot Disallow: / 例4. 允许某个搜索引擎的访问 User-agent: Baiduspider allow:/ 例5.一个简单例子 在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。 需要注意的是对每一个目录必须分开声明,而不要写成 “Disallow: /cgi-bin/ /tmp/”。 User-agent:后的*具有特殊的含义,代表“any robot”,所以在该文件中不能有“Disallow: /tmp/*” or “Disallow:*.gif”这样的记录出现。 User-agent: * Disallow: /cgi-bin/ Disallow: /tmp/ Disallow: /joe/ Robot特殊参数: 允许 Googlebot: 如果您要拦截除 Googlebot 以外的所有漫游器不能访问您的网页,可以使用下列语法: User-agent: Disallow:/ User-agent:Googlebot Disallow: Googlebot 跟随指向它自己的行,而不是指向所有漫游器的行。 “Allow”扩展名: Googlebot 可识别称为“Allow”的 robots.txt 标准扩展名。其他搜索引擎的漫游器可能无法识别此扩展名,因此请使用您感兴趣的其他搜索引擎进行查找。“Allow”行的作用原理完全与“Disallow”行一样。只需列出您要允许的目录或页面即可。 您也可以同时使用“Disallow”和“Allow”。例如,要拦截子目录中某个页面之外的其他所有页面,可以使用下列条目: User-agent:Googlebot Disallow:/folder1/ Allow:/folder1/myfile.html 这些条目将拦截 folder1 目录内除 myfile.html 之外的所有页面。 如果您要拦截 Googlebot 并允许 Google 的另一个漫游器(如 Googlebot-Mobile),可使用”Allow”规则允许该漫游器的访问。例如: User-agent:Googlebot Disallow:/ User-agent:Googlebot-Mobile Allow: 使用 * 号匹配字符序列: 您可使用星号 (*) 来匹配字符序列。例如,要拦截对所有以 private 开头的子目录的访问,可使用下列条目: User-Agent:Googlebot Disallow:/private*/ 要拦截对所有包含问号 (?) 的网址的访问,可使用下列条目: User-agent:* Disallow:/*?* 使用 $ 匹配网址的结束字符 您可使用 $ 字符指定与网址的结束字符进行匹配。例如,要拦截以 .asp 结尾的网址,可使用下列条目: User-agent:Googlebot Disallow:/*.asp$ 您可将此模式匹配与 Allow 指令配合使用。例如,如果 ? 表示一个会话 ID,您可排除所有包含该 ID 的网址,确保 Googlebot 不会抓取重复的网页。但是,以 ? 结尾的网址可能是您要包含的网页版本。在此情况下,可对 robots.txt 文件进行如下设置: User-agent:* Allow:/*?$ Disallow:/*? Disallow:/ *? 一行将拦截包含 ? 的网址(具体而言,它将拦截所有以您的域名开头、后接任意字符串,然后是问号 (?),而后又是任意字符串的网址)。 Allow: /*?$ 一行将允许包含任何以 ? 结尾的网址(具体而言,它将允许包含所有以您的域名开头、后接任意字符串,然后是问号 (?),问号之后没有任何字符的网址)。 Robots Meta标签Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots Meta标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots Meta标签也是放在页面中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。 Robots Meta标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。 index指令告诉搜索机器人抓取该页面; follow指令表示搜索机器人可以沿着该页面上的链接继续抓取下去; Robots Meta标签的缺省值是index和follow,只有inktomi除外,对于它,缺省值是index、nofollow。目前,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于RobotsMETA标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。词汇积累:consort kns:t vi. 结交;陪伴;符合; vt. 使结合;使联系 n. 配偶;伙伴consortium kns:tjm n. 财团;联合;合伙内容五 网页的布局网页设计必须着重考虑访问者会对你的网站有什么感觉。它应该实现一致性、可预测性、可导航性,并用在体现一个明确目的的基础上具有良好的视觉效果和交互性。把设计重点放在主题上,紧扣主题,但应该简洁明了,不应有太多的不同的内容。特别不要被图形、字体、颜色、动画等冲淡主题(即不要陷入诱惑)。一个网站大致可以包含三种页面:欢迎页面、链接页面和终结页面(内容网页)。一致性:外壳或模板(外壳一词比模板要准确一些,因为传统模板总是包含一些格式信息,而现在的网页设计中常将格式信息都用CSS抽取出来了,剩下的只是一个网页的外壳)可以提供一致性,如相同的外观、相同的段落缩进、相同的段前、段后间距及相同的图片等。可预测性:没有人真正喜欢惊奇,网页中的元素应该按照访问都期待的那样显示出来。如不要把链接的颜色(一般是蓝色带下划线)定义为与其他文本的颜色相同,否则访问者就不知道要去点击它。同样,虽然精细一些是很好的,但也不能将图形映像中的按钮造作得太精细。否则也没有人会想到要去点击它。可导航性:这是战术问题,导航栏可以是文本、表格中的文本或图形映像,导航栏应该出现在每个页面的相同位置上。目前,很多网
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 扑火队员安全消防培训课件
- 2024年黑龙江省绥化市中考语文真题及答案解析
- 2025年广西焊工证考试试题及答案
- 2025年韩语考试题目解释及答案
- 慢性便秘课件
- 重庆历史中考试题及答案
- 权威认证考试题及答案
- 恪尽职守廉洁奉公课件
- 恐怖的安全培训课件
- 江苏海关考试题目及答案
- 外委人员管理办法
- 《国家基层肥胖症综合管理技术指南(2025)》解读
- 邮储银行招聘考试笔试试题集及参考答案
- 投标部奖罚管理办法
- 补充耕地后期管护方案(3篇)
- 设备设施运行台账教学幻灯片
- 健康四大基石科普讲座
- 护士培训班自我介绍
- 封路店铺经营补偿方案
- 2025深入贯彻中央八项规定精神学习教育测试题和答案
- 音乐人工智能应用-洞察阐释
评论
0/150
提交评论