Python爬虫丨HTML基础_第1页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、python爬虫丨html基础html是什么?html(hyper text markup language)是用来描述网页的一种语言,也叫超文本标志语言。html文档就是前端工程师设计网页时用法的语言,扫瞄器会按照html文档的描述,解析出它所描述的网页。查看网页的html代码打开风变编程教学网站:在网页随意地方点击鼠标右键,然后点击"显示网页源代码"。(windows系统的快捷键crtl+u)。扫瞄器会弹出一个新的标签页在网页空白处点击右键,然后挑选检查(快捷方式ctrl+shift+i)。点击后的效果注:标亮的部分就是网页的html代码将鼠标放在htm

2、l源代码上,左边网页上有一些内容会被标量。这其实就是这行代码所描述的网页内容,一左一右,互相对应。html的层级html源代码和网页,就像建造图制和房子。房子有不同楼层所组成,每一层中,都会包含一些房间,一个房间还可能划分几个更小的房间,每个小房间是由门、窗、墙壁、地板等等构建组成的。html源代码中有一些小三角,每一个三角形都可以绽开或合上。每一个可以绽开和合上的小三角形里包含的内容,都是一个层级,它很像电脑中一层一层的文件夹。html的组成标签和元素实例尖括号中间的字母,就叫做标签。标签通常是成对浮现的:前面的是开头标签,例;后面的是结束标签,如。常见元素:注:html标签是可以嵌套标签的

3、,而且可以多层嵌套。网页头和网页体html文档的基本是有网页头和网页体组成的html文档的最外层标签一定是,里面嵌套着元素与元素。元素代表了网页头,元素代表了网页体。网页头里面的内容定义了html文档的字符编码。元素定义网页的标题而网页体,就是显示在网页中的内容了。网页体中依次有四个内容:元素代表一级标题,元素代表二级标题等等 。然后元素,代表段落文本。属性html标签可以通过设置属性来为html元素描述更多信息实例这行代码给元素添加了一个style属性,属性中的内容规定了这行文字的色彩。style属性可以用来定义网页文本的样式,比如字体大小、色彩、间距、对齐方式等等。href属性&m

4、dash;—添加链接除了style和href,html中还有两个很常用的属性,即class与id。实例元素的内容,是对.book网页布局的详细描述.book中的.对应class。因此,网页头中的.book和网页体中的class=&39;book&39;是有联系的。在网页头里面,定义了class属性,属性值为&39;book&39;,然后下面一长串代码是对这个class属性的描述;接着再再网页体中调用,所以看到了。类似建造师会做门表图,规定好每一种门的具体尺寸和样式,然后给每个门都起个名字。网页头的元素中定义了.book的样式,因此,凡是cla

5、ss=&39;book&39;的元素都会继承它的样式。id属性和class属性的使用类似,给元素定义id和class的目的都是为了查找、定位元素,或者为元素设置样式。而id属性用于表示唯一的元素,而class用于标识一系列的元素。常用html属性总结一起来读html点击url:网页中点击右键——检查在网页头中定义了编码、选项卡之类的内容,里面的元素也定义了一些样式。网页体,点击三角符号折叠,内部的结构网页体有三大部分,元素的部分,元素的部分,和元素的部分。三部分分离是:顶部的标题、中间的内容、以及底部。首个元素是网页的顶部标题:id=&a

6、mp;39;header&39;然后是元素,对应的是中间的正文部分。底部对应着的继续点开html的元素,折叠三角符号元素分为两部分,分离是对应着网页中间的左边栏和正文部分。第一个元素,id=&39;nav&39;,对应着侧边栏。可以看到元素中,包含了三个元素,内容是:科幻小说、人文读物、技术参考。其次个元素对应着右边正文部分,id=&39;main&39;在中,又包含了三个元素,它们都用同样的属性。每个元素分离介绍了一本书的内容。修改网页打开网页,点击开发者工具的左上角点击它,然后再把鼠标放在网页中,和点击源代码的情景相反,当数标放在网页上,右边代码区中描述它的代码会被标亮出来。这是以后要常常用到的功能,用来定位所要查找的网页内容的源代码。通过修改html源代码,是可以修改网页的。实例:修改网页的标题把鼠标放在网页"这个书苑不太冷",看到网页源代码中,标题所在的这个元素被标亮了,接下来修改这里的内容。把鼠标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论