因为最近在学习爬虫,那么在爬取网页内容时,就要求我们能够简单的看懂这个网页的基本结构,才能更好的去爬取我们所需要的内容。
这篇随笔也只是简单的说明了一些标签的含义。
标签关系
包含关系
eg:<head>
<title></title>
<head>
并列关系
<head></head>
<body></body>
标签名 | 标签定义 | 说明 | |
<html></html> | HTML标签 | 根标签 | |
<head></head> | 文档的头部 | ||
<title></title> | 文档标题 | ||
<body></body> | 文档的主体 | ||
<h1></h1> --<h6></h6> |
标题标签 | 重要性递减 | |
<p></p> | 段落标签 | ||
<br/> | 换行标签 | 单标签 | |
<div></div> <span></span> |
容器盒子 | 用来存放内容 | |
<img src = ""> | 图像标签 | src是必须属性 | |
<a href = ""> | 超链接标签 | href是必须属性 | |
<table> <tr>行标签 <td> </tr> <table> |
表格标签 | 用于表格的标签 |
<table></table>是用于表格的标签
<tr></tr>行标签,嵌套在<table></table>标签当中
<td></td>单元格
表格的结构标签
<thead>表格的头部区域
<tbody>表格的主体区域
<thead><.thead>定义表格的头部
<tbody></tbody>定义表格的主体
列表标签
1.无序列表
<ul>
<li>列表1</li>
<li>列表2</li>
</ul>
2.有序列表
<ol>
<li>列表1</li>
<li>列表2</li>
</ol>
3.自定义列表
<dl>
<dt>定义名词1</dt>
<dd>名词1解释</dd>
</dl>