西安经发国际会馆:网站地图应用完全解析

来源:百度文库 编辑:九乡新闻网 时间:2024/04/26 11:05:08


通过一个单独页面或者一个单独的区域将网站的全部重要内容都展示出来,不仅可以让用户对网站的结构一目了然,还可以让蜘蛛进行更充分的、更容易的爬行。所以,无论站点大小都应该拥有一个网站地图,这也是搜索一直建议的做法。

网站地图分根据形式不同可以分为两种:

HTML网站地图(sitemap)

HTML网站地图是用户可以直接看到的网站地图,一般单独通过一个页面将网站所属的全部分类和重要内容以列表形式全部展示出来。对于大型网站来说这相当重要,大量内容显然无法通过导航系统得到充分的展示;对于小网站来说通过网站地图甚至可以将站内所有的内容全部展示出来,但这种情况下通常导航系统的作用没有区别,都可以将网站内容得到充分的展示。

XML网站地图(Sitemap)

这是提供给搜索引擎读取的网站地图,最早是由谷歌于2005年提出,2006年微软、雅虎都表示支持,现在百度也表示支持,另外在2007年所有搜索引擎都开始支持robots文件制定网站地图位置。

Sitemap的制作

XML版本网站地图当然是由XML制作而成,并且必须是UTF8编码。实际上Sitemap就是列出网站所有需要被收录的URL的页面,只是格式是XML格式。其目的是提供给搜索引擎读取,作为搜索引擎了解网站结构和页面内容变化的辅助资料。当然其中所列的信息并不会被搜索引擎完全接受,这和页面宁日一样,不是你说它是什么就是什么的问题。另外有些人说,小型为搜索引擎提供Sitemap不但不能产生积极作用,反倒有负作用,当然,这种说法的也不是可靠的。

一个标准的XML网站地图示例如下:

1 2 3 4 5 6 7 8 9 xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/scgenas/sitemap/0.9">   <url>          <loc>http://www.example.com/loc>          <lastmod>2011-3-25lastmod>          <changefreq>monthlychangefreq>          <priority>0.8priority>   url> urlset>

标签解释如下:

urlset

必须具备,声明文件所使用的Sitemap协议版本

loc

必须具备,包含页面完整的URL

lastmod

必须具备,标识页面最后更新时间

changefreg

可选标签,标识文件的更新频率。该标签的值如下:

  • always: 一直变动,指每次访问页面的内容都不同
  • never:  从不改变
  • yearly:  每年
  • monthly:  每月
  • weekly:  每星期
  • daily:  每天
  • hourly:  每小时

priority

可选标签,标识页面URL的相对重要程度。其值在0.0-1.0之间,0.0表示最低,0.5是默认。

XML网站地图文件最多可列出5万个URL,文件大小不能超过10MB,超出部分可以用另外一个XML文件进行列出,并通过其中一个文件进行索引。一个网站最多可以列出1000个XML网站地图,所以总共可以列出5000万个URL地址。

Sitemap的提交

制作好的XML网站地图可以通过各大搜索引擎的网站管理员工具进行提交。百度在即将开放注册的站长开放平台中也将提供这个功能。

另外一个更简易的方式就是在网站根目录的robots.txt文件中之间通知到访的搜索引擎XML网站地图所处的位置,并且所有主流搜索引擎都支持,包含谷歌、雅虎、微软、百度。代码如下所示:

1 Sitemap: http://www.example.com/sitemap.xml

最后再次强调,向搜索引擎提供网站地图只是辅助搜索引擎蜘蛛对网站进行抓取,并不能左右它的行为。所以对网站的收录只能提供些许改善作用。