技术改变生活

sitemap

随笔来源: 991℃

sitemap就是我们常说的网站地图,网站地图是用来帮助搜索引擎快速全面抓取网站所有链接的一个引导性文件,补充网站内链的不足。网站地图要求包含网站所有希望被收录的页面链接,有三种格式:xml格式的网站地图、html格式的网站地图和txt格式的网站地图。

以上三种sitemap中xml的网站地图是搜索引擎最喜欢的,它的读取效率最高,其次是txt格式的,最后是html的,不过html格式的网站地图即可以帮助搜索引擎蜘蛛索引链接,也可以为用户提供指引。

我们通常用谷歌的sitemap当成xml网站地图的标准。下面我们一起来看看Google Sitemap的规则和写法。

Google SiteMap Protocol是Google自己推出的一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所升级。在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于Google网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括链接地址、更新时间、更新频率和索引优先权。[1]
<urlset xmlns=“网页列表地址”>
<url>
<loc>网址</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>网址</loc>
<lastmod>2005-06-02T20:20:36Z</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>

其中:

changefreq表示页面内容更新频率。
lastmod表示页面最后修改时间
loc表示页面永久链接地址
priority表示相对于其他页面的优先权
url表示相对于前4个标签的父标签
urlset表示相对于前5个标签的父标签

通常情况下我们把网站的xml网站地图放在网站根目录wwwroot下,当然也可以不放在这里,但是一定要在robots.txt蜘蛛文件中放上网站地图的url地址。这样可以让搜索引擎第一时间找到该网站地图进行索引。

网站日常要更新,网站地图也要及时添加网站新的URL链接。不然网站地图就起不到它应有的作用了哦!

转载请注明本文地址:/350.html

若非注明,本站所有文章版权均为谢比特所有,转载本站文章请注明出处!