当前位置:首页 > 网站建设

教你创建Google网站地图Sitemap.xml

时间:2018-02-10 22:00:00来源:网站建设作者:seo实验室小编阅读:112次「手机版」
 

谷歌网站地图

sitemap.xml是Google搞出来的,也就是网站地图,不过这个网站地图是用xml写的,而且要按google的标准来写,并且要将写出来的这个文件sitemap.xml上传到自己的服务器空间中去。目前,Google, Yahoo, MSN都已经声明支持这种格式,Baidu还没有声明支持,但估计走这一步也是大势所趋。这将是向众多搜索引擎提供你网站信息的一种很好的方法。   提交sitemap一是有利于搜索抓取一些正常抓取过程中无法抓取的网址,比如动态网页,包含大量AJAX的网页或者flash的页面。二是为搜索蜘蛛指明“工作方向”。Sitemap就是你网站上页面的列表,googlebot就按照这个去一个个的抓取收录页面,显然比它自己去?#19968;?#25928;率高,而且要全。Google网站上有完整的关于sitemap.xml的详细说明:

HTTP://www.google.com/support/webmasters/bin/answer.py?answer=40318&hl=zh_CN

但很多站长看后仍然不会操作,下面这个教程就是手把手教会你创建Sitemap.xml。

<!--[if !supportLists]-->1. <!--[endif]-->Sitemap.XML 的格式

完整格式如下:

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

<url>

<loc>http://www.yrtrip.com/default.asp</loc>

<lastmod>2008-07-17</lastmod>

<changefreq>daily</changefreq>

<priority>1.0</priority>

</url>

<url>

<loc> http://www.yrtrip.com/search2.asp?id=32003044&amp;sq=1</loc>

<lastmod>2008-07-17</lastmod>

<changefreq>weekly</changefreq>

<priority>0.9</priority>

</url>

</urlset>

下面,对以上标签分别加以解释

<!--[if !supportLists]-->a) <!--[endif]--><?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

这两行就相当于网页文件中的<HTML>标签一样的作用。不必管这两行什么意思,照抄即可。

切记:一个?#22336;?#20063;不能错,即使多一个空格,google网站采集时也会报错。另外,千万别忘了在文件的末尾加上</urlset>标签。

<!--[if !supportLists]-->   b) url:每个标签包含一个网页地址,是以下标签的父标签。

c) http://www.yrtrip.com/default.asp

这里是页面链接地址,也就是你希望蜘蛛访?#23454;?#22320;址。

切记:在地址中出现的某些特殊?#22336;?#38656;要使用转义?#22336;?/a>,否则,google也会报错。最典型的就是 & 号,经常在动态网址中出现,在提交地址中必须写成 & 如:提交http://www.yrtrip.com/search2.asp?id=32003044&sq=1,google管理员工具就会报错,而改为 http://www.yrtrip.com/search2.asp?id=32003044&sq=1提交后就没有问题了。我看到网上有人说sitemap.xml只能提交一个?#38382;?#30340;网页的说法,其实多半是因为没有使用转义?#22336;?#32780;导致出错的。其他的转义?#22336;?#23601;不一一列出了,大家可以在网上查。

d) lastmod:页面最后修改时间

这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行 比?#24076;?#22914;果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新 对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:

年:YYYY(2008)

年和月:YYYY-MM(2008-06)

年月日:YYYY-MM-DD(2008-06-04)

年月日小时?#31181;櫻篩YYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)

年月日小时?#31181;用耄篩YYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)

这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了

切记:其他格式可能引起出错,比如将2008-08-08 写成2008-8-8就会出问题。

e) changefreq:页面内容更新频率。

这里可以用来描述的单?#20351;?#36825;几个:"always", "hourly", "daily", "weekly", "monthly", "yearly",具体含义我就不用解释了吧,光看单?#23454;?#24847;思就明白了

f) priority:相对于其他页面的优先权

定于0.0 - 1.0之间 。

切记:建议将各类网页根据重要性给出不同的数值,以方便蜘蛛的采集,不要耍小聪明全部写1.0,google管理工具会报错的。

2. Sitemap.xml制作方式

制作方式无非两种,自动方式和手动方式。

自动方式一般使用生成工具自动生成,只需输入自己的网址,就可以得到完整的xml文件。这种方式一般适用于静态网站,在此不再赘述。但需要提醒的是,网上的工具良莠不齐,生成的文件经常?#20889;?#35823;,不一定能通过google的校验,使用者需认真辨别。

手工方式则是由站长手工填写或写程序完成均可,代码很简单,大家可以到网上查找。

3. 提交

Sitemap.xml制作完成后,就需要将xml文件提交到相关搜索引擎。

Google提交网址:http://www.google.com/webmasters/sitemaps/?hl=zh-CN

Yahoo提交网址:http://sitemap.cn.yahoo.com/

提交后,一般在几个小时之内,系统就开始下载处理了。

4. Sitemap.xml的校验

至于你的网站地图是否符合标准,最方便的手段就是使用google的管理员工具了。

在他下载你的sitemap.xml后几天内,这个工具就会将详细的分析结果反馈回来,包括:sitemap.xml中包含了多少地址,google已将多少地址加入索引,sitemap.xml中出现了哪些错误,甚至蜘蛛采集过程中遇到的各种问题,比如哪些网页有404,500错误都会详细的罗列出来,非常方便。

如果你提交的xml文件一切无误,那么接下来,你就是等着让它的搜索蜘蛛来爬了,sitemap的文件告知了文件更新的频率,这样搜索蜘蛛来得更勤快,页面被收录当然也就更快。

5分半钟:Google网站地图 Sitemap.xml

相关阅读

cer, pfx 创建,并且读取公钥/密钥,加解密 (C#程序实现)

http://blog.csdn.net/zj510/article/details/39964533PKI技术(public key infrastructure)里面,cer文件和pfx文件是很常见的。通常c

洛阳地图

洛阳附近山脉洛阳附近河流洛阳皇陵位置洛阳宫?#19988;?#22336;位置

小技巧教你解决此windows副本不是正版的问题

最近有很多朋友都说,在安装完win7系?#25345;?#21518;,却出现了?#25353;藈indows副本不是正版”的问题,我们该怎么解决这个问题呢?今天就教大家如何解

什么是数组、如何创建数组、数组?#25345;怠?#25968;组增加一个新

一起组团(什么是数组)我们知道变量用?#21019;?#20648;数据,一个变量只能存储一个内容。假设你想存储10个人的姓名或者存储20个人的数学成绩,就需

地图产品:如何提高搜索效率?

在用户的?#29616;?#27169;型中,“用地图搜索地点”是一个简单到无感知的操作,总共分两步:输入关键字,找到目标地点(比关大象还简单)。就是这简单的

分享到:

栏目?#24049;?/h2>

推荐阅读

?#35753;?#38405;读

疯狂麻将试玩