网站 sitemap.xml 制作指南

Sitemap.xml是一个网站的地图,是用xml写的,sitemap有自己的书写标准。提交sitemap有利于搜索引擎抓取网站内,能有效的提高被搜索引擎收录的效率。

下面是一个网站创建Sitemap.xml的创建指南。

sitemap.xml格式

sitemap完整格式如下:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.9" >
    <url>
        <loc>https://www.aiyanshe.com/site/net_hanziyuan</loc>
        <lastmod>2024-10-07T03:07:11+00:00</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    ...
</urlset>

loc

页面链接地址,也就是你希望蜘蛛访问的地址。在地址中出现的某些特殊字符需要使用转义字符。

lastmod

页面最后修改时间,搜索引擎会在索引此链接前先和上次索引记录的最后更新时间进行比较,如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次索引时的内容有所改变,应该更新该时间,让搜索引擎下次索引时会重新对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:

年:YYYY(2008)
年和月:YYYY-MM(2008-06)
年月日:YYYY-MM-DD(2008-06-04)
年月日小时分钟:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)
年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)
TZD指定就是本地时间区域标记,像中国就是+08:00了

changefreq

页面内容更新频率。这里可以用来描述的单词共这几个:"always", "hourly", "daily", "weekly", "monthly", "yearly"。

priority

相对于其他页面的优先权,定于0.0 - 1.0之间。建议将各类网页根据重要性给出不同的数值,以方便蜘蛛的采集,不要耍小聪明全部写1.0。

提交 sitemap.xml

Sitemap.xml制作完成后,就需要将xml文件提交到相关搜索引擎。

网站地图是否符合标准,最方便的手段就是使用google的管理员工具,这个工具就会将详细的分析结果反馈回来,包括:sitemap.xml中包含了多少地 址,google已将多少地址加入索引,sitemap.xml中出现了哪些错误,甚至蜘蛛采集过程中遇到的各种问题,比如哪些网页有404,500错误 都会详细的罗列出来。

如果提交的xml格式正确,url可以正常访问,等待搜索引擎蜘蛛来爬取就可以了。

我的笔记