怎样优化XML格式的网站地图
资源介绍
怎样优化XML格式的网站地图?创建站点地图是优化任何网站的重要部分。
Sitemaps 不仅为搜索引擎提供了你的网站布局的蓝图,而且还可以包含有价值的元数据,例如:
每页的更新频率。
当他们后一次改变的时候。
页面之间的关系是多么重要。
站点地图对于网站来说尤其重要:
包含许多未链接在一起的存档内容。
缺乏外部链接。
有成百上千页。
顾名思义,这些文件为搜索引擎机器人提供了一个站点地图,帮助搜索引擎机器人发现和索引重要的页面。
在本文中,我将讨论为搜索引擎和访问者创建和优化站点地图所需要的重要的技巧。
1. 使用工具和插件自动生成站点地图
当你拥有合适的工具时,生成站点地图是很容易的,比如使用内置的 XML sitemap 生成器或类似百度 XML Sitemaps 的流行插件的审计软件。
事实上,已经在使用 蜂锐建站系统 的网站可以直接在插件中启用 XML 站点地图。
或者,你可以通过遵循 XML sitemap 代码结构手动创建 sitemap。从技术上讲,你的站点地图甚至不需要使用 XML 格式 —— 一个带有新行分隔的文本文件就足够了。
但是,如果要实现 hreflang 属性,则需要生成完整的 XML sitemap,因此让工具为你工作更容易。
访问百度官方页面,了解更多关于如何手动设置站点地图的信息。
2. 提交你的站点地图到百度
你可以从百度站长平台提交你的站点地图到百度。在你的指示板中,点击抓取 < Sitemaps < 添加测试站点地图。
测试你的站点地图,并在单击“提交”之前查看结果,以检查可能阻止关键着陆页面被索引的错误。
理想情况下,你希望索引的页面数与提交的页面数相同。
请注意,提交你的 sitemap 告诉百度,前提是你认为是高质量以及值得索引的页面,但是这并不能保证它们将被索引。
相反,提交网站地图的好处是:
帮助百度了解你的网站是如何布局的。
发现错误,你可以纠正,以确保你的页面被正确地索引。
站点地图
3. 在站点地图中优先考虑高质量的页面
说到排名,整体的网站质量是一个关键因素。
如果你的站点地图将搜索引擎机器人引导到数千个低质量的页面,搜索引擎会将这些页面解读为一个标志,表明你的网站可能并不是一个访问者想要访问的网站 —— 即使你的站点需要页面,比如着陆页面。
相反,试着把搜索引擎机器人引导到你网站上重要的页面。理想情况下,这些页面是:
高度优化的。
包括图片和视频。
有很多独特的内容。
通过评论和反馈提示用户参与。
4. 隔离指数化问题
如果搜索引擎机器人没有索引所有页面,那么百度站长平台可能会有点令人沮丧,因为它没有告诉你哪些页面有问题。
例如,如果你提交了 20,000 个页面,其中只有 15,000 个页面被编入索引,那么你就不会被告知 5000 个“问题页面”是什么。
这对于大型电子商务网站来说尤其如此,因为这些网站有很多类似的产品。
我建议将产品页面拆分为不同的 XML 站点,并对它们进行测试。
创建可以肯定假设的站点地图,比如“没有产品图片的页面没有被索引”或者“没有唯一副本的页面没有被索引”。
当你隔离了主要问题时,你可以解决问题,或者将这些页面设置为“noindex”,这样它们就不会降低你的整体站点质量。
更新:百度站长平台近更新了索引覆盖率。特别是,现在列出了问题页面,以及为什么百度没有索引一些 url 的原因。
5. 在站点地图中只包含 URL 的规范版本
当你有多个非常相似的页面时,比如同一产品的不同颜色的产品页面,你应该使用“link rel=canonical”标签来告诉百度,该页面是它们应该抓取和索引的“主要”页面。
如果不包含指向其他页面的规范 URL 的页面,就可以更容易地发现关键页面。
6. 使用 Robots 元标签尽可能替代 Robots.txt
当你不想要一个页面被索引时,你通常希望使用元机器人“noindex,follow”标记。
这阻止了百度对页面进行索引,并且它保留了你的链接资产,它对那些对你的站点很重要但不应该出现在搜索结果中的实用页面特别有用。
你唯一想使用 robots.txt 去阻止搜索引擎抓取页面是当你在消耗你的抓取预算时。
如果你注意到百度正在重新抓取并索引相对不重要的页面(例如,单独的产品页面),那么你可能想要使用 robots.txt。
站点地图
7. 不要在站点地图中包含“noindex”url
说到浪费的爬行预算,如果搜索引擎机器人不被允许索引某些页面,那么他们就没有业务在你的站点地图。
当你提交一个包含阻止和“noindex”页面的站点地图时,你同时告诉百度“你索引的页面非常重要”和“你不允许索引这个页面”。
缺乏一致性是一个常见的错误。
8. 为大型站点创建动态 XML Sitemaps
在大型网站上,几乎不可能跟上所有的元机器人。
相反,你应该设置规则逻辑来决定何时将页面包含在 XML sitemap 中,或者从 noindex 更改为“index,follow”。
你可以找到关于如何创建动态 XML sitemap 的详细说明,并且,在为你生成动态 sitemaps 的工具的帮助下,这一步变得更加容易。
9. 使用 XML Sitemaps & RSS / Atom 提要
RSS / Atom 提要在更新页面或向网站添加新内容时通知搜索引擎。百度推荐使用 sitemaps 和 RSS / Atom 提要来帮助搜索引擎了解应该对哪些页面进行索引和更新。
通过在 RSS / Atom 提要中添加近更新的内容,你将使搜索引擎和访问者更容易找到新鲜内容。
10. 只有在进行重大更改时才更新修改时间
不要试图通过更新修改时间来让搜索引擎重新索引页面,而不需要在页面上添加任何实质性的页面。
站点地图
11. 不要太担心优先级设置
一些站点地图有一个“优先级”列,它表面上告诉搜索引擎哪些页面是重要的。
然而,这个功能是否真的有效,一直以来都存在争议。
12. 保持文件尽可能小
Sitemap 越小,服务器上的压力就越小。保持站点地图的精简和对关键的着陆页面的优先级仍然是很好的做法。
13. 如果站点包含 < 50,000 url,创建多个 Sitemaps
每个站点地图只能有 5 万个 url。
虽然这对于大多数站点来说已经足够了,但是有些站点需要创建多个站点地图。例如,大型电子商务网站可能需要创建额外的站点地图来处理额外的产品页面。
转载请注明出处。