站点地图Sitemap是什么?对SEO有什么用?

地图给我们带来很多好处。例如,藏宝图告诉我们如何致富。

但是,SEO人可能对网站站点地图(Sitemap)是又爱又恨 —— 爱的是Sitemap有助于提高收录量(对SEO人来说,收录是个大问题),恨的是很多人还不怎么了解Sitemap,更不用说正确地创建站点地图了。

因此,在这篇文章中,我将与您分享站点地图是什么、站点地图的常见类型以及Sitemap在SEO中如何发挥作用。

站点地图Sitemap

一、什么是站点地图Sitemap?

站点地图,顾名思义,就是一张网站的地图。它是一种用于列举网站中所有重要页面的URL的文件。它的主要用途是帮助搜索引擎了解您的网站并轻松找到特定页面。还有站点地图可以帮助用户浏览您的站点,我稍后会介绍。

站点地图的概念最早可以追溯到1990年代末期,当时搜索引擎的抓取技术还不够成熟,站点地图的作用非常明显。随着搜索引擎技术的不断发展,尤其是谷歌推出了专门针对站点地图的协议,站点地图逐渐成为网站SEO优化的一个重要组成部分。

二、网站站点地图的类型

一般来说,网站sitemap有两种类型:HTML 站点地图(超文本标记语言,面向人类)和 XML 站点地图(可扩展标记语言,专为搜索引擎爬虫设计)。

网站站点地图的类型

1. XML 站点地图

XML,即可扩展标记语言,是一种以搜索引擎易于阅读的格式对信息进行编码的格式。XML站点地图是搜索引擎(例如 Google)首选的站点地图格式。 您通常可以通过以下网址找到大部分网站的站点地图:domainname.com/sitemap.xml。

XML Sitemap看起来长这样:

Shein XML Sitemap

如上图所示,XML 站点地图看起来类似于一个简单的 URL 列表,但添加了一些额外的信息。

  • <urlset> – 这是当前的协议标准,站点地图使用此标签打开和关闭。
  • <url> –这是每个URL条目的父标记。
  • <Loc> – 页面永久链接地址。
  • <lastmod> – 此标签包含“文件的最后修改日期是什么时候”的信息。
  • <changefreq> – 此标记包含有关文件更改频率的信息。它可以设置为每小时(hourly)、每天(daily)、每周(weekly)、每月(monthly)、每年(yearly)、和始终(always)。
  • <priority> – 此标记表示 URL 的重要性。该值的范围可以从 0.0 到 1.0,值越大,表示此链接的优先权就越高。

Sitemaps.org在此处提供了有用的 XML 标记定义列表

XML 标记定义列表

XML站点地图又还有4种类型:

(1)图片站点地图

图片站点地图可以很好地告知 Google 您网站上的其他图片,尤其是 Google 可能无法通过其他方式找到的图片(例如,您的网站通过 JavaScript 代码获取的图片)。您可以创建单独的图片站点地图,也可以向现有站点地图添加图片站点地图标记;这两种方法对 Google 来说都没有问题。

图片站点地图示例:

图片站点地图

(2)视频站点地图

视频站点地图通过提供给搜索引擎的附加信息帮助网站增强视频内容,以便更好地理解它们。这可以包括定义视频的类别、在视频中添加音频脚本等等。使用视频站点地图可以帮助您在 Google 视频搜索中获得良好的排名。

视频站点地图示例:

视频站点地图

(3)新闻站点地图

如果您是一家新闻发布商,可使用 Google 新闻站点地图将您的新闻报道和其他相关信息告知 Google。您既可以使用 Google 新闻专用标记扩展现有站点地图,也可以创建单独的 Google 新闻站点地图,专供您的新闻报道使用。这两种方案 Google 来说都没有问题。不过,如果为您的新闻报道创建单独的站点地图,可通过 Search Console 更好地跟踪您在 Google 搜索中的内容。

新闻站点地图示例:

新闻站点地图

(4)文本站点地图

这是最简单的站点地图,适用于网页较少的小型网站。

文本站点地图示例:

文本站点地图

2. HTML 站点地图

HTML站点地图是访问者可见的实际网站页面,其中包含指向您网站上所有页面的可点击链接列表。HTML站点地图曾经是一种改进网站导航并在一个位置提供指向所有页面的链接的流行方式。虽然现在它已经不那么流行了,但它仍然很有价值,尤其是对于大型网站

以下是Apple的 HTML站点地图示例:

Apple的 HTML站点地图

如您所见,它是一个标准页面,包含指向以分层方式组织的各种页面的链接。当难以在网站的主导航菜单或内部链接中找到页面时,HTML 站点地图可以更轻松地找到该页面。

三、站点地图Sitemap在SEO中的关键角色

要了解站点地图在SEO中的重要性,您必须首先了解搜索引擎的工作原理。特别是术语“抓取”和“索引”的含义。下面,我们以Google为例介绍Google搜索工作流程的三个主要阶段:

  • 抓取:Google 会使用名为“抓取工具”的自动程序来搜索网络,以查找新网页或更新后的网页。Google 会将这些网页的地址(即网址)存储在一个大型列表中,以便日后查看。
  • 编入索引:Google 会访问通过抓取得知的网页,并会尝试分析每个网页的主题。Google 会分析网页中的内容、图片和视频文件,尝试了解网页的主题。这些信息存储在 Google 索引中,而 Google 索引是一个存储在海量计算机中的巨大数据库。
  • 呈现搜索结果:当用户执行 Google 搜索时,Google 会尝试确定最优质的搜索结果。

这一切意味着,如果您的网页难以抓取,它可能不会进入Google的索引库,如果它不在 Google 的索引库中,它就不会出现在Google搜索中。这就是站点地图发挥作用的地方。

Google越了解您的网站并且越容易抓取它,您就可以更有效地为您的目标关键字排名并为您的网站带来更多流量。话虽如此,并结合上述信息,这里更深入地探讨了拥有站点地图的好处:

(1)让您的网页更快地被抓取和编入索引

Google 无法每天抓取整个互联网。相反,它对不同的网站和内容类型有不同的抓取“时间表” ——因此有时Google可能需要几天、几周甚至几个月的时间才能发现您网站上的新页面。站点地图可以帮助 Google更快地发现和索引新页面。

(2)保持高价值页面的良好表现

您是否曾经更新过您网站上的页面——也许是为了刷新您的常青内容 —— 但没有在SERP中看到更改?那是因为自您更新后 Google 还没有抓取该网页。通过更高效的抓取和索引,您可以确保用户看到您的高价值或经常修改的页面的最新版本。

(3)帮助搜索机器人(蜘蛛)定位孤立页面

Google 的漫游器通常会像访问者一样发现您网站上的页面——通过跟踪它正在抓取的页面上的链接(这就是内部链接如此重要的原因)。孤立页面是您网站上没有其他链接指向它的页面,这使得它们很难被Google 访问。但是,如果您把这些页面放进了Sitemap中,Google可以更轻松地找到它们并将其编入索引。

(4)帮助Google辨别重复页面

在某些情况下,网站可能会出现重复或接近重复的页面——例如,在电商网站上,您可能会有重复的产品页面,其中产品的颜色不同。在这些情况下,Google可能不知道页面的哪个版本是您要排名的主要版本。在站点地图中,您可以使用规范标签向Google显示哪个版本是主要版本,哪些是重复版本,以帮助Google进行区分。

(5)减少爬虫的抓取负担

站点地图可以帮助搜索引擎更高效地抓取网站内容,避免爬虫在网站上进行无效的抓取,从而降低服务器的负担。

(6)帮助找到页面问题

除了帮助搜索引擎找到您的所有内容之外,Sitemap也是一个很好的方式去发现您页面上的任何错误 ——您可能没有发现这些错误,但搜索引擎发现了。例如,在 Google Search Console 中提交站点地图后,您将能够访问站点地图覆盖率报告,其中会显示站点地图的错误和警告。这些错误可能是服务器错误 (5xx)、未找到 (404) 或软 404。通过获取这些报告,您将能够避免这些问题影响您在自然搜索结果中的表现。

四、哪些网站从站点地图中获益最多? 

每个网站都可以从站点地图中受益,因为站点地图有助于提高网站的收录量,进而为网站提供在线排名的机会。根据谷歌的说法,以下是最需要站点地图的网站类型:

  • 您的网站很大。一般来说,在大型网站上,要确保网站上的每个网页都至少被另外一个网页链接更为困难。因此,Googlebot 更有可能发现不了您的某些新网页。而包含最新信息的站点地图可以确保Google可以发现和抓取每个网页。
  • 您的网站为新网站且指向该网站的外部链接不多。Googlebot 及其他网页抓取工具是通过跟踪网页之间的链接来抓取网页的。因此,如果没有其他网站链接到您的网页,Googlebot 可能发现不了您的网页。此外,如果您的网站有在前端不可见的页面,站点地图可以帮助爬​​虫识别孤立页面。
  • 您的网站包含大量富媒体内容(视频、图片)或显示在 Google 新闻中。Google 可将站点地图中的其他信息纳入搜索范围。

如果您的网站属于这些类别中的一个或多个,它将​​受益于站点地图,您应该尽快创建一个。 即使您的站点很小、有很多内部链接并且几乎不包含任何富媒体,您也应该创建一个站点地图。

结语

总而言之,任何网站都不会因为没有站点地图而受到处罚。但是,如果您积极为您的网站(尤其是大型网站)创建站点地图,您可能会得到不少好处。在下一篇文章中,我将继续介绍如何创建站点地图并将它提交给Google/Bing/Yandex/Yahoo等。

error: Content is protected !!