製作和提交XML網站地圖Sitemap:基礎和最佳實踐

製作Sitemap 網站地圖

一、如何製作網站地圖

您可以手動製作網站地圖或使用自動生成網站地圖的工具 —— 這取決於您的的網站類型。在詳細瞭解製作網站地圖的不同方法之前,您可能需要進行一個重要步驟——理清您的網站內容與結構。

方法 1:使用外掛程式製作網站地圖

如果您的網站使用 WordPress、Wix、Squarespace或任何其他CMS,您將可以使用外掛程式製作網站地圖。例如,對於 WordPress,您可以使用流行的Yoast SEO 外掛程式來製作網站地圖。而對於 Wix 和 Squarespace,您也無需擔心。他們會自動製作和更新您的網站網站地圖。

方法 2:使用Sitemap生成器自動製作網站地圖

如果您的網站不是CMS系統搭建的,您也可以使用一些Sitemap生成器幫助您自動製作網站的網站地圖。在之前的文章中,我介紹了10款超贊的Sitemap網站地圖產生器。您可以前去挑選適合您的一款。

在這裡,我選取Screaming Frog進行舉例說明如何用Sitemap生成器製作網站地圖。以下,我將向您介紹如何使用Screaming Frog SEO Spider 生成 XML 網站地圖。

1 使用Screaming Frog抓取您的網站

在工具列中輸入您網站的功能變數名稱位址,然後按“開始”。根據您網站的大小,這可能需要一些時間,因為每個頁面都需要被發現和抓取。

抓取以生成 XML 站点地图

2 刪除任何不需要的 URL

抓取完成後,查看完整的 URL 列表並查找您不想包含在網站地圖中的任何內容。如果您有要排除的 URL,請按右鍵這些 URL 並選擇“刪除”。如果您按住 Shift 或 Ctrl 按鈕(在 Windows 上),您可以選擇多個URL進行批量刪除。

从 XML 站点地图中删除页面

3 打開網站地圖菜單

打開工具列上的網站地圖功能表並選擇“XML 網站地圖”。您將打開一個包含多個選項的功能表。預設選項是在網站地圖中僅包含Status 為200的 URL,但您可以選擇包含帶有 noindex 標籤的頁面、分頁頁面或帶有 301 重定向的頁面。

要包含在 XML 站点地图中的页面

其他子功能表 — Last Modified、Priority、Change Frequency、Images、Hreflang — 讓您可以選擇編輯 <changefreq>、<priority> 和 <lastmod> 標籤以滿足您網站的需要。

XML 站点地图

4 保存網站地圖

完成編輯後,按一下“下一步”按鈕,將打開“保存”菜單。默認檔案類型為XML。

创建 XML 站点地图

5 上傳您的網站地圖

現在您有了新的網站地圖,您需要將其上傳到您的網站。

由於每個網站的 CMS 都會有所不同,我無法就執行此操作的最佳方式提供建議。如有需要,您可以諮詢您網站的開發人員。

方法 3:手動製作網站地圖

在部分情況下,您不得不手動製作網站地圖。

要從頭開始手動構建網站地圖,您需要具備一定程度的技術知識,這是所有列出的製作網站地圖的方法中難度最高的 —— 難度可能是前面2種的方法的10倍以上;如果您的網站是個大型網站,增加的難度更有可能達到百倍以上。作為回報,您將獲得對網站地圖的完全可定制性及可控性,使其成為所有方法中最具擴展性的。

現在,我們來看看手動製作網站地圖的基本步驟。

1步:打開文字編輯器

如記事本(Notepad)或其他任何支援純文字編輯的軟體。

2步:編寫XML標籤

在文字編輯器中,開始編寫XML網站地圖的基本結構。首先,添加XML版本資訊和編碼方式,如下所示:

3步:添加網站地圖協議

接下來,添加網站地圖協議,用以告訴搜尋引擎這是一個網站地圖檔。添加如下代碼:

4步:添加URL信息

在<urlset>標籤內部,添加網站上每個頁面的URL資訊。對於每個頁面,都需要使用<url>標籤,並在其中添加相應的<loc>、<lastmod>、<changefreq>和<priority>標籤。例如:

5步:保存檔:

完成上述步驟後,將檔保存為.xml格式,例如:sitemap.xml。

6步:驗證您的網站地圖

完成製作 sitemap.xml 檔後,您應該對其進行驗證以確保代碼中沒有錯誤。

您可以使用使用Google Search Console或Bing Webmaster Tools驗證您的Sitemap是否存在錯誤。您還可以線上網站地圖驗證工具。例如,XML Sitemaps Validator是流行的網站地圖驗證工具。只需輸入您的網站地圖URL或上傳網站地圖檔,這些工具將檢查其格式並報告任何錯誤或警告。

7步:上傳網站地圖

將生成的網站地圖檔上傳到網站的根目錄下,確保搜尋引擎可以訪問。

一般情況下,我們會將網站地圖放在網站的根目錄下(即http://www.example.com/sitemap.xml)。文件位置很重要,因為提交的 URL 必須以與網站地圖相同的路徑開頭。例如,位於 http://example.com/catalog/sitemap.xml 的網站地圖檔可以包含任何以 http://example.com/catalog/ 開頭的網址,但不能包含以 http://example.com/images 開頭的網址。又或者如果網站地圖位於 http://www.example.com/sitemap.xml,則它不能包含來自 http://subdomain.example.com 的 URL。

二、網站地圖最佳實踐與做法

使用XML網站地圖的最佳實踐可以確保搜尋引擎更好地抓取和索引您的網站內容。以下是一些建議:

1. 使用標準的XML格式

遵循W3C的XML標準,確保網站地圖的格式正確。這樣搜尋引擎才能正確解析網站地圖。

2. 確保您的XML網站地圖保持最新

確保您的XML網站地圖提供您網站的最新內容。每當刪除一個頁面時,它也應該從您的XML網站地圖中刪除。對於經常更新的內容,確保網站地圖及時更新。如果您使用可選的lastmod標籤,請確保在頁面更改時更新時間戳記。

當我們的網站有很多頁面時,我們不太可能手動更新Sitemap。那麼,如何讓sitemap自動更新呢?

要讓XML網站地圖自動更新,您可以選擇以下方法之一:

1)使用內容管理系統(CMS)的外掛程式或擴展:許多內容管理系統(如WordPress、Drupal、Joomla等)提供自動生成並更新網站地圖的外掛程式或擴展。安裝並配置這些外掛程式後,您的網站地圖將隨著網站內容的更改而自動更新。

例如,在WordPress中,您可以安裝“Yoast SEO”等外掛程式來自動生成並更新網站地圖。

2)使用自訂腳本:如果您沒有使用CMS,可以編寫自訂腳本(如Python、PHP等)來自動生成網站地圖。這些腳本可根據您的網站內容自動製作網站地圖,並在內容發生變化時自動更新網站地圖。將此腳本設置為定時任務(如使用Linux的Cron Job或Windows的任務計畫程式),以便定期運行並更新網站地圖。

3)使用協力廠商網站地圖生成工具:有些線上服務或軟體可以説明您自動生成並更新網站地圖。這些工具會定期抓取您的網站,並根據檢測到的更改自動更新網站地圖。例如,Screaming Frog SEO Spider和XML-Sitemaps.com等工具可以自動生成網站地圖。儘管如此,自動更新功能可能需要付費訂閱或購買軟體許可。

3. 遵循URL數量和檔大小的限制

單個網站地圖檔中的URL數量不得超過50,000個,檔大小不得超過50MB(未壓縮)。如果超出這些限制,請將網站地圖拆分成多個檔並使用網站地圖索引檔進行管理。

現在我們來解釋一下什麼是網站地圖索引檔。

讓我們看一個例子:

在這個網站地圖索引檔中,我們有三個網站地圖檔(sitemap1.xml、sitemap2.xml 和 sitemap3.xml)。網站地圖索引檔包括以下元素:

  • <sitemap>:此標籤將索引檔中的每個網站地圖條目包裹起來。
  • <loc>:網站地圖文件的URL。請用您實際的網站地圖文件URL替換此URL。
  • <lastmod>:網站地圖檔的最後修改日期和時間,採用W3C DateTime格式(YYYY-MM-DDThh:mm:ss+timezone)。請將其替換為您網站地圖檔的實際最後修改日期和時間。

讓我們來剖析一下這個檔與普通的XML sitemap有什麼不同。

1XML 標頭

<?xml version=”1.0″ encoding=”UTF-8″?>

這裡沒有什麼新東西,就像我們之前定義檔是XML格式以及使用哪種字元編碼的XML Sitemap 檔一樣。

2)網站地圖索引的定義

<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

現在,我們看到的不是urlset定義,而是sitemapindex定義。此定義封裝了網站地圖索引中包含的所有網站地圖,並再次說明了使用哪個版本的 XML 網站地圖標準。

3)單個網站地圖

<sitemap>

      <loc>https://www.example.com/sitemap1.xml</loc>

      <lastmod>2023-03-20T18:00:00+00:00</lastmod>

   </sitemap>

就像 URL 一樣,每個網站地圖定義都需要至少包含 <loc>標籤,其中包含單個 XML 網站地圖的完整 URL。最重要的是,網站地圖定義也可以選擇包含 <lastmod>標籤。

4. 按內容類別型分割網站地圖

如果您的網站內容較多,即便不超過5萬個URL,您也可以考慮將網站地圖按內容類別型(如文章、產品、分類等)進行拆分。然後,可以使用網站地圖索引檔將各個網站地圖連結起來。

5. 設置合適的更新頻率和優先順序

為每個URL設置合適的更新頻率(<changefreq>標籤)和優先順序(<priority>標籤)。這有助於搜尋引擎更好地理解網站內容的重要性和更新頻率。

但是,您又不需要太擔心優先順序的設置。

一些網站地圖有一個“優先順序”列,表面上告訴搜尋引擎哪些頁面最重要。然而,這個功能是否真的有效一直存在爭議。早在 2017 年,Google 的 Gary Illyes就回復推文稱Googlebot 在抓取時會忽略優先順序設置。

6. 避免包含無關或重複的URL

確保網站地圖中只包含有價值、不重複的URL。避免包含重複或無關內容的URL,因為這可能會導致搜尋引擎對您網站的評價降低。

當您有多個非常相似的頁面時,例如同一產品的不同顏色的產品頁面,您應該使用“link rel=canonical”標籤來告訴 Google 哪個頁面是它應該抓取和索引的“主”頁面。

此外,永遠不要列出您的 NoIndex 網址。網站地圖用於告訴 Google 抓取和索引哪些 URL ,而不是忽略哪些 URL。

7. 考慮只將高品質頁面放在網站地圖中

在排名方面,整體網站品質是一個關鍵因素。

如果您的網站地圖將抓取工具引導至非常多低品質的頁面,搜尋引擎會將這些頁面解釋為您的網站的大部分內容都是低品質的。因此,您可以考慮只將高品質的頁面放在網站地圖中。

8. 注意多語言網站的XML檔寫法

對於多語言網站,您可以使用<xhtml:link>標籤在XML網站地圖中指定不同語言版本的URL。以下是一個多語言網站的XML網站地圖示例:

在這個示例中,我們為同一個頁面提供了三種語言版本:英文(en)、中文(zh)和西班牙文(es)。請注意以下幾點:

  • 確保在<urlset>標籤中添加xmlns:xhtml=”http://www.w3.org/1999/xhtml”屬性,以便使用<xhtml:link>標籤。
  • 使用<xhtml:link>標籤為每個語言版本的URL添加rel=”alternate”和hreflang屬性。hreflang屬性的值應為代表相應語言的ISO 639-1語言代碼。
  • 為每種語言版本的URL製作一個<url>條目,並在其中包含所有其他語言版本的<xhtml:link>標籤。

您可以根據您自己的多語言網站的實際情況修改上述示例。

9. 將網站地圖添加到 robots.txt 文件

robots.txt檔是爬蟲訪問網站時首先訪問的地方。通過向其中添加網站地圖,他們可以快速發現網站的所有 URL。

10. 使用絕對URL

在網站地圖中,確保所有URL為絕對URL(包括協議和功能變數名稱)。這樣搜尋引擎就不會對URL產生歧義。

11. 網站地圖檔編碼

網站地圖檔必須採用 UTF-8 編碼。所有網站地圖檔只能包含 ASCII 字元——即數位 0-9、英文字母 AZ 和一些特殊字元。像符號、引號或大於/小於需要用轉義碼替換的字元:

站点地图转义码

12. 網站地圖檔位置

您可以將網站地圖託管在網站的任何位置,但是網站地圖只影響父級目錄中的下級目錄。因此,如果網站地圖發佈在網站的根目錄下,則可以影響網站上的所有檔,所以我建議將網站地圖發佈在此目錄下。

三、將您的網站地圖提交給穀歌/Bing/Yandex/Yahoo

製作並上傳網站地圖後需要執行的最後一步是將其提交給搜尋引擎,以便它們可以開始抓取其中列出的 URL。在這裡,我將分別介紹如何將網站地圖提交給Google、Bing、以及Yandex。

1. 將Sitemap提交給Google

如果您想將 XML 網站地圖提交給 Google,您可以通過3 種不同的方式進行。

(1)通過 Google Search Console 提交 XML 網站地圖

針對Google, Google Search Console 是您提交網站網站地圖的地方。請按照以下步驟向Google提交您的網站地圖:

1)登錄 Google Search Console,然後找到螢幕左側 “索引”部分下的“網站地圖”。

2)進入頁面後,輸入您的網站地圖URL,然後按一下“提交”。

就是這麼簡單。現在Google將驗證您的網站地圖。如果格式正確,它將更新為“成功”狀態。

(2)使用 robots.txt 文件提交 XML 網站地圖

如果您不想使用 Google Search Console,那麼您也可以通過將網站地圖添加到您的 robots.txt 文件來提交您的網站地圖。下圖是Shein的示例:

(3)發送 HTTP GET 請求以“ping”穀歌

最後一個選項是“ping”穀歌並要求他們的抓取工具抓取您的網站。這是通過發送 HTTP GET 請求來完成的:

https://www.google.com/ping?sitemap=https://yourwebsite.com/sitemaplocation.xml

2. 將Sitemap提交給Bing

與Google類似,您可以通過Bing的網站管理員工具將您網站的網站地圖提交給Bing 。您可以按照以下步驟提交您的網站地圖:

1)在Bing網站管理員工具上註冊您的網站。

2)登錄 Bing 網站管理員工具後,轉到“我的網站”頁面並按一下您的網站。 

3)在左側邊欄菜單,找到“網站地圖”;點擊“提交網站地圖”,然後輸入您網站網站地圖的完整URL,點擊“提交”。與在Google中一樣,您可以在下面的列表中查看有關您提交的網站地圖的詳細資訊。

3. 將Sitemap提交給Yandex

Yandex 是俄羅斯的主要搜尋引擎之一。在那裡提交您的網站地圖可能會幫助您獲得更多來自俄羅斯的流量。您可以按照以下步驟將您的網站地圖提交給Yandex:

1)製作一個帳戶並在Yandex上註冊您的網站。

2)登錄到 Yandex 網站管理員工具並從主儀錶板中選擇您的網站。

3)使用螢幕左側的功能表,導航至“Indexing”> 網站地圖文件。 

4)在相應的欄位中輸入指向您網站網站地圖的完整URL,即www.mywebsite.com/sitemap.xml 。

按一下添加按鈕。 

結語

精心設計的網站網站地圖可幫助訪問者和爬蟲更有效地流覽網站,這對於用戶體驗、SEO 和網站優化至關重要。

對於製作網站地圖,您可以使用線上生成器製作網站地圖以加快該過程。但是,如果您想對其進行更多控制,請考慮手動編寫代碼。

完成後,您只需將網站地圖提交給主要搜尋引擎並將其添加到robots.txt文件中。

我希望本篇文章能幫助您通過製作和提交網站地圖加大網站的收錄量!

error: Content is protected !!