什麼是軟404 (Soft 404)& 如何修復它們

您可能已經非常熟悉404 (not found) 錯誤代碼——它告訴您找不到您想要訪問的資訊。但部分SEO查看他們的 Google Search Console報告時,他們還發現自己的網站上還有很多軟404 (Soft 404)錯誤。

什麼是軟404錯誤?為什麼會發生這種錯誤?這種錯誤對網站有什麼影響?您可以做些什麼來處理這些錯誤?

從本文中,我們將向您詳細解釋什麼是軟404、軟 404 對您的網站的影響、可能導致它們的原因以及您可以採取哪些措施來修復它們。

軟404

什麼是軟404?

Soft 404 錯誤是一個網址,會在返回的頁面中向使用者表明目標網頁不存在,同時還會返回 200 (success) 狀態碼。在某些情況下,軟 404 可能是一個不含任何主要內容的頁面或是一個空頁面。簡單來說,軟 404 錯誤是指網站伺服器為頁面發送 200 (success) 狀態,但Google認為該頁面應返回 404 代碼。

如果Google認為一個頁面是Soft 404, 它會減緩這個頁面的抓取速度。

從搜尋引擎的角度來看,檢測軟 404 是必不可少的,原因有兩個:

  • Google資源有限。網路無限大,根本不可能爬取所有頁面。這就是為什麼谷歌需要優先考慮並選擇哪些頁面值得抓取。省略軟 404 可以讓它專注於更有價值的頁面,從而提高其抓取效率。
  • Google希望向使用者展示高品質的頁面。如果 Google 懷疑某個頁面不存在,那麼很明顯沒有人想找到它,並且它不應該出現在搜索結果頁面上。

Soft 404 如何影響您的網站

Soft 404如何影響您的網站可能因被Google 歸類為軟 404 的頁面類型而異 —— Google有時能正確識別Soft 404頁面,但有時它也會在對頁面進行分類時出錯。

如果 Google 是正確的並且該頁面確實不存在,那麼主要後果就是浪費您的抓取預算。您的抓取預算表示 Google 可以並希望在您的網站上抓取的頁面數量。例如,如果您有 100,000 個頁面,並且您的抓取預算允許抓取 50,000 個,那麼確保將預算用於有價值的頁面至關重要。如果 Google 將您的抓取預算浪費在抓取軟 404 上,那麼可能某些重要的且能為您帶來流量的頁面就不能被抓取了。

如果錯誤地將正常的頁面歸類為Soft 404,這些頁面將不會被索引,也不會帶來自然流量。 在這種情況下,您可以在Google Search Console請求Google “驗證修正情況”。

如何檢測軟 404?

您可以在 Google Search Console 的“覆蓋率”報告中查看 Google 將哪些頁面報告為軟 404。

如果 Google 認為某個頁面是軟 404,它可以為其分配以下兩種狀態之一:

  • 軟 404(已排除類別)
  • 網址已提交,但貌似會返回軟 404 錯誤(錯誤類別)
Soft 404

這兩種狀態的之間的唯一區別是Google發現URL的方式不同。在“網址已提交,但貌似會返回軟 404 錯誤”狀態下, Google在您的網站地圖中找到了它們。同時,在“軟 404”狀態下,Google自己找到了這些URL。

您可以通過按一下這些狀態中的任何一個來查看報告軟 404 的各個URL的列表。此資料可用於匯出,但有 1,000 個 URL 限制。

此外,覆蓋率報告不是您可以查看 URL 狀態的唯一位置——您也通過Google Search Console 中的URL 檢查工具檢查URL的狀態。如果您想檢查多個 URL,您還可以使用URL Inspection API並一次檢查多達 2,000 個 URL。

如果您發現覆蓋率報告和 URL 檢查工具中的狀態存在差異,則可能只是索引覆蓋率報告出現延遲。在這種情況下,以URL 檢查工具的資料為准,因為它會顯示更新的資料。

移動設備與桌面設備上的軟 404 檢測

2021年6月,Google改變了它檢測軟404的方式:它以不同的方式看待桌面和移動設備,但Google Search Console 只根據移動版本報告狀態。因此如果只有桌上出版本被標記為軟 404,它可能不會向您顯示對應的狀態。

什麼會導致軟 404 以及如何修復它

Google可能將頁面歸類為Soft 404的常見原因有以下幾個:

  • 404 頁面回應 200 HTTP 狀態碼
  • 不相關的重定向
  • 頁面內容很少或沒有內容
  • 頁面包含類似 404 的字詞
  • 渲染錯誤

1. 404 頁面回應 200 HTTP 狀態碼

如果一個頁面實際上是一個 404 頁面,但它返回 200 HTTP 狀態碼,Google 會將其歸類為軟 404。

如果您有自訂 404 頁面,則需要特別注意這一點。自訂 404 頁面能説明您的使用者在頁面不存在時繼續流覽您的網站。但是,這些頁面返回 200 HTTP 狀態碼的情況並不少見。您應該避免這種情況,因為 Google 會繼續抓取這些頁面,這會浪費您的抓取預算。

此問題的解決方案是為不存在的頁面返回正確的狀態碼(404 Not Found)。

2. 不相關的重定向

重定向到不相關的頁面是一種不好的做法,這可能會使用戶感到困惑。這就是為什麼如果 Google 檢測到重定向指向一個不相關的頁面,搜尋引擎可能會將該頁面視為軟 404。

要解決此問題,請始終重定向到相關頁面。 

3. 頁面內容很少或沒有內容

頁面上的內容很少或沒有內容可能會使 Google 認為該頁面是空的,並將其歸類為軟 404。 例如電商網站,他們可能經常有各種產品上架下架,部分下架的產品頁面可能為空。又或者如果您使用 WordPress,並且設置了一系列標籤,那麼您尚未使用的任何標籤都將顯示為空頁面。這些將生成軟 404 錯誤。

處理該問題的一種方法是阻止空頁的索引。畢竟,如果它是一個空頁面,它對您的用戶沒有幫助,也不應該被索引。此時,您可以通過添加一個noindex 元標記告訴搜尋引擎您不希望該頁面被索引。

此外,如果您的網站上有很多內容稀薄的頁面,您或許應該重新考慮您的網站是否需要這些頁面。畢竟這些內容稀薄的頁面會以兩種方式對您的網站產生負面影響:

  • 它們可能會浪費您的抓取預算,並且
  • 如果您有很多低品質、可索引的頁面,Google 可能會認為您的整個網站缺乏品質,並決定停止經常抓取您的網站。 

4. 頁面包含類似 404 的字詞

有時,如果某個頁面包含通常出現在 404 頁面上的字詞,則 Google可能會錯誤地識別該頁面。例如,當電商網站上的產品頁面使用“缺貨”或“產品不可用”等術語時,Google可能錯誤地判斷這些頁面為Soft 404。

要解決此問題,您可以刪除這些易引起搜尋引擎誤解的字詞。

5. 渲染問題

渲染是 Google 看到您的內容的必要步驟。如果搜尋引擎看不到它,它可能會認為該頁面是空的,並將其歸類為軟 404。

Google不能渲染您的網站內容的原因之一是您在robots.txt 中組織了 CSS 或 JavaScript 等資源。Robots.txt 是一個檔,可讓您指定搜尋引擎機器人可以抓取哪些頁面,哪些不能。如果 Google 無法訪問渲染所需的資源,它將無法看到內容。 要瞭解 Google 是否能正確呈現您的內容,請使用 Google Search Console 中的 URL 檢查工具。您可以檢查各個網址並瞭解 Google 如何查看您的網頁。如果內容丟失,則表明存在渲染問題。

要解決此問題,請確保 Google 有權訪問渲染所需的資源。檢查您的 robots.txt 檔並確保允許抓取 CSS 和 JavaScript。

結語

檢查並修復Soft 404是非常重要的。這樣做可確保Soft 404頁面不會浪費您的抓取預算或將有價值的頁面排除在索引之外而損害您的網站。

以下是本文的主要內容,可説明您避免軟 404:

  • 如果頁面不存在,請確保它返回 404 HTTP 狀態碼
  • 創建重定向時,請始終確保您重定向到相關內容
  • 不要在 robots.txt 中阻止渲染所必需的資源,例如 CSS 或 JavaScript 文件
  • 如果您有空頁面,請添加 noindex 元標記或從您的網站中刪除這些頁面
  • 注意使用類似 404 的短語。如果您注意到您的頁面(例如缺貨產品)被標記為軟 404,請嘗試刪除這些字詞或使用不同的術語。

Leave a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

error: Content is protected !!