收錄對于GoogleSEO至關重要。 如果谷歌沒有收錄你的網頁,你所做的一切SEO工作都會變得毫無價值,哪怕你已經針對一個頁面進行了臻于完美的優化,并能確保它將帶來絕佳的用戶體驗。殘酷的現實是:未被收錄的頁面不會進入搜索結果頁(SERP),也不會帶來任何流量和轉化。 同樣,如果谷歌偶然收錄了一個本不應該被收錄的頁面,那么你就有可能面臨私人信息泄露、收到谷歌對低質量內容的懲罰等其他嚴重的后果。 ▊?在本指南中,我們將探索Google收錄的常見問題,以及如何解決它們。但首先,讓我們來看看如何檢查你的網站是否存在收錄問題。 01 如何發現收錄問題? Google SearchConsole可以幫助你發現你的網站存在哪些收錄問題,請點擊收“收錄”(Index)>“頁面”(Page)以查看,如下圖所示。 只要是未被Google收錄的頁面,不管是因為什么原因,都會統一顯示在“未收錄”(NotIndexed)部分。被Google收錄,但是存在其他問題等待你解決的頁面將會顯示在底部的“改善頁面外觀”(Improvepage appearance)部分。 Google SearchConsole將提供更多細節,幫助你確定頁面的問題所在,如下圖: 在了解如何發現網站存在的收錄問題后,我們可以探討解決方案啦。當然,本文探討的所有解決方案,都是針對需要收錄的網頁。如果你的頁面不需要被Google收錄,你可以采用noindex標簽,或者通過robots.txt指令的限制Google訪問相關頁面。此外,確保將這些網頁從你的網站地圖(sitemap)中刪除。當然,如果這些頁面本就未被收錄,那么你無需采取任何行動。 02 如何解決Google收錄問題? 1??404錯誤:網頁未找到(Not found 404) 404網頁未找到(Notfound404),或者失效URL,應該是最常見的收錄問題之一。很多原因都可能導致HTTP狀態碼出現404,比如,你已經刪除了URL,但沒有從網站地圖(sitemap)中或站內其它頁面中刪除該失效URL,URL有誤,等等。 Google曾提示404本身并不損害網站性能,除非這些URL是主動提交給Google收錄的URL。那么,如果你在收錄報告中看到404網址,應該如何修復呢?我們提供以下解決方案: ● 更新你的網站地圖(sitemap),檢查受影響的URL是否有誤。 ● 如果該頁面已經遷移到一個新的地址,設置一個301重定向。 ● 如果該頁面已經被刪除,也沒有任何替換網頁,那么將其保留為404,但從網站地圖(sitemap)中刪除,假如站內其它頁面有鏈接到該頁面,該內鏈也需要同步刪除或更新。這樣,Google就不會再試圖找到并抓取這個頁面了。 ● 如果你需要保留404,那就創建一個用戶友好型404頁面--你可以在那里添加一些有用的鏈接,使用戶繼續停留在你的網站上,而不是直接關閉頁面。但有一點需要記住,404頁面的性質并不會因此改變,你依舊應該禁止Google收錄它。 ● 請注意,Google Search Console現在并不區分404(Not found,未找到)和410(gone,已消失),而是將它們都分類進404報告中。這兩個代碼曾經是不同類型的響應代碼。404意味著 "沒有找到,但以后也許可以找到",而410代表 "現在沒有找到,未來也不會找到,因為它已經永遠消失了"。現在,Google對404和410頁面采取的措施是一樣的。 所以,如果你在404報告中發現一個410的頁面,不要感到奇怪。我們建議你不要保留空的410頁面,而是設置一個自定義的404頁面,降低用戶跳出率。許多SEO從業者和站長有一個習慣,就是把404重定向到網站主頁,但事實上,這并不是最好的做法。它會讓Google覺得混亂,并導致“軟404”(Soft 404)。 2??軟404錯誤(Soft 404) 當一個網頁,HTTP狀態碼出現200(服務器成功返回網頁),但Google無法找到它的內容并認為它是一個404錯誤的時候,就會出現軟404(Soft404)問題。軟404的出現通常是由以下原因造成的: ① 服務器端文件丟失 ② 與數據庫的連接中斷 ③ 網站的內部搜索頁結果為空 ④ 未加載或丟失JavaScript文件 ⑤ 頁面內容太少 ⑥ 頁面隱蔽 這些問題實際上并不難解決,下面是一些常見的解決方案: ● 如果網頁內容已經遷移,該頁面內容為空,且HTTP狀態碼顯示200 OK,那么設置一個301重定向到新的地址。 ● 如果被刪除的內容頁沒有替代頁,請將其標記為404并從網站地圖(sitemap)中刪除。 ● 如果該頁面應該存在,請豐富該頁面內容,并檢查該頁面上的所有腳本是否被正確渲染和顯示(例如被robots.txt禁止,瀏覽器不支持,等等)。 ● 如果錯誤發生的原因是Google bot試圖獲取該頁面時,服務器出現故障,請檢查服務器是否正常工作,然后要求Google重新收錄該網頁。 3??401錯誤:網頁未授權 HTTP401錯誤代表Googlebot沒有網頁訪問權限,需要進行身份認證。如果你希望該頁面被收錄,請授予Googlebot相關的權限,或者刪除網頁的授權要求。 4??403錯誤:訪問被禁止 這種類型的錯誤發生在用戶代理提供了進入該頁面的憑證(登錄、密碼),但“執行”訪問被禁止。所以服務器返回403,而不是預期的頁面。 如果一個頁面被錯誤地禁止訪問了,而你又確實需要Google收錄它,那么你應該允許未登錄的用戶訪問該頁面,或者允許Googlebot進入該頁面,以閱讀和收錄它。 5??網址已提交,但帶有“noindex”標記 當你明確要求谷歌收錄一個頁面(即把它添加到網站地圖或手動請求Google收錄),但該頁面有一個noindex標簽時,這個錯誤就會發生。解決方案很簡單--刪除noindex標簽,谷歌就可以訪問并收錄該頁面。 6??robots.txt設置了不可被抓取 如果你通過robots.txt屏蔽了某個頁面,那么谷歌將不會抓取收錄它。只要移除這些限制,Google就會收錄這個頁面。 ?注意:Robots.txt并不能確保一個網頁不被收錄。有時,GoogleSearch Console可能會顯示:“已收錄,盡管遭遇robots.txt阻止(Indexed,though blockedby robots.txt)” 這種情況比未被Google收錄要麻煩得多。因為Google可能會訪問一些私密信息(比如購物車、私人數據等),并將其展示在搜索結果頁。 如果遇見這種情況,請先確認是否需要Google收錄該頁面。如果是,從robots.txt文件中刪除該網頁URL。如果不是,也需要把這個URL從robots.txt中刪除,但同時應用noindex標簽,或限制非授權用戶的訪問。在采取限制措施后,你也可以通過GoogleSearch Console選擇“收錄(index)”>“移除(Removals)”>“新請求(Newrequest)”要求谷歌從收錄中移除該網頁。 以上六個常見問題的解決方案學會了嗎?在下一篇文章中,我們將繼續聚焦Google收錄的疑難雜癥!快點關注和收藏,才不會錯過《Google收錄的常見問題及解決方案指南(下)》更新!
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)