在全球海量的網站中,數量已高達數十億,而搜索引擎的資源卻相對有限,無法實現對每個網站的每日全面審視。因此,搜索引擎制定了策略,決定哪些內容應被優先抓取,以及何時進行抓取。

      接下來,我們將分析搜索引擎的抓取配額機制如何深刻影響網站的排名,并分享如何借助Semrush來精準優化網站的SEO策略,從而提升網站在搜索引擎結果中的表現。





      01


      什么是抓取配額?



      抓取配額是指Google等搜索引擎在一定時間內計劃抓取的網站上的URL 數量。在規定時間內,搜索引擎將按計劃對網站URL進行抓取。



      02


      為什么抓取配額對SEO很重要?



      Google首先需要抓取您的網頁并將其編入索引,然后才能對其進行排名。并且這些流程必須順利進行,您的內容才能顯示在搜索結果中,這是網站獲取自然搜索排名和流量的前提


      >>>

      大多數網站站長不需要太擔心抓取配額。因為Google抓取網站的效率相當高。但在某些特定情況下,Google的抓取配額對網站SEO尤為重要:?

      01

      網站頁面非常多

      如果您的網站很大且很復雜(10K+頁面),Google可能不會立即找到新頁面或經常重新抓取您的所有頁面;

      02

      網站添加了大量新頁面


      果網站頻繁添加大量新頁面,則抓取配額可能會影響這些頁面的可見性;

      03

      網站存在技術問題


      如果可抓取性問題阻礙搜索引擎有效地抓取您的網站,您的內容可能不會顯示在搜索結果中。



      03


      Google如何確定抓取配額?



      您網站的抓取配額由兩個主要因素決定:?

      1
      抓取需求

      抓取需求是指Google根據感知的重要性對您的網站進行抓取的頻率。有三個因素會影響您網站的抓取需求:

      a.感知庫存

      Google通常會嘗試抓取您網站上它所能識別的全部或大部分網頁,除非您禁止Google抓取。例如如果您沒有禁止Googlebot抓取重復頁面和您已刪除的頁面,它每次仍可能會反復抓取這些頁面。

      b.受歡迎程度?

      Google通常會優先抓取具有更多反向鏈(來自其他網站的鏈接)和流量較大的網頁。這兩者都可以向Google算法發出信號,表明您的網站很重要,值得更頻繁地抓取。但注意,反向鏈接不能只追求數量,需相關性強且來源權威。

      使用Semrush的反向鏈接分析工具查詢網站各頁面的反向鏈接情況。



      我們可查看網站反向鏈接概況,點擊 “編入索引頁面” 選項卡,可按頁面查看反向鏈接。



      單擊 “反向鏈接” 列,按反向鏈接最多的頁面排序。



      Semrush所列的頁面都是Google最常抓取的頁面,我們需留意那些反向鏈接較少的重要頁面,并考慮實施反向鏈接策略,讓更多網站鏈接到這些重要頁面。

      c.過時

      搜索引擎的目標是以足夠高的頻率抓取內容,以便發現任何變化。但是,如果您的內容在一段時間內沒有發生太大變化,Google可能會開始降低抓取頻率。

      例如,Google通常會大量抓取新聞網站,因為這些網站通常每天發布數次新內容。在這種情況下,網站的抓取需求很高。當然,這并不意味著您需要每天更新內容,只是為了讓Google更頻繁地抓取您的網站。Google的指導方針表示它只想抓取高質量的內容。因此,應優先考慮內容質量,而不是為了提高抓取頻率而進行頻繁、不相關的更新。


      2
      抓取容量限制

      抓取容量限制可防止Google機器人因過多請求而減慢您的網站速度,從而導致性能問題,它主要受您網站的整體健康狀況和Google自身的抓取限制的影響。?

      a.網站的抓取健康狀況

      您的網站響應Google請求的速度會影響您的抓取配額。如果您的網站響應迅速,您的抓取容量限制就會增加。Google可能會更快地抓取您的網頁。但如果您的網站速度變慢,您的抓取容量限制可能會降低。如果您的網站響應服務器錯誤,這也會降低限制。并且 Google可能會減少對您的網站的抓取頻率。

      提示:使用 Semrush Site Audit檢查加載速度問題和服務器錯誤。以減少網站抓取容量限制下降的可能性。

      b.Google 的抓取限制

      Google沒有無限的資源來抓取網站。這就是為什么首先要有抓取配額。基本上,這是Google確定最常抓取哪些頁面的優先級的一種方式。如果由于某種原因Google的資源有限,這可能會影響您網站的抓取容量限制。



      04


      如何檢查你網站的抓取情況?



      Google Search Console (GSC) 提供有關Google如何抓取您的網站的完整信息。以及可能存在的任何問題以及抓取行為隨時間發生的任何重大變化。這可以幫助您了解是否存在影響抓取配額的問題并可以進行修復。要查找此信息,請訪問您的GSC屬性并單擊“Settings”。

      在“Crawling”部分,您將看到過去90天內的抓取請求數量,單擊 “OPEN REPORT” 以獲取更詳細的見解。

      Google Search Console可以直接從源頭提供有關您的抓取配額的有用信息。但其他工具可以提供您提高網站抓取能力所需的更詳細的見解。



      05


      如何分析網站的可抓取性?



      Semrush的項目(project)工具可以向您顯示您的抓取配額被浪費的地方,并可以幫助您優化網站的抓取能力。



      在這里,你會發現你網站的抓取配額有多少被浪費了,以及出現了哪些問題。例如臨時重定向、永久重定向、重復內容和加載速度慢。單擊任意一個欄都會顯示存在該問題的頁面列表。根據問題的不同,您將看到每個受影響頁面的各個列中的信息。瀏覽這些頁面并修復相應的問題。以提高您網站的可抓取性。





      06


      抓取配額優化的7個技巧



      一旦您知道網站的抓取配額問題出在哪里,您就可以修復它們以最大限度提高抓取效率。我們可以做好以下工作:

      01

      提高網站速度

      提高網站速度可以幫助Google更快地抓取您的網站。這可以更好地利用您網站的抓取配額。此外,這對用戶體驗 (UX) 和SEO也有好處。要檢查頁面加載速度,請返回之前設置的項目概覽,然后單擊“效果”框中的“查看詳情”。您將看到頁面加載速度和平均頁面加載速度的細分,以及可能導致性能不佳的錯誤和警告列表。





      有很多方法可以提高頁面速度,包括:

      a.優化圖片:使用圖片壓縮器等在線工具來減少文件大小,而不會使圖片變得模糊;

      b.最小化代碼和腳本:考慮使用Minifier.org等在線工具或WP Rocket等 WordPress 插件來最小化網站代碼,以加快加載速度;

      c.使用內容分發網絡 (CDN):CDN是一個分布式服務器網絡,可根據用戶位置向其分發 Web 內容,以加快加載速度。

      02

      使用戰略性內部鏈接

      完善的內部鏈接結構可以讓搜索引擎爬蟲更輕松地找到并理解您的內容。這可以更有效地利用您的爬蟲預算并提高您的排名潛力,同時,這也會為您的網站創建一個清晰且合乎邏輯的結構,方便用戶和搜索引擎瀏覽。?





      為所有重要頁面添加內部鏈接,以便 Google 更輕松地找到您最重要的內容。?

      這還可以幫助您避免無主頁面(沒有內部鏈接指向的頁面)。Google仍然可以找到這些頁面,但如果您有相關的內部鏈接指向它們,那么查找起來就容易多了。單擊項目的 “內部鏈接” 框中的 “查看詳情” 以查找內部鏈接的問題,您可看到網站內部鏈接結構的概覽,包括從主頁到每個頁面需要點擊多少次。






      您還將看到錯誤、警告和通知的列表。這些內容涵蓋諸如鏈接斷開、內部鏈接上的nofollow 屬性以及無錨文本的鏈接等問題。仔細檢查并糾正每個頁面上的問題,以便搜索引擎更輕松地抓取和索引您的內容。

      03

      保持網站地圖更新

      擁有最新的XML站點地圖是另一種讓Google找到您最重要的頁面的方法。添加新頁面時更新站點地圖可使這些頁面更有可能被抓取。Google建議僅在站點地圖中包含您希望出現在搜索結果中的URL,以避免浪費抓取配額。您還可以使用<lastmod>標簽來指示您上次更新給定URL的時間。但這不是必需的。

      04

      屏蔽你不想讓搜索引擎抓取

      的URL

      使用robots.txt文件(該文件會告訴搜索引擎機器人哪些頁面應該被抓取,哪些頁面不應該被抓取)來最大程度地減少Google抓取您不希望抓取的頁面的機會。這有助于減少抓取配額浪費。

      05

      刪除不必要的重定向

      重定向會將用戶(和機器人)從一個URL帶到另一個URL。這會減慢頁面加載時間并浪費抓取配額。如果您有重定向鏈,這種情況會特別成問題。當原始URL 和最終URL之間有多個重定向時,就會發生這種情況。像這樣:





      要了解有關在您的網站上設置的重定向的更多信息,請打開項目工具并導航到 “問題” 選項卡。在搜索欄中輸入“重定向”以查看與您網站重定向相關的問題,點擊 “原因及如何修復” 或 “了解更多” 以獲取有關每個問題的更多信息。并查看如何解決問題的指導。





      06

      修復損壞的鏈接

      斷開的鏈接是那些不會引導至實際頁面的鏈接,它們通常會返回404錯誤代碼。這不一定是壞事。事實上,不存在的頁面通常應該返回404狀態代碼。但大量指向不存在的損壞頁面的鏈接會浪費抓取配額。因為機器人可能仍會嘗試抓取它,即使頁面上沒有任何有價值的內容。

      07

      消除重復內容

      重復內容是指您的網站上有高度相似的頁面。這個問題會浪費抓取配額,因為機器人實際上是在抓取同一頁面的多個版本。重復內容有幾種形式。例如,相同或幾乎相同的頁面(通常要避免這種情況)。或者由URL參數導致的頁面變化(電子商務網站中很常見)。



      07


      通過定期網站診斷最大化網站的抓取配額



      定期監控和優化網站的問題有助于搜索引擎找到您的內容。定期使用Semrush對網站進行全面分析,可使我們第一時間發現問題并針對性解決問題,提升網站在搜索引擎中的綜合表現。




      Semrush是全球知名數字營銷工具,擁有包括:競爭對手流量分析,網站排名跟蹤,外鏈分析,關鍵字研究,PPC廣告分析,網站分析,社交媒體監控和內容規劃等服務。

      Cross Border Digital是Semrush在中國的重要戰略合作伙伴,也是目前中國唯一的Semrush官方授權一級代理,我們已創建Semrush官方學習群,感興趣的朋友請掃描下方二維碼入群交流!


      掃碼入群





      原文鏈接:https://www.semrush.com/blog/crawl-budget/




      END





      點贊(2) 打賞

      評論列表 共有 0 條評論

      暫無評論

      服務號

      訂閱號

      備注【拉群】

      商務洽談

      微信聯系站長

      發表
      評論
      立即
      投稿
      返回
      頂部