大家好!我是SEO小平,SEO捕魚大師,9年獨立站賣家,一直從事各個國家本土語言的獨立站SEO實操。加SEO小平微信的直接復制?Xiao_Ping_Up?,或者文末掃描二維碼


      今天我們公司小伙伴說看到谷歌GSC的收錄數據提示WebP圖片都是已抓取-尚未編入索引,她打算直接用robots.txt 阻止掉所有WebP的爬取,你們說能這樣做嗎?

      ?截圖來源:danielkcheung.com

      其實這個問題困擾我們也很多年了,一直沒辦法徹底解決這個問題。今天我也互聯網查詢了很多資料,最后搞明白了,這TM是GSC這個工具的Bug。

      主要參考資料來源:

      參考一:

      https://www.danielkcheung.com/why-are-webp-and-webm-files-showing-up-as-crawled-currently-not-indexed-in-search-console/

      參考二:谷歌官方John Mueller 的解釋

      https://www.searchenginejournal.com/googles-john-mueller-clarifies-webp-image-indexing-confusion/485844/

      SEO小平把這些內容總結如下:GSC報錯的原因是因為在GSC收錄板塊的【頁面】里面看索引的數據,但是實際Webp不是HTML頁面,所以從HTML頁面的角度來判斷他是不索引的


      這個現象的根源在于我們查看 GSC 報告的 頁面視角。該報告主要關注的是?HTML 網頁?的索引情況。當 WebP 圖片 URL 出現在這里并顯示“未索引”時,并不意味著它作為圖片資源沒有被 Google 處理。更重要的是,理解這一點能幫助我們避免一個嚴重的 SEO 錯誤:絕對不要在?robots.txt?中阻止 Google 抓取 WebP 文件!

      核心原因:GSC“網頁索引”報告的視角偏差

      GSC 中的“網頁索引”(Pages) 報告,其核心功能是告訴您,您網站上哪些 URL 被 Google 視為?獨立的、可以在標準網頁搜索結果中展示的 HTML 頁面,以及它們的索引狀態。

      當 Googlebot 抓取您的網站并發現一個 WebP 圖片文件的 URL 時,它會嘗試理解這個 URL。但是,當這個 URL 的信息被放入“網頁索引”報告進行評估時,它是?從“這是否是一個合格的網頁?”的角度?來判斷的。

      顯而易見,一個?.webp?文件是一個圖片資源,它本身并不是一個包含文本、鏈接等元素的獨立 HTML 文檔。因此,從“網頁索引”報告的視角來看,它不符合被收錄為標準網頁搜索結果的標準,自然會被標記為“已抓取 - 尚未編入索引”或“被發現 - 尚未編入索引”等。

      關鍵區別:“頁面未索引” ≠ “圖片未被處理”

      這是最需要厘清的一點:

      • “未索引”(在 GSC 網頁報告中)
        :指的是這個 URL?不符合作為獨立網頁被索引的條件
      • “圖片資源被處理/索引”
        :Google 需要抓取并訪問這個 WebP 圖片文件本身,以便:
        • 正確渲染包含該圖片的網頁:
          ?Google 需要“看到”用戶所看到的完整頁面。
        • 分析圖片內容:
          ?用于 Google 圖片搜索 (Google Images) 的索引和排名。
        • 評估圖片質量和相關性:
          ?作為理解網頁內容的一部分。

      所以,即使 GSC 的“網頁索引”報告顯示 WebP URL“未索引”,這?完全不代表?Google 沒有處理這個圖片或者它不會出現在 Google 圖片搜索中。它僅僅意味著,從“網頁”的角度評判,這個 URL 不合格。而作為“圖片”,它很可能已經被 Google 正常處理,并有資格被納入 Google 圖片搜索的索引庫。

      致命誤區:絕不能在?robots.txt?中屏蔽 WebP 抓取!

      理解了上述報告視角的偏差后,最關鍵的行動就是?避免犯一個常見的嚴重錯誤。有些網站管理員可能會錯誤地認為:“既然 GSC 說這些 WebP 沒被(網頁)索引,那我不如在?robots.txt?文件里把它們屏蔽掉,讓報告‘干凈’一些。”

      這是一個“自殘”的想法!請絕對不要這樣做!

      Disallow: /*.webp?(或類似阻止抓取圖片目錄的規則)

      如果在?robots.txt?中阻止 Googlebot 抓取您的 WebP (或其他任何格式的) 圖片文件,會發生什么?

      1. Google 無法訪問圖片:
        ?Googlebot 將遵守?robots.txt?的指令,不再下載這些圖片文件。
      2. 圖片無法被圖片搜索索引:
        ?因為 Google 無法獲取和分析圖片內容,這些圖片將?絕對不會?出現在 Google 圖片搜索結果中。如果您的網站依賴圖片搜索流量,這將是巨大的損失。
      3. 影響頁面理解和渲染:
        ?Google 可能無法完全理解和渲染包含這些被屏蔽圖片的頁面,潛在地影響該頁面的整體評估。

      正確的應對策略:接受報告,優化圖片,確保可抓取

      面對 GSC 中 WebP 圖片的“未索引”狀態,正確的做法是:

      1. 理解并接受報告狀態:
        ?認識到這是 GSC“網頁索引”報告特定視角下的正常反饋,不必為此焦慮。它反映的是 URL 作為“網頁”的資格,而非作為“圖片”的處理狀態。
      2. 檢查核心頁面的索引:
        ?使用 GSC 的“網址檢查工具”確保那些?嵌入了?WebP 圖片的?HTML 頁面?被成功索引。這才是關鍵所在。
      3. 優化圖片 SEO:
        ?專注于實際能提升圖片可見性的措施:使用描述性的 Alt 文本、有意義的文件名、將圖片置于相關內容中、優化圖片大小和質量。
      4. 確保圖片可抓取性:
        ?檢查您的?robots.txt?文件,確保沒有任何規則阻止 Googlebot 訪問您的 WebP 文件或包含圖片的目錄。?這是底線!
      5. 監控圖片搜索表現:
        ?在 GSC 的“效果”報告中,篩選“圖片”搜索類型,關注實際的圖片搜索數據(展示次數、點擊次數),這比糾結于“網頁索引”報告中的狀態更有意義。


      GSC 中 WebP 圖片顯示為“已抓取 - 尚未編入索引”通常源于報告本身的評估視角,它判斷的是 URL 作為“網頁”的資格。這并不意味著圖片本身未被 Google 處理或不會出現在圖片搜索中。最關鍵的行動是,絕不能因為這個報告狀態而在?robots.txt?中阻止 Google 抓取這些圖片文件,否則將嚴重損害您的圖片 SEO 效果。請將精力放在確保核心頁面被索引、遵循圖片 SEO 最佳實踐,并保證您的圖片資源對 Googlebot 始終是可訪問的。

      -------------

      SEO小平作為9年SEO小語種跨境電商賣家,把整套SEO搞成了完整的SOP開課培訓需要了解SEO培訓陪跑課程的朋友可以加SEO小平的微信。

      圖片
      圖片
      Image

      以往的文章也是干貨,歡迎閱讀和轉發

      圖片

      獨立站 SEO 全面指南

      Google SEO 術語掃盲貼,你是否都知道這些含義

      社媒短視頻流量那么大,2025還要不要做外貿獨立站

      AI就是個充氣娃娃,擺弄什么姿勢(知識)取決于你的技術

      谷歌算法又雙叒叕更新?Google SEO算法為啥一直在更新?

      谷歌3月算法更新,我的小語種SEO流量翻倍

      谷歌SEO需要多久才會有效果?

      給小白的寶典:SEO關鍵詞調研和布局-文字+視頻

      了解獨立站的引流方式,招聘最合適的人才



      點贊(14) 打賞

      評論列表 共有 0 條評論

      暫無評論

      服務號

      訂閱號

      備注【拉群】

      商務洽談

      微信聯系站長

      發表
      評論
      立即
      投稿
      返回
      頂部