大家好!我是SEO小平,SEO捕魚大師,9年獨立站賣家,一直從事各個國家本土語言的獨立站SEO實操。加SEO小平微信的直接復制?Xiao_Ping_Up?,或者文末掃描二維碼
今天我們公司小伙伴說看到谷歌GSC的收錄數據提示WebP圖片都是已抓取-尚未編入索引,她打算直接用robots.txt 阻止掉所有WebP的爬取,你們說能這樣做嗎?

?截圖來源:danielkcheung.com
其實這個問題困擾我們也很多年了,一直沒辦法徹底解決這個問題。今天我也互聯網查詢了很多資料,最后搞明白了,這TM是GSC這個工具的Bug。
主要參考資料來源:
參考一:
https://www.danielkcheung.com/why-are-webp-and-webm-files-showing-up-as-crawled-currently-not-indexed-in-search-console/
參考二:谷歌官方John Mueller 的解釋
https://www.searchenginejournal.com/googles-john-mueller-clarifies-webp-image-indexing-confusion/485844/
SEO小平把這些內容總結如下:GSC報錯的原因是因為在GSC收錄板塊的【頁面】里面看索引的數據,但是實際Webp不是HTML頁面,所以從HTML頁面的角度來判斷他是不索引的

這個現象的根源在于我們查看 GSC 報告的 頁面視角。該報告主要關注的是?HTML 網頁?的索引情況。當 WebP 圖片 URL 出現在這里并顯示“未索引”時,并不意味著它作為圖片資源沒有被 Google 處理。更重要的是,理解這一點能幫助我們避免一個嚴重的 SEO 錯誤:絕對不要在?robots.txt
?中阻止 Google 抓取 WebP 文件!
核心原因:GSC“網頁索引”報告的視角偏差
GSC 中的“網頁索引”(Pages) 報告,其核心功能是告訴您,您網站上哪些 URL 被 Google 視為?獨立的、可以在標準網頁搜索結果中展示的 HTML 頁面,以及它們的索引狀態。
當 Googlebot 抓取您的網站并發現一個 WebP 圖片文件的 URL 時,它會嘗試理解這個 URL。但是,當這個 URL 的信息被放入“網頁索引”報告進行評估時,它是?從“這是否是一個合格的網頁?”的角度?來判斷的。
顯而易見,一個?.webp
?文件是一個圖片資源,它本身并不是一個包含文本、鏈接等元素的獨立 HTML 文檔。因此,從“網頁索引”報告的視角來看,它不符合被收錄為標準網頁搜索結果的標準,自然會被標記為“已抓取 - 尚未編入索引”或“被發現 - 尚未編入索引”等。
關鍵區別:“頁面未索引” ≠ “圖片未被處理”
這是最需要厘清的一點:
-
“未索引”(在 GSC 網頁報告中)
:指的是這個 URL?不符合作為獨立網頁被索引的條件。 -
“圖片資源被處理/索引”
:Google 需要抓取并訪問這個 WebP 圖片文件本身,以便: -
正確渲染包含該圖片的網頁:
?Google 需要“看到”用戶所看到的完整頁面。 -
分析圖片內容:
?用于 Google 圖片搜索 (Google Images) 的索引和排名。 -
評估圖片質量和相關性:
?作為理解網頁內容的一部分。
所以,即使 GSC 的“網頁索引”報告顯示 WebP URL“未索引”,這?完全不代表?Google 沒有處理這個圖片或者它不會出現在 Google 圖片搜索中。它僅僅意味著,從“網頁”的角度評判,這個 URL 不合格。而作為“圖片”,它很可能已經被 Google 正常處理,并有資格被納入 Google 圖片搜索的索引庫。
致命誤區:絕不能在?robots.txt
?中屏蔽 WebP 抓取!
理解了上述報告視角的偏差后,最關鍵的行動就是?避免犯一個常見的嚴重錯誤。有些網站管理員可能會錯誤地認為:“既然 GSC 說這些 WebP 沒被(網頁)索引,那我不如在?robots.txt
?文件里把它們屏蔽掉,讓報告‘干凈’一些。”
這是一個“自殘”的想法!請絕對不要這樣做!
Disallow: /*.webp
?(或類似阻止抓取圖片目錄的規則)
如果在?robots.txt
?中阻止 Googlebot 抓取您的 WebP (或其他任何格式的) 圖片文件,會發生什么?
-
Google 無法訪問圖片:
?Googlebot 將遵守? robots.txt
?的指令,不再下載這些圖片文件。 -
圖片無法被圖片搜索索引:
?因為 Google 無法獲取和分析圖片內容,這些圖片將?絕對不會?出現在 Google 圖片搜索結果中。如果您的網站依賴圖片搜索流量,這將是巨大的損失。 -
影響頁面理解和渲染:
?Google 可能無法完全理解和渲染包含這些被屏蔽圖片的頁面,潛在地影響該頁面的整體評估。
正確的應對策略:接受報告,優化圖片,確保可抓取
面對 GSC 中 WebP 圖片的“未索引”狀態,正確的做法是:
-
理解并接受報告狀態:
?認識到這是 GSC“網頁索引”報告特定視角下的正常反饋,不必為此焦慮。它反映的是 URL 作為“網頁”的資格,而非作為“圖片”的處理狀態。 -
檢查核心頁面的索引:
?使用 GSC 的“網址檢查工具”確保那些?嵌入了?WebP 圖片的?HTML 頁面?被成功索引。這才是關鍵所在。 -
優化圖片 SEO:
?專注于實際能提升圖片可見性的措施:使用描述性的 Alt 文本、有意義的文件名、將圖片置于相關內容中、優化圖片大小和質量。 -
確保圖片可抓取性:
?檢查您的? robots.txt
?文件,確保沒有任何規則阻止 Googlebot 訪問您的 WebP 文件或包含圖片的目錄。?這是底線! -
監控圖片搜索表現:
?在 GSC 的“效果”報告中,篩選“圖片”搜索類型,關注實際的圖片搜索數據(展示次數、點擊次數),這比糾結于“網頁索引”報告中的狀態更有意義。
GSC 中 WebP 圖片顯示為“已抓取 - 尚未編入索引”通常源于報告本身的評估視角,它判斷的是 URL 作為“網頁”的資格。這并不意味著圖片本身未被 Google 處理或不會出現在圖片搜索中。最關鍵的行動是,絕不能因為這個報告狀態而在?robots.txt
?中阻止 Google 抓取這些圖片文件,否則將嚴重損害您的圖片 SEO 效果。請將精力放在確保核心頁面被索引、遵循圖片 SEO 最佳實踐,并保證您的圖片資源對 Googlebot 始終是可訪問的。
-------------
SEO小平作為9年SEO小語種跨境電商賣家,把整套SEO搞成了完整的SOP開課培訓需要了解SEO培訓陪跑課程的朋友可以加SEO小平的微信。



以往的文章也是干貨,歡迎閱讀和轉發
谷歌算法又雙叒叕更新?Google SEO算法為啥一直在更新?
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)