重復內容是指可以通過多個 URL 訪問相同或非常相似的內容。這些重復頁面是通過多種方式無意中創建的 - 例如,同時具有HTTP和HTTPS 版本的頁面;www 和非 www 頁面版本;UTM參數;分頁等。這時我們就需要對我們的網址進行規范化,確定首選網址。
為什么規范化很重要?
當搜索引擎抓取許多具有相同(或非常相似)內容的 URL 時,可能會導致許多SEO問題。首先,如果搜索爬蟲必須瀏覽太多重復的內容,他們可能會錯過一些獨特的內容。
其次,大規模重復可能會削弱你的排名能力。重復內容會導致關鍵字蠶食。當網站上的多個頁面競爭相同的排名時,就會發生這種情況。并在此過程中損害彼此的排名。
最后,即使你的內容確實排名,搜索引擎也可能會選擇錯誤的 URL。
通過正確使用規范標簽,你可以幫助 Google 了解你網站的結構。并確定重復頁面的最佳版本。
重復內容的可能原因?
l以下是適用于所有類型網站的重復內容的其他一些常見原因:
l具有搜索參數的參數化 URL??(例如example.com?q=search-term)
l具有會話 ID 的參數化 URL(例如,https://example.com?sessionid=3)
l擁有單獨的可打印頁面版本?(例如example.com/page?和example.com/print/page)
l不同類別下的帖子具有唯一的 URL??(例如example.com/?services?/?SEO/?和example.com/specials?/SEO/)
l擁有適用于不同設備類型的頁面?(例如example.com?和m.example.com)
l擁有?頁面的AMP和非 AMP版本?(例如example.com/page?和amp.example/page)
l在非 www 和 www 變體?(例如,http://example.com?和http://www.example.com)上提供相同的內容
l在非Https 和Https 變體上提供相同的內容?(例如,http://www.example.com?和https://www.example.com)
l使用或不使用尾部斜杠提供相同的內容?(例如,https://example.com/page/?和http://www.example.com/page)
l在頁面的默認版本?(例如索引頁面)上提供相同的內容(例如,https://www.example.com/、https://www.example.com/index.htm、https://www.example. com/index.html、https://www.example.com/index.php、https://www.example.com/default.htm等)
l使用或不使用大寫字母提供相同的內容?(例如,https://example.com/page/?和http://www.example.com/Page/)
l整個分頁系列中具有相同或非常相似的內容(例如:https:?//www.example.com/和Https://www.example.com/?page=2)
l為定位不同位置而創建的 URL(例如:https://en-us.example.com/ 和https://en-gb.example.com)
l聯合內容:如果你有一個網站將其內容聯合發布或被合作伙伴利用,你需要確保出現在搜索結果中的是你的版本。
Google官方提供的規范化網址方法
若要向 Google 搜索指定重復網頁或非常相似網頁的規范網址,你可以使用多種方法指明你更愿意使用哪個網址。這些方法按照其對規范化的影響程度排列如下:
重定向:強信號,表明重定向的目標應成為規范網址。
rel="canonical"?link?注釋:強信號,表明所指定的網址應成為規范網址。
站點地圖包含:弱信號,有助于站點地圖中包含的網址成為規范網址。
請注意,這些方法可以疊加,因此組合使用會更有效。 這意味著,如果你使用兩種或更多種方法,將會增加你的首選規范網址出現在搜索結果中的幾率。
這里查看更多https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls?hl=zh-cn
Google 如何確定頁面的規范版本?
當 Google 在索引過程中遇到多個看起來相似的頁面時,它會選擇一個頁面作為規范頁面。但谷歌是如何確定這一點的呢?他們考慮了以下一些因素:
1.移動設備優于桌面設備:通過移動優先索引方法,Google 將選擇在搜索結果中優先考慮頁面的移動版本而不是桌面版本,因為更多的用戶使用移動設備訪問網絡,并且 Google 的目標是在移動設備上提供最佳的用戶體驗。
2.基于HTTP的HTTPS:與非安全頁面 (HTTP) 相比,一般來說,Google 更喜歡提供安全頁面 (HTTPS)。
3.“干凈”的 URL 優于帶參數的 URL:谷歌喜歡更短、更干凈的網址,因為它認為它們對用戶更友好。例如,https://www.example.com/canonicalization/將比https://www.example.com/blog/canonicalization?2023=july/獲得更高的優先級
4.PDF 和其他文件格式的頁面:Google 通常會選擇網頁作為規范版本,因為它們比 PDF 或其他文件格式更容易被用戶訪問。
5.語言:如果你創建了針對多種語言和位置的頁面,Google 可能會將查詢語言視為規范語言,這意味著如果用戶使用法語執行搜索,Google 會選擇你的法語頁面作為規范頁面。
6.整體頁面信號:Google 評估各種頁面信號,包括用戶體驗 (UX)、專業知識、權威性、可信度 (EEAT) 和語言相關性。在這些領域表現出強烈信號的頁面更有可能被選為規范版本。
優化我們的首選頁面以符合 Google 的偏好將增加我們所需的規范頁面被選擇的可能性。
閱讀更多:https://www.womenintechseo.com/knowledge/dealing-with-duplicate-content-canonicalization-in-detail/
如何知道你的網站是否存在規范化問題??
1.查看源碼
在大多數瀏覽器中,你可以右鍵單擊查看源代碼,或者只需在地址欄中鍵入它,如下所示:?查看源代碼:https://moz.com/learn/seo/cano...源代碼,在<head>中搜索canonical標簽。如果存在,它應該如下所示:
?
1.使用Google Search Console
使用Google Search Console(https://search.google.com/search-console/about)了解 Google 認為你網站上任何頁面的規范 URL 。登錄后,在頂部搜索 URL。
當“URL 檢查”報告準備就緒時,打開“頁面索引”部分。向下滾動查看“Google 選擇的規范”。
如果這不是你的首選 URL,你需要檢查頁面上的重復數據刪除策略。?首先,請確保“用戶聲明的規范”存在且正確。
要批量檢查,可以使用Ahrefs, SEMrush, Screaming Frog等工具。另外,可以查看谷歌的Canonical 報告,如下圖
你如何解決此類問題?請按照以下步驟改進并提交給Google:?
1.HTTPS:與 (HTTP) 相比,Google 更喜歡安全頁面 (HTTPS)。給你的網站安裝SSL安全證書可以增強信號并符合 Google 對安全瀏覽體驗的偏好。
2.“干凈”的 URL 結構:擁有干凈且用戶友好的 URL,沒有過多的參數或分頁細節,向 Google 發出信號,表明這些是主要頁面,應該優先考慮。簡化你首選頁面的 URL 結構可以增強規范信號。
3.內部鏈接:內部鏈接表明你的頁面的重要性和相關性。確保你在內部鏈接時僅到規范版本(而不鏈接到非規范版本),這樣 Google 就很難忽視你的預期選擇。
4.hreflang注釋:在你的頁面上包含Hreflang 注釋可以讓 Google 了解你的位置和/或語言定位。這有助于確保提供最相關的頁面版本。?
5.網站地圖:在站點地圖中包含 URL 可以向 Google 表明你認為這些頁面很有價值并且值得優先考慮。因此,將規范 URL 放在站點地圖中可以增強信號,使 Google 更難以忽視。
6.外鏈:當其他網站鏈接到你的首選頁面時,它會向 Google 發出強烈信號,表明用戶發現你的內容有價值且有用。如果你正在從事公關或其他類型的鏈接建設活動,請確保你請求鏈接到你的頁面的規范版本(而不是非規范版本)。?
7.301 重定向:這里要小心!僅當沒有令人信服的理由導致頁面存在多個版本,并且你的目的是永久合并這些頁面版本時,才應考慮 301 重定向。在這種情況下實施 301 重定向不僅可以確保用戶登陸正確的版本,還可以傳輸鏈接權限和其他排名信號。?
所有這些規范化因素結合在一起,告訴 Google 你喜歡哪個 URL,并幫助證明你頁面上的規范鏈接元素是經過深思熟慮的。
指定規范URL的方法
規范標簽是一種告訴搜索引擎特定 URL 代表頁面主副本的方法。使用規范標簽可以防止由于多個 URL 上出現相同或“重復”內容而導致的問題。實際上,規范標簽告訴搜索引擎你希望在搜索結果中顯示哪個版本的 URL。一般規范標簽位于網頁HTML 源代碼的 <head> 部分,如下所示:
<link rel="canonical"??/>
通常,規范標簽從備用頁面指向首選頁面。但首選頁面也會使用自引用規范。
WordPress站網址規范化方法
你可以使用WordPress SEO 插件在 WordPress 網站上設置規范 URL 。?例如,Yoast SEO 插件,Rank Math SEO等。
其他方法
通常,你可以使用規范標簽指定規范 URL 首選項。但你還可以嘗試其他方法:
l在HTTP標頭中使用 rel="canonical"(最適合非HTML 文檔)
Link:<https://www.example.com/downloads/filename.pdf>; rel="canonical"
l將重復頁面重定向到規范頁面(最適合不需要保留的重復頁面)
Google建議使用 3xx 重定向(服務器端重定向)以獲得最快結果。一個常見的 SEO 問題是規范標簽是否像 301 重定向一樣傳遞鏈接資產(PageRank、權威等)。在大多數情況下,他們似乎是這樣,但這可能是一個危險的問題。請記住,這兩種解決方案為搜索爬蟲和網站訪問者創建了兩種截然不同的結果。
如果你?301 重定向頁面 A--> 頁面 B,那么人類訪問者將自動被帶到頁面 B,而永遠不會看到頁面 A。如果你?rel-canonical 頁面 A--> 頁面 B,那么搜索引擎將知道頁面 B 是規范,但人們將能夠訪問這兩個 URL。確保你的解決方案符合預期結果。
l僅在站點地圖中列出規范 URL(所有網站所有者的最佳實踐)
據谷歌稱,“站點地圖中列出的所有頁面都被建議為規范頁面” 。這意味著最好僅在站點地圖中提交規范 URL(和非重復頁面) 。并保留備用網址。
注意:如果你為特定頁面設置規范標簽,但隨后在站點地圖中包含該頁面的不同設置,或者內部鏈接到該非規范頁面,它會發送混合信號,并可能導致搜索引擎忽略規范標簽并自己選擇規范版本。所以保持一致性以向搜索引擎強調你的意圖。
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)