重復(fù)內(nèi)容是指可以通過多個(gè) URL 訪問相同或非常相似的內(nèi)容。這些重復(fù)頁面是通過多種方式無意中創(chuàng)建的 - 例如,同時(shí)具有HTTPHTTPS 版本的頁面;www 和非 www 頁面版本;UTM參數(shù);分頁等。這時(shí)我們就需要對(duì)我們的網(wǎng)址進(jìn)行規(guī)范化,確定首選網(wǎng)址

      為什么規(guī)范化很重要?

      當(dāng)搜索引擎抓取許多具有相同(或非常相似)內(nèi)容的 URL 時(shí),可能會(huì)導(dǎo)致許多SEO問題。首先,如果搜索爬蟲必須瀏覽太多重復(fù)的內(nèi)容,他們可能會(huì)錯(cuò)過一些獨(dú)特的內(nèi)容。

      其次,大規(guī)模重復(fù)可能會(huì)削弱你的排名能力。重復(fù)內(nèi)容會(huì)導(dǎo)致關(guān)鍵字蠶食。當(dāng)網(wǎng)站上的多個(gè)頁面競(jìng)爭(zhēng)相同的排名時(shí),就會(huì)發(fā)生這種情況。并在此過程中損害彼此的排名。

      最后,即使的內(nèi)容確實(shí)排名,搜索引擎也可能會(huì)選擇錯(cuò)誤的 URL。

      通過正確使用規(guī)范標(biāo)簽,可以幫助 Google 了解網(wǎng)站的結(jié)構(gòu)。并確定重復(fù)頁面的最佳版本。

      重復(fù)內(nèi)容的可能原因?

      l以下是適用于所有類型網(wǎng)站的重復(fù)內(nèi)容的其他一些常見原因:

      l具有搜索參數(shù)的參數(shù)化 URL??(例如example.com?q=search-term)

      l具有會(huì)話 ID 的參數(shù)化 URL(例如,https://example.com?sessionid=3)

      l擁有單獨(dú)的可打印頁面版本?(例如example.com/page?和example.com/print/page)

      l不同類別下的帖子具有唯一的 URL??(例如example.com/?services?/?SEO/?和example.com/specials?/SEO/)

      l擁有適用于不同設(shè)備類型的頁面?(例如example.com?和m.example.com)

      l擁有?頁面的AMP和非 AMP版本?(例如example.com/page?和amp.example/page)

      l在非 www 和 www 變體?(例如,http://example.com?和http://www.example.com)上提供相同的內(nèi)容

      l在非Https 和Https 變體上提供相同的內(nèi)容?(例如,http://www.example.com?和https://www.example.com)

      l使用或不使用尾部斜杠提供相同的內(nèi)容?(例如,https://example.com/page/?和http://www.example.com/page)

      l在頁面的默認(rèn)版本?(例如索引頁面)上提供相同的內(nèi)容(例如,https://www.example.com/、https://www.example.com/index.htm、https://www.example. com/index.html、https://www.example.com/index.php、https://www.example.com/default.htm等)

      l使用或不使用大寫字母提供相同的內(nèi)容?(例如,https://example.com/page/?和http://www.example.com/Page/)

      l整個(gè)分頁系列中具有相同或非常相似的內(nèi)容(例如:https:?//www.example.com/Https://www.example.com/?page=2)

      l為定位不同位置而創(chuàng)建的 URL(例如:https://en-us.example.com/ 和https://en-gb.example.com)

      l聯(lián)合內(nèi)容:如果有一個(gè)網(wǎng)站將其內(nèi)容聯(lián)合發(fā)布或被合作伙伴利用,需要確保出現(xiàn)在搜索結(jié)果中的版本。

      Google官方提供的規(guī)范化網(wǎng)址方法

      若要向 Google 搜索指定重復(fù)網(wǎng)頁或非常相似網(wǎng)頁的規(guī)范網(wǎng)址,可以使用多種方法指明更愿意使用哪個(gè)網(wǎng)址。這些方法按照其對(duì)規(guī)范化的影響程度排列如下:

      • 重定向:強(qiáng)信號(hào),表明重定向的目標(biāo)應(yīng)成為規(guī)范網(wǎng)址。

      • rel="canonical"?link?注釋:強(qiáng)信號(hào),表明所指定的網(wǎng)址應(yīng)成為規(guī)范網(wǎng)址。

      • 站點(diǎn)地圖包含:弱信號(hào),有助于站點(diǎn)地圖中包含的網(wǎng)址成為規(guī)范網(wǎng)址。

      請(qǐng)注意,這些方法可以疊加,因此組合使用會(huì)更有效。 這意味著,如果使用兩種或更多種方法,將會(huì)增加的首選規(guī)范網(wǎng)址出現(xiàn)在搜索結(jié)果中的幾率。

      這里查看更多https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls?hl=zh-cn

      Google 如何確定頁面的規(guī)范版本?

      當(dāng) Google 在索引過程中遇到多個(gè)看起來相似的頁面時(shí),它會(huì)選擇一個(gè)頁面作為規(guī)范頁面。但谷歌是如何確定這一點(diǎn)的呢?他們考慮了以下一些因素:

      1.移動(dòng)設(shè)備優(yōu)于桌面設(shè)備:通過移動(dòng)優(yōu)先索引方法,Google 將選擇在搜索結(jié)果中優(yōu)先考慮頁面的移動(dòng)版本而不是桌面版本,因?yàn)楦嗟挠脩羰褂靡苿?dòng)設(shè)備訪問網(wǎng)絡(luò),并且 Google 的目標(biāo)是在移動(dòng)設(shè)備上提供最佳的用戶體驗(yàn)。

      2.基于HTTPHTTPS:與非安全頁面 (HTTP) 相比,一般來說,Google 更喜歡提供安全頁面 (HTTPS)。

      3.“干凈”的 URL 優(yōu)于帶參數(shù)的 URL:谷歌喜歡更短、更干凈的網(wǎng)址,因?yàn)樗J(rèn)為它們對(duì)用戶更友好。例如,https://www.example.com/canonicalization/將比https://www.example.com/blog/canonicalization?2023=july/獲得更高的優(yōu)先級(jí)

      4.PDF 和其他文件格式的頁面:Google 通常會(huì)選擇網(wǎng)頁作為規(guī)范版本,因?yàn)樗鼈儽?PDF 或其他文件格式更容易被用戶訪問。

      5.語言:如果創(chuàng)建了針對(duì)多種語言和位置的頁面,Google 可能會(huì)將查詢語言視為規(guī)范語言,這意味著如果用戶使用法語執(zhí)行搜索,Google 會(huì)選擇的法語頁面作為規(guī)范頁面。

      6.整體頁面信號(hào)Google 評(píng)估各種頁面信號(hào),包括用戶體驗(yàn) (UX)、專業(yè)知識(shí)、權(quán)威性、可信度 (EEAT) 和語言相關(guān)性。在這些領(lǐng)域表現(xiàn)出強(qiáng)烈信號(hào)的頁面更有可能被選為規(guī)范版本。

      優(yōu)化我們的首選頁面以符合 Google 的偏好將增加我們所需的規(guī)范頁面被選擇的可能性。

      閱讀更多:https://www.womenintechseo.com/knowledge/dealing-with-duplicate-content-canonicalization-in-detail/

      如何知道的網(wǎng)站是否存在規(guī)范化問題??

      1.查看源碼

      在大多數(shù)瀏覽器中,可以右鍵單擊查看源代碼,或者只需在地址欄中鍵入它,如下所示:?查看源代碼:https://moz.com/learn/seo/cano...源代碼,在<head>中搜索canonical標(biāo)簽。如果存在,它應(yīng)該如下所示:

      ?

      1.使用Google Search Console

      使用Google Search Consolehttps://search.google.com/search-console/about)了解 Google 認(rèn)為網(wǎng)站上任何頁面的規(guī)范 URL 。登錄后,在頂部搜索 URL。

      當(dāng)“URL 檢查”報(bào)告準(zhǔn)備就緒時(shí),打開“頁面索引”部分。向下滾動(dòng)查看“Google 選擇的規(guī)范”。

      如果這不是的首選 URL,需要檢查頁面上的重復(fù)數(shù)據(jù)刪除策略。?首先,請(qǐng)確保“用戶聲明的規(guī)范”存在且正確。

      要批量檢查,可以使用Ahrefs, SEMrush, Screaming Frog等工具。另外,可以查看谷歌的Canonical 報(bào)告如下圖

      如何解決此類問題?請(qǐng)按照以下步驟改進(jìn)并提交給Google?

      1.HTTPS: (HTTP) 相比,Google 更喜歡安全頁面 (HTTPS)。給你的網(wǎng)站安裝SSL安全證書可以增強(qiáng)信號(hào)并符合 Google 對(duì)安全瀏覽體驗(yàn)的偏好。

      2.“干凈”的 URL 結(jié)構(gòu):擁有干凈且用戶友好的 URL,沒有過多的參數(shù)或分頁細(xì)節(jié),向 Google 發(fā)出信號(hào),表明這些是主要頁面,應(yīng)該優(yōu)先考慮。簡(jiǎn)化首選頁面的 URL 結(jié)構(gòu)可以增強(qiáng)規(guī)范信號(hào)。

      3.內(nèi)部鏈接:內(nèi)部鏈接表明的頁面的重要性和相關(guān)性。確保在內(nèi)部鏈接時(shí)僅到規(guī)范版本(而不鏈接到非規(guī)范版本),這樣 Google 就很難忽視的預(yù)期選擇。

      4.hreflang注釋:的頁面上包含Hreflang 注釋可以讓 Google 了解的位置和/或語言定位。這有助于確保提供最相關(guān)的頁面版本。?

      5.網(wǎng)站地圖:在站點(diǎn)地圖中包含 URL 可以向 Google 表明認(rèn)為這些頁面很有價(jià)值并且值得優(yōu)先考慮。因此,將規(guī)范 URL 放在站點(diǎn)地圖中可以增強(qiáng)信號(hào),使 Google 更難以忽視。

      6.外鏈當(dāng)其他網(wǎng)站鏈接到的首選頁面時(shí),它會(huì)向 Google 發(fā)出強(qiáng)烈信號(hào),表明用戶發(fā)現(xiàn)的內(nèi)容有價(jià)值且有用。如果正在從事公關(guān)或其他類型的鏈接建設(shè)活動(dòng),請(qǐng)確保請(qǐng)求鏈接到的頁面的規(guī)范版本(而不是非規(guī)范版本)。?

      7.301 重定向:這里要小心!僅當(dāng)沒有令人信服的理由導(dǎo)致頁面存在多個(gè)版本,并且的目的是永久合并這些頁面版本時(shí),才應(yīng)考慮 301 重定向。在這種情況下實(shí)施 301 重定向不僅可以確保用戶登陸正確的版本,還可以傳輸鏈接權(quán)限和其他排名信號(hào)。?

      所有這些規(guī)范化因素結(jié)合在一起,告訴 Google 喜歡哪個(gè) URL,并幫助證明頁面上的規(guī)范鏈接元素是經(jīng)過深思熟慮的。

      指定規(guī)范URL的方法

      規(guī)范標(biāo)簽是一種告訴搜索引擎特定 URL 代表頁面主副本的方法。使用規(guī)范標(biāo)簽可以防止由于多個(gè) URL 上出現(xiàn)相同或“重復(fù)”內(nèi)容而導(dǎo)致的問題。實(shí)際上,規(guī)范標(biāo)簽告訴搜索引擎希望在搜索結(jié)果中顯示哪個(gè)版本的 URL。一般規(guī)范標(biāo)簽位于網(wǎng)頁HTML 源代碼的 <head> 部分,如下所示:

      <link rel="canonical"??/>

      通常,規(guī)范標(biāo)簽從備用頁面指向首選頁面。但首選頁面也會(huì)使用自引用規(guī)范。

      WordPress站網(wǎng)址規(guī)范化方法

      可以使用WordPress SEO 插件在 WordPress 網(wǎng)站上設(shè)置規(guī)范 URL 。?例如,Yoast SEO 插件Rank Math SEO等。

      其他方法

      通常,可以使用規(guī)范標(biāo)簽指定規(guī)范 URL 首選項(xiàng)。但還可以嘗試其他方法:

      lHTTP標(biāo)頭中使用 rel="canonical"(最適合非HTML 文檔)

      Link:<https://www.example.com/downloads/filename.pdf>; rel="canonical"

      l將重復(fù)頁面重定向到規(guī)范頁面(最適合不需要保留的重復(fù)頁面)

      Google建議使用 3xx 重定向(服務(wù)器端重定向)以獲得最快結(jié)果。一個(gè)常見的 SEO 問題是規(guī)范標(biāo)簽是否像 301 重定向一樣傳遞鏈接資產(chǎn)(PageRank、權(quán)威等)。在大多數(shù)情況下,他們似乎是這樣,但這可能是一個(gè)危險(xiǎn)的問題。請(qǐng)記住,這兩種解決方案為搜索爬蟲和網(wǎng)站訪問者創(chuàng)建了兩種截然不同的結(jié)果。

      如果?301 重定向頁面 A--> 頁面 B,那么人類訪問者將自動(dòng)被帶到頁面 B,而永遠(yuǎn)不會(huì)看到頁面 A。如果?rel-canonical 頁面 A--> 頁面 B,那么搜索引擎將知道頁面 B 是規(guī)范,但人們將能夠訪問這兩個(gè) URL。確保的解決方案符合預(yù)期結(jié)果。

      l僅在站點(diǎn)地圖中列出規(guī)范 URL(所有網(wǎng)站所有者的最佳實(shí)踐)

      據(jù)谷歌稱,“站點(diǎn)地圖中列出的所有頁面都被建議為規(guī)范頁面” 。這意味著最好僅在站點(diǎn)地圖中提交規(guī)范 URL(和非重復(fù)頁面) 。并保留備用網(wǎng)址。

      注意如果為特定頁面設(shè)置規(guī)范標(biāo)簽,但隨后在站點(diǎn)地圖中包含該頁面的不同設(shè)置,或者內(nèi)部鏈接到該非規(guī)范頁面,它會(huì)發(fā)送混合信號(hào),并可能導(dǎo)致搜索引擎忽略規(guī)范標(biāo)簽并自己選擇規(guī)范版本。所以保持一致性向搜索引擎強(qiáng)調(diào)的意圖。



      點(diǎn)贊(3) 打賞

      評(píng)論列表 共有 0 條評(píng)論

      暫無評(píng)論

      服務(wù)號(hào)

      訂閱號(hào)

      備注【拉群】

      商務(wù)洽談

      微信聯(lián)系站長(zhǎng)

      發(fā)表
      評(píng)論
      立即
      投稿
      返回
      頂部