前幾天,有朋友咨詢自己的網(wǎng)站內(nèi)容被惡意抓取,展示在別人的網(wǎng)站上,該怎么辦?今天我們就講一下如何Google中刪除網(wǎng)址Google中刪除網(wǎng)址的方法有很多種,但沒(méi)有一種方法萬(wàn)能的。這取決于當(dāng)前的情況。使用錯(cuò)誤的方法有時(shí)不僅會(huì)導(dǎo)致頁(yè)面未按預(yù)期從索引中刪除,而且可能對(duì)SEO產(chǎn)生負(fù)面影響。

      為了幫助快速確定哪種刪除方法最適合,我們制作了一個(gè)流程圖,以便可以跳到你最需要的部分。


      在這篇文章中,將了解到:

      1. 如何檢查URL是否已編入索引

      2. Google中刪除網(wǎng)址的五種方法

      3. 如何確定移除的優(yōu)先順序

      4. 要避免的常見(jiàn)錯(cuò)誤

      5. 如何刪除不在網(wǎng)站上的內(nèi)容

      6. 如何刪除圖像

      如何檢查URL是否已編入索引

      通常檢查內(nèi)容是否被索引的做法是使用site:在Google中搜索。site:搜索可用于查看網(wǎng)站的頁(yè)面,如果你的頁(yè)面顯示在搜索結(jié)果中,這也并不能說(shuō)明你的頁(yè)面索引或沒(méi)有被索引site:搜索可能只是顯示Google已知的頁(yè)面并不意味著這些頁(yè)面有資格在其他搜索詞的SERP中參與排名

      例如,site:搜索仍然可以顯示重定向或規(guī)范化到另一個(gè)頁(yè)面的頁(yè)面。當(dāng)請(qǐng)求訪問(wèn)特定網(wǎng)站時(shí),Google可能會(huì)顯示該域名下的頁(yè)面,以及其他域名下的內(nèi)容、標(biāo)題和說(shuō)明。以moz.com為例,它以前是seomoz.org。當(dāng)你查詢指向moz.com上的頁(yè)面時(shí),會(huì)在SERP中顯示moz.com,而查詢site:seomoz.org將在SERP中顯示seomoz.org。
      不了解這個(gè)重要區(qū)別可能會(huì)導(dǎo)致SEO犯錯(cuò)誤,例如主動(dòng)阻止URL或從舊域名索引中刪除URL,導(dǎo)致阻止諸如PageRank等信號(hào)的傳遞。我見(jiàn)過(guò)很多域名遷移的案例,人們認(rèn)為他們?cè)谶w移過(guò)程出了問(wèn)題,因?yàn)檫@些頁(yè)面仍然顯示site:old-domain.com搜索,然后嘗試“修復(fù)”問(wèn)題導(dǎo)致損害網(wǎng)站。

      更好檢查索引的方法是使用Google Search Console中的索引覆蓋率報(bào)告,或針對(duì)單個(gè)URL使用URL檢查工具。這些工具會(huì)告訴某個(gè)頁(yè)面是否已編入索引,并提供有關(guān)Google如何處理該頁(yè)面的附加信息。如果無(wú)權(quán)訪問(wèn)此內(nèi)容,只需在Google中搜索頁(yè)面的完整URL即可。

      AhrefsSEMrush等工具查找“熱門(mén)頁(yè)面”報(bào)告或自然關(guān)鍵字排名中找到該頁(yè)面,通常意味著我們看到它在正常搜索查詢中排名,并且很好地表明該頁(yè)面已被索引。請(qǐng)注意,當(dāng)我們看到這些頁(yè)面時(shí),它們已被索引,但此時(shí)這個(gè)頁(yè)面可能已經(jīng)改變

      如果特定URL存在問(wèn)題并且需要從索引中刪除,請(qǐng)按照本文開(kāi)頭的流程圖查找正確的刪除方法,然后跳轉(zhuǎn)到下面的相應(yīng)部分。

      刪除方法?1:刪除內(nèi)容

      如果刪除頁(yè)面并提供404(未找到)或410(消失)狀態(tài)代碼,則在重新抓取頁(yè)面后不久,該頁(yè)面將從索引中刪除。在刪除之前,該頁(yè)面可能仍會(huì)顯示在搜索結(jié)果中。即使頁(yè)面本身不再可用,頁(yè)面的緩存版本也可能暫時(shí)可用。

      此時(shí)你可能有以下幾種選擇

      • 我需要立即刪除?請(qǐng)參閱URL刪除工具部分。

      • 我需要整合鏈接信號(hào)?請(qǐng)參閱規(guī)范化部分。

      • 我需要該頁(yè)面可供用戶使用。?查看noindex或限制訪問(wèn)部分是否適合的情況。

      下拉跳轉(zhuǎn)到你需要部分。

      刪除方法?2:Noindex

      Noindex?Robots?meta標(biāo)X-Robots-Tag標(biāo)頭可以告訴搜索引擎從索引中刪除頁(yè)面。Noindex?Robots?meta標(biāo)記適用于頁(yè)面,而X-Robots-Tag標(biāo)頭適用于頁(yè)面和其他文件類型(例如PDF)。為了讓這些標(biāo)簽可見(jiàn),搜索引擎需要能夠抓取頁(yè)面,因此請(qǐng)確保它們沒(méi)有在robots.txt中被阻止。另請(qǐng)注意,從索引中刪除頁(yè)面可能會(huì)阻止鏈接其他信號(hào)的合并。

      Noindex?Robots?meta標(biāo)記的示例:

      <meta name="robots" content="noindex">
      Noindex?X-Robots-Tag標(biāo)頭中的示例:

      HTTP/1.1 200 OKX-Robots-Tag: noindex
      關(guān)于Robots?meta標(biāo)X-Robots-Tag標(biāo)頭的介紹和用法,請(qǐng)查看:

      https://developers.google.com/search/docs/crawling-indexing/robots-meta-tag?hl=zh-cn

      此時(shí)你可能面臨的選擇:

      • 我不希望用戶訪問(wèn)這些頁(yè)面。?請(qǐng)參閱限制訪問(wèn)部分。

      • 我需要整合鏈接等信號(hào)。?請(qǐng)參閱規(guī)范化部分。

      刪除方法?3:限制訪問(wèn)

      如果希望某些用戶可以訪問(wèn)該頁(yè)面,但搜索引擎不能訪問(wèn)該頁(yè)面,那么可能需要以下三個(gè)方式之一:

      • 登錄系統(tǒng);

      • HTTP身份驗(yàn)證?(需要密碼才能訪問(wèn));

      • IP白名單(僅允許特定IP地址訪問(wèn)頁(yè)面)

      這種類型的設(shè)置最適合內(nèi)部網(wǎng)絡(luò)、僅限會(huì)員的內(nèi)容或暫存、測(cè)試或開(kāi)發(fā)站點(diǎn)等內(nèi)容。它允許一組用戶訪問(wèn)該頁(yè)面,但搜索引擎無(wú)法訪問(wèn),也不會(huì)索引這些頁(yè)面。

      此時(shí)你可能面臨的選擇:
      我需要立即移除。?請(qǐng)參閱URL刪除工具部分。在這種特殊情況下,如果嘗試隱藏的內(nèi)容已被緩存,并且需要防止用戶看到該內(nèi)容,可能需要立即刪除。

      刪除方法?4:URL刪除工具

      谷歌給這個(gè)工具的名字有點(diǎn)誤導(dǎo),因?yàn)樗墓ぷ鞣绞绞菚簳r(shí)隱藏內(nèi)容。Google仍會(huì)看到并抓取這些內(nèi)容,但這些頁(yè)面不會(huì)向用戶顯示。這種臨時(shí)效果在Google中持續(xù)六個(gè)月,而B(niǎo)in 有一個(gè)類似的工具可以持續(xù)三個(gè)月。這些工具應(yīng)該在最極端的情況下使用,例如安全問(wèn)題、數(shù)據(jù)泄露、個(gè)人身份信息 (PII) 等。對(duì)于Google,請(qǐng)使用刪除工具;對(duì)于Bing請(qǐng)參閱如何阻止URL部分

      除此之外仍然需要使用另一種方法使實(shí)際頁(yè)面刪除更長(zhǎng)時(shí)間(索引或刪除)或阻止用戶訪問(wèn)內(nèi)容(如果他們?nèi)匀粨碛墟溄樱▌h除或限制訪問(wèn))。這只是為提供了一種更快的隱藏頁(yè)面的方法,同時(shí)有時(shí)間進(jìn)行刪除操作。

      刪除方法?5:規(guī)范化

      當(dāng)擁有頁(yè)面的多個(gè)版本并希望將鏈接等信號(hào)合并到單個(gè)版本時(shí),需要做的是某種形式的規(guī)范化。這主要是為了防止重復(fù)內(nèi)容?,同時(shí)將頁(yè)面的多個(gè)版本合并到單個(gè)索引URL。

      有多種選擇

      • 規(guī)范標(biāo)簽。指定另一個(gè)URL作為規(guī)范版本或想要顯示的版本。如果頁(yè)面重復(fù)或非常相似,這應(yīng)該沒(méi)問(wèn)題。當(dāng)頁(yè)面差異太大時(shí),規(guī)范化標(biāo)簽可能會(huì)被忽略,因?yàn)樗翘崾径皇侵噶睢?/span>

      • 重定向。重定向?qū)⒂脩艉退阉鳈C(jī)器人從一個(gè)頁(yè)面轉(zhuǎn)移到另一個(gè)頁(yè)面。301是SEO最常用的重定向,它告訴搜索引擎希望哪個(gè)URL成為搜索結(jié)果中顯示的URL以及信號(hào)整合的到哪個(gè)URL302或臨時(shí)重定向告訴搜索引擎希望原始URL保留在索引中并在那里鞏固信號(hào)
        更多閱讀:Technical SEO: 如何處理網(wǎng)站上的重復(fù)內(nèi)容?規(guī)范化!

      如何確定URL刪除的優(yōu)先順序

      如果有多個(gè)頁(yè)面需要從Google索引中刪除,那么應(yīng)該對(duì)它們進(jìn)行相應(yīng)的優(yōu)先級(jí)排序。

      最高優(yōu)先級(jí):這些頁(yè)面通常與安全相關(guān)或與機(jī)密數(shù)據(jù)相關(guān)。包括包含個(gè)人數(shù)據(jù) (PII)、客戶數(shù)據(jù)或?qū)S行畔⒌膬?nèi)容。

      中等優(yōu)先級(jí):這通常涉及針對(duì)特定用戶組的內(nèi)容。公司內(nèi)部網(wǎng)或員工門(mén)戶、僅供會(huì)員使用的內(nèi)容以及暫存、測(cè)試或開(kāi)發(fā)環(huán)境。

      低優(yōu)先級(jí):這些頁(yè)面通常涉及?某種重復(fù)內(nèi)容。包括從多個(gè)URL提供的頁(yè)面、帶有參數(shù)的URL,并且還可能包括暫存、測(cè)試或開(kāi)發(fā)環(huán)境。

      要避免的常見(jiàn)錯(cuò)誤

      我想介紹一些我通常看到的錯(cuò)誤刪除方法以及每種情況下會(huì)發(fā)生什么,以幫助人們理解為什么你的設(shè)置不起作用。

      robots.txt中設(shè)置noindex

      雖然Google曾經(jīng)在robots.txt中非正式地支持noindex,但它從來(lái)都不是官方標(biāo)準(zhǔn),現(xiàn)在他們已經(jīng)正式刪除了關(guān)于這項(xiàng)的支持。許多網(wǎng)站這樣做都是錯(cuò)誤的

      阻止在robots.txt中抓取

      爬網(wǎng)與索引不同。即使某個(gè)頁(yè)面屏蔽Google抓取,只要你這個(gè)頁(yè)面有任何內(nèi)部或外部鏈接,Google仍然可以對(duì)這個(gè)頁(yè)面建立索引。當(dāng)然谷歌不知道頁(yè)面上有什么,因?yàn)樗麄儾粫?huì)抓取到頁(yè)面里的內(nèi)容Google只是知道這個(gè)頁(yè)面存在,甚至?xí)鶕?jù)頁(yè)面鏈接的錨文本等信號(hào)編寫(xiě)標(biāo)題以顯示在搜索結(jié)果中。

      Nofollow

      大家通常會(huì)把NofollowNoindex混淆,有些人會(huì)在頁(yè)面使用它,希望頁(yè)面不會(huì)被索引。Nofollow是一個(gè)提示,雖然它過(guò)去阻止了頁(yè)面上的鏈接以及帶有nofollow屬性的單個(gè)鏈接的爬行,但現(xiàn)在情況已不再如此。如果谷歌愿意的話,現(xiàn)在可以抓取這些鏈接。

      Nofollow還被用于單個(gè)鏈接,阻止Google對(duì)特定頁(yè)面進(jìn)行權(quán)重傳遞。同樣,這不再有效,因?yàn)?/span>Nofollow是一個(gè)提示。

      請(qǐng)注意,可以使用AhrefsSEMrush等工具進(jìn)行nofollow查找。由于nofollow頁(yè)面上的所有鏈接幾乎沒(méi)有意義,因此結(jié)果數(shù)應(yīng)該為零或接近于零。如果有匹配結(jié)果,我強(qiáng)烈建議檢查是否意外添加了nofollow指令來(lái)代替noindex,并在需要時(shí)選擇更合適的刪除方法。

      Noindex?& 規(guī)范另一個(gè)URL

      信號(hào)是相互矛盾的。Noindex表示從索引中刪除該頁(yè)面,規(guī)范表示另一個(gè)頁(yè)面是應(yīng)該索引的版本。這可能有助于整合頁(yè)面,因?yàn)楣雀柰ǔ?huì)選擇忽略noindex,而是使用規(guī)范作為主要信號(hào)。然而,這并不是一種絕對(duì)的行為。如果是這種情況,頁(yè)面將無(wú)法正確整合

      請(qǐng)注意,可以使用工具找到具有非自引用規(guī)范的無(wú)索引頁(yè)面選擇更合適的刪除方法。

      如果這是的內(nèi)容但不在擁有的網(wǎng)站上怎么辦?

      如果擁有其他網(wǎng)站上使用的內(nèi)容,可以根據(jù)《數(shù)字千年版權(quán)法》(DMCA) 提出索賠。可以使用Google 的版權(quán)刪除工具h(yuǎn)ttps://www.google.com/webmasters/tools/dmca-dashboard 執(zhí)行所謂的DMCA刪除,即要求刪除任何受版權(quán)保護(hù)的材料。

      如果內(nèi)容與有關(guān)但不在擁有的網(wǎng)站上怎么辦?

      如果位于歐盟,根據(jù)法院關(guān)于被遺忘權(quán)的命令,可以刪除包含信息的內(nèi)容。可以使用歐盟隱私刪除表https://www.google.com/webmasters/tools/legal-removal-request?complaint_type=rtbf&hl=en請(qǐng)求刪除個(gè)人信息。

      刪除圖片

      要從Google中刪除圖像,最簡(jiǎn)單的方法是使用robots.txt。

      對(duì)于單個(gè)圖片

      User-agent: Googlebot-ImageDisallow: /images/dogs.jpg
      對(duì)于所有圖片

      User-agent: Googlebot-ImageDisallow: /

      最后

      如何刪除URL取決于具體情況。我們已經(jīng)討論了幾個(gè)方法,但如果仍然困惑哪個(gè)適合,請(qǐng)返回到開(kāi)始時(shí)的流程圖。

      還可以通過(guò)?Google 提供的法律問(wèn)題排查工具來(lái)刪除內(nèi)容。鏈接如下:https://support.google.com/legal/troubleshooter/1114905?hl=en



      點(diǎn)贊(2) 打賞

      評(píng)論列表 共有 0 條評(píng)論

      暫無(wú)評(píng)論

      服務(wù)號(hào)

      訂閱號(hào)

      備注【拉群】

      商務(wù)洽談

      微信聯(lián)系站長(zhǎng)

      發(fā)表
      評(píng)論
      立即
      投稿
      返回
      頂部