當你的網(wǎng)站許多頁面被標記為彼此重復時,你該如何解決?本質上,重復內(nèi)容是出現(xiàn)在Internet上多個位置的內(nèi)容。太相似的內(nèi)容,即使不完全相同,也可能被視為彼此重復。一是訪問者在訪問您的網(wǎng)站并比較兩個頁面時看到的內(nèi)容;二是搜索引擎和搜尋器訪問這些頁面時看到的內(nèi)容和源代碼,如果該代碼過于相似,則搜尋器可能會認為它正在查看同一頁面的兩個版本。負面影響是搜索引擎可能無法弄清楚應該對哪個頁面進行排名,排除哪個頁面,或者對不正確的頁面進行排名,也不知道要將定向鏈接指標(信任,權限,錨文本,鏈接等)定向到一個頁面,或將其分隔在多個版本之間。
解決商城重復性內(nèi)容的6種方式:
1.?301重定向
這個是比較基礎的方法應用于解決重復頁面,可以將頁面的舊版本重定向到新的更新版本。這與子域或協(xié)議更改以及內(nèi)容更新有關。
兩個頁面重復度較高時,可以在其中一個不打算給予排名的頁面代碼頭部加上rel = canonicals選項,告知搜尋器哪個是最重要的頁面,但不影響用戶對兩個頁面的訪問。這類似于出售兩種顏色不同的商品。您希望訪客能夠看到和訪問這兩種顏色,但是您將使用規(guī)范的標簽來告訴爬蟲哪些是最相關的頁面。 格式為:<link href="URL OF ORIGINAL PAGE"?rel ="canonical"?/> (在html的<head>部分)rel = canonical屬性應添加到頁面的每個重復版本的HTML頭中,上面的“ URL OF ORIGINAL PAGE”部分應替換為指向原始(規(guī)范)頁面的鏈接。(請確保保留引號。)該屬性傳遞的鏈接公平性(排名能力)與301重定向大致相同,并且由于它是在頁面(而不是服務器)級別實現(xiàn)的,因此通常只需較少的開發(fā)時間即可實行。
?3.?元索引
如果同一個主題內(nèi)容有兩個頁面A,B版本,你更推薦B是最新且最相關的,但希望A版本仍然是可以閱讀的,那可以選擇將A頁面標記為meta noindex。元noindex標記告訴抓取工具可以抓取重復的頁面,但不應將其包含在索引中。這可以幫助解決由于分頁等原因造成的重復內(nèi)容問題。格式為:<meta name="robots" content="noindex,follow">(在html的<head>部分,對重復的頁面加上這段代碼)meta robots標簽允許搜索引擎抓取頁面上的鏈接,但阻止它們將這些鏈接包括在索引中。但您即使告訴Google不要對其進行索引,仍然要保障他們可以對重復頁面進行爬網(wǎng),因為Google明確警告不要限制對網(wǎng)站上重復內(nèi)容的爬網(wǎng)訪問。
4.?添加內(nèi)容
如果兩個頁面涉及不同的主題,但卻被判斷為重復頁面,這種情況,可以選擇向這些頁面中的每個頁面添加更多內(nèi)容,使不同的主題都可以脫穎而出。
這類似于說在一個紙杯蛋糕上撒些巧克力和櫻桃,而在另一個紙杯蛋糕上添加另一種顏色的糖霜。
5.?URL變體
URL參數(shù)(例如點擊跟蹤和一些分析代碼)可能會導致重復的內(nèi)容問題。不僅由參數(shù)本身引起,而且還由這些參數(shù)在URL本身中出現(xiàn)的順序引起的問題。

支持打印的內(nèi)容頁面也可能會造成重復頁面:
?

解決方法:避免添加URL參數(shù)或URL的備用版本,通常可以通過腳本傳遞這些信息。
6.?HTTP與HTTPS或WWW與非WWW頁面
如果"www.site.com"?和"site.com"上具有單獨的版本,http://?和?https://?版本的網(wǎng)站版本都是實時的并且對搜索引擎可見,則可能會遇到重復的內(nèi)容問題。
解決方法是保持域名的唯一性,https://www.site.com/?的唯一,其他的版本都跳轉到這里。