網(wǎng)頁索引增加的10種辦法

      ?

      一般來說正常的網(wǎng)站內(nèi)容都能夠被谷歌搜索引擎收錄并添加到其索引數(shù)據(jù)庫中,只不過每個網(wǎng)站頁面可能因為頁面質(zhì)量、搜索用戶體驗、網(wǎng)站域名權(quán)重等因素的影響會導(dǎo)致被索引的時間存在一定的差異。但實際情況下,很多同學(xué)還是在為自己的網(wǎng)站頁面遲遲不能被谷歌索引而感到頭疼。那么,今天Jack老師就和大家一起來學(xué)習(xí)一下 網(wǎng)頁索引增加的10種方法 。

      方法一:刪除 robots.txt 文件中禁止爬取代碼

      robots.txt是一種存放于網(wǎng)站根目錄下的ASCII編碼的文本文件,它通常告訴網(wǎng)絡(luò)搜索引擎的漫游器(又稱網(wǎng)絡(luò)蜘蛛),此網(wǎng)站中的哪些內(nèi)容不應(yīng)被搜索引擎的漫游器獲取的,哪些可以被漫游器獲取的。因為一些系統(tǒng)中的URL大小寫敏感的,所以robots.txt文件名應(yīng)統(tǒng)一為小寫。那么這個文件怎么設(shè)置或者改寫呢?通過ftp軟件遠(yuǎn)程連接或者直接登錄直接網(wǎng)站的后臺服務(wù)器,找到根目錄下的該文件,然后進(jìn)行改寫。

      我們再來看一下robots.txt文件的寫法:

      User-agent: * 這里的*代表的所有的搜索引擎種類,*是一個通配符
      Disallow: /admin/ 這里定義是禁止爬尋admin目錄下面的目錄
      Disallow: /require/ 這里定義是禁止爬尋require目錄下面的目錄
      Disallow: /ABC/ 這里定義是禁止爬尋ABC目錄下面的目錄
      Disallow: /cgi-bin/*.htm 禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。
      Disallow: /*?* 禁止訪問網(wǎng)站中所有包含問號 (?) 的網(wǎng)址
      Disallow: /.jpg$ 禁止抓取網(wǎng)頁所有的.jpg格式的圖片
      Disallow:/ab/adc.html 禁止爬取ab文件夾下面的adc.html文件。
      Allow: /cgi-bin/ 這里定義是允許爬尋cgi-bin目錄下面的目錄
      Allow: /tmp 這里定義是允許爬尋tmp的整個目錄
      Allow: .htm$ 僅允許訪問以”.htm”為后綴的URL。
      Allow: .gif$ 允許抓取網(wǎng)頁和gif格式圖片
      Sitemap: 網(wǎng)站地圖 告訴爬蟲這個頁面是網(wǎng)站地圖

      比方說我們要禁止百度的蜘蛛來爬取我們網(wǎng)站的頁面內(nèi)容,那robots.txt文件應(yīng)該怎么寫呢?如下所示。

      User-agent: Baiduspider

      Disallow: /

      如果我們又突然改變主意,想允許它爬取我們的內(nèi)容,又該怎么寫呢?如下所示。

      User-agent: Baiduspider

      Allow: /


      方法二:移除noindex代碼

      但我們在做wordpress網(wǎng)站的時候,一般會在設(shè)置中的閱讀功能下設(shè)置“暫不對搜索引擎可見”,這時候如果你去查看網(wǎng)站任何一個頁面的源代碼(用ctrl+u快捷鍵,或者鼠標(biāo)右鍵點擊查看網(wǎng)頁源代碼),你會在源代碼中看到noindex的存在。


      這個代碼告訴了搜索引擎不要將該頁面內(nèi)容添加到谷歌的索引數(shù)據(jù)庫中。在做完網(wǎng)站之后,我們很可能忘記了最初的這個網(wǎng)站功能設(shè)置,導(dǎo)致自己的網(wǎng)站頁面遲遲的不能被索引。所以在網(wǎng)站內(nèi)容檢查無誤準(zhǔn)備放開收錄的時候,這里的功能一定要取消,如下圖所示。

      ?

      還有一種noindex的情況比較特殊,那就是X?Robots-Tag標(biāo)頭。X-Robots-Tag?可用作指定網(wǎng)址的 HTTP 標(biāo)頭響應(yīng)中的一個元素??稍诼纹髟獦?biāo)記中使用的任何指令均可被指定為?X-Robots-Tag。下面是一個 HTTP 響應(yīng)示例,它含有一個指示抓取工具不要將某一網(wǎng)頁編入索引的?X-Robots-Tag


      這一點可能對同學(xué)們比較陌生,我們可以使用Ahrefs工具的“站點審核工具”來進(jìn)行操作,如下圖所示。

      如果對這個項目不是很明白的同學(xué),建議先點擊查看一下這方面的知識,鏈接如下

      漫游器元標(biāo)記知識拓展入口

      方法三:在站點地圖中包含該頁面

      站點地圖告訴 Google 你網(wǎng)站上的哪些頁面重要,哪些不重要。它還可能會就應(yīng)重新抓取它們的頻率提供一些指導(dǎo)。Google 應(yīng)該能夠在你的網(wǎng)站上找到頁面,無論它們是否在你的站點地圖中,但將它們包含在內(nèi)仍然是一種很好的做法。

      畢竟,讓谷歌的抓取工作變得困難是沒有意義的。要檢查某個頁面是否在你的站點地圖中,請使用Search Console 中的網(wǎng)址檢查工具。如果你看到“網(wǎng)址不在 Google 上”錯誤和“站點地圖:不適用”這些報錯情況,那么說明某個網(wǎng)站頁面不在你的站點地圖中或尚未編入索引。

      一般來說,如果你安裝了yoast seo或者math rank等谷歌SEO優(yōu)化插件,它們都會為你主動生成網(wǎng)站的sitemap,你只需要將這些sitemap主動提交到網(wǎng)站的google search console中即可。提交完成之后,你可以順手做一個ping提交指令,如下所示:

      https://www.google.com/ping?sitemap=http://www.domain.com/sitemap_url.xml

      方法四:刪除流氓規(guī)范標(biāo)簽

      規(guī)范標(biāo)簽告訴 Google 哪個是頁面的首選版本。它看起來像這樣:

      <link rel="canonical” href="/page.html/">

      大多數(shù)頁面要么沒有規(guī)范標(biāo)簽,要么沒有所謂的自引用規(guī)范標(biāo)簽。這告訴 Google 頁面本身是首選的,也可能是唯一的版本。換句話說,你希望谷歌搜索引擎將此頁面編入索引。但是,如果你的頁面有一個流氓規(guī)范標(biāo)簽,那么它可能會告訴 Google 該頁面的首選版本不存在。


      在這種情況下,你的頁面不會被編入索引。如果你想要檢查URL網(wǎng)址規(guī)范,那么請使用 Google 的URL檢查工具。如果規(guī)范指向另一個頁面,那么你將會看到“帶有規(guī)范標(biāo)記的備用頁面”警告,如下所示。


      需要注意的是:規(guī)范標(biāo)簽并不總是壞的。大多數(shù)帶有這些標(biāo)簽的頁面都會有它們。如果看到你的頁面具有規(guī)范集,請檢查規(guī)范頁面。如果這確實是頁面的首選版本,并且不需要為相關(guān)頁面建立索引,那么規(guī)范標(biāo)簽應(yīng)該保留。

      方法五:檢查孤立頁面

      孤立頁面是那些沒有內(nèi)部鏈接指向它們的頁面。或者說當(dāng)前的某個頁面沒有任何的鏈接方式通往自己網(wǎng)站的其他頁面。常見于一些landing page頁面,甚至都沒有菜單導(dǎo)航欄的存在。

      由于 Google 通過抓取網(wǎng)絡(luò)來發(fā)現(xiàn)新內(nèi)容,因此他們無法通過該過程發(fā)現(xiàn)孤立頁面。網(wǎng)站訪問者也無法找到它們。要檢查孤立頁面,可以使用Ahrefs 的站點審核來抓取網(wǎng)站頁面。然后檢查?“孤立頁面(沒有傳入的內(nèi)部鏈接)”錯誤的鏈接報告,如下圖所示。

      當(dāng)然了,市面上還是有很多其他的url檢測工具也有非常強大的功能,比方說尖叫青蛙,Check box等等。利用這些工具也能夠為自己的網(wǎng)站檢測出沒有做任何鏈接指向其他頁面的“孤立頁面”。

      好了,以上就是 網(wǎng)頁索引增加的10種辦法 上半部分的內(nèi)容,下半部分內(nèi)容將在下一章節(jié)中進(jìn)行講解,敬請期待。

      如果對本章內(nèi)容還有不理解的地方,沒關(guān)系,解決方案如下:


      百度或者谷歌瀏覽器搜索???“JACK外貿(mào)建站”,排名首頁首位的就是我的網(wǎng)站。網(wǎng)站上有更多免費的外貿(mào)建站、谷歌SEO優(yōu)化、外貿(mào)客戶開發(fā)等實操干貨知識等著你哦!

      各位看官老爺,都看到這里了,就麻煩動動金手點擊轉(zhuǎn)發(fā)一下本文到自己的微信朋友圈吧,轉(zhuǎn)發(fā)過程如下


      QQ:3233269705

      QQ群:645296397

      微信公眾號:JACK?SEO



      點贊(1) 打賞

      評論列表 共有 0 條評論

      暫無評論

      服務(wù)號

      訂閱號

      備注【拉群】

      商務(wù)洽談

      微信聯(lián)系站長

      發(fā)表
      評論
      立即
      投稿
      返回
      頂部