分享一個最近碰到的案例。

      某天微信上來了個消息,咨詢為什么自己做的網頁收錄極少。明明已經有了上千個頁面且內容還算是不錯,網站的技術設置也沒有屏蔽爬蟲抓取,但整體的收錄數據就是上不去,更別提關鍵詞出詞了。

      起初我還以為是低質量內容的緣故,但一打開人家的網頁,上面的內容做的確實不錯,圖片搭配合理且排版精美,仔細讀起來也有點東西。

      于是一點點排查。

      起初看站長工具后臺,里面的爬蟲報告上顯示是有抓取記錄的,且一直持續有爬蟲光顧他的網站。

      這也就說明整體的技術通道是沒有問題的,問題可能就出在某些技術設置有瑕疵。

      然后準備排查 SEO 插件的設置,但是反饋說在這塊沒有做任何操作。因為并不是使用 WordPress 建站,而是直接在某平臺上買的源代碼,并部署在自己的服務器上。

      所以后面自然就懷疑是不是這套源代碼有什么技術問題。

      通過工具測試后發現,這套源代碼在 SEO 優化方面基本就是坑,因為整體上使用的是客戶端渲染(CSR)技術來做內容加載的。

      技術層面上的通俗理解,就是網站初始加載時只有一個網頁框架,里面基本沒任何內容。后續有用戶在網頁上做了點擊或者瀏覽動作時,觸發了 js 代碼才會去加載網頁內容。

      注:這種內容加載方式現在已經非常少見了,主流的建站方式都不是這種內容渲染方式。

      這種技術邏輯,對于個人用戶的使用體驗而言基本沒有問題,但是對于爬蟲而言就問題大了。

      因為爬蟲初次加載時只有一個空曠的內容框架(沒有內容),于是爬蟲自然就會認為這個頁面是沒有內容的,它并不會像人一樣會去做點擊之類的操作。

      問題發現了,后續自然就是整改了,無奈前面花的那些成本都白白浪費了。

      所以這種 JavaScript SEO,如果你純粹是使用技術去搭建網站的話,是很有必要好好學習一下的。

      且官方文檔里已經有了不少這方面的說明,值得我們在動手之前好好看看。

      像官方文檔里的這個案例(第十點),說的內容付費墻方面的實操操作。

      比如我們看很多平臺需要付費訂閱才能顯示完整內容,但是在做內容隱藏時只是通過簡單的 js 代碼設置內容不可見。

      于是矛盾出現了,雖然普通用戶在瀏覽器上看不到隱藏內容,但是這些被隱藏的內容卻在網頁源代碼里明明白白的顯示著(通過查看網頁源代碼的方式都能看到這些被刻意隱藏的內容)。

      這就讓爬蟲很尷尬了,到底是抓取已經呈現出來的內容,還是說這些被隱藏的內容都要抓取進去。

      于是官方文檔里就給實操說明,不要用這種 js 代碼認為隱藏的方式去做內容付費墻。

      相反直接在服務端做出免費版本與付費完整版本,倒是一個更好選擇。

      其實在網站運營過程中,類似這樣的坑還挺多的,沒辦法只能一個一個踩過去才能提高自己的能力。


      點贊(10) 打賞

      評論列表 共有 0 條評論

      暫無評論

      服務號

      訂閱號

      備注【拉群】

      商務洽談

      微信聯系站長

      發表
      評論
      立即
      投稿
      返回
      頂部