分享一個最近碰到的案例。
某天微信上來了個消息,咨詢為什么自己做的網頁收錄極少。明明已經有了上千個頁面且內容還算是不錯,網站的技術設置也沒有屏蔽爬蟲抓取,但整體的收錄數據就是上不去,更別提關鍵詞出詞了。
起初我還以為是低質量內容的緣故,但一打開人家的網頁,上面的內容做的確實不錯,圖片搭配合理且排版精美,仔細讀起來也有點東西。
于是一點點排查。
起初看站長工具后臺,里面的爬蟲報告上顯示是有抓取記錄的,且一直持續有爬蟲光顧他的網站。
這也就說明整體的技術通道是沒有問題的,問題可能就出在某些技術設置有瑕疵。
然后準備排查 SEO 插件的設置,但是反饋說在這塊沒有做任何操作。因為并不是使用 WordPress 建站,而是直接在某平臺上買的源代碼,并部署在自己的服務器上。
所以后面自然就懷疑是不是這套源代碼有什么技術問題。
通過工具測試后發現,這套源代碼在 SEO 優化方面基本就是坑,因為整體上使用的是客戶端渲染(CSR)技術來做內容加載的。
技術層面上的通俗理解,就是網站初始加載時只有一個網頁框架,里面基本沒任何內容。后續有用戶在網頁上做了點擊或者瀏覽動作時,觸發了 js 代碼才會去加載網頁內容。
注:這種內容加載方式現在已經非常少見了,主流的建站方式都不是這種內容渲染方式。
這種技術邏輯,對于個人用戶的使用體驗而言基本沒有問題,但是對于爬蟲而言就問題大了。
因為爬蟲初次加載時只有一個空曠的內容框架(沒有內容),于是爬蟲自然就會認為這個頁面是沒有內容的,它并不會像人一樣會去做點擊之類的操作。
問題發現了,后續自然就是整改了,無奈前面花的那些成本都白白浪費了。
所以這種 JavaScript SEO,如果你純粹是使用技術去搭建網站的話,是很有必要好好學習一下的。
且官方文檔里已經有了不少這方面的說明,值得我們在動手之前好好看看。

像官方文檔里的這個案例(第十點),說的內容付費墻方面的實操操作。
比如我們看很多平臺需要付費訂閱才能顯示完整內容,但是在做內容隱藏時只是通過簡單的 js 代碼設置內容不可見。
于是矛盾出現了,雖然普通用戶在瀏覽器上看不到隱藏內容,但是這些被隱藏的內容卻在網頁源代碼里明明白白的顯示著(通過查看網頁源代碼的方式都能看到這些被刻意隱藏的內容)。
這就讓爬蟲很尷尬了,到底是抓取已經呈現出來的內容,還是說這些被隱藏的內容都要抓取進去。
于是官方文檔里就給實操說明,不要用這種 js 代碼認為隱藏的方式去做內容付費墻。
相反直接在服務端做出免費版本與付費完整版本,倒是一個更好選擇。
其實在網站運營過程中,類似這樣的坑還挺多的,沒辦法只能一個一個踩過去才能提高自己的能力。

文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)