我前段時間有說過,自己的網站時不時會收到來自 AI 搜索引擎的詢盤信息,但是不清楚具體的 AI 搜索引擎收錄了我網站的哪些內容。那今天的這篇文章簡單聊聊怎么確定,以及怎么做。
先談第一點,怎么確定網站的內容是不是出現在 AI 搜索引擎中了。
一般針對這種問題,我基本會使用兩種方式去核實。
方法一其實很簡單,那就是直接到具體的 AI 搜索引擎中去搜索自己的產品,看看是否存在相應的產品信息。如果有看到信息,則表明 AI 搜索引擎之前有抓取過我們的產品信息,且已經在用戶搜索交互中使用了我們的內容。
像最常使用的 ChatGPT Search 或者 Perplexity,直接在用戶搜索界面輸入自己的品牌信息,便可以直觀看到相應的搜索結果。或者在搜索的過程中使用一些精準長尾詞,也可以核實自己的內容是不是被 AI 搜索引擎收錄索引。
方法二使用起來稍微復雜一點,主要是去網站的主機訪問日志里看相應的爬蟲抓取記錄。
這個過程中,我們需要確保自己的網站是對所有網絡爬蟲公開的(不能屏蔽),這點在網站的 robots.txt 文件中便能看到。
然后再去網站服務器的用戶訪問日志里看,自己的網站信息有沒有被相應的 AI 搜索引擎爬蟲抓取過。
我這里拿 SiteGround 主機搭建的網站為例,可以在網站后臺的“Activity Log”里面看到所有的用戶訪問信息。
比如下圖是我某個網站的具體訪問信息,可以看到有谷歌搜索引擎爬蟲的訪問記錄,也有 Yandex 搜索引擎的爬蟲記錄。大家有興趣的話,可以在這份日志里好好找找有沒有 AI 搜索引擎的爬蟲記錄。
一般 Perplexity 的爬蟲名是 PerplexityBot,ChatGPT 的爬蟲名是 GPTBot。當看到這兩個爬蟲的信息抓取記錄時,即表明 AI 搜索引擎的爬蟲有來過,也有抓取過我們的內容(至于有沒有索引則需要進一步核實了)。
基本經過上面兩個步驟的操作,便能大致了解網站內容在 AI 搜索引擎上的收錄情況。
如果發現自己網站的內容,根本就不曾出現在 AI 搜索引擎中,我這里推薦嘗試著做一下主動搜索。
比如將自己網站的長尾關鍵詞拿到 AI 搜索引擎中去搜索,并嘗試著給一個具體的網站鏈接讓 AI 消化,看看相應的輸出結果。
如果內容與我們網站的基本情況相符,那便一定程度表明自己的內容是能被 AI 搜索引擎消化的。如此多嘗試幾次,再來看看后續的搜索表現。
但是這種方法不具有普遍性,我也只是在自己的某一個站點上使用過,僅供參考。
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)