最近一直在利用喝茶時間消化 LLMs Search 相關內容,今天這篇文章簡單分享下這類大模型搜索的工作流程。

有興趣的朋友,可以關注下這次 Claude 4 更新時泄露出來的系統級 Prompt,這對于我們理解 AI Search 的工作原理有很多幫助。
且這類信息都是第一手資料了,非常有價值。
言歸正傳,其實大模型搜索與傳統搜索的工作流程根本上就是兩套邏輯,沒有什么共同性。
比如我們現在寫了一篇文章,然后發布到自己的網站。
傳統搜索引擎的爬蟲會到我們的網站上,抓取這篇文章的信息,然后通過切片分詞、相關性分析、排名等一系列操作,將我們的內容收錄到他們的索引數據庫中。
那后續用戶在搜索某個關鍵詞時,一旦其搜索詞與我們的文章內容有匹配出相關性,搜索引擎就可能會將我們的內容展示在用戶面前(會根據各維度的指標給一個初始的排名)。
而用戶看到搜索結果頁后,可能會去點擊我們的文章,也可能不會點擊,畢竟頁面上的內容實在有很多。如果你的標題內容與描述內容與用戶的搜索意圖不相關的話,大概率用戶不會點擊到你的網站。
其實上面這樣的流程,就是傳統搜索的大致工作流程,而這樣的流程完全不適用大模型搜索。
根據這次 Claude 泄露出來的系統級 Prompt 信息,可以看到大模型搜索流程似乎是更簡單了。
首先大模型搜索沒有索引庫,它不會提前收錄你的內容并做一系列初始操作,這點與傳統搜索完全不一樣。
但是因為大模型都是用數據訓練出來的,在進行數據訓練之前就已經抓取了非常多的數據,由此它們在前期就積累了非常多的原始信息。
其次大模型搜索會將用戶的搜索行為大致分為四類,分別是 never_search、do_not_search_but_offer、single_search,與 research。
比如我們現在搜索“美國的首都是哪里”這個詞條,由于這類信息基本是固定不變的,也就是我們通常意義上所說的信息詞,于是這類詞條便大致歸入 never_search 這個分類。
大模型搜索的處理邏輯就是直接在自己的數據集中,找到這個問題的答案并直接呈現給用戶,這個過程基本就是一個內部信息的搜索查詢,根本不會觸發外部信息的搜索。
類似 do_not_search_but_offer 這個分類,如果用戶搜索一些固定頻率更新的信息時,大概率會觸發這個分類的搜索邏輯。
比如用戶搜索“美國的人口是多少”,這個數據在大模型的數據集里大概率會存在,但數據可能并不是最新的。于是大模型就會直接去某個權威網站上,獲取最新的數據并直接呈現給用戶。
至于 single_search 與 research 這兩個分類的處理邏輯基本趨同,區別是處理簡單搜索還是復雜搜索。
比如“昨天 NBA 總決賽的比分”與“分析下昨天兩支球隊的技戰術策略”這樣的詞條,可能就會分別觸發這兩個分類的搜索邏輯。至于分析過程中的具體信息獲取,可能就會觸發更多的外部信息搜索了。
所以從上面的工作流程對比中,我能清晰發現 SEO 與 GEO 工作重心的不同。
在 SEO 時代,我們的主要工作任務是寫出符合用戶需求的內容,然后盡可能獲取高相關高權重的外鏈,來得到更高的自然搜索排名。
而 GEO 時代的邏輯變了,我們的任務重心變成了如何讓 AI 模型更多引用我們的網站內容。

文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)