大模型是怎么搜索內(nèi)容的

755 閱讀 0 評(píng)論 4 點(diǎn)贊

最近一直在利用喝茶時(shí)間消化 LLMs Search 相關(guān)內(nèi)容，今天這篇文章簡(jiǎn)單分享下這類大模型搜索的工作流程。

有興趣的朋友，可以關(guān)注下這次 Claude 4 更新時(shí)泄露出來(lái)的系統(tǒng)級(jí) Prompt，這對(duì)于我們理解 AI Search 的工作原理有很多幫助。

且這類信息都是第一手資料了，非常有價(jià)值。

言歸正傳，其實(shí)大模型搜索與傳統(tǒng)搜索的工作流程根本上就是兩套邏輯，沒(méi)有什么共同性。

比如我們現(xiàn)在寫(xiě)了一篇文章，然后發(fā)布到自己的網(wǎng)站。

傳統(tǒng)搜索引擎的爬蟲(chóng)會(huì)到我們的網(wǎng)站上，抓取這篇文章的信息，然后通過(guò)切片分詞、相關(guān)性分析、排名等一系列操作，將我們的內(nèi)容收錄到他們的索引數(shù)據(jù)庫(kù)中。

那后續(xù)用戶在搜索某個(gè)關(guān)鍵詞時(shí)，一旦其搜索詞與我們的文章內(nèi)容有匹配出相關(guān)性，搜索引擎就可能會(huì)將我們的內(nèi)容展示在用戶面前（會(huì)根據(jù)各維度的指標(biāo)給一個(gè)初始的排名）。

而用戶看到搜索結(jié)果頁(yè)后，可能會(huì)去點(diǎn)擊我們的文章，也可能不會(huì)點(diǎn)擊，畢竟頁(yè)面上的內(nèi)容實(shí)在有很多。如果你的標(biāo)題內(nèi)容與描述內(nèi)容與用戶的搜索意圖不相關(guān)的話，大概率用戶不會(huì)點(diǎn)擊到你的網(wǎng)站。

其實(shí)上面這樣的流程，就是傳統(tǒng)搜索的大致工作流程，而這樣的流程完全不適用大模型搜索。

根據(jù)這次 Claude 泄露出來(lái)的系統(tǒng)級(jí) Prompt 信息，可以看到大模型搜索流程似乎是更簡(jiǎn)單了。

首先大模型搜索沒(méi)有索引庫(kù)，它不會(huì)提前收錄你的內(nèi)容并做一系列初始操作，這點(diǎn)與傳統(tǒng)搜索完全不一樣。

但是因?yàn)榇竽Ｐ投际怯脭?shù)據(jù)訓(xùn)練出來(lái)的，在進(jìn)行數(shù)據(jù)訓(xùn)練之前就已經(jīng)抓取了非常多的數(shù)據(jù)，由此它們?cè)谇捌诰头e累了非常多的原始信息。

其次大模型搜索會(huì)將用戶的搜索行為大致分為四類，分別是 never_search、do_not_search_but_offer、single_search，與 research。

比如我們現(xiàn)在搜索“美國(guó)的首都是哪里”這個(gè)詞條，由于這類信息基本是固定不變的，也就是我們通常意義上所說(shuō)的信息詞，于是這類詞條便大致歸入 never_search 這個(gè)分類。

大模型搜索的處理邏輯就是直接在自己的數(shù)據(jù)集中，找到這個(gè)問(wèn)題的答案并直接呈現(xiàn)給用戶，這個(gè)過(guò)程基本就是一個(gè)內(nèi)部信息的搜索查詢，根本不會(huì)觸發(fā)外部信息的搜索。

類似 do_not_search_but_offer 這個(gè)分類，如果用戶搜索一些固定頻率更新的信息時(shí)，大概率會(huì)觸發(fā)這個(gè)分類的搜索邏輯。

比如用戶搜索“美國(guó)的人口是多少”，這個(gè)數(shù)據(jù)在大模型的數(shù)據(jù)集里大概率會(huì)存在，但數(shù)據(jù)可能并不是最新的。于是大模型就會(huì)直接去某個(gè)權(quán)威網(wǎng)站上，獲取最新的數(shù)據(jù)并直接呈現(xiàn)給用戶。

至于 single_search 與 research 這兩個(gè)分類的處理邏輯基本趨同，區(qū)別是處理簡(jiǎn)單搜索還是復(fù)雜搜索。

比如“昨天 NBA 總決賽的比分”與“分析下昨天兩支球隊(duì)的技戰(zhàn)術(shù)策略”這樣的詞條，可能就會(huì)分別觸發(fā)這兩個(gè)分類的搜索邏輯。至于分析過(guò)程中的具體信息獲取，可能就會(huì)觸發(fā)更多的外部信息搜索了。

所以從上面的工作流程對(duì)比中，我能清晰發(fā)現(xiàn) SEO 與 GEO 工作重心的不同。

在 SEO 時(shí)代，我們的主要工作任務(wù)是寫(xiě)出符合用戶需求的內(nèi)容，然后盡可能獲取高相關(guān)高權(quán)重的外鏈，來(lái)得到更高的自然搜索排名。

而 GEO 時(shí)代的邏輯變了，我們的任務(wù)重心變成了如何讓 AI 模型更多引用我們的網(wǎng)站內(nèi)容。

文章為作者獨(dú)立觀點(diǎn)，不代表DLZ123立場(chǎng)。如有侵權(quán),請(qǐng)聯(lián)系我們。( 版權(quán)為作者所有，如需轉(zhuǎn)載，請(qǐng)聯(lián)系作者 )

網(wǎng)站運(yùn)營(yíng)至今，離不開(kāi)小伙伴們的支持。為了給小伙伴們提供一個(gè)互相交流的平臺(tái)和資源的對(duì)接，特地開(kāi)通了獨(dú)立站交流群。群里有不少運(yùn)營(yíng)大神，不時(shí)會(huì)分享一些運(yùn)營(yíng)技巧，更有一些資源收藏愛(ài)好者不時(shí)分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。

現(xiàn)在可以掃碼進(jìn)群，備注【加群】。 ( 群完全免費(fèi)，不廣告不賣課！)

點(diǎn)贊(4) 打賞