? 這是一篇2011年的原創文章,作者當然不是我,而是老爺子比爾.斯勞斯基。雖然這是一篇十年前的文章,當對于當下我們投身于研究和提高谷歌SEO優化技能水平的同學們來說,還是有著非常重要的學習意義。
? 老爺子寫這篇文章的初衷是因為谷歌更新了熊貓算法(Panda),隨著 Panda 算法的更新,我Google 引入了一種對大規模數據集(如 Web)中的信息進行建模的方法,以嘗試識別和預測網頁的特征,這些特征不僅可以根據相關性和流行度(基于指向這些頁面的鏈接),但也基于一系列其他特征,例如可信度、信任值、原創性、主題的覆蓋范圍、可用性等多重因素。
很顯然,谷歌不可能將這些辨識特征雜亂無序的散布,否則就無法根據搜索用戶的搜索需求來匹配較為精準的搜索內容結果,這樣的結果顯然是谷歌不愿意看到的。所以谷歌啟用了三元組專利技術,該技術最初在03年提交,在07年獲得授權,在此后的日子里,一直被谷歌所沿用和改造,并逐漸成為了如今谷歌千人前面的重要內容構成算法專利之一。
那么,什么是三元組專利?它的公式是這樣的Z=(u,q,d),這其中
u代表的是搜索用戶本身的數據
q代表的是搜索用戶的查詢數據
d代表的是查詢數據返回的頁面相關的文檔信息
這樣子說可能有點不是特別清楚,我在下面列舉一些實例項目:
用戶所在的國家/地區,這屬于u的數據范疇
用戶提供查詢 q 的時間,這屬于u的數據范疇
用戶所在國家的語言,這屬于u的數據范疇
查詢語言 q,這屬于q的數據范疇
查詢 q 的確切字符串,這屬于q的數據范疇
查詢 q 中的單詞,這屬于q的數據范疇
查詢 q 中的單詞數,這屬于q的數據范疇
文檔 中的每個單詞,這屬于d的數據范疇
文檔 的統一資源定位符 (URL) 中的每個詞,這屬于d的數據范疇
文檔 的 URL 中的頂級域,這屬于d的數據范疇
文檔? 的 URL 的每個前綴,這屬于d的數據范疇
文件 標題中的每個詞,這屬于d的數據范疇
鏈接中指向文檔 的每個單詞,這屬于d的數據范疇
查詢 q 中的單詞與文檔 d 中的單詞匹配的次數,
用戶 u 先前訪問文檔 d 的次數,
很明顯,上面所列舉的三元組內容實例和實際的搜索引擎工作機制還相差個十萬八千里,光頭佬Brian Dean曾經寫過一篇文章,羅列了影響谷歌SEO優化排名的200多個因素,但實際上可能還遠遠不止。這個龐大的三元組數據庫可能會收集超過500萬個不同的特征。這句話體現在了三元組特征的專利說明文檔中。你要是不信,沒關系,點擊下面的專利鏈接進行查詢
《基于大型數據集的排名文檔》
既然這個模型是為了更好的為搜索引擎用戶提供精準的搜索結果,那么它的功能顯然不僅僅局限在搜集上述三元組的相關特征上。因為特征數據收集的再多,不進行利用還是等于無效數據。因此,收集的查詢數據可能包括用戶先前提供的用于查找特定頁面的搜索詞,用戶數據可能包括互聯網協議地址、cookie 信息、查詢語言和/或與用戶相關的地理信息,文檔信息可能包括有關在搜索結果中呈現給用戶的特定頁面的數據,以及這些文檔在被選擇或經過時所處的位置。
當該模型經過運算之后自然的就給出了相關的自然搜索排名結果內容,注意,這時候整個運算機制還沒有結束,因為搜索用戶對當前內容的選擇和點擊查看與否,也會直接關聯到下一次的內容推薦模型中。也就是說該大數據模型從來不會孤立存在,只要你從使用谷歌瀏覽器那一刻開始,你的所有細微操作都會對后續結果產生影響,哪怕你使用的是無痕瀏覽模式也不例外。
那么這篇文章對我們的谷歌SEO優化有什么意義呢?
第一點:擺脫關鍵詞的迷信思想
關鍵詞對網站頁面排名固然重要,但絕不可能在三元組模型產生極其重要的本質性影響。相關搜索用戶的特征數據收集,以及用戶對谷歌搜索引擎給出的自然排名結果操作(點擊、查看和瀏覽時間)都直接影響后續SERP的排名結果。舉個很簡單的例子,當我們使用中文搜索關鍵詞“面包”,基本上不太可能出現以阿拉伯文“ ????? . ”的對應結果。
這就是三元組中u系列因素的效果。而當我們使用“bread”搜索英語的結果,該模型也不會緊盯著這一個變量因素,它會去搜集統計數據庫中的其他參數,可能是關鍵詞Bread baking,可能是名為Delicious bread的一張面包圖片,甚至是搜索相關文檔中的地理信息,
因為搜索引擎判斷你搜索“bread”這個關鍵詞的時候,可能是肚子餓了,想找個就近的面包店買點面包充饑,那么在搜索結果中就可能出現一個谷歌地圖,上面標注著離你最近的面包店。所以在以后的谷歌SEO優化過程中,盡量將關鍵詞從神壇上拉下來吧,它并沒有我們想象的那么神秘。
第二點:考慮更多的搜索用戶相關因素
在三元組模型中,最重要的不是q和d,而是u,也就是說搜索用戶本身的相關因素在某種程度上更加能夠影響搜索結果的呈現。很多時候我們在執行具體的谷歌優化過程中,過于將精力集中在內容輸出上,而忘記了文章的本身是為了面向用戶群體。
你覺得一篇文章很優秀,那是因為你覺得它優秀,但似乎很多時候你的潛在用戶群體并不這么認為。這也是為什么很多人覺得自己文章寫的質量很好,但是網站卻沒有流量和排名的根本原因。
從而就放棄了輸出原創內容,轉而去做外鏈或者其他一些黑帽手法的工作。比方說阿拉伯文的閱讀方式是從右到左,但我們絕大部分人的書寫習慣是從左到右,如果你的客戶是阿拉伯地區的,那么這種閱讀習慣上的差異,就很可能導致他們的頁面體驗度極差,你的網站頁面排名也就很難起來了。
好了,以上就是本章關于?谷歌搜索與大數據模型?的全部內容,
如果對本章內容還有不理解的地方,沒關系,解決方案如下:
百度或者谷歌瀏覽器搜索???“JACK外貿建站”,排名首頁首位的就是我的網站。網站上有更多免費的外貿建站、谷歌SEO優化、外貿客戶開發等實操干貨知識等著你哦!
(各位看官老爺,都看到這里了,就麻煩動動金手點擊轉發一下本文到自己的微信朋友圈吧,轉發過程如下)
QQ:3233269705
QQ群:645296397
微信公眾號:JACK?SEO
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)