原文來源:SparkToro 作者:Vlado Pavlik 2022.7-8月,SparkToro(通過Twitter、email
newsletter、LinkedIn、Facebook和Instagram等多個平臺)招募志愿者分享其網站的Google
Analytics 數據。超過1,000名參與者與我們分享了他們網站的流量數據。接著我們收集了四家第三方網站流量估計工具(即SEMRush、Datos、SimilarWeb和Ahrefs*)提供的數據,并將其與Google
Analytics 報告的數據進行比較。此外,我們還收集了Moz域名權重數據和Google
Trends 的品牌搜索量數據。所有這些數據都基于同一時間范圍:2020年6月至2021年6月,為期一年。 *在收集指標并發布這篇文章后,有人指出,Ahrefs的流量估算未包含所有流量來源,而僅包含自然搜索訪問數據,我們在最初撰寫時并未說明或進一步確認。抱歉! 1?? 找到一個可靠的第三方平臺,其估計的流量數據與 GA 數據相關性高且誤差較小。這樣我們就能(希望如此)將這些數據應用到
SparkToro后續的的受眾調研產品中。 2?? 與營銷從業者們分享我們的研究成果,以便其他營銷人員和分析師能在接下來的工作中更好地利用這些信息和工具。 先說結論,壞消息是:我們認為目前這些第三方網站估計都不夠準確,無法應用在SparkToro的后續項目中。我們希望未來這個情況能有所改善,也希望這篇博客可以推動平臺們進步。 但也有一個好消息。經過廣泛的數據收集、數據整理、MySQL和Excel分析,我們有很多有趣的數據可以與大家分享。接下來就讓我們一起來看看吧。 如果只用單一方式來呈現數據,結果可能會太片面。因此,在這篇文章中,我們將網站規模劃分成了六個梯隊來進行多維度的對比。其中,如果我得選擇一個最喜歡的,且未來幾年我將經常提及的(直到有人進行更全面的研究),那就是下面這張分析圖表: 為了得到第三方工具最佳運行狀態下的結果,我們完成了以下四個操作: 我們選擇使用GA的 "用戶 "(Users)指標,該指標可以衡量曾被稱為 "獨立訪客(Unique
Visitors)
"的相關數據。我們發現,這個指標與第三方平臺的數據最為吻合,對那些只估計總訪問量/所有會話數據的平臺而言也是如此。 我們使用了每個平臺的以下指標(這些指標,經測試,與GA指標的相關性最高)。SEMRush的 "訪問量"(Visits),從他們工具的網頁界面中提取,設置如下:(根域名),(所有設備),(全球),(偏差范圍:關閉)【(root
domain), (all devices), (worldwide), (deviation range: OFF)】;Ahrefs的 "流量表現"(traffic
performance),包括所有子域名,每月流量,平均自然流量(all
subdomains, monthly volume, avg. organic
traffic);Datos的每月會話(包含所有流量,由Datos團隊發送);SimilarWeb的 "總訪問量"( total
visits),我們采用的是全球范圍數據,由SimilarWeb團隊發送給我們;Google
Trends的 "平均興趣時間"(Average
Interest Over Time),從工具的網頁界面收集;以及Moz的 "域名權重
"(Domain
Authority)和 "鏈接根域名 "(Linking
Root Domain)估計,我們從其API提取。 有1,053 個網站與我們共享了流量數據,但在分析前我們先對這些數據進行了篩選和清理,同時排除掉了沒有第三方平臺數據的網站、以及任何在其 GA 報告的流量中可能存在差異或錯誤的網站(例如,如果他們的網站或部分頁面中刪除了 GA 收集器,可能造成月份缺失或不全)。 我們還從剩余的數據中刪除了幾十個異常值,這使得相關性和準確性的范圍變得更加一致。對于下面的數據和圖表,我們采用了641個網站提供給我們的共7,692項獨特數據進行比較(12個月X
641個網站)。 在上面的圖表中,每個第三方數據平臺也呈現了其每月流量數據與GA提供的數據誤差在30%以內的次數百分比。重要的是,我們還根據網站的流量高低對其進行了細分,最終呈現為如下六個梯隊: 平均每月250,000+
GA 用戶的網站(641 個網站中,共46 個屬于此類) 平均每月100,000-250,000
GA 用戶的網站(641 個網站中,共39個屬于此類) 平均每月50,000-100,000
GA 用戶的網站(641 個網站中,共
91 個屬于此類) 平均每月 25,000-50,000
GA 用戶的網站(641 個網站中,
共96 個屬于此類) 平均每月 5,000-25,000
GA 用戶的網站(641 個網站中,
共
186 個屬于此類) 平均每月 <5,000
GA 用戶的網站(641 個網站中,
共
183個屬于此類) 我們相信這些結果是真實且有用的。我們調研的網站規模已經足夠大,即使我們將樣本量增加10倍甚至100倍(比如收集10W+網站的GA數據),最終結果可能也差不多。 值得注意的是,盡管SimilarWeb是明顯的贏家,但還是有一個例外:它在小型網站(根據GA的定義,小型網站指的是每月訪問者少于5,000人的網站)的流量估計中表現最差。如果它在這方面能有所改進,它將在其他分析中也能占據明顯優勢。但,但當我們采用其他指標來評判時,情況發生了很大的變化。 我們介紹的第二個指標是大多數估計人員都很熟悉的一個指標:相關系數。如果你很早之前就已經關注了我的博客,你可能記得我曾經介紹過谷歌排名和Moz指標之間的相關性。 這個分析有些不同。 為什么呢?因為所有的第三方平臺和GA(我們正在與之比較)都試圖測量同樣的東西:網絡流量。機器學習指標與有數百或數千輸入的算法是不沖突的。下面的圖表簡單地展示了SEMRush、Datos、SimilarWeb和Ahrefs的流量指標與Google
Analytics在相同時間框架內對相同網站收集的流量指標的對比。 上圖顯示了各個平臺與Google
Analytics每個月報告的用戶指標之間的原始相關性。范圍從0(無相關性)到1.0(完美相關性),在641個網站共7692項每月數據中,SEMRush表現最好,為0.790,緊隨其后的是Datos的0.720,然后是SimilarWeb的0.659,以及Ahrefs的0.504(注意,Ahrefs只測量有機搜索流量;當他們與Google
Search Console的指標進行相關性分析時,結果是~0.75)。 如果你想了解的話,我們還選擇了包括Moz的域名權重(Domain
Authority)和Google
Trends的"平均興趣時間"(Average
Interest Over
Time)指標。這兩個指標都不是用來衡量搜索流量的,但兩者仍然具有相關性,而且我們知道營銷人員有時會使用它們作為相對流量水平的參考指標。這份報告有助于澄清它們是否有助于衡量搜索流量。 但是,關聯性只是衡量這些指標性能的一種方式。為了繼續挖掘這些指標的價值,我們決定研究大家都比較感興趣的問題:"這些第三方平臺的數據到底存在多大的偏差?" 在下面的圖表中,你會看到每個數據提供平臺的正負值。這些正負值代表了它們與GA數據的偏差,即每個平臺高估或低估了網站流量的最大值。由于數據較多,這張圖只能看第一梯隊(GA估計用戶超過25萬/月的網站)的數據。 下方的圖表比較了所有四個平臺在五個流量較低的梯隊的表現。 在這些數據中,我們看到了平臺之間一些很有意思的差異。其中最突出的幾個是: 對于每月 <50K
GA Users的網站來說,Ahrefs的誤差值最小 對于每月5K-100K
GA
Users的網站來說,SimilarWeb 的實力突出 對于GA
Users處于第一梯隊的網站,所有平臺的表現都不盡人意,出現了較大誤差。 一些有意思的發現: Ahrefs 幾乎總是低估數據(這也說得通,畢竟,他們只估計自然搜索流量,而不是所有流量)但是對于每月5000以下 GA用戶的網站,它又總是高估數據。 Datos 和 SimilarWeb 在高估和低估之間相當平衡。 SEMRush 高估的次數遠遠多于低估的次數 這輪分析并沒有告訴我們方差值,但好在我們已經在上述分析中涵蓋了這一點。 我們進行這次數據分析是為了找到一個(或幾個)數據值得信賴的平臺,哪怕結果并不完美。在過去的幾年里,我們的首選是SimilarWeb,但也非常看重Eli
Goodman和Datos的團隊,以及Tim
Soulo和他在Ahrefs的伙伴們。 但是,至少當涉及到估計一個網站在某個月得到多少流量,或者流量是上升還是下降這個問題上,我與Martin
MacDonald的看法是一致的: 對于某些范圍的流量,一些平臺是相當不錯的。但是,目前沒有哪個第三方工具的數據是一貫準確的,不足以讓大家完全相信它們的數據。相關性并不是很糟糕。誤差范圍也沒有特別大(訪問量最大的站點除外)。這些數據并不是來源于猜測,很顯然這些平臺都擁有可靠數據源和流程的支持。只是數據還沒有精準到那個程度。 對于大型網站,建議使用SimilarWeb的估計數據。在大部分的情況下,相比于其它平臺,它提供的數據誤差都在30%以內。 對于小型網站,Datos的數據表現是最強的。由于他們是一個剛成立不久平臺(<2年),希望在幾年后,如果我們重新做這份評估,它可以成為行業領導者。 不得不說,我們對Google
Trends品牌搜索興趣(brand
search
interest)與流量的相關性如此之差感到震驚。這無疑是本次研究中,最讓我們驚訝的一個。對我們來說,接下來需要馬上采取的措施是:停止使用Google
Trends來預測一個網站有多受歡迎。事實證明,一些熱門品牌的網站并沒有獲得多少流量,而一些品牌搜索興趣較低的網站卻獲得了很多流量。
這些不是平臺和GA的數據之間的平均方差;它們顯示了最大誤差和最小誤差。上面的圖回答了"所有第三方平臺在整個數據集的大方向上有多大偏差?”,而這些圖表回答的是"這些數據可能存在多大偏差?"
如你所見,偏差值可能高達+/-100%甚至更多,這意味著第三方平臺可能會聲稱某網站在6月獲得了50,000次訪問,但它實際上卻僅有5,000或高達100,000次訪問。事實上,這些工具在小型和中型網站表現出了更高的準確性,但差異也可能很大。
最后一個要回答的問題是——是否不同平臺提供的流量數值常常在同一方向上存在偏差?下圖比較分析了每個平臺在六個梯隊的表現來較為全面地回答這個問題。
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)