原文來源:SparkToro

      作者:Vlado Pavlik

      2022.7-8月,SparkToro(通過Twitter、email newsletter、LinkedIn、Facebook和Instagram等多個(gè)平臺(tái))招募志愿者分享其網(wǎng)站的Google Analytics 數(shù)據(jù)。過1,000名參與者與我們分享了他們網(wǎng)站的流量數(shù)據(jù)。接著我們收集了四家第三方網(wǎng)站流量估計(jì)工具(即SEMRush、Datos、SimilarWeb和Ahrefs*)提供的數(shù)據(jù),并將其與Google Analytics 報(bào)告的數(shù)據(jù)進(jìn)行比較。此外,我們還收集了Moz域名權(quán)重?cái)?shù)據(jù)和Google Trends 的品牌搜索量數(shù)據(jù)。所有這些數(shù)據(jù)都基于同一時(shí)間范圍:2020年6月至2021年6月,為期一年。


      *在收集指標(biāo)并發(fā)布這篇文章后,有人指出,Ahrefs的流量估算未包含所有流量來源,而僅包含自然搜索訪問數(shù)據(jù),我們?cè)谧畛踝珜憰r(shí)并未說明或進(jìn)一步確認(rèn)。抱歉!


      我們有兩個(gè)目標(biāo):


      1?? 找到一個(gè)可靠的第三方平臺(tái),其估計(jì)的流量數(shù)據(jù)與 GA 數(shù)據(jù)相關(guān)性高且誤差較小。這樣我們就能(希望如此)將這些數(shù)據(jù)應(yīng)用到 SparkToro后續(xù)的的受眾調(diào)研產(chǎn)品中。

      2?? 與營(yíng)銷從業(yè)者們分享我們的研究成果,以便其他營(yíng)銷人員和分析師能在接下來的工作中更好地利用這些信息和工具。


      先說結(jié)論,壞消息是:我們認(rèn)為目前這些第三方網(wǎng)站估計(jì)都不夠準(zhǔn)確,無法應(yīng)用在SparkToro的后續(xù)項(xiàng)目中。我們希望未來這個(gè)情況能有所改善,也希望這篇博客可以推動(dòng)平臺(tái)們進(jìn)步。


      但也有一個(gè)好消息。經(jīng)過廣泛的數(shù)據(jù)收集、數(shù)據(jù)整理、MySQL和Excel分析,我們有很多有趣的數(shù)據(jù)可以與大家分享。接下來就讓我們一起來看看吧。


      01
      哪家第三方網(wǎng)站
      估計(jì)工具與GA的數(shù)據(jù)誤差小于30%?

      如果只用單一方式來呈現(xiàn)數(shù)據(jù),結(jié)果可能會(huì)太片面。因此,在這篇文章中,我們將網(wǎng)站規(guī)模劃分成了六個(gè)梯隊(duì)來進(jìn)行多維度的對(duì)比。其中,如果我得選擇一個(gè)最喜歡的,且未來幾年我將經(jīng)常提及的(直到有人進(jìn)行更全面的研究),那就是下面這張分析圖表:

      為了得到第三方工具最佳運(yùn)行狀態(tài)下的結(jié)果,我們完成了以下四個(gè)操作:

      • 我們選擇使用GA的 "用戶 "(Users)指標(biāo),該指標(biāo)可以衡量曾被稱為 "獨(dú)立訪客(Unique Visitors) "的相關(guān)數(shù)據(jù)。我們發(fā)現(xiàn),這個(gè)指標(biāo)與第三方平臺(tái)的數(shù)據(jù)最為吻合,對(duì)那些只估計(jì)總訪問量/所有會(huì)話數(shù)據(jù)的平臺(tái)而言也是如此。

      • 我們使用了每個(gè)平臺(tái)的以下指標(biāo)(這些指標(biāo),經(jīng)測(cè)試,與GA指標(biāo)的相關(guān)性最高)。SEMRush的 "訪問量"(Visits),從他們工具的網(wǎng)頁(yè)界面中提取,設(shè)置如下:(根域名),(所有設(shè)備),(全球),(偏差范圍:關(guān)閉)【(root domain), (all devices), (worldwide), (deviation range: OFF)】;Ahrefs的 "流量表現(xiàn)"(traffic performance),包括所有子域名,每月流量,平均自然流量(all subdomains, monthly volume, avg. organic traffic);Datos的每月會(huì)話(包含所有流量,由Datos團(tuán)隊(duì)發(fā)送);SimilarWeb的 "總訪問量"( total visits),我們采用的是全球范圍數(shù)據(jù),由SimilarWeb團(tuán)隊(duì)發(fā)送給我們;Google Trends的 "平均興趣時(shí)間"(Average Interest Over Time),從工具的網(wǎng)頁(yè)界面收集;以及Moz的 "域名權(quán)重 "(Domain Authority)和 "鏈接根域名 "(Linking Root Domain)估計(jì),我們從其API提取。

      • 有1,053 個(gè)網(wǎng)站與我們共享了流量數(shù)據(jù),但在分析前我們先對(duì)這些數(shù)據(jù)進(jìn)行了篩選和清理,同時(shí)排除掉了沒有第三方平臺(tái)數(shù)據(jù)的網(wǎng)站、以及任何在其 GA 報(bào)告的流量中可能存在差異或錯(cuò)誤的網(wǎng)站(例如,如果他們的網(wǎng)站或部分頁(yè)面中刪除了 GA 收集器,可能造成月份缺失或不全)。

      • 我們還從剩余的數(shù)據(jù)中刪除了幾十個(gè)異常值,這使得相關(guān)性和準(zhǔn)確性的范圍變得更加一致。對(duì)于下面的數(shù)據(jù)和圖表,我們采用了641個(gè)網(wǎng)站提供給我們的共7,692項(xiàng)獨(dú)特?cái)?shù)據(jù)進(jìn)行比較(12個(gè)月X 641個(gè)網(wǎng)站)。


      在上面的圖表中,每個(gè)第三方數(shù)據(jù)平臺(tái)也呈現(xiàn)了其每月流量數(shù)據(jù)與GA提供的數(shù)據(jù)誤差在30%以內(nèi)的次數(shù)百分比。重要的是,我們還根據(jù)網(wǎng)站的流量高低對(duì)其進(jìn)行了細(xì)分,最終呈現(xiàn)為如下六個(gè)梯隊(duì):

      • 平均每月250,000+ GA 用戶的網(wǎng)站(641 個(gè)網(wǎng)站中,共46 個(gè)屬于此類)

      • 平均每月100,000-250,000 GA 用戶的網(wǎng)站(641 個(gè)網(wǎng)站中,共39個(gè)屬于此類)

      • 平均每月50,000-100,000 GA 用戶的網(wǎng)站(641 個(gè)網(wǎng)站中,共 91 個(gè)屬于此類)

      • 平均每月 25,000-50,000 GA 用戶的網(wǎng)站(641 個(gè)網(wǎng)站中, 共96 個(gè)屬于此類)

      • 平均每月 5,000-25,000 GA 用戶的網(wǎng)站(641 個(gè)網(wǎng)站中, 共 186 個(gè)屬于此類)

      • 平均每月 <5,000 GA 用戶的網(wǎng)站(641 個(gè)網(wǎng)站中, 共 183個(gè)屬于此類)

      我們相信這些結(jié)果是真實(shí)且有用的。我們調(diào)研的網(wǎng)站規(guī)模已經(jīng)足夠大,即使我們將樣本量增加10倍甚至100倍(比如收集10W+網(wǎng)站的GA數(shù)據(jù)),最終結(jié)果可能也差不多。


      值得注意的是,盡管SimilarWeb是明顯的贏家,但還是有一個(gè)例外:它在小型網(wǎng)站(根據(jù)GA的定義,小型網(wǎng)站指的是每月訪問者少于5,000人的網(wǎng)站)的流量估計(jì)中表現(xiàn)最差。如果它在這方面能有所改進(jìn),它將在其他分析中也能占據(jù)明顯優(yōu)勢(shì)。但,但當(dāng)我們采用其他指標(biāo)來評(píng)判時(shí),情況發(fā)生了很大的變化。


      02
      第三方工具
      與GA用戶之間的相關(guān)性

      我們介紹的第二個(gè)指標(biāo)是大多數(shù)估計(jì)人員都很熟悉的一個(gè)指標(biāo):相關(guān)系數(shù)。如果你很早之前就已經(jīng)關(guān)注了我的博客,你可能記得我曾經(jīng)介紹過谷歌排名和Moz指標(biāo)之間的相關(guān)性。


      這個(gè)分析有些不同。


      為什么呢?因?yàn)樗械牡谌狡脚_(tái)和GA(我們正在與之比較)都試圖測(cè)量同樣的東西:網(wǎng)絡(luò)流量。機(jī)器學(xué)習(xí)指標(biāo)與有數(shù)百或數(shù)千輸入的算法是不沖突的。下面的圖表簡(jiǎn)單地展示了SEMRush、Datos、SimilarWeb和Ahrefs的流量指標(biāo)與Google Analytics在相同時(shí)間框架內(nèi)對(duì)相同網(wǎng)站收集的流量指標(biāo)的對(duì)比。

      上圖顯示了各個(gè)平臺(tái)與Google Analytics每個(gè)月報(bào)告的用戶指標(biāo)之間的原始相關(guān)性。范圍從0(無相關(guān)性)到1.0(完美相關(guān)性),在641個(gè)網(wǎng)站共7692項(xiàng)每月數(shù)據(jù)中,SEMRush表現(xiàn)最好,為0.790,緊隨其后的是Datos的0.720,然后是SimilarWeb的0.659,以及Ahrefs的0.504(注意,Ahrefs只測(cè)量有機(jī)搜索流量;當(dāng)他們與Google Search Console的指標(biāo)進(jìn)行相關(guān)性分析時(shí),結(jié)果是~0.75)。


      如果你想了解的話,我們還選擇了包括Moz的域名權(quán)重(Domain Authority)和Google Trends的"平均興趣時(shí)間"(Average Interest Over Time)指標(biāo)。這兩個(gè)指標(biāo)都不是用來衡量搜索流量的,但兩者仍然具有相關(guān)性,而且我們知道營(yíng)銷人員有時(shí)會(huì)使用它們作為相對(duì)流量水平的參考指標(biāo)。這份報(bào)告有助于澄清它們是否有助于衡量搜索流量。


      但是,關(guān)聯(lián)性只是衡量這些指標(biāo)性能的一種方式。為了繼續(xù)挖掘這些指標(biāo)的價(jià)值,我們決定研究大家都比較感興趣的問題:"這些第三方平臺(tái)的數(shù)據(jù)到底存在多大的偏差?"


      03
      第三方指標(biāo)
      的流量估算范圍

      在下面的圖表中,你會(huì)看到每個(gè)數(shù)據(jù)提供平臺(tái)的正負(fù)值。這些正負(fù)值代表了它們與GA數(shù)據(jù)的偏差,即每個(gè)平臺(tái)高估或低估了網(wǎng)站流量的最大值。由于數(shù)據(jù)較多,這張圖只能看第一梯隊(duì)(GA估計(jì)用戶超過25萬/月的網(wǎng)站)的數(shù)據(jù)。

      下方的圖表比較了所有四個(gè)平臺(tái)在五個(gè)流量較低的梯隊(duì)的表現(xiàn)。

      在這些數(shù)據(jù)中,我們看到了平臺(tái)之間一些很有意思的差異。其中最突出的幾個(gè)是:

      • 對(duì)于每月 <50K GA Users的網(wǎng)站來說,Ahrefs的誤差值最小

      • 對(duì)于每月5K-100K GA Users的網(wǎng)站來說,SimilarWeb 的實(shí)力突出

      • 對(duì)于GA Users處于第一梯隊(duì)的網(wǎng)站,所有平臺(tái)的表現(xiàn)都不盡人意,出現(xiàn)了較大誤差。

      這些不是平臺(tái)和GA的數(shù)據(jù)之間的平均方差;它們顯示了最大誤差和最小誤差。上面的圖回答了"所有第三方平臺(tái)在整個(gè)數(shù)據(jù)集的大方向上有多大偏差?”,而這些圖表回答的是"這些數(shù)據(jù)可能存在多大偏差?"


      如你所見,偏差值可能高達(dá)+/-100%甚至更多,這意味著第三方平臺(tái)可能會(huì)聲稱某網(wǎng)站在6月獲得了50,000次訪問,但它實(shí)際上卻僅有5,000或高達(dá)100,000次訪問。事實(shí)上,這些工具在小型和中型網(wǎng)站表現(xiàn)出了更高的準(zhǔn)確性,但差異也可能很大。


      04
      第三方工具
      出現(xiàn)誤差的頻率如何?

      最后一個(gè)要回答的問題是——是否不同平臺(tái)提供的流量數(shù)值常常在同一方向上存在偏差?下圖比較分析了每個(gè)平臺(tái)在六個(gè)梯隊(duì)的表現(xiàn)來較為全面地回答這個(gè)問題。

      一些有意思的發(fā)現(xiàn):

      • Ahrefs 幾乎總是低估數(shù)據(jù)(這也說得通,畢竟,他們只估計(jì)自然搜索流量,而不是所有流量)但是對(duì)于每月5000以下 GA用戶的網(wǎng)站,它又總是高估數(shù)據(jù)。

      • Datos 和 SimilarWeb 在高估和低估之間相當(dāng)平衡。

      • SEMRush 高估的次數(shù)遠(yuǎn)遠(yuǎn)多于低估的次數(shù)

      這輪分析并沒有告訴我們方差值,但好在我們已經(jīng)在上述分析中涵蓋了這一點(diǎn)。


      研究思考:


      我們進(jìn)行這次數(shù)據(jù)分析是為了找到一個(gè)(或幾個(gè))數(shù)據(jù)值得信賴的平臺(tái),哪怕結(jié)果并不完美。在過去的幾年里,我們的首選是SimilarWeb,但也非常看重Eli Goodman和Datos的團(tuán)隊(duì),以及Tim Soulo和他在Ahrefs的伙伴們。


      但是,至少當(dāng)涉及到估計(jì)一個(gè)網(wǎng)站在某個(gè)月得到多少流量,或者流量是上升還是下降這個(gè)問題上,我與Martin MacDonald的看法是一致的:

      對(duì)于某些范圍的流量,一些平臺(tái)是相當(dāng)不錯(cuò)的。但是,目前沒有哪個(gè)第三方工具的數(shù)據(jù)是一貫準(zhǔn)確的,不足以讓大家完全相信它們的數(shù)據(jù)。相關(guān)性并不是很糟糕。誤差范圍也沒有特別大(訪問量最大的站點(diǎn)除外)。這些數(shù)據(jù)并不是來源于猜測(cè),很顯然這些平臺(tái)都擁有可靠數(shù)據(jù)源和流程的支持。只是數(shù)據(jù)還沒有精準(zhǔn)到那個(gè)程度。


      如何使用這些數(shù)據(jù)?


      對(duì)于大型網(wǎng)站,建議使用SimilarWeb的估計(jì)數(shù)據(jù)。在大部的情況下,相比于其它平臺(tái),它提供的數(shù)據(jù)誤差都在30%以內(nèi)。


      對(duì)于小型網(wǎng)站,Datos的數(shù)據(jù)表現(xiàn)是最強(qiáng)的。由于他們是一個(gè)剛成立不久平臺(tái)(<2年),希望在幾年后,如果我們重新做這份評(píng)估,它可以成為行業(yè)領(lǐng)導(dǎo)者。



      不得不說,我們對(duì)Google Trends品牌搜索興趣(brand search interest)與流量的相關(guān)性如此之差感到震驚。這無疑是本次研究中,最讓我們驚訝的一個(gè)。對(duì)我們來說,接下來需要馬上采取的措施是:停止使用Google Trends來預(yù)測(cè)一個(gè)網(wǎng)站有多受歡迎。事實(shí)證明,一些熱門品牌的網(wǎng)站并沒有獲得多少流量,而一些品牌搜索興趣較低的網(wǎng)站卻獲得了很多流量。



      點(diǎn)贊(1) 打賞

      評(píng)論列表 共有 0 條評(píng)論

      暫無評(píng)論

      服務(wù)號(hào)

      訂閱號(hào)

      備注【拉群】

      商務(wù)洽談

      微信聯(lián)系站長(zhǎng)

      發(fā)表
      評(píng)論
      立即
      投稿
      返回
      頂部