2021年4月,Google Search Console的Performance報告篩選增加了對正則表達式的支持,6月初又新增了否定的選項,支持直接排除符合正則條件的頁面。應該很多SEO運營人員都關注到了這一功能更新,但是可能因為對正則不太熟悉,未能充分利用這個功能來促進Google Search Console的數據分析工作。


      因此,本文分享了一些大家可能會用到的正則表達式,不熟悉如何寫表達式的人也能輕松體驗這個功能。


      目前Google Search Console的Performance報告下的“Page”及“Query”報告支持使用正則表達(RegEx)篩選,點擊下圖中的New按鈕,在下拉菜單中可以選擇這兩個報告。


      根據需要篩選的是關鍵詞還是頁面,選擇對應的報告,之后,就可以輸入正則條件進行篩選了。


      操作過程其實是比較簡單的,但是如果對于不熟悉正則表達式的人而言,就沒法利用好這個高級版的篩選功能。


      下面給大家介紹一些獨立站運營人員經常使用到的篩選條件以及對應的正則表達式如何撰寫,大家可以根據需要復制后稍作修改就能完成自身網站的數據篩選分析。


      1. 篩選包含某個詞的關鍵詞或者頁面

      篩選包含某個詞的關鍵詞或者頁面,在這個詞前后用.*。例如,需要搜索包含pro的詞,正則的寫法是.*pro.*。


      2. 篩選多個特定的頁面

      如果需要篩選多個頁面,URL相同的部分可以只寫一次,后面的文件路徑使用 | 進行連接,例如:

      ^https://crossborderdigital.cn/(google-seo|orm-service/sem-service)/ $


      表達式符號說明:

      • ^ 表示開始

      • ()表示將一系列元素組合在一起

      • | 表示或的意思,滿足其中一個條件即可

      • $ 表示結束


      3. 否定篩選

      Google Search Console的支持正則表達式否定篩選,直接選擇Doesn’t match regex即可,下面的正則表達式跟非否定篩選寫法一致,如需要篩選不包含pro的詞,如下圖:


      4. 指定關鍵詞字符數進行篩選

      如果需要直接查看網站非長尾關鍵詞來源,可以選擇字符數少于10的關鍵詞(也可以更長字符數),正則表達式的寫法是:^[\w\W\s\S]{1,10}$,那么,符合這一條件的關鍵詞就能快速被篩選出來,超過10個字符數的長尾關鍵詞將被排除。


      正則表達式符號說明:

      • ^ 表示開始

      • [ ] 匹配字符數長度

      • \w 表示匹配任何大小寫字母,數字以及下劃線。等同于[A-Za-z0-9_]\g

      • \s 表示空格

      • \W 表示匹配非字母,數字及下劃線

      • \S 表示匹配任何非空格

      • {1,10} 表示前面的規則重復1-10次

      • $ 表示結束


      注意,如果覺得這個表達式的符號太多不容易記住,可以直接復制上面的樣例,[\w\W\s\S]整體的意思就是匹配任意字符,因此只需要修改{1,10}來調整限定的字符數長度。


      5. 篩選長尾關鍵詞

      篩選長尾關鍵詞,可以選擇按照字符數長度篩選,例如要搜索字符數大于40的長尾詞,對應的正則表達是:^[\w\W\s\S]{40,}$


      正則表達式符號說明:

      • ^ 表示開始

      • [\w\W\s\S] 表示匹配任何字符,拆分的符號對應意義見上文第四點。

      • {40,} 表示重復40次及以上

      • $ 表示結束


      篩選長尾關鍵詞的方法還有一個是指定單詞之間的空格數,比如包含5個空格以上,對應的正則表達式是:(\w+\s){4,}\w+。


      正則表達式符號說明:

      • (\w+\s) 表示任何字數后面緊跟一個空格

      • {4,} 表示重復4次以上

      • \w+表示以單詞結尾


      6. 查找長URL

      如果要查找URL較長的頁面,例如,超過100個字符數的URL,可以使用正則表達式:^[\w\W\s\S]{100,}$


      7. 查找包含特殊字符的URL

      查找URL包含特殊字符,正則表達式撰寫:[^\/\.\-:0-9A-Za-z_]


      正則表達式符號說明:

      • [^] 表示排除一系列字符

      • \/\.\-\: 表示排除URL里面非字母類的字符,例如 ://, -

      • 0-9A-Za-z_ 需要排除的字母,數字


      8. 分析關鍵詞了解用戶意圖

      我們在做關鍵詞分析的時候,經常會把關鍵詞分為四大類,包括Informational,Navigational, Commercial, Transactional. 對應的正則篩選模板可參考下方:

      • Information: who|what|when|how|why

      • Navigational: .*brand.*

      • Commercial: .*(best|top|vs|review*).*


      最后需要提醒大家注意的是,Google Search Console 對正則表達式的字符數長度有限制,所以建議盡可能精簡表達式,例如 example.com/aa|example.com/bb 建議寫成 example.com/(aa|bb),兩個表達式條件一致,但是后者就精簡許多。


      使用正則表達式,讓Google Search Console 的報告篩選變得更加強大高效,歡迎大家留言分享自己覺得很實用的正則表達式,解決什么情況的快速篩選需求?;蛘哂邢牒Y選/查找的情況但是不知道正則表達式怎么寫的,也可以留言一起研究。




      Lily? 丘立妮

      從事海外數字營銷近十年,曾任職百度國際,負責海外hao123網站、百度瀏覽器搜索營銷與Facebook運營;曾負責萬興科技三大品牌搜索引擎營銷內容策略,有豐富的團隊管理經驗;服務客戶:OPPO海外、唯品會、Anker、Roborock等。





      點贊(6) 打賞

      評論列表 共有 0 條評論

      暫無評論

      服務號

      訂閱號

      備注【拉群】

      商務洽談

      微信聯系站長

      發表
      評論
      立即
      投稿
      返回
      頂部