URL 參數或查詢字符串是 URL 的一部分,通常位于問號 (?) 之后,用于與 URL 一起傳遞數據。它們可以是修改頁面內容的主動參數,也可以是主要用于跟蹤且不更改內容的被動參數。
它們由鍵值對組成,其中鍵告訴您正在傳遞什么數據,而值是您正在傳遞的數據,例如標識符。它們看起來像 ?key=value 但如果有一對以上,則可以用與號 (&) 分隔,例如 ?key=value&key2=value2。
URL參數部分的解釋。
在本指南中,我們將介紹您需要了解的有關 URL 參數的內容。
如何使用參數
正如我在介紹中提到的,參數可以是活動的的或被動的。讓我們看一些例子。
活動參數
活動參數以某種方式修改頁面的內容。
過濾器。刪除一些內容,在用戶想要查看的頁面上留下更具體的內容。例如電子商務中的分面導航。
?color=yellow
排序。以某種方式重新排序內容,例如按價格或評級。
?sort=highest_rated
分頁。將內容劃分為一系列相關頁面。
?p=2
翻譯。更改內容的語言。
?lang=de
搜索。查詢網站以獲取用戶正在尋找的信息。
在搜索引擎yep.com 上,我們使用鍵“q”進行查詢,該值包含有關用戶查詢的信息。
?q=ahrefs
被動參數
被動參數不改變內容。它們通常用于跟蹤。讓我們看一些例子。
附屬 ID。傳遞用于跟蹤銷售和注冊來源的標識符。
?id=ahrefs
廣告標簽。跟蹤廣告活動。
?utm_source=newsletter
會話 ID。標識特定用戶。在現代網站上使用會話 ID 來跟蹤用戶并不常見。
?sessionid=12345
視頻時間戳。跳轉到視頻中的指定時間戳。
?t=135
搜索引擎優化的影響
當涉及到 SEO 時,URL 參數可能會導致許多不同的問題,尤其是在使用多個參數的情況下。以下是您可能會遇到的一些問題。
被動參數可能會導致重復內容的問題。通常,您希望它們被抓取,并且每個頁面都應該有一個規范設置為主版本。
有時您可能希望使用robots.txt完全阻止這些參數被抓取- 但僅在您可能遇到抓取預算問題的情況下。稍后我們將對此進行更多介紹。
Google 將在稱為規范化的過程中選擇要索引的頁面版本,并且鏈接等信號將合并到該索引版本。
活動參數可能會創建具有近乎重復的內容或與其他內容非常相似的內容的頁面。它們也可能是完全不同的內容。您需要檢查參數的實際用途。
內部鏈接
您應該避免使用被動參數,例如用于跟蹤內部鏈接(從您網站上的一個頁面到另一個頁面的鏈接)。
這在大型網站上仍然是一種非常普遍的做法,但我想強調的是,這是一種陳舊過時的做法。
大多數分析系統都有事件跟蹤,您可以使用它來記錄數據,而無需向您的 URL 添加參數。
在大多數情況下,可以在內部鏈接上使用活動參數。
抓取
帶有參數或大量不同組合的無限 URL 路徑可能會導致抓取問題。保持一致的順序,并且沒有允許添加其他參數的路徑。
您可以使用Site Audit中Structure Explorer工具下的Depth報告輕松找到潛在的無限路徑。網站有 9 個以上的級別并不常見,因此這是一個強有力的指標,表明實際上可能存在無限路徑或其他問題。
Structure Explorer中的深度報告。
谷歌會在抓取時進行調整,因為它識別出無限的路徑或某些模式。它將嘗試限制對它認為無用或重復的 URL 的抓取。
國際化
URL 參數有時用于國際網站。這些被列為特定于語言環境的 URL的一個選項。但即使是谷歌也表示不推薦。它增加了復雜性,更可能會出錯。您也無法在 Google Search Console 中對這些 URL 進行地理定位。
電子商務
參數通常用于電子商務中的所有內容——從跟蹤到分頁,再到分面導航。這些主題可能非常復雜。
JavaScript
人們使用 # 而不是 ? 作為片段標識符,特別是對于那些用于跟蹤的被動參數。這通常不是一個好主意。但在特定情況下,可以這樣做來替換不必要的參數。
問題是服務器忽略 # 之后的任何內容,并且許多系統根本不會或無法識別使用 # 的參數。
另外,# 已經有一個指定的用例,就是滾動到頁面的一部分。這是在客戶端完成的,JavaScript 開發人員也可以使用它來轉到具有不同內容的頁面。
檢查
檢查您的站點上使用了哪些參數。在Site Audit 的 Page Explorer工具中,您可以搜索包含問號 (?) 的 URL。
在Page Explorer中搜索參數
您可以使用高級過濾器查找具有多個參數的頁面或開始排除參數以幫助您識別網站上使用的所有各種參數。
一旦您知道使用了哪些參數,我建議您查看一些頁面以了解這些參數的實際作用。
您還可以檢查重復報告中的準確或近似重復。視覺效果使您可以輕松查看您是否有許多相同或相似頁面的版本,以及它們是否具有匹配的規范標簽來選擇首選版本。您可以單擊每個集群以獲取更多信息。
復制內容樹圖視圖以顯示集群。
“批量導出”下還有一個選項,可讓您一次導出所有重復的內容。我發現這個選項更容易用于更大的數據集。
控制參數
過去,Google 在 Google Search Console 中有一個 URL 參數工具,您可以在其中根據是否更改頁面內容來選擇如何處理不同的參數。該工具已于 2022 年初棄用。以下是 Google 對此的評價:
2009 年,當 Search Console 的前身網站管理員工具中推出 URL 參數工具時,互聯網是一個比今天更加狂野的地方。SessionID 參數非常常見,CMS 難以組織參數,瀏覽器經常斷開鏈接。使用 URL 參數工具,網站所有者可以通過指定某些參數如何影響其網站上的內容來精細控制 Google 如何抓取他們的網站。
多年來,谷歌在猜測網站上哪些參數有用,哪些參數——簡單地說——無用方面變得更好了。事實上,目前在 URL Parameters 工具中指定的參數配置中只有大約 1% 對爬取有用。由于該工具對 Google 和 Search Console 用戶的價值較低,我們將在 1 個月內棄用 URL 參數工具。
雖然沒有提到,但我懷疑某些用戶可能一直在使用該工具傷害自己。我過去遇到過這種情況,有人設置了錯誤的設置,說內容沒有改變,但確實發生了。這從該網站的索引中刪除了幾十萬頁。哎呀!
您可以讓 Google 抓取并弄清楚如何為您處理參數,但您也可以利用一些控件。
規范標簽
規范標簽可以幫助將信號整合到選定的 URL,但需要抓取頁面的每個附加版本。正如我之前提到的,Google 可能會在識別模式時進行調整,并且隨著時間的推移,這些規范化的 URL 可能會被抓取的次數減少。
這是我默認選擇的。但是,如果一個站點有很多問題并且參數失控,我可能會考慮其他一些選項。
無索引
noindex 元機器人標記從索引中刪除頁面。這需要抓取一個頁面。但同樣,它可能會隨著時間的推移而減少。如果您需要將信號整合到其他頁面,我將避免使用 noindex。
在 robots.txt 中阻止
robots.txt 中的屏蔽參數意味著這些頁面可能仍會被編入索引。它們不太可能出現在正常搜索中。
問題是這些頁面不會被抓取,也不會整合信號。如果要合并信號,請避免阻止參數。
站點審核
在站點審核中設置項目時,抓取設置中有一個名為“刪除 URL 參數”的切換,您可以使用它來忽略任何帶有參數的 URL。
您還可以使用模式匹配在爬網設置中排除參數化 URL。
阻止站點審查中的參數。
邊注。有趣的事實:我們只將頁面的規范化版本計入您的抓取積分。
最后的想法
總結一下,URL 參數有很多不同的用例,它們可能會也可能不會給您的網站帶來問題。一切都是看實際情況。
翻譯作品,原作者:Patrick Stox
相關文章:
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)