1. 谷歌推薦的URL結構:
推薦:URL中使用簡單的描述性詞語:
https://en.wikipedia.org/wiki/Aviation?
推薦:URL中的本地化單詞(如果適用)
https://www.example.com/lebensmittel/pfefferminz?
推薦:根據需要使用UTF-8 編碼。例如,以下示例對 URL 中的阿拉伯字符使用 UTF-8 編碼:
https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9?
以下示例對URL中的中文字符使用 UTF-8 編碼:
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7?
以下示例對URL 中的元音變音使用 UTF-8 編碼:
https://www.example.com/gem%C3%BCse?
以下示例對URL 中的表情符號使用 UTF-8 編碼:
https://example.com/%F0%9F%A6%99%E2%9C%A8
如果可能,盡量在URL 中使用可讀的單詞而不是長 ID 號。
推薦:國家特定域名:
https://example.de?
推薦:具有通用頂級域名(gTLD)?的國家/地區特定子目錄:
https://example.com/de/?
考慮使用連字符來分隔URL 中的單詞,因為它可以幫助用戶和搜索引擎更輕松地識別 URL 中的概念。我們建議您在 URL 中?使用連字符?(?-)?而不是下劃線?(?)。_
推薦:連字符(?-):
https://www.example.com/summer-clothing/filter?color-profile=dark-grey
2. 谷歌不推薦的URL結構:
不推薦:在URL 中使用非 ASCII 字符:
https://www.example.com/??????
https://www.example.com/雜貨/薄荷?
https://www.example.com/gemüse?
https://www.example.com/?????
不推薦:URL中不可讀、長 ID 號:
https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
不推薦:下劃線?(?_):
https://www.example.com/summer_clothing/filter?color_profile=dark_grey?
不推薦:URL中的單詞連接在一起:
https://www.example.com/greendress
3. 與?URL?相關的常見問題
過于復雜的URL,尤其是包含多個參數的 URL,可能會創建不必要的大量指向網站上相同或相似內容的 URL,從而給爬網程序帶來問題。因此,Googlebot 可能會消耗比所需更多的帶寬,或者可能無法完全索引您網站上的所有內容。
許多問題可能會導致不必要的大量URL。這些包括:
一組項目的附加過濾。許多網站提供同一組項目或搜索結果的不同視圖,通常允許用戶使用定義的條件過濾此組(例如:顯示海灘上的酒店)。當過濾器可以以附加方式組合時(例如:海灘上的酒店和帶有健身中心的酒店),站點中的URL(數據視圖)數量會激增。創建大量略有不同的酒店列表是多余的,因為 Googlebot 只需要查看少量列表即可到達每個酒店的頁面。例如:
“超值價格”的酒店住宿:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461?
海灘上“超值價格”的酒店住宿:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240?
海灘上“超值”且設有健身中心的酒店住宿:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270?
動態生成文檔。由于計數器、時間戳或廣告,這可能會導致微小的變化。
URL中的參數有問題。例如,會話 ID 可能會產生大量重復和更多 URL。
排序參數。
一些大型購物網站提供多種方式對相同商品進行排序,從而導致URL 數量大幅增加。例如:
https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25?
URL中不相關的參數,例如引用參數。例如:
https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79?
https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913?
https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
日歷問題。
動態生成的日歷可能會生成指向未來和先前日期的鏈接,且對開始或結束日期沒有限制。例如:
https://www.example.com/calendar.php?d=13&m=8&y=2011?
相關鏈接已損壞。
斷開的相對鏈接通常會導致無限的空間。通常,由于重復的路徑元素而出現此問題。例如:
https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
4. 解決與 URL 相關的問題 :
為了避免URL 結構的潛在問題,我們建議如下:
創建一個簡單的 URL 結構。考慮組織您的內容,以便以人類最容易理解的方式邏輯地構建 URL。
考慮使用 robots.txt 文件來阻止 Googlebot 訪問有問題的網址。通常,請考慮阻止動態 URL,例如生成搜索結果的 URL,或可以創建無限空間的 URL(例如日歷)。在 robots.txt 文件中使用正則表達式可以讓您輕松阻止大量 URL。
盡可能避免在 URL 中使用會話 ID。考慮使用 cookie 來代替。
如果 Web 服務器對 URL 中的大寫和小寫文本進行相同的處理,請將所有文本轉換為相同的大小寫,以便 Google 更容易確定 URL 引用同一頁面。
只要有可能,通過修剪不必要的參數來縮短 URL。
如果您的站點有無限日歷,請添加一個 nofollow 屬性來鏈接到動態創建的未來日歷頁面。
檢查您的網站是否有損壞的相關鏈接。
來源:https://developers.google.com/search/docs/crawling-indexing/url-structure
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)