1. 谷歌推薦的URL結構:

      推薦:URL中使用簡單的描述性詞語:

      https://en.wikipedia.org/wiki/Aviation?

      • 推薦:URL中的本地化單詞(如果適用)

      https://www.example.com/lebensmittel/pfefferminz?

      • 推薦:根據需要使用UTF-8 編碼。例如,以下示例對 URL 中的阿拉伯字符使用 UTF-8 編碼:

      https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9?

      以下示例對URL中的中文字符使用 UTF-8 編碼:

      https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7?

      以下示例對URL 中的元音變音使用 UTF-8 編碼:

      https://www.example.com/gem%C3%BCse?

      以下示例對URL 中的表情符號使用 UTF-8 編碼:

      https://example.com/%F0%9F%A6%99%E2%9C%A8

      • 如果可能,盡量在URL 中使用可讀的單詞而不是長 ID 號

      • 推薦:國家特定域名:

      https://example.de?

      • 推薦:具有通用頂級域名(gTLD)?的國家/地區特定子目錄:

      https://example.com/de/?

      考慮使用連字符來分隔URL 中的單詞,因為它可以幫助用戶和搜索引擎更輕松地識別 URL 中的概念。我們建議您在 URL 中?使用連字符?(?-)?而不是下劃線?(?)。_

      • 推薦:連字符(?-):

      https://www.example.com/summer-clothing/filter?color-profile=dark-grey

      2. 谷歌不推薦的URL結構:

      不推薦:在URL 中使用非 ASCII 字符:

      https://www.example.com/??????

      https://www.example.com/雜貨/薄荷?

      https://www.example.com/gemüse?

      https://www.example.com/?????

      不推薦:URL中不可讀、長 ID 號:

      https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1

      不推薦:下劃線?(?_):

      https://www.example.com/summer_clothing/filter?color_profile=dark_grey?

      不推薦:URL中的單詞連接在一起:

      https://www.example.com/greendress

      3. 與?URL?相關的常見問題

      過于復雜的URL,尤其是包含多個參數的 URL,可能會創建不必要的大量指向網站上相同或相似內容的 URL,從而給爬網程序帶來問題。因此,Googlebot 可能會消耗比所需更多的帶寬,或者可能無法完全索引您網站上的所有內容。

      許多問題可能會導致不必要的大量URL。這些包括:

      • 一組項目的附加過濾。許多網站提供同一組項目或搜索結果的不同視圖,通常允許用戶使用定義的條件過濾此組(例如:顯示海灘上的酒店)。當過濾器可以以附加方式組合時(例如:海灘上的酒店和帶有健身中心的酒店),站點中的URL(數據視圖)數量會激增。創建大量略有不同的酒店列表是多余的,因為 Googlebot 只需要查看少量列表即可到達每個酒店的頁面。例如:

      “超值價格”的酒店住宿:

      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461?

      海灘上“超值價格”的酒店住宿:

      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240?

      海灘上“超值”且設有健身中心的酒店住宿:

      https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270?

      • 動態生成文檔。由于計數器、時間戳或廣告,這可能會導致微小的變化。

      • URL中的參數有問題。例如,會話 ID 可能會產生大量重復和更多 URL。

      排序參數。

      • 一些大型購物網站提供多種方式對相同商品進行排序,從而導致URL 數量大幅增加。例如:

      https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25?

      • URL中不相關的參數,例如引用參數。例如:

      https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79?

      https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913?

      https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.

      • 日歷問題。

      動態生成的日歷可能會生成指向未來和先前日期的鏈接,且對開始或結束日期沒有限制。例如:

      https://www.example.com/calendar.php?d=13&m=8&y=2011?

      • 相關鏈接已損壞。

      斷開的相對鏈接通常會導致無限的空間。通常,由于重復的路徑元素而出現此問題。例如:

      https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

      4. 解決與 URL 相關的問題 :

      為了避免URL 結構的潛在問題,我們建議如下:

      • 建一個簡單的 URL 結構。考慮組織您的內容,以便以人類最容易理解的方式邏輯地構建 URL。

      • 考慮使用 robots.txt 文件來阻止 Googlebot 訪問有問題的網址。通常,請考慮阻止動態 URL,例如生成搜索結果的 URL,或可以創建無限空間的 URL(例如日歷)。在 robots.txt 文件中使用正則表達式可以讓您輕松阻止大量 URL。

      • 盡可能避免在 URL 中使用會話 ID。考慮使用 cookie 來代替。

      • 如果 Web 服務器對 URL 中的大寫和小寫文本進行相同的處理,請將所有文本轉換為相同的大小寫,以便 Google 更容易確定 URL 引用同一頁面。

      • 只要有可能,通過修剪不必要的參數來縮短 URL。

      • 如果您的站點有無限日歷,請添加一個 nofollow 屬性來鏈接到動態創建的未來日歷頁面。

      • 檢查您的網站是否有損壞的相關鏈接。

      來源:https://developers.google.com/search/docs/crawling-indexing/url-structure



      點贊(2) 打賞

      評論列表 共有 0 條評論

      暫無評論

      服務號

      訂閱號

      備注【拉群】

      商務洽談

      微信聯系站長

      發表
      評論
      立即
      投稿
      返回
      頂部