已確認：ChatGPT 已修復導致禁止回復的最大安全漏洞

1012 閱讀 0 評論 0 點贊

記得關注·飛咕咕出海～

幾天前，OpenAI試圖通過發布其新模型（稱為GPT-4o mini）來搶占所有頭條新聞，該模型將進一步增強其人工智能的功能，甚至免費用戶也可以使用。但直到現在，我們才通過更好的審查發現了此更新的真正范圍，修復了平臺中的嚴重缺陷。

盡管我們宣布了這一消息，并廣泛解釋了這一變化包括哪些內容，但事實是，由于遭受了全球性故障，這一消息完全被掩蓋并被置于背景中。微軟與 CrowdStrike 合作，連續幾天讓世界天翻地覆。

這也許是OpenAI發布新模型時沒有發現一個小但重要的細節的主要原因：實施的改變不僅使平臺更智能、更輕量，還修復了一個關鍵的 AI 錯誤。

語言模型的開發競相日趨復雜，這也引發了人們對這些平臺安全性的擔憂，因為這些模型可能被操縱，從而產生不適當、有害或惡意的反應。

幾個月來，那些知道如何在正確的地方尋找漏洞的人能夠利用安全漏洞或漏洞，這使得 ChatGPT 能夠通過一系列提示來解鎖一些安全鎖。但現在這已經成為過去了。

ChatGPT 不再被愚弄：GPT-4o 微型指令層次結構的工作方式如下

據The Verge友商報道，OpenAI 又向前邁進了一步，推出了最新模型 GPT-4o Mini，采用了一種名為“指令層次結構”的新穎安全技術，旨在保護語言模型免受這些通過網絡上流傳的提示進行“欺騙”的企圖。

廣義上講，指令層次結構包括建立一種命令階梯，賦予開發人員的原始指令更高的優先級，并淡化后續用戶試圖修改模型行為的請求。

GPT-4o Mini這款新模型代表著人工智能朝著民主化邁出了重要一步，提供了一種更經濟、更強大的模型，使開發人員能夠進行創新，而不受以前模型所施加的財務限制。（OpenAI）

這樣，如果用戶試圖“欺騙”聊天機器人忽略其初始指令并執行完全不同的任務，指令層次結構將阻止這種情況發生并阻止操縱提示。

“基本上，我們教模型始終優先考慮開發人員的指示，”他解釋道。OpenAI的 API 平臺產品經理Olivier Godement。“這樣，我們就可以防止用戶操縱模型產生非預期的響應。”

因此，指令層次結構代表了 OpenAI 語言模型在安全領域的重大進步。然而，需要注意的是，這種技術并不是一個明確的解決方案，找到繞過阻止過濾器的方法可能只是時間問題。

ChatGPT 變得越來越智能，但 OpenAI 仍受到嚴厲批評

隨著新 GPT-4o 迷你模型的集成，ChatGPT 掩蓋了一個導致其安全過濾器被突破的漏洞。圖片來源：Fast Company。

近幾個月來，OpenAI 因專注于產品開發而犧牲了人工智能本身的安全而受到批評。負責將語言模型與人類利益相結合的團隊解散，以及員工和前員工發表公開信要求提高安全保障，凸顯了解決這些問題的迫切需要。

隨著 GPT-4o mini 的推出和指令層次結構的實施，該公司似乎正在展示對其模型安全性的承諾。

然而，為確保這些系統得到負責任且合乎道德的使用，仍有許多工作要做。

微博：飛咕咕出海

微信號：dgsuuu

掃描二維碼，關注更多咨詢

點個【在看】，你最好看

文章為作者獨立觀點，不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有，如需轉載，請聯系作者 )

網站運營至今，離不開小伙伴們的支持。為了給小伙伴們提供一個互相交流的平臺和資源的對接，特地開通了獨立站交流群。群里有不少運營大神，不時會分享一些運營技巧，更有一些資源收藏愛好者不時分享一些優質的學習資料。

現在可以掃碼進群，備注【加群】。 ( 群完全免費，不廣告不賣課！)

国产91在线观看_国产卡1卡2卡三卡在线_综合久久久久综合_99视频有精品高清视频