記得關注·飛咕咕出海~

      幾天前,OpenAI試圖通過發布其新模型(稱為GPT-4o mini)來搶占所有頭條新聞,該模型將進一步增強其人工智能的功能,甚至免費用戶也可以使用。但直到現在,我們才通過更好的審查發現了此更新的真正范圍,修復了平臺中的嚴重缺陷。

      盡管我們宣布了這一消息,并廣泛解釋了這一變化包括哪些內容,但事實是,由于遭受了全球性故障,這一消息完全被掩蓋并被置于背景中。微軟與 CrowdStrike 合作,連續幾天讓世界天翻地覆。

      這也許是OpenAI發布新模型時沒有發現一個小但重要的細節的主要原因:實施的改變不僅使平臺更智能、更輕量,還修復了一個關鍵的 AI 錯誤。

      語言模型的開發競相日趨復雜,這也引發了人們對這些平臺安全性的擔憂,因為這些模型可能被操縱,從而產生不適當、有害或惡意的反應。

      幾個月來,那些知道如何在正確的地方尋找漏洞的人能夠利用安全漏洞或漏洞,這使得 ChatGPT 能夠通過一系列提示來解鎖一些安全鎖。但現在這已經成為過去了。

      ChatGPT 不再被愚弄:GPT-4o 微型指令層次結構的工作方式如下

      據The Verge友商報道,OpenAI 又向前邁進了一步,推出了最新模型 GPT-4o Mini,采用了一種名為“指令層次結構”的新穎安全技術,旨在保護語言模型免受這些通過網絡上流傳的提示進行“欺騙”的企圖。

      廣義上講,指令層次結構包括建立一種命令階梯,賦予開發人員的原始指令更高的優先級,并淡化后續用戶試圖修改模型行為的請求。

      GPT-4o Mini這款新模型代表著人工智能朝著民主化邁出了重要一步,提供了一種更經濟、更強大的模型,使開發人員能夠進行創新,而不受以前模型所施加的財務限制。(OpenAI)


      這樣,如果用戶試圖“欺騙”聊天機器人忽略其初始指令并執行完全不同的任務,指令層次結構將阻止這種情況發生并阻止操縱提示。

      “基本上,我們教模型始終優先考慮開發人員的指示,”他解釋道。OpenAI的 API 平臺產品經理Olivier Godement。“這樣,我們就可以防止用戶操縱模型產生非預期的響應。”

      因此,指令層次結構代表了 OpenAI 語言模型在安全領域的重大進步。然而,需要注意的是,這種技術并不是一個明確的解決方案,找到繞過阻止過濾器的方法可能只是時間問題。

      ChatGPT 變得越來越智能,但 OpenAI 仍受到嚴厲批評


      隨著新 GPT-4o 迷你模型的集成,ChatGPT 掩蓋了一個導致其安全過濾器被突破的漏洞。圖片來源:Fast Company。


      近幾個月來,OpenAI 因專注于產品開發而犧牲了人工智能本身的安全而受到批評。負責將語言模型與人類利益相結合的團隊解散,以及員工和前員工發表公開信要求提高安全保障,凸顯了解決這些問題的迫切需要。

      隨著 GPT-4o mini 的推出和指令層次結構的實施,該公司似乎正在展示對其模型安全性的承諾。

      然而,為確保這些系統得到負責任且合乎道德的使用,仍有許多工作要做。



      微博:飛咕咕出海

      微信號:dgsuuu

      掃描二維碼,關注更多咨詢

      點個【在看】,你最好看


      點贊(0) 打賞

      評論列表 共有 0 條評論

      暫無評論

      服務號

      訂閱號

      備注【拉群】

      商務洽談

      微信聯系站長

      發表
      評論
      立即
      投稿
      返回
      頂部