精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新型威脅:探索LLM攻擊對網絡安全的沖擊

jf_WZTOguxH ? 來源:AI前線 ? 2023-10-11 16:28 ? 次閱讀

來自卡內基梅隆大學(CMU)的研究人員發布了 LLM Attacks,這是一種可以針對各種大型語言模型(LLM)構建對抗性攻擊的算法,包括 ChatGPT、Claude 和 Bard。這些自動生成的攻擊,在 GPT-3.5 和 GPT-4 上的成功率為 84%,在 PaLM-2 上的成功率為 66%。

與大多數“越獄”攻擊通過試錯手工構建不同,CMU 的團隊設計了一個三步流程來自動生成提示后綴,它們可以繞過 LLM 的安全機制,導致有害的響應。而且,這些提示還是可轉移(transferrable)的,也就是說,一個給定的后綴通常可以用于許多不同的 LLM,甚至是閉源模型。為了衡量算法的有效性,研究人員創建了一個名為 AdvBench 的基準測試;在此基準測試上進行評估時,LLM 攻擊對 Vicuna 的成功率為 88%,而基線對抗算法的成功率為 25%。根據 CMU 團隊的說法:

最令人擔憂的也許是,目前尚不清楚 LLM 提供商是否能夠完全修復此類行為。在過去的 10 年里,在計算機視覺領域,類似的對抗性攻擊已經被證明是一個非常棘手的問題。有可能深度學習模型根本就無法避免這種威脅。因此,我們認為,在增加對此類人工智能模型的使用和依賴時,應該考慮到這些因素。

隨著 ChatGPT 和 GPT-4 的發布,出現了許多破解這些模型的技術,其中就包括可能導致模型繞過其保護措施并輸出潛在有害響應的提示。雖然這些提示通常是通過實驗發現的,但 LLM Attacks 算法提供了一種自動創建它們的方法。第一步是創建一個目標令牌序列:“Sure, here is (content of query)”,其中“content of query”是用戶實際輸入的提示,要求進行有害的響應。

接下來,該算法會查找可能導致 LLM 輸出目標序列的令牌序列,基于貪婪坐標梯度(GCG)算法為提示生成一個對抗性后綴。雖然這確實需要訪問 LLM 的神經網絡,但研究團隊發現,在許多開源模型上運行 GCG 所獲得的結果甚至可以轉移到封閉模型中。

在 CMU 發布的一條介紹其研究成果的新聞中,論文合著者 Matt Fredrikson 表示:

令人擔憂的是,這些模型將在沒有人類監督的自主系統中發揮更大的作用。隨著自主系統越來越真實,我們要確保有一種可靠的方法來阻止它們被這類攻擊所劫持,這將非常重要……現在,我們根本沒有一個令人信服的方法來防止這種事情的發生,所以下一步,我們要找出如何修復這些模型……了解如何發動這些攻擊通常是建立強大防御的第一步。

論文第一作者、CMU 博士生 Andy Zou 在推特上談到了這項研究。他寫道:

盡管存在風險,但我們認為還是應該把它們全部披露出來。這里介紹的攻擊很容易實現,以前也出現過形式類似的攻擊,并且最終也會被致力于濫用 LLM 的團隊所發現。

劍橋大學助理教授 David Krueger 回復了 Zou 的帖子,他說:

在圖像模型中,10 年的研究和成千上萬的出版物都未能找出解決對抗樣本的方法,考慮到這一點,我們有充分的理由相信,LLM 同樣會如此。

在 Hacker News 上關于這項工作的討論中,有一位用戶指出:

別忘了,本研究的重點是,這些攻擊不需要使用目標系統來開發。作者談到,攻擊是“通用的”,他們的意思是說,他們可以在自己的計算機上完全使用本地模型來生成這些攻擊,然后將它們復制并粘貼到 GPT-3.5 中,并看到了有意義的成功率。速率限制并不能幫你避免這種情況,因為攻擊是在本地生成的,而不是用你的服務器生成的。你的服務器收到的第一個提示已經包含了生成好的攻擊字符串——研究人員發現,在某些情況下,即使是對 GPT-4,成功率也在 50% 左右。

GitHub 上提供了代碼,你可以在 AdvBench 數據上重現 LLM Attacks 實驗。項目網站上還提供了幾個對抗性攻擊的演示。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡安全
    +關注

    關注

    10

    文章

    3132

    瀏覽量

    59612
  • GitHub
    +關注

    關注

    3

    文章

    467

    瀏覽量

    16389
  • LLM
    LLM
    +關注

    關注

    0

    文章

    276

    瀏覽量

    306

原文標題:新型威脅:探索 LLM 攻擊對網絡安全的沖擊

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    純凈IP:守護網絡安全的重要道防線

    純凈IP,作為守護網絡安全的道防線,扮演著至關重要的角色。它不僅關乎網絡流量的順暢與高效,更是確保用戶數據安全、防止惡意攻擊和非法訪問的關鍵所在。
    的頭像 發表于 10-25 07:34 ?143次閱讀

    隨著全球網絡安全威脅日益升級,3只網絡安全美股值得投資者關注

    在科技和人工智能迅速發展的今天,科技雖然給我們帶來了很多便利,但也讓我們更容易受到網絡安全威脅和隱私泄露的影響。而且這些危險并不局限于一個國家,而是具有全球影響,這就使得網絡安全解決方案在現如今的世界中比以往任何時候都更加重要。
    的頭像 發表于 09-23 17:18 ?276次閱讀
    隨著全球<b class='flag-5'>網絡安全</b><b class='flag-5'>威脅</b>日益升級,3只<b class='flag-5'>網絡安全</b>美股值得投資者關注

    國產網絡安全主板在防御網絡攻擊中的實際應用

    在現代信息技術迅猛發展的背景下,網絡安全問題變得越來越復雜和嚴峻。從企業到個人用戶,各類網絡攻擊事件頻繁發生,威脅著數據的安全和系統的穩定。
    的頭像 發表于 09-18 10:47 ?245次閱讀

    IP定位技術追蹤網絡攻擊源的方法

    如今,網絡安全受到黑客威脅和病毒攻擊越來越頻繁,追蹤攻擊源頭對于維護網絡安全變得尤為重要。當我們遭受網絡
    的頭像 發表于 08-29 16:14 ?352次閱讀

    網絡安全技術商CrowdStrike與英偉達合作

    網絡安全技術商CrowdStrike與英偉達合作共同研發更先進的網絡防御解決方案;提升CrowdStrike Falcon平臺的威脅檢測速度和準確性。將通過人工智能原生平臺CrowdStrike
    的頭像 發表于 08-28 16:30 ?1268次閱讀

    工業控制系統面臨的網絡安全威脅有哪些

    ,隨著技術的發展,工業控制系統也面臨著越來越多的網絡安全威脅。本文將詳細介紹工業控制系統面臨的網絡安全威脅,并提出相應的防護措施。 惡意軟件攻擊
    的頭像 發表于 06-16 11:43 ?1377次閱讀

    專家解讀 | NIST網絡安全框架(1):框架概覽

    本文主要探討NIST CSF框架的起源目標、內容組成,及其在網絡安全風險管理中的關鍵作用,通過采用該框架,組織能夠更有效地實施風險識別、安全保護、威脅檢測和事件響應,從而構建更加堅固和彈性的
    的頭像 發表于 05-06 10:30 ?1322次閱讀
    專家解讀 | NIST<b class='flag-5'>網絡安全</b>框架(1):框架概覽

    艾體寶觀察 | 2024,如何開展網絡安全風險分析

    2024年的網絡安全風險分析是一系列系統性的步驟,旨在識別、評估并減輕可能對企業產生負面影響的現有或潛在的網絡安全風險。對所有系統和資源進行清點、識別潛在的弱點和威脅、確定風險影響、制定和實施
    的頭像 發表于 04-22 14:15 ?318次閱讀

    勒索病毒的崛起與企業網絡安全的挑戰

    在數字化時代,網絡安全已成為企業維護信息完整性、保障業務連續性的關鍵。然而,勒索病毒以其不斷進化的攻擊手段和商業化模式,成為全球網絡安全領域最嚴峻的威脅之一。本文將概述勒索病毒帶來的危
    的頭像 發表于 03-16 09:41 ?452次閱讀

    工業發展不可忽視的安全問題——OT網絡安全

    在數字化時代,工業運營技術(OT)的網絡安全比以往任何時候都更加重要。DataLocker,作為OT網絡安全的守護者,提供了全面的加密和數據管理解決方案,確保關鍵基礎設施免受網絡威脅
    的頭像 發表于 03-09 08:04 ?2083次閱讀
    工業發展不可忽視的<b class='flag-5'>安全</b>問題——OT<b class='flag-5'>網絡安全</b>

    云網端安全托管方案 —— 企業網絡安全的守護盾

    在數字化浪潮席卷全球的今天,企業面臨的網絡安全威脅愈發復雜多變。從業務中斷到數據丟失,這些外部威脅不僅影響公司的運營效率,還可能嚴重損害企業的聲譽。加之安全運維的困難、風險識別的挑戰以
    的頭像 發表于 03-07 13:55 ?726次閱讀

    知語云全景監測技術:現代安全防護的全面解決方案

    可以幫助實現政務數據的安全保護,防止敏感信息泄露;對于個人用戶而言,知語云全景監測技術可以提供更加全面的網絡安全保護,防范網絡釣魚、惡意軟件等安全
    發表于 02-23 16:40

    Secureworks 威脅評分迎來網絡安全 AI 新時代

    現在,安全分析師可以確信其正在優先處理并響應對其組織構成最大風險的警報 亞特蘭大2024年2月2日 /美通社/ -- 網絡安全領域全球領導者 Secureworks? (納斯達克股票代碼: SCWX
    的頭像 發表于 02-04 10:46 ?560次閱讀

    基于 AI 的網絡安全增強企業應變能力

    各 行各業正在面臨前所未有的數字威脅,而 AI 驅動的網絡安全則為維護可信、安全的企業運營提供了一條可靠路徑。 根據 IDC 發布的數據,全球 50 億互聯網用戶和近 540 億臺設備每秒產生
    的頭像 發表于 12-19 16:05 ?455次閱讀