美企微軟軟件工程師謝恩·瓊斯(Shane Jones)于今年2月初指認OpenAI的DALL-E 3模型存在漏洞,該模型可產生一系列色情內容。瓊斯在公布這一問題后,竟收到微軟的“封口令”威脅。盡管如此,他仍選擇向外披露該漏洞。
瓊斯去年底在進行自主研究時,發現OpenAI的圖像生成模型DALL-E 3存在一個漏洞,漏洞利用者可以越過AI保護墻來制作色情內容。他將此情況報告給微軟和OpenAI,并發文警示這種攻擊可能給公眾帶來危害,要求他們暫停使用DALL-E 3模型或在修復漏洞之前先下線。
然而,瓊斯隨后收到了來自微軟法務部門和管理層的壓力,要求其刪除領英上的相關文章且禁止對外透露信息。盡管他多次試圖聯系公司高層,尋求解釋并解決漏洞問題,但都沒得到回應。在此期間,漏洞也沒有得到解決,于是,瓊斯決定向媒體和相關部門公開。
瓊斯亦表示,近期網絡上廣為傳播的AI生成泰勒·斯威夫特(Taylor Swift)的不雅照片可能與此次漏洞有關。因為那些圖片是根據微軟的Designer AI創作出來的,其實質是用的DALL-E 3底層架構,因此在此事件中,微軟對瓊斯施加“封口令”的行為,無疑是種嚴重的失策。
對此,微軟發表聲明回應媒體,承認問題的存在,并承諾修復漏洞,解決員工的疑慮。同時強調,瓊斯所揭示的漏洞,成功率并不高,并且技術上無法“突破所有針對該模型設定的安全措施”,至于,“這一漏洞與泰勒·斯威夫特照片的制作是否有關聯,則不得而知”。
-
AI
+關注
關注
87文章
30239瀏覽量
268484 -
模型
+關注
關注
1文章
3178瀏覽量
48731 -
圖像生成
+關注
關注
0文章
22瀏覽量
6883 -
OpenAI
+關注
關注
9文章
1045瀏覽量
6412
發布評論請先 登錄
相關推薦
評論