南大研發越獄技術讓聊天機器人互相突破開發者權限

2023/12/29 • 4221閱

南大研究人員成功開發「越獄技術」，讓ChatGPT、Bard和Bing Chat等聊天機器人突破開發者的權限，生成違規內容。研究旨在提醒企業重視大語言模型安全，防範黑客攻擊。了解大語言模型安全漏洞和局限，保護您的AI系統免受惡意攻擊。

人工智慧。（示意圖。圖：iStock）

南洋理工大學的電腦科學家利用多個人工智慧聊天機器人，制定出可讓這些聊天機器人互相突破開發者權限或業界俗稱「越獄技術」（jailbreaking）的方式。

所謂的「越獄技術」，一般是指黑客找出並利用系統軟體的漏洞，指使系統執行開發者原本限定執行的功能。

南大在聲明中說，科研人員已成功讓多個聊天機器人，包括：ChatGPT、谷歌的Bard和微軟的Bing Chat，製作出違反開發者限定執行的內容。

此外，研究人員也讓已證實可入侵聊天機器人的指令資料庫接受大語言模型（large language model，LLM）訓練，進而創造出可使用「越獄技術」入侵其他聊天機器人的大語言模型聊天機器人。

有關的研究報告將在明年2月，在美國舉行的網絡與分布式系統安全會議上發表。

研究人員希望，這個研究結果有助企業和機構意識到他們所使用的大語言模型聊天機器人的弱點和局限，以便採取步驟，防範黑客攻擊。

及時獲取本站更新：

NTU科研新突破：鹽粒大小的神經植入物！