研究:用诗歌就能让AI说违禁内容,成功率达62%
[娱乐] 时间:2025-12-06 23:57:58 来源:南宁市某某车业制造厂 作者:探索 点击:60次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容临沂市某某机床铸造维修站便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功临沂市某某机床铸造维修站实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:焦点)
相关内容
- 周五了,是时候准备一场微醺小酌
- 粗粮也分真伪 吃对了才能稳定血糖
- 57岁袁惟仁送医画面曝光,成植物人三年身形消瘦,靠母亲姐姐照顾
- 脱皮年糕爆火,但劝你少吃!“胖过”米饭,还是隐形“血糖炸弹”
- 怼同行顺便怼老板?理想高管批理想ONE质保策略,一众车企躺枪
- 单身,任素汐现状却应了徐峥的话
- 心理咨询不是“万能药” 4个常见误解要注意
- 穿睡衣睡和裸睡,到底哪个更健康?
- 脱皮年糕爆火,但劝你少吃!“胖过”米饭,还是隐形“血糖炸弹”
- 中年女人想穿得时髦,少穿羽绒服+紧身裤,换成这些好看保暖
- 今年冬天最流行的大衣“高阶穿搭”,太时髦了!
- 卫衣+外套,这个冬天的王牌组合!
- 高市早苗的算计,将让日本割肉5000亿
- 李乃文现身大孤山祈福,满头白发疲惫无神,袁姗姗眼圈肿胀发乌
精彩推荐
- 传奇之路,东契奇成为奥尼尔后首位连续五场两双的湖人球员
- 河北秦皇岛:8.45万吨级多用途纸浆船交付
- 【图解】促消费新政“瞄准”不同年龄人群精准发力
- 李乃文现身大孤山祈福,满头白发疲惫无神,袁姗姗眼圈肿胀发乌
- 刚上任2个月,A股80后董事长被留置
- 学习新语|中法元首外交再写佳话
热门点击
- 北京楼市新政半月:新房热度提升,价格仍在寻底 views+
- 夏天这个超需要防晒的部位,别忽略了! views+
- 加拿大航空将接收8架波音737 views+
- 4月份北京住房租赁市场成交量回落、议价空间加大 views+
- 听不清、听不到、说话声越来越大,小心“老年性耳聋”找上门 views+
- “乳”此重要!自检“三步曲”学起来 views+
- 男子拳击课后猝死,又是谁的“锅”? views+
- 煤制油与食用油混装,疯狂的罐车背后健康隐患有多大? views+
- 今日辟谣(2024年7月15日) views+
- ARJ21飞机首条高高原航线成功开航 views+
