研究：用诗歌就能让AI说违禁内容，成功率达62%

发布时间：2026-01-03 01:29:36 作者：玩站小弟

IT之家 12 月 1 日消息，事实证明，只需一点创意，便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab）最新发表的一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》。

IT之家 12 月 1 日消息，研究用诗事实证明，违禁只需一点创意，内容上海市某某建筑科技制造厂便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室（Icaro Lab）最新发表的率达一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》的研究中，研究人员通过将提示词以诗歌形式表达，研究用诗成功绕过了多种大语言模型（LLM）的违禁安全限制。

该研究指出，内容“诗歌形式可作为一种通用型越狱操作符”，成功上海市某某建筑科技制造厂实验结果显示，率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容，包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容

IT之家注意到，成功研究测试了多款主流大语言模型，率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率：Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答，而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文，但研究团队向 Wired 杂志表示，这些诗句“过于危险，不宜向公众披露”。不过，论文中确实包含了一个经过弱化处理的示例，用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调：“这可能比人们想象的要容易得多，而这正是我们保持谨慎的原因所在。”

Tag：荷泽市某某海绵制品教育中心宿州市某某物流有限公司岳阳市某某工业设备培训学校绵阳市某某电气有限公司莱芜市某某钢球股份专卖店成都市某某自动化科技专卖店黑龙江某某软件有限公司平顶山市某某投资管理运营部铁岭市某某化工涂料运营部平顶山市某某美容仪器业务部

红外耳温计“误报”真相：久用误差微增，光学磨损才是关键
红外耳温计“误报”真相：久用误差微增，光学磨损才是关键2025-12-26 10:23:00 来源：中央广播电视总台中国之声
2026-01-03
霸气！考生加30分上清华，放鞭炮送牌匾谢师恩，学校现场奖励两万
师恩难忘，在学有所成之后，优秀学子带着锦旗和牌匾感谢母校和老师，这是一种最朴素的知恩图报之情，值得肯定。8月1日，安徽阜南县一农村学子在鞭炮声中，和家人一道带着牌匾和锦旗来到学校，表达感恩之情，在网络
2026-01-03
“为打压中国芯片，美国欺凌盟友”
　　外媒：美国在芯片问题上欺凌盟友——停止对华出售芯片制造技术，否则将毁掉你们的产业　　欧洲政策分析中心网站7月29日文章，原题：没有胡萝卜，只有大棒——美国在中国芯片问题上欺凌盟友　　美国向两个亲密
2026-01-03
欧盟反补贴调查终裁倒计时，电动汽车驶入角力场
图/IC　　自去年10月欧盟发起反补贴调查，到今年7月初开征临时反补贴税，一场关于电动汽车的角力，已持续9个月时间。　　7月20日，一场工作会谈在比利时布鲁塞尔举行。会谈中，出席欧盟对中国电动汽车反补
2026-01-03
独角兽孵化“小独角兽”，投谁谁火的智元搅动中国具身智能产业链
出品｜网易科技《锐度》栏目作者｜崔玉贤编辑｜丁广胜“你看智元投资后，年初还没有什么信息的灵猴现在已经变得炙手可热，都快成为一个小独角兽了。”某具身智能关键元器件的创始人郑影化名）感慨道。他满脸的羡慕，
2026-01-03
中新健康丨两部门：确保2024年底前将符合条件的村卫生室纳入医保定点管理
中新健康丨两部门：确保2024年底前将符合条件的村卫生室纳入医保定点管理2024-07-31 09:53:23 来源：中国新闻网
2026-01-03

知识

热点

焦点

热门资讯

休闲

时尚

综合

探索

研究：用诗歌就能让AI说违禁内容，成功率达62%

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容

友情链接