OpenAI 提升大模型指令层次安全性
2026年03月10日 · 功能更新
OpenAI 提出 IH-Challenge 训练方法,使模型能够优先处理可信指令,从而改进指令层次结构、增强安全可控性,并提升对提示词注入攻击的抵抗能力。
openai
来源:官方网站 · OpenAI Blog
AI 领域技术新闻时间线
OpenAI 提出 IH-Challenge 训练方法,使模型能够优先处理可信指令,从而改进指令层次结构、增强安全可控性,并提升对提示词注入攻击的抵抗能力。
来源:官方网站 · OpenAI Blog