来自 Anthropic 安全保障研究团队的研究人员开发出一种新方法,用于保护人工智能模型免受通用越狱攻击。

文章原文链接:https://www.anquanke.com/post/id/303816