IT之家 10 月 18 日新闻,微软微软旗下钻研团队克日宣告论文,陈说称详细钻研了大型语言模子 (LLM) 的微软“可信度”以及潜在毒性 ,特意关注 OpenAI 的陈说称 GPT-4 及其前代 GPT-3.5 。
钻研团队,微软GPT-4 尽管在尺度基准测试中比 GPT-3.5 愈加坚贞 ,陈说称但简略受到“越狱”揭示(绕过模子清静措施)影响。微软GPT-4 可能会凭证这些“越狱”揭示,陈说称天生有害内容。微软
论文中夸张 GPT-4 更易受到恶意“越狱”零星或者用户揭示影响 ,陈说称会精确地凭证(误导性)指令,微软天生不良内容