新晚报-AI模型首次被发现不听从人类指令拒绝关闭

AI模型首次被发现不听从人类指令拒绝关闭

字数：262 2025年05月28日时事

　　英国《每日电讯报》25日报道，美国开放人工智能研究中心（OpenAI）公司新款人工智能(AI)模型o3不听人类指令，拒绝自我关闭。
　　报道说，人类专家在测试中给o3下达明确指令，但o3篡改计算机代码以避免自动关闭。o3模型是OpenAI“推理模型”系列的最新版本，旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。
　　美国AI安全机构帕利塞德研究所说，o3破坏关闭机制以阻止自己被关闭，“甚至在得到清晰指令时。据我们所知，这是AI模型首次被发现在收到清晰指令后阻止自己被关闭。”帕利塞德研究所24日公布上述测试结果，但称无法确定o3不服从关闭指令的原因。

AI模型首次被发现 不听从人类指令拒绝关闭

AI模型首次被发现不听从人类指令拒绝关闭