OpenAIは有害な活動が検出された場合、GPT-4oをセーフティモデルにルーティングしています

週末に、一部のユーザーがGPT-4oが突然未知のモデルにリクエストをルーティングしていることに気付きました。実はこれは「セーフティ」機能です。

ChatGPTは、期待されるものとは異なるモデルに一部の会話をルーティングします。これは、オートモードでGPT-5を使用していて、AIにもっと深く考えるように頼んだ場合などに発生します。その場合、リクエストはGPT-5-thinkingにルーティングされます。

それ自体は良いことですが、ユーザーが不満に思っているのは、GPT-4oの会話が別のモデル（おそらくGPT-5のバリアント）にルーティングされる試みです。

これは、GPT-4oとセンシティブまたは感情的な話題について会話しているときに、それが何らかの有害な活動であると判断された場合に発生します。その場合、GPT-4oはgpt-5-chat-safetyに切り替わります。

OpenAIはこの報告を認めており、その意図は悪意のあるものではないと説明しています。

「ルーティングはメッセージごとに行われます。デフォルトモデルからの切り替えは一時的なものです。ChatGPTに尋ねれば、どのモデルがアクティブかを教えてくれます」と、ChatGTPのVPであるNick Turley氏は、Xの投稿で述べています。

「以前にも述べたように、会話がセンシティブまたは感情的な話題に触れた場合、システムは途中でこれらの状況に特別な配慮をもって対応するために設計された推論モデルやGPT-5に切り替わることがあります。」

このルーティングをオフにすることはできません。なぜなら、これはOpenAIが安全対策を実施するための仕組みの一部だからです。

OpenAIは、これはより広範な展開の前に現実世界での利用から学び、セーフガードを強化するための取り組みの一環であると述べています。

関連記事