anchor left anchor right

Mar 06 2026 AIニュース

OpenAIがGPT-5.4を公開——プロ仕事向け最高性能モデル

anchor left anchor right

📖 この記事で分かること

  • GPT-5.4がGPT-5.2比でハルシネーション33%減を達成
  • 推論・コーディング・エージェント機能を1モデルに統合
  • APIで最大100万トークンのコンテキストウィンドウを提供
  • ChatGPTのPlusとTeam・Proユーザーが即日利用可能

💡 知っておきたい用語

  • コンテキストウィンドウ:AIが一度に読み書きできる文字・データ量のこと。冷蔵庫の容量に例えると、100万トークンは分厚い本を何十冊も一気に詰め込める大きさ

最終更新日: 2026年03月06日

GPT-5.4とは何か

OpenAIが2026年3月5日(日本時間6日)にリリースした、同社史上最もプロフェッショナル業務向けに最適化されたフロンティアモデルです。ChatGPT・API・Codexの3プラットフォームで同日提供が始まりました。

GPT-5.4はGPT-5.3 Codexの高度なコーディング能力を継承しつつ、推論・エージェントワークフロー・業務文書処理の改善を1モデルに集約しています。「より少ないやりとりで、求められた成果物を正確に届ける」ことを設計思想に掲げており、スライド作成・財務モデリング・法律分析などの長期タスクへの対応を強化しています。

主なラインアップ

  • GPT-5.4:標準モデル。API・Codexで提供
  • GPT-5.4 Thinking:推論モデル。ChatGPTのPlus・Team・Proユーザーが利用可能(GPT-5.2 Thinkingを置き換え)
  • GPT-5.4 Pro:最高性能版。Pro・Enterpriseプラン向け

主要な改善点と性能

GPT-5.4はハルシネーション低減・コンテキスト拡張・エージェント能力の3軸で大幅に進化しています。

事実精度の向上

OpenAIの発表によると、個別クレームの誤り率がGPT-5.2比で33%減少し、レスポンス全体でエラーが含まれる確率も18%低下しました。

ベンチマーク結果

  • GDPval(44職種の実務タスク評価):オフィスワーカーを**83%**の場面で上回る
  • OSWorld-Verified・WebArena Verified(コンピュータ操作評価):いずれも記録更新
  • BigLaw Bench(法律文書評価):**91%**を達成

コンテキストウィンドウ

APIでは最大100万トークンのコンテキストウィンドウをサポートします。これにより、エージェントが長期タスクの計画・実行・検証を1セッションで行えるようになりました。ただし、標準のコンテキストウィンドウは272Kトークンであり、それを超える部分は通常の2倍の課金レートが適用されます。Codex環境での100万トークン対応は現時点で実験的(Experimental)な扱いです。

トークン効率

同等の問題をGPT-5.2より大幅に少ないトークンで処理できるとされており、コスト削減とレスポンス速度の向上が期待されます。

新機能:Tool SearchとComputer Use

Tool Search(APIおよびCodex)

これまでのAPI呼び出しでは、利用可能なすべてのツール定義をシステムプロンプトに記述する必要があり、ツールが増えるほど大量のトークンを消費していました。新しいTool Searchは、必要なタイミングでツール定義を動的に検索できる仕組みで、大規模なツール群を持つシステムでのコストと速度を改善します。

ネイティブComputer Use(APIおよびCodex)

GPT-5.4は汎用モデルとして初めてネイティブのコンピュータ操作機能を搭載しました。エージェントが複数アプリにまたがる複雑なワークフローを自律的に実行できる点が特徴です。

Thinkingの「思考計画」表示(ChatGPT)

GPT-5.4 ThinkingはChatGPT上で回答生成前に思考の計画をユーザーに提示します。途中で方向修正ができるため、余計なやりとりを減らしながら期待通りの出力に近づけることができます。

安全性への取り組み

OpenAIはGPT-5.4 Thinkingに合わせてシステムカードを公開し、安全対策の詳細を開示しています。特筆すべき点として、本モデルはサイバーセキュリティ領域の「High capability」に対して初めて緩和策を実装した汎用モデルとされています。

また、推論モデルが自身の思考プロセス(Chain of Thought)を意図的に偽る可能性について新たな評価指標を導入。GPT-5.4 Thinkingでは欺瞞が起きにくく、CoT監視が有効な安全ツールとして機能することが示されたとしています。

提供状況と今後の予定

プラン利用可能なモデル
ChatGPT Plus・TeamGPT-5.4 Thinking(即日)
ChatGPT ProGPT-5.4 Thinking・GPT-5.4 Pro
Enterprise・Edu管理者設定で早期アクセス可能
API・CodexGPT-5.4(標準)

なお、GPT-5.2 Thinkingは2026年6月5日に廃止予定で、それまでの3カ月間はレガシーモデルセクションから引き続き選択できます。


よくある質問

Q: GPT-5.4はChatGPTの無料プランでも使えますか?

A: 現時点ではPlus・Team・Proなどの有料プランが対象です。無料プランでの提供については公式アナウンスをご確認ください。

Q: GPT-5.2 ThinkingからGPT-5.4 Thinkingへの切り替えは自動ですか?

A: ChatGPTではGPT-5.4 ThinkingがGPT-5.2 Thinkingのデフォルトを置き換えます。GPT-5.2 Thinkingは2026年6月5日までレガシーモデルとして手動選択が可能です。

Q: Tool Searchは既存のAPIコードに変更が必要ですか?

A: 既存ツール定義の方式も引き続き利用できると考えられますが、Tool Searchを活用するには実装上の変更が必要になる可能性があります。詳細はOpenAIの公式APIドキュメントをご確認ください。


まとめ

GPT-5.4はOpenAIが「プロフェッショナル業務向け最高性能モデル」と位置付ける大型アップデートです。ハルシネーションの大幅な低減、100万トークンのコンテキストウィンドウ、ネイティブのコンピュータ操作機能、そして新しいTool Searchによりエージェントとしての実用性が向上しています。ChatGPTでの即日展開に加え、今後はExcelアドインなどのビジネス統合との組み合わせも注目されます。


【用語解説】

  • フロンティアモデル: 現時点で最高水準の性能を持つAIモデルの総称。研究・開発の最前線にあるモデルを指す。
  • ハルシネーション: AIが存在しない事実や誤った情報を自信を持って出力してしまう現象。幻覚とも呼ばれる。
  • エージェントワークフロー: AIが複数のツールや操作を自律的に組み合わせ、人の指示なしに長期タスクを実行し続ける処理の流れ。

免責事項: 本記事の情報は執筆時点のものです。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。


引用元:

anchor left anchor right
KOJI TANEMURA

15年以上の開発経験を持つソフトウェアエンジニア。クラウドやWeb技術に精通し、業務システムからスタートアップ支援まで幅広く手掛ける。近年は、SaaSや業務システム間の統合・連携開発を中心に、企業のDX推進とAI活用を支援。

技術だけでなく、経営者やビジネスパーソンに向けた講演・執筆を通じて、生成AIの最新トレンドと実務への落とし込みをわかりやすく伝えている。

また、音楽生成AIのみで構成したDJパフォーマンスを企業イベントで展開するなど、テクノロジーと表現の融合をライフワークとして探求している。