claude-sonnet-4-6 anchor left anchor right

Feb 20 2026

Anthropic「Claude Sonnet 4.6」正式リリース──Opus級の性能が5分の1の価格で利用可能に

anchor left anchor right

📖 この記事で分かること

  • Anthropic最新モデルSonnet 4.6の主要機能と強化点
  • コーディング・PC操作の自動化が人間に近づいた具体的な数値
  • 無料プランでも最新モデルが使えるようになった背景
  • RPA・業務自動化の市場に与える今後の影響

💡 知っておきたい用語

  • Computer Use(コンピューターユース):AIがマウスやキーボードを使って、人間のようにPCを操作する技術。たとえばWebフォームの入力やExcel操作を、人の代わりにAIが画面を見ながら実行します。

最終更新日: 2026年02月20日

Sonnet 4.6とは何か──「中間モデル」がフラッグシップに迫る

Anthropicは2026年2月17日、AIモデル「Claude Sonnet 4.6」を正式にリリースしました。従来の最上位モデル「Opus」に匹敵する性能を、約5分の1の価格で提供するという、コストパフォーマンスの常識を覆すモデルです。

Claudeシリーズには小型の「Haiku」、中型の「Sonnet」、最上位の「Opus」の3ラインが存在します。今回リリースされたSonnet 4.6は中型モデルの最新版にあたりますが、複数のベンチマークで上位モデルのOpus 4.6とほぼ同等のスコアを記録しています。

価格は前世代のSonnet 4.5と同じく、入力100万トークンあたり3ドル、出力100万トークンあたり15ドルです。Opus 4.6の入力15ドル/出力75ドルと比較すると、5分の1のコストで近い性能が得られる計算になります。

主な特徴は以下のとおりです。

  • コーディング、Computer Use、長文推論、エージェント計画、ナレッジワーク、デザインの全方位で性能向上
  • コンテキストウィンドウ【文脈窓】が最大100万トークン(ベータ版)に拡大
  • claude.aiのFree・ProプランでSonnet 4.6がデフォルトモデルに変更
  • API識別子は claude-sonnet-4-6
  • Amazon Bedrock、Google Cloud Vertex AI、GitHub Copilotでも同時に利用可能

ベンチマークで見る「Opus級」の実力

Sonnet 4.6は、主要なベンチマークで前世代から大幅なスコア向上を見せています。特にComputer UseとコーディングではOpus 4.6との差がほぼなくなりました。

代表的なベンチマーク結果は以下のとおりです。

  • SWE-bench Verified(コーディング): 79.6%(Sonnet 4.5は77.2%、Opus 4.6は80.8%)
  • OSWorld-Verified(Computer Use): 72.5%(Sonnet 4.5は61.4%、Opus 4.6は72.7%)
  • ARC-AGI-2(新規問題解決): 58.3%(Sonnet 4.5は13.6%で、4.3倍の向上)
  • GDPval-AA(オフィス業務): 1633 Elo(Opus 4.6の1606を上回る)
  • Finance Agent v1.1(金融分析): 63.3%(Opus 4.6の60.1%を上回る)

注目すべきは、オフィス業務と金融分析ではSonnet 4.6がOpus 4.6を上回っている点です。Anthropicの公式ブログでも「これまでOpusクラスでなければ対応できなかった、実世界で経済的価値のあるオフィス業務が、Sonnet 4.6で可能になった」と述べられています。

Claude Codeでの早期テストでは、開発者の約70%がSonnet 4.5よりSonnet 4.6を好み、59%が前世代のフラッグシップであるOpus 4.5よりSonnet 4.6を選んだと報告されています。

Computer Use──16カ月で5倍に進化したPC操作能力

今回のリリースで特に話題を集めているのが、Computer Use機能の飛躍的な向上です。

Computer Useとは、AIがマウスクリックやキーボード入力を通じて、人間と同じようにPCのGUI【グラフィカルユーザーインターフェース】を操作する機能です。Anthropicは2024年10月にこの機能を初めて公開しましたが、当時のOSWorldスコアは14.9%でした。

その後の推移を見ると、進化のスピードが際立ちます。

  • 2024年10月(Sonnet 3.5): 14.9%
  • 2025年2月(Sonnet 3.7): 28.0%
  • 2025年6月(Sonnet 4): 42.2%
  • 2025年10月(Sonnet 4.5): 61.4%
  • 2026年2月(Sonnet 4.6): 72.5%

16カ月で約5倍という向上率です。Anthropicの公式発表によると、早期アクセスのユーザーからは「複雑なスプレッドシートの操作」「複数ステップのWebフォーム入力」「複数のブラウザタブをまたいだ作業」で人間レベルの能力が報告されています。

ただし、Anthropic自身も「最も熟練した人間のPC操作にはまだ及ばない」と認めています。また、Computer Useにはプロンプトインジェクション【不正な命令注入】攻撃のリスクがあり、Sonnet 4.6ではこの耐性がSonnet 4.5から大幅に改善され、Opus 4.6と同等レベルになったとされています。

この技術の進化は、API【エーピーアイ】を持たないレガシーシステムの自動化に大きな意味を持ちます。従来であれば人手で操作するしかなかった古い業務システムやWebフォームを、AIが直接操作できるようになることで、RPA【アールピーエー】(業務自動化)市場に大きなインパクトを与える可能性があります。

今後の注目点──コスト革命とエージェント時代の加速

Sonnet 4.6のリリースがもたらす最大の構造変化は、「Opus級の能力がSonnet価格で手に入る」というコスト面の転換です。

VentureBeatは「1月にはコスト面で常時稼働が難しかったAIエージェントが、2月には手の届く価格になった」と報じています。入力100万トークンあたり数ドルでOpus相当の能力が使えることで、企業のAIエージェント導入計算が根本的に変わる可能性があります。

無料プランへのデフォルト搭載も見逃せません。Sonnet 4.6は、ファイル作成、コネクタ、スキル、コンパクション【文脈圧縮】といった機能とともに無料プランで提供されています。これにより、有料プランを契約していないユーザーも最新のAI能力に即座にアクセスできるようになりました。

一方で、いくつかの留意点もあります。

  • 100万トークンのコンテキストウィンドウはまだベータ版であり、APIでのみ利用可能
  • Opus 4.6は深い科学的推論(GPQA Diamond: 91.3% vs 89.9%)や高度なターミナルコーディング(Terminal-Bench 2.0: 65.4% vs 59.1%)では依然として優位
  • Computer Useの本番環境での利用には、人間による監視・承認フローの設計が引き続き推奨されている
  • ベンチマークスコアと実運用でのパフォーマンスには乖離がある場合がある

Anthropicは2週間前にOpus 4.6をリリースしたばかりであり、今後Haikuモデルのアップデートも予想されています。AI業界全体として、フラッグシップ級の性能がより低コストで広く行き渡る流れが加速しており、ソフトウェア業界への影響は引き続き注視が必要です。


よくある質問

Q: Claude Sonnet 4.6は無料で使えますか?

A: はい。claude.aiのFreeプランでSonnet 4.6がデフォルトモデルとして利用可能です。ファイル作成やコネクタ機能も無料プランに含まれています。ただし、100万トークンのコンテキストウィンドウはAPIのベータ版でのみ提供されています。

Q: 前世代のSonnet 4.5とどこが違いますか?

A: コーディング(SWE-bench: 77.2%→79.6%)、Computer Use(OSWorld: 61.4%→72.5%)、新規問題解決(ARC-AGI-2: 13.6%→58.3%)など全方位で向上しています。価格は据え置きのまま、多くの指標でOpus級の性能に到達しています。

Q: Computer Useで業務を完全に自動化できますか?

A: OSWorldベンチマークで72.5%のスコアは大きな進歩ですが、100%ではありません。Anthropicも「最も熟練した人間にはまだ及ばない」としており、本番環境での利用には人間による監視と承認フローの設計が推奨されています。特にプロンプトインジェクション対策など、セキュリティ面の考慮も必要です。


まとめ

Anthropicの「Claude Sonnet 4.6」は、中間モデルでありながらフラッグシップのOpus 4.6に迫る性能を実現し、その価格は5分の1に抑えられています。特にComputer Use機能は16カ月で約5倍に向上し、業務自動化の可能性を大きく広げました。無料プランでのデフォルト搭載により、多くのユーザーが恩恵を受けられる点も注目に値します。ベンチマークの進化ペースを考えると、今後数カ月で「AIによるPC操作」が実用的な業務ツールとして定着する可能性は十分にあると考えられます。


【用語解説】

  • Computer Use【コンピューターユース】: AIがマウスやキーボードを使い、人間と同じようにPCの画面を操作する技術。APIを持たない古い業務システムでもAIによる自動化が可能になる。
  • コンテキストウィンドウ【文脈窓】: AIモデルが一度に処理できるテキストの量。100万トークンは、コードベース全体や数十本の研究論文を一度に読み込める規模に相当する。
  • SWE-bench Verified【エスダブリューイーベンチ】: AIが実際のGitHubリポジトリのバグ修正や機能実装をどれだけ正確に行えるかを測るベンチマーク。ソフトウェアエンジニアリング能力の標準的な指標として広く使われている。
  • OSWorld【オーエスワールド】: Chrome、LibreOffice、VS Codeなど実際のソフトウェアをシミュレーション環境で動かし、AIのPC操作能力を測定するベンチマーク。
  • プロンプトインジェクション【不正命令注入】: Webサイト等に悪意ある指示を隠し、AIの動作を乗っ取ろうとするサイバー攻撃の手法。Computer Useにおいて特に注意が必要なセキュリティリスク。

免責事項: 本記事の情報は執筆時点のものです。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。


引用元:

anchor left anchor right
KOJI TANEMURA

15年以上の開発経験を持つソフトウェアエンジニア。クラウドやWeb技術に精通し、業務システムからスタートアップ支援まで幅広く手掛ける。近年は、SaaSや業務システム間の統合・連携開発を中心に、企業のDX推進とAI活用を支援。

技術だけでなく、経営者やビジネスパーソンに向けた講演・執筆を通じて、生成AIの最新トレンドと実務への落とし込みをわかりやすく伝えている。

また、音楽生成AIのみで構成したDJパフォーマンスを企業イベントで展開するなど、テクノロジーと表現の融合をライフワークとして探求している。