claude-opus-4-6 anchor left anchor right

Feb 06 2026

Anthropic「Claude Opus 4.6」発表──100万トークン対応とエージェントチームで知識労働の転換点へ

anchor left anchor right

📖 この記事で分かること

  • AnthropicがClaude Opus 4.6を発表、コーディングと業務タスクが大幅強化
  • コンテキストウィンドウが100万トークンに拡大、長文処理が飛躍的に向上
  • 複数AIエージェントが並列で動く「Agent Teams」機能が登場
  • 金融・法務分野でGPT-5.2やGemini 3 Proを上回るベンチマーク結果

💡 知っておきたい用語

  • コンテキストウィンドウ:AIが一度に「覚えていられる」情報量のこと。本に例えると、Opus 4.5は薄い文庫本1冊分だったのが、Opus 4.6では分厚い百科事典1冊分の情報をまとめて処理できるようになりました。

最終更新日: 2026年02月06日

Opus 4.6の概要──Opusシリーズ初の100万トークン対応

Anthropicは2026年2月5日(米国時間)、最新フラグシップモデル「Claude Opus 4.6」を発表しました。2025年11月に公開されたOpus 4.5の後継モデルで、コーディング、エージェント処理、エンタープライズ向けワークフローの各領域で性能が向上しています。

今回のアップデートで注目すべきポイントは大きく3つあります。

  • 100万トークンのコンテキストウィンドウ(ベータ):Opusクラスのモデルとしては初めて、一度に処理できる情報量が従来の20万トークンから100万トークンに拡大しました。大規模なコードベースの変更や、複数の長文ドキュメントの横断分析が可能になります。
  • 出力トークンの上限が12万8,000に拡大:より長い文章やコードを一度に生成できるようになりました。
  • アダプティブシンキング(適応的思考):Anthropicのモデルとして初めて、プロンプトの内容に応じて「どれだけ深く考えるか」を自動で判断する機能が搭載されました。これまでは拡張思考のオン/オフしか選べませんでしたが、より細かい制御が可能になっています。

API利用時の価格は入力100万トークンあたり5ドル、出力100万トークンあたり25ドルで、Opus 4.5から据え置きです。モデル識別子は claude-opus-4-6 で、claude.ai、API、AWS Bedrock【ベッドロック】、Google Vertex AI、Azureのいずれからも利用できます。

主要ベンチマークの結果──ARC AGI 2で競合を大きく引き離す

Opus 4.6は多くのベンチマークで業界トップの成績を記録しています。特に目を引くのが、「人間には簡単だがAIには難しい問題」を測定するARC AGI 2での結果です。

  • ARC AGI 2:68.8%(Opus 4.5は37.6%、GPT-5.2は54.2%、Gemini 3 Proは45.1%)
  • Terminal Bench 2.0(ターミナル環境でのコーディング):65.4%(Opus 4.5の59.8%から向上)
  • OSWorld(コンピュータ操作):72.7%(Opus 4.5の66.3%から向上)
  • MRCR v2(長文中の情報検索・推論):76%(Sonnet 4.5は18.5%)
  • GDPval-AA Elo(経済的価値のある知識労働):1,606
  • Finance Agent ベンチマーク:1位

一方で、SWE-bench VerifiedとMCP Atlas【エムシーピー・アトラス】ベンチマークではわずかな後退(リグレッション)が報告されています。Anthropicはこれを「異例」としつつ、類似の評価指標では大幅に改善していると説明しています。

安全性評価については、欺瞞性(ディセプション)、追従性(シコファンシー)、ユーザーの妄想を助長する傾向など、Opus 4.5と同水準を維持しているとのことです。

新機能と業界への影響──「バイブワーキング」時代の到来か

Opus 4.6は単なるモデル性能の向上にとどまらず、AIの使われ方そのものを変えうる機能が複数追加されています。

Agent Teams(エージェントチーム)は、複数のAIエージェントがタスクを分担し、並列で作業を進める機能です。Anthropicのプロダクト責任者であるScott White氏は「1人のエージェントが順番にタスクをこなすのではなく、複数のエージェントがそれぞれの担当を持ち、直接連携しながら並行して作業する」と説明しています。APIユーザーおよびサブスクリプションユーザー向けにリサーチプレビューとして提供されています。

Claude in PowerPoint(リサーチプレビュー)では、PowerPoint内でClaudeを直接利用できるようになりました。既存のレイアウトやフォント、テンプレートを読み取り、デザインの一貫性を保ったままスライドを生成・編集できるとされています。Max、Team、Enterpriseプラン向けのベータ提供です。

コンパクション(文脈要約)機能もAPI向けに追加されました。長時間のタスク実行中にコンテキストを要約することで、コンテキスト上限に達する前に作業を継続できるようにするものです。

デジタル主権オプションとして、米国内のみでワークロードを処理するオプションが新設されています(料金は10%増)。

さらに注目されているのがセキュリティ分野です。Anthropicのフロンティア・レッドチームが事前テストを行ったところ、Opus 4.6はオープンソースコードから500件以上の未知のゼロデイ脆弱性を発見しました。各脆弱性はAnthropicのチームまたは外部のセキュリティ研究者によって検証されています。Axiosの報道によると、Anthropicのフロンティア・レッドチームを率いるLogan Graham氏は「防御側にツールをできるだけ早く届けたい」と述べています。

業界全体への影響も広がっています。CNBCによれば、Anthropicの法人顧客は売上の約80%を占め、同社のプロダクト責任者は「バイブコーディング」の次の段階として「バイブワーキング」への移行を示唆しています。Coworkプラットフォームのプラグイン公開に続くこの発表は、SaaS企業の株価下落にも影響を与えたと報じられています。

今後の注目点──エンタープライズAIの競争激化

Opus 4.6のリリースは、Anthropicが「最高のコーディングアシスタント」から「知識労働全般のAIレイヤー」へと戦略を転換するシグナルと受け止められています。

同日にはOpenAIも新たなAIエージェントプラットフォーム「Frontier」を発表しており、エンタープライズ向けAIエージェント市場での競争はさらに激しくなっています。Anthropicは30万社以上の法人顧客を抱えており、今回のモデル強化でCoworkやClaude Codeとの連携をさらに推し進める方針です。

なお、Opus 4.6で「production-ready(本番利用可能)品質」に近いアウトプットが出せるとAnthropicは主張していますが、実際の業務での有効性については今後の導入事例やユーザーフィードバックを見る必要があるでしょう。Agent Teamsやアダプティブシンキングといった新機能がどこまで実務に貢献するかは、リサーチプレビューから一般提供に移行する段階で明らかになっていくと考えられます。


よくある質問

Q: Claude Opus 4.6はどこで使えますか?

A: claude.ai(Webチャット)、Anthropic API、AWS Bedrock、Google Vertex AI、Microsoft Azureで利用できます。一部の新機能(Agent Teams、Claude in PowerPoint)はリサーチプレビューとしての提供で、Max・Team・Enterpriseプランが対象です。

Q: Opus 4.5からの料金変更はありますか?

A: API利用料金は入力100万トークンあたり5ドル、出力100万トークンあたり25ドルで据え置きです。ただし、米国内限定処理オプションを利用する場合は10%の追加料金がかかります。

Q: Opus 4.6はOpus 4.5と比べて何が大きく変わりましたか?

A: 主な変更点は、コンテキストウィンドウの100万トークンへの拡大(ベータ)、複数エージェントが並列作業する「Agent Teams」の追加、プロンプトに応じて思考の深さを自動調整する「アダプティブシンキング」の導入、そしてARC AGI 2をはじめとする多くのベンチマークでの大幅な性能向上です。


まとめ

Claude Opus 4.6は、Anthropicが2026年最初に投入したフラグシップモデルです。100万トークンのコンテキストウィンドウ、Agent Teams、アダプティブシンキングなど、エンタープライズ向けの新機能が目立ちます。ベンチマーク上ではARC AGI 2で競合モデルを大きく引き離し、金融・法務領域でもトップ水準を記録しています。ただし一部のベンチマークで後退も見られ、実務での評価はこれからです。エンタープライズAI市場での競争が激化するなか、今後の導入事例やユーザーの声が注目されます。


【用語解説】

  • コンテキストウィンドウ【こんてきすとうぃんどう】: AIモデルが一度の処理で参照できる情報量の上限。トークン数で表され、大きいほど長い文書やコードを一括で扱えます。
  • エージェントチーム【えーじぇんとちーむ】: 複数のAIエージェントがタスクを分担し、並列で協調作業を行う仕組み。人間のチーム作業に近い形で、大規模な仕事を効率的に処理します。
  • アダプティブシンキング【あだぷてぃぶしんきんぐ】: プロンプトの複雑さに応じて、AIが思考に費やす時間やリソースを自動的に調整する機能。簡単な質問には素早く、複雑な問題にはじっくり取り組みます。
  • ゼロデイ脆弱性【ぜろでいぜいじゃくせい】: ソフトウェアの開発元がまだ認識していない、修正パッチが存在しないセキュリティ上の欠陥。悪用されると防御手段がない状態になります。

免責事項: 本記事の情報は執筆時点のものです。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。


引用元:

anchor left anchor right
KOJI TANEMURA

15年以上の開発経験を持つソフトウェアエンジニア。クラウドやWeb技術に精通し、業務システムからスタートアップ支援まで幅広く手掛ける。近年は、SaaSや業務システム間の統合・連携開発を中心に、企業のDX推進とAI活用を支援。

技術だけでなく、経営者やビジネスパーソンに向けた講演・執筆を通じて、生成AIの最新トレンドと実務への落とし込みをわかりやすく伝えている。

また、音楽生成AIのみで構成したDJパフォーマンスを企業イベントで展開するなど、テクノロジーと表現の融合をライフワークとして探求している。