AnthropicがClaude Managed Agentsに「ドリーミング」を追加—自己改善型AIエージェントへ anchor left anchor right

May 07 2026 AIニュース

AnthropicがClaude Managed Agentsに「ドリーミング」を追加—自己改善型AIエージェントへ

anchor left anchor right

📖 この記事で分かること – ドリーミングとは何か、どうエージェントを進化させるか – アウトカムズでタスク品質をルーブリック評価できる仕組み – マルチエージェントオーケストレーションで並列処理が可能に – Harvey・Netflix・Wisedocsの実導入事例と成果数値

💡 知っておきたい用語ドリーミング(Dreaming): AIエージェントが過去の会話履歴をまとめて振り返り、パターンを抽出して記憶を整理するプロセス。人間が寝ている間に脳が経験を整理するイメージに近い。


最終更新日: 2026年05月07日

ドリーミングとは何か

Anthropicは2026年5月6日、Claude Managed Agentsに3つの新機能を追加した。中心的な新機能「ドリーミング」はリサーチプレビューとして公開され、残る「アウトカムズ(Outcomes)」「マルチエージェントオーケストレーション(Multiagent Orchestration)」「ウェブフック(Webhooks)」はパブリックベータとして利用可能になった。

ドリーミングはスケジュール実行型のプロセスで、エージェントの過去セッションと既存のメモリストアを読み込み、パターンを抽出・整理して新しいメモリストアを生成する。具体的には以下の作業を自動で行う。

  • 重複エントリの統合
  • 古くなった情報・矛盾する記録の更新
  • 単一エージェントでは気づきにくいパターンの発見(繰り返すミス、チーム共通の作業フロー、複数エージェントにまたがる傾向など)

開発者が制御レベルを選択できる点も重要だ。メモリ更新を自動適用するか、変更内容をレビューしてから適用するかを指定できる。また入力ストアは変更されないため、結果を確認してから不要なら破棄することも可能だ。

Anthropicの公式ドキュメントによれば、ドリーミングジョブは非同期で実行され、入力セッション数に応じて数分から数十分かかる。対応モデルは現在claude-opus-4-7claude-sonnet-4-6の2つで、1回あたり最大100セッションを入力として扱える。

アウトカムズ:品質基準を自分で定義する

アウトカムズはエージェントに「正解の定義」を与える仕組みだ。開発者がルーブリック(採点基準)を記述すると、エージェントはその基準に向かって作業を進める。評価は専用のグレーダー(採点モジュール)が独立したコンテキストウィンドウ上で行うため、エージェント自身の推論に影響されない客観的な判定が得られる。基準を満たさない場合、グレーダーが改善点を指摘し、エージェントが再度タスクを実行する。

Anthropicの社内ベンチマークでは、標準プロンプトループと比較してタスク成功率が最大10ポイント向上した。ファイル生成品質については、docxで+8.4%、pptxで+10.1%の改善が確認されている。主観的な品質評価—ブランドボイスへの適合、ビジュアルガイドラインの遵守—にも対応しており、適用範囲が広い。

アウトカムズを定義したうえでエージェントを実行し、完了時にウェブフックで通知を受け取る使い方も可能になった。

マルチエージェントオーケストレーション:並列処理で複雑な仕事をさばく

マルチエージェントオーケストレーションは、一つのエージェントで処理しきれない複雑なタスクに向けた機能だ。リードエージェントが仕事を分割し、モデル・プロンプト・ツールをそれぞれ持つスペシャリストエージェントに委任する。

各スペシャリストは共有ファイルシステム上で並列に動作し、リードエージェントの全体コンテキストに貢献する。イベントが永続化されており、すべてのエージェントが自分の作業履歴を保持しているため、リードエージェントはワークフローの途中で他エージェントに確認を入れることもできる。Claude Consoleでは、どのエージェントが何をどの順番で実行したかを完全にトレースできる。

実導入事例:現場での効果

今回の発表に合わせて、複数の企業が具体的な成果を公開している。

  • Harvey(法律向けAI): ドリーミングを活用した長文ドラフト・文書作成ワークフローで、セッション間の記憶保持が改善し、タスク完了率が社内テストで約6倍に向上した。
  • Netflix(プラットフォームチーム): 数百ビルドのログを横断分析するエージェントをマルチエージェントオーケストレーションで構築。バッチを並列処理し、対処すべきパターンのみを抽出できるようになった。
  • Wisedocs(文書検証): アウトカムズを使った文書品質チェックエージェントを構築。内部ガイドラインへの準拠を保ちながら、レビュー処理速度が50%向上した。
  • Spiral by Every(ライティングエージェント): リードエージェントにHaikuを使い、下書き生成をOpusで動くサブエージェントに委任。アウトカムズによるルーブリック評価で、Every編集方針とユーザーの文体に合致した草稿だけを返す仕組みを実現した。

今後の注目点

ドリーミングは現在リサーチプレビュー段階であり、利用には申請が必要だ。アウトカムズ、マルチエージェントオーケストレーション、メモリはパブリックベータとしてManaged Agentsの一部として提供されている。今後の注目ポイントは以下の通りだ。

  • ドリーミングが正式ベータに移行する時期と追加モデルへの対応
  • アウトカムズの評価精度が長期運用でどこまで維持されるか
  • マルチエージェント環境でのコスト最適化(エージェント数・モデル選択)

開発者はドリーミングのアクセスリクエストをclaude.com/form/claude-managed-agentsから申請できる。


よくある質問

Q: ドリーミングはいつでも実行できますか?

A: ドリーミングは非同期ジョブとして実行され、スケジュール設定が可能です。処理時間は入力セッション数によって異なり、数分〜数十分かかります。現在はリサーチプレビューのため利用申請が必要です。

Q: アウトカムズはどのような評価基準に対応していますか?

A: 客観的な仕様(ファイル形式、必須項目など)だけでなく、ブランドボイスへの適合やビジュアルガイドラインの遵守といった主観的な基準にも対応しています。開発者がルーブリックをテキストで記述するだけで機能します。

Q: マルチエージェントオーケストレーションの費用はどうなりますか?

A: Anthropicの公開情報によれば、ドリーミングは選択したモデルの標準APIトークンレートで課金されます。マルチエージェントの費用については各エージェントで利用したモデルとトークン量に依存するため、公式ドキュメントで最新情報を確認することを推奨します。


まとめ

Anthropicが2026年5月6日に発表したClaude Managed Agentsの新機能は、AIエージェントの自律性と品質を引き上げる実践的なアップデートだ。ドリーミングによるセッション間の自己改善、アウトカムズによるルーブリック評価ループ、マルチエージェントオーケストレーションによる並列処理は、それぞれが独立して使えるが、組み合わせることでより高い効果を発揮する。Harvey・Netflix・Wisedocsの事例が示すように、長時間・高精度が求められるエンタープライズ用途での活用が主なターゲットとなっている。


【用語解説】

  • ドリーミング(Dreaming): エージェントが過去セッションを振り返り、記憶を整理・更新するスケジュール実行プロセス。重複や矛盾を除去し、チーム共通のパターンを抽出する。
  • アウトカムズ(Outcomes): 開発者が「成功の定義」をルーブリックで記述し、独立したグレーダーが出力を評価して再実行を促す品質管理の仕組み。
  • マルチエージェントオーケストレーション(Multiagent Orchestration): リードエージェントが複数のスペシャリストエージェントに仕事を分割・委任し、並列で複雑なタスクをこなす仕組み。
  • メモリストア(Memory Store): エージェントが作業中に学んだ情報を保存する永続的なデータストア。ドリーミングの入出力として使われる。

免責事項: 本記事の情報は執筆時点のものです。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。


引用元:

anchor left anchor right
KOJI TANEMURA

15年以上の開発経験を持つソフトウェアエンジニア。クラウドやWeb技術に精通し、業務システムからスタートアップ支援まで幅広く手掛ける。近年は、SaaSや業務システム間の統合・連携開発を中心に、企業のDX推進とAI活用を支援。

技術だけでなく、経営者やビジネスパーソンに向けた講演・執筆を通じて、生成AIの最新トレンドと実務への落とし込みをわかりやすく伝えている。

また、音楽生成AIのみで構成したDJパフォーマンスを企業イベントで展開するなど、テクノロジーと表現の融合をライフワークとして探求している。

人気の記事

anchor left anchor left

おすすめの記事

anchor left anchor left

categories

anchor left anchor left

tags

anchor left anchor left