AIエージェント用語集 は、Hugging Face が 2026 年 5 月 25 日に公開した公式グロッサリで、Model / Scaffolding / Harness など 13 用語を整理しています。
📖 この記事で分かること
- Hugging Face が AI エージェント用語の公式グロッサリを公開した経緯
- 「Agent = Model + Harness」という整理の意味と背景
- Scaffolding と Harness の違いを区別する実務上のメリット
- Anthropic や OpenAI など主要ラボのドキュメントとの整合関係
💡 知っておきたい用語
- エージェント: LLM 単体ではなく「観察→判断→行動」のループを回す仕組み全体のこと
- ハーネス: LLM を呼び出し、ツールを実行し、停止判断まで担う実行レイヤ
- スキャフォルディング: システムプロンプトやツール定義など、モデルから見える「世界の作り方」を決める設計レイヤ
最終更新日: 2026年5月26日
▶ 公式ページ
- Harness, Scaffold, and the AI Agent Terms Worth Getting Right(Hugging Face Blog)

Hugging Face が AIエージェント用語の公式グロッサリを公開
この記事のポイント
- Hugging Face が 2026 年 5 月 25 日付で AI エージェント関連用語の公式グロッサリを公開しました。
- 中核は「Agent = Model + Harness」という整理で、Scaffolding と Harness を別物として明確化(2026年5月時点)。
- ICLR 2026 で「人によって用語の説明が違いすぎる」という共通体験が出発点。
- 著者は Sergio Paniego 氏と Aritra Roy Gosthipaty 氏ほか、複数の貢献者によるコミュニティ協働の成果。
Hugging Face は 2026 年 5 月 25 日、AI エージェントを構成する用語を整理した公式ブログ記事「Harness, Scaffold, and the AI Agent Terms Worth Getting Right」を公開しました。Model / Scaffolding / Harness / Agent / Policy / Tool Use / Skills / Sub-agents など 13 用語を、現場の使われ方に沿って定義し直しています。
ICLR 2026 での「言葉が噛み合わない」体験が出発点
執筆のきっかけは、共著者の一人 Aritra Roy Gosthipaty 氏が ICLR 2026 で抱いた違和感です。「harness と scaffold について多くの説明を聞いたが、どれも一つの定義に収束しなかった」という SNS の投稿が、記事冒頭で引用されています。
著者らは「分野が急速に進化するとき、語彙はそれ以上の速度で動いてしまう」と指摘し、唯一の正解を押し付けるのではなく「会話を成立させるための実用的な共通モデル」を提示することを目的としています。LLM【エルエルエム】を中心としたエージェント開発が研究と実装の両面で広がる中で、用語の食い違いはそのまま技術判断の食い違いに直結する、という問題意識が背景にあります。
中核は「Agent = Model + Harness」というシンプルな等式
記事の中核となる整理は、シンプルな 1 行に集約されています。
- Model: LLM 本体。テキストを入力し、テキストを返す。記憶もループも持たず、ツール呼び出しの意図を表明できても自分では実行しない。
- Scaffolding: モデルから見える「世界」を形作るレイヤ。システムプロンプト、ツールの説明、応答のパース方法、文脈管理の方針などが含まれる。
- Harness: モデルを呼び出し、ツール呼び出しを実行し、停止のタイミングを決める実行レイヤ。これがエージェントを「動かす」役目を担う。
- Agent: 上記を組み合わせた完全系。観察を受け取り行動を返すループを持つ。
著者は「Model、Harness、プロダクトは別物であり、同じモデルでもハーネスの設計が違えば挙動はまったく変わる」と強調しています。Cursor のブログや OpenAI が公開した Codex の harness engineering 解説など、各社が自社のエージェント体験を「ハーネス設計の差別化」として説明している例が引用されています。
なお、Claude Code 公式ドキュメントは「Claude Code serves as the agentic harness around Claude」と表現しており、ここでは harness が scaffolding を含む広い意味で使われている点も注釈されています。用語が完全には統一されていない現状そのものが、グロッサリ整備の必要性を裏付けています。
学習側の用語と推論側の用語を分けて整理
記事の後半では、学習(RL)寄りの用語にも踏み込んでいます。
- RL Environment: 行動を入力として状態を更新し、観察を返すステートフルな対象。
- Trainer: エージェントのエピソードを走らせ、報酬で採点し、モデルの重みを更新する仕組み。例として TRL の GRPOTrainer が挙げられています。
- Rollout: エージェントが一連の動作を最初から最後まで走らせた記録。trajectory や trace とも呼ばれる。
- Reward: モデル改善の指標となるスコア。検証可能型(テスト合否)、学習型(人間の選好)、疎(エピソード末尾のみ)、密(各ステップ)の 4 区分で整理。
推論時の議論で頻出する harness と、学習時の評価で使われる eval harness を別概念として扱う点も明確化されています。「ツール / スキル / サブエージェント」の境界もフレームワークごとに揺れていることに触れ、相対的な定義として提示している点が実務的です。
編集部の見方
用語の標準化ではなく「共通モデル」を提示している姿勢が現実的: 著者自身が「唯一の正解を押し付けない」と明言している通り、記事は規範ではなく地図に近いものです。Anthropic、OpenAI、Cursor、Google それぞれの用語の揺れを認めた上で「この記事ではこう使い分ける」という姿勢は、研究と現場の中間に立つ Hugging Face らしい立ち位置と言えます。
エンタープライズで AI エージェント導入を検討する層に有効: 「同じモデルでもハーネスの設計次第で挙動が変わる」という整理は、ベンダー選定や内製判断の議論で実利があります。ツール選定の議論を「どの LLM か」だけで進めがちな組織にとって、scaffolding と harness の責任範囲を分けて評価する観点はそのまま意思決定の質に効きます。
研究者・開発者の用語衝突を緩和する一次資料として有用: ICLR 2026 で起きた混乱の整理を、コミュニティ発で公式化した点に価値があります。社内の設計ドキュメントや RFP の付録に引用できる「中立的な一次資料」が増えたことで、議論のスタート地点を揃えやすくなります。
開発者と意思決定者の双方に効く整理
今回の Hugging Face グロッサリは、エージェント実装に踏み込む開発者だけでなく、評価・調達側の意思決定者にも有用です。「Agent = Model + Harness」というシンプルな等式は、技術選定の議論で「モデルの選定」と「ハーネスの設計」を分けて語る共通言語を提供してくれます。
よくある質問
Q: なぜ「Scaffolding」と「Harness」を区別する必要があるのですか?
A: 同じモデルでも、システムプロンプトやツール設計(scaffolding)とループ制御や停止判断(harness)の組み合わせ次第で挙動が大きく変わるためです。両者を切り分けることで、性能や信頼性の改善ポイントを特定しやすくなります。
Q: Claude Code は harness の意味を広く取っていますが、矛盾しないのですか?
A: 記事は唯一の定義を押し付けず、各社の使い方を尊重した上で「本記事ではこう使い分ける」と立場を示しています。読者が他社ドキュメントを読む際の翻訳辞書として機能する設計です。
Q: この整理は学習・研究側にも適用できますか?
A: 適用できます。記事の後半では RL Environment、Trainer、Rollout、Reward など学習側の用語も整理されており、推論側と学習側を地続きで議論できる枠組みが提示されています。
まとめ
Hugging Face が 2026 年 5 月 25 日に公開した AI エージェント用語グロッサリは、ICLR 2026 で顕在化した「用語の食い違い」をコミュニティ発で整理した実務寄りのドキュメントです。「Agent = Model + Harness」というシンプルな等式と、Scaffolding を別レイヤとして扱う立場は、エージェント関連の議論を組織横断で進める際の共通言語として機能します。Anthropic や OpenAI の既存ドキュメントとの差異も丁寧に触れており、研究者・開発者・意思決定者のいずれにも参照価値があります。
【用語解説】
- GRPO: Group Relative Policy Optimization。グループ単位の相対比較で報酬を扱う強化学習アルゴリズムで、Hugging Face の TRL ライブラリに実装が提供されている。
- ICLR【アイシーエルアール】: International Conference on Learning Representations。機械学習分野の主要国際会議の一つで、エージェントや学習表現に関する研究発表が集まる。
- eval harness: モデルの評価フェーズで使われるハーネス。重みを更新せず、固定シナリオを走らせて指標を記録する用途に特化している。
引用元:
- [1] Harness, Scaffold, and the AI Agent Terms Worth Getting Right(Hugging Face Blog)
- [2] Claude Code: How Claude Code works(Anthropic)
- [3] Harness Engineering: leveraging Codex(OpenAI)
- [4] Continually improving our agent harness(Cursor)
この記事について: AI 支援で執筆、編集部が事実確認・編集しています。誤りや追加情報があれば Contact よりお知らせください。
Previous Post
Suno v5.5 徹底調査レポート:企業利用のための完全リファレンス
Next Post
AnthropicエンジニアがAI出力にHTMLを推奨。Markdownの限界を主張
15 年以上の開発経験を持つソフトウェアエンジニア / テクノロジーライター。AI エージェントの実務活用を研究し、現場や経営者向けセミナーでその知見を発信。本メディア tech-noisy.com では、一次情報に基づく最新ニュース・解説記事を執筆。また、音楽生成 AI による DJ パフォーマンスを企業イベントで行うなど、テクノロジーと表現の融合も探求している。