Claude Code オープンモデルは、Hugging Face が、Claude Code から Inference Providers 経由でオープンモデルを利用する公式の統合手順と拡張「hf-claude」を公開しました。
📖 この記事で分かること
- Claude Code の中身を GLM 等の OSS に差し替える方法
- 専用拡張「hf-claude」でモデルとプロバイダを選択
- 手動設定に必要な環境変数と課金先の指定方法
- ベンダーロックインを緩めるツール連携の意味
💡 知っておきたい用語
- Inference Providers:多数の推論プロバイダを 1 つの窓口から使える Hugging Face の仕組み
最終更新日: 2026年7月4日
▶ 公式ページ
- Claude Code 統合ドキュメント(Hugging Face)
- hf-claude 拡張リポジトリ(GitHub)

Claude Code でオープンモデルを使う統合が公開
この記事のポイント
- Hugging Face が Claude Code とオープンモデルをつなぐ公式ドキュメントと拡張「hf-claude」を公開(2026年7月時点)。
- 環境変数でエンドポイントを HF の router に向けると、GLM 等の OSS モデルを Claude Code のバックエンドに使える。
- 利用には Inference Providers 権限付きの HF トークンが必要。組織課金にも対応。
Hugging Face が、Anthropic のエージェント型コーディングツール Claude Code から、Inference Providers 経由でオープンモデルを利用する公式の統合手順を公開しました。Claude Code の操作感を保ったまま、バックエンドの LLM【エルエルエム】を差し替えられます。
仕組みと導入手順
Claude Code は環境変数でカスタム API エンドポイントに対応します。ANTHROPIC_BASE_URL を Hugging Face の router(https://router.huggingface.co)に向け、HF トークンを渡すと、すべてのリクエストが Inference Providers を経由し、多数のオープンモデルが選べます。
推奨されるのは hf CLI の拡張「hf-claude」です。HF_TOKEN を設定したうえで hf extensions install hf-claude を実行し、hf claude で起動すると、モデルとプロバイダをインタラクティブに選ぶ画面が表示され、必要な環境変数を自動で設定して Claude Code を立ち上げます。
手動設定では、ANTHROPIC_BASE_URL に加えて ANTHROPIC_AUTH_TOKEN / ANTHROPIC_API_KEY(いずれも HF トークン)、ANTHROPIC_DEFAULT_OPUS_MODEL などのモデル指定変数を設定します。公式ドキュメントの例では zai-org/GLM-5.1(2026年7月時点)が使われ、Opus / Sonnet / Haiku の内部スロットに別々のモデルを割り当てて、能力と速度を調整できます。X 上では「GLM-5.2」を組み込む投稿も拡散していますが、公式ドキュメントの明示例は GLM-5.1 です。
プロバイダ選択と課金
モデル名に付けるサフィックスで挙動が変わります。指定なしは既定の :fastest で、スループット最大のプロバイダを選び、障害時は自動でフェイルオーバーします。ほかに :cheapest、:preferred、プロバイダ名の直接指定(例 MiniMaxAI/MiniMax-M2.7:fireworks-ai)による決定的なルーティングもできます。
課金先は個人アカウントが既定ですが、組織に振り替える手段も用意されています。hf-claude なら --bill-to フラグ、または HF_BILL_TO 環境変数、手動設定なら ANTHROPIC_CUSTOM_HEADERS に X-HF-Bill-To ヘッダを加えます。対象は自分が所属する Team / Enterprise 組織に限られます。前提として、HF トークンには「Make calls to Inference Providers」権限が必要です。
編集部の見方
体験を保ったモデル差し替え:これはモデル自体の新発表ではなく、Claude Code という UI・エージェント体験を維持したまま、中身の LLM をオープンモデルに置き換える連携手段です。使い慣れたワークフローを変えずに選択肢だけ広がる点が実務的です。
ベンダーロックインの緩和:単一ベンダーのモデルに縛られず、コスト重視なら :cheapest、速度重視なら :fastest と、用途に応じて切り替えられます。スロットごとに別モデルを割り当てられるため、重い推論と軽い補完でモデルを使い分ける運用も現実的です。
向く読者:オープンモデルの品質を自分のコーディング用途で検証したい開発者や、組織単位で推論コストを管理したいチームに向きます。一方、標準の Claude モデルで十分な場合は、追加設定の手間に見合うかを見極める必要があります。
よくある質問
Q: Claude Code 本体とは別の料金がかかりますか。
A: Inference Providers 経由の推論利用として課金されます。HF トークンに Inference Providers 権限が必要で、組織課金への振り替えも設定できます。
Q: どのモデルが使えますか。
A: Inference Providers で提供されるオープンモデルが対象です。公式ドキュメントの例では zai-org/GLM-5.1 が使われています。
Q: 設定は難しいですか。
A: 拡張「hf-claude」を使うと、モデルとプロバイダを選ぶだけで必要な環境変数が自動設定されます。手動でも環境変数を数個設定すれば動きます。
まとめ
Hugging Face が Claude Code とオープンモデルを結ぶ公式手順と拡張「hf-claude」を公開しました。環境変数でエンドポイントを HF の router に向けるだけで、GLM などの OSS モデルを Claude Code のバックエンドに使えます。プロバイダ選択ポリシーや組織課金にも対応し、使い慣れた操作感のままモデルの選択肢を広げられます。
【用語解説】
- Inference Providers: 複数の推論プロバイダを 1 つの API 窓口から利用できる Hugging Face の仕組み。プロバイダの切り替えやフェイルオーバーを自動化します。
- フェイルオーバー: 利用中のプロバイダが停止した際に、別のプロバイダへ自動的に切り替えて処理を継続する仕組み。
引用元:
- [1] Claude Code – Inference Providers ドキュメント(Hugging Face)
- [2] hf-claude 拡張リポジトリ(GitHub)
この記事について: AI 支援で執筆、編集部が事実確認・編集しています。誤りや追加情報があれば Contact よりお知らせください。
Previous Post
Cloudflare、AIクローラーを「検索・エージェント・学習」で管理する新機能 ― Content Signals拡張と「Pay Per Use」実証実験
Next Post
Google MeetのGemini議事録の使い方|設定と手順を初心者向けに解説
15 年以上の開発経験を持つソフトウェアエンジニア / テクノロジーライター。AI エージェントの実務活用を研究し、現場や経営者向けセミナーでその知見を発信。本メディア tech-noisy.com では、一次情報に基づく最新ニュース・解説記事を執筆。また、音楽生成 AI による DJ パフォーマンスを企業イベントで行うなど、テクノロジーと表現の融合も探求している。