Claude Codeにボイスモード が2026年3月3日から段階展開され、/voiceコマンドでプッシュ・トゥ・トーク型の音声入力を有効化でき、話しかけるだけでコーディングを進められる時代に入りました。
📖 この記事で分かること
- AnthropicがClaude Codeにボイスモードを段階的に展開
- /voiceコマンドで起動、スペースバーを押しながら音声入力
- Pro・Max・Team・Enterprise向けに追加料金なしで提供
- OpenAI Codexが数日先行し、音声対応が業界標準化の兆し
💡 知っておきたい用語
- プッシュ・トゥ・トーク:ボタンを押している間だけ音声を送る方式。常時マイクオンではないため誤認識や騒音混入を防ぎやすく、コーディングのような精度重視の作業に向いている。
最終更新日: 2026年5月21日

Claude Codeに音声操作機能が追加
Claude Codeのボイスモードは2026年3月3日に段階展開が始まった。/voiceコマンドでプッシュ・トゥ・トーク機能が有効になり、Pro・Max・Team・Enterpriseの各プランで追加料金なく利用できる。
発表はAnthropicエンジニアのThariq Shihipar氏がX(旧Twitter)上で行い、現時点では全体の約5%のユーザーが利用でき、数週間かけて順次拡大される見込みだ。アクセスが有効になるとClaude Codeのウェルカム画面に通知が表示される。
使い方と主な機能
操作手順はシンプルだ。CLIで/voiceと入力するとボイスモードが起動し、スペースバーを押しながら話しかけてから離すと入力が送信される。たとえば「認証ミドルウェアをリファクタリングして」と口頭で指示するだけで、Claude Codeが処理を実行する。
ボイスとキーボード入力は同一セッション内で混在して使えるため、複数画面を参照しながらコードレビューするような場面でも柔軟に対応できる。また音声認識トークンは無料で提供され、キーボード入力とリアルタイムでシームレスに統合される。
競合との位置づけと市場背景
OpenAIのCodexは2026年2月25日にCLI(コマンドラインインターフェース)版の音声入力機能をバージョン0.105.0でリリースしており、Claude Codeの展開はその約1週間後にあたる。ただし同機能は実験的な段階にあり、設定ファイルを手動で編集して有効化する必要があった。これに対し、Claude Codeのボイスモードはネイティブ対応として展開されており、成熟度には差がある。音声対応が開発者ツールにおける標準的な機能になりつつある状況を示している。
Claude Codeは2026年2月時点で年換算売上(ランレート)が25億ドルを超え、2026年初頭から2倍以上に成長した。週間アクティブユーザー数も1月から2倍になっている。競合にはMicrosoftのGitHub Copilot、Cursor、Google、OpenAIが名を連ねる。
Anthropicは今週、メモリー機能を無料プランへ開放するとともに、有料プラン向けのメモリーインポート機能も追加した。ClaudeのiPhoneアプリは先週末に米App Storeでダウンロード数1位を記録し、ChatGPTを上回った。
不明点と今後の注目ポイント
音声インタラクションの上限や具体的な技術的制約については現時点で明らかにされていない。ElevenLabsなどサードパーティの音声プロバイダーとの連携有無についても、Anthropicはコメントを発表していない。
コーディング用途では「認証ミドルウェアをリファクタリング」のような技術的語彙が的確に認識されるかが鍵になる。Anthropicは全ユーザーへのロールアウト完了時期を明示していないが、3月中に順次拡大する方針だ。
編集部の見方
「プッシュ・トゥ・トーク」採用は実用視点で堅実: 常時マイクオンのハンズフリー方式ではなく、スペースバー押下中だけ音声を送る設計を選んだのは、コーディング現場の実態に合っている。オフィスやカフェでの周囲ノイズや、別画面の動画音声を誤認識させない。OpenAI Codex の音声入力が実験段階で設定ファイル編集を要したのと比べ、ネイティブ統合された UX は導入障壁が低い。
「コードを話す」精度がプロダクトの本質的な評価軸: 音声認識自体は成熟技術だが、CLI 操作の文脈で「ミドルウェア」「リファクタリング」「Promise.all」などの技術語彙、関数名、ファイルパスの認識精度が業務効率に直結する。Anthropic 側はベンチマークを公表していないため、初期ユーザーのフィードバックが安定品質の判断材料になる。 向く読者: モノレポの大規模コード探索や、長いタスク指示を口頭で投げたい開発者。逆に、関数名・変数名を音声で正確に伝える必要があるリファクタ作業中心のチームは、しばらく様子見が現実的。
よくある質問
Q: ボイスモードを使うには追加料金がかかりますか?
A: かかりません。Pro・Max・Team・Enterpriseの各プランに含まれており、音声認識トークンも無料です。
Q: ボイスモードの使い方を教えてください。
A: Claude CodeのCLIで/voiceと入力してモードをオンにし、スペースバーを押しながら話しかけ、離すと送信されます。アクセス権があればウェルカム画面に通知が表示されます。
Q: すべてのユーザーが今すぐ使えますか?
A: 現時点では全体の約5%のユーザーが対象です。2026年3月中に順次拡大予定で、利用可能になるとウェルカム画面に通知が表示されます。
まとめ
AnthropicはClaude Codeにボイスモードを追加し、開発者が音声でコーディング指示を出せる環境を整えた。/voiceコマンドで起動するプッシュ・トゥ・トーク方式を採用し、追加料金なしでProプラン以上に提供する。OpenAI Codexが数日先行するなか、音声対応が開発者ツールの新たな標準へと移行しつつある状況だ。技術的な詳細や制約については未公表の部分も多く、今後の正式発表が待たれる。
【用語解説】
- Claude Code【クロードコード】: Anthropicが提供するCLI(コマンドラインインターフェース)ベースのAIコーディングアシスタント。大規模コードベースの理解と編集を得意とする。
- ランレート: 直近の実績をもとに年間収益を試算した指標。月次や週次の数値を年換算した推計値であり、確定決算とは異なる。
- プッシュ・トゥ・トーク: ボタンを押している間だけ音声を送信する入力方式。常時マイクオンの「ハンズフリーモード」とは異なり、誤検知や周囲の雑音を抑えやすい。
免責事項: 本記事の情報は執筆時点のものです。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。
引用元:
- [1] Anthropic公式X(Thariq Shihipar @trq212)- https://x.com/trq212/status/2028628570692890800
- [2] OpenAI Codex changelog(公式)- https://developers.openai.com/codex/changelog/
- [3] Claude公式Threads(メモリーインポートは有料プラン)- https://www.threads.com/@claudeai/post/DVUj83BjNJm/
この記事について: AI 支援で執筆、編集部が事実確認・編集しています。誤りや追加情報があれば Contact よりお知らせください。
Previous Post
Google、Gemini 3.1 Flash-Liteをプレビュー公開——Gemini 3シリーズ初の超低コストモデル
Next Post
Google Workspace CLIとは?Drive・Gmail・CalendarをAIエージェントと連携する「gws」の全貌
15 年以上の開発経験を持つソフトウェアエンジニア / テクノロジーライター。AI エージェントの実務活用を研究し、現場や経営者向けセミナーでその知見を発信。本メディア tech-noisy.com では、一次情報に基づく最新ニュース・解説記事を執筆。また、音楽生成 AI による DJ パフォーマンスを企業イベントで行うなど、テクノロジーと表現の融合も探求している。