📖 この記事で分かること
- AnthropicがClaude Codeにボイスモードを段階的に展開
/voiceコマンドで起動、スペースバーを押しながら音声入力- Pro・Max・Team・Enterprise向けに追加料金なしで提供
- OpenAI Codexが数日先行し、音声対応が業界標準化の兆し
💡 知っておきたい用語
- プッシュ・トゥ・トーク:ボタンを押している間だけ音声を送る方式。常時マイクオンではないため誤認識や騒音混入を防ぎやすく、コーディングのような精度重視の作業に向いている。
最終更新日: 2026年03月05日
Claude Codeに音声操作機能が追加
Claude Codeのボイスモードは2026年3月3日に段階展開が始まった。/voiceコマンドでプッシュ・トゥ・トーク機能が有効になり、Pro・Max・Team・Enterpriseの各プランで追加料金なく利用できる。
発表はAnthropicエンジニアのThariq Shihipar氏がX(旧Twitter)上で行い、現時点では全体の約5%のユーザーが利用でき、数週間かけて順次拡大される見込みだ。アクセスが有効になるとClaude Codeのウェルカム画面に通知が表示される。
使い方と主な機能
操作手順はシンプルだ。CLIで/voiceと入力するとボイスモードが起動し、スペースバーを押しながら話しかけてから離すと入力が送信される。たとえば「認証ミドルウェアをリファクタリングして」と口頭で指示するだけで、Claude Codeが処理を実行する。
ボイスとキーボード入力は同一セッション内で混在して使えるため、複数画面を参照しながらコードレビューするような場面でも柔軟に対応できる。また音声認識トークンは無料で提供され、キーボード入力とリアルタイムでシームレスに統合される。
競合との位置づけと市場背景
OpenAIのCodexは2026年2月25日にCLI(コマンドラインインターフェース)版の音声入力機能をバージョン0.105.0でリリースしており、Claude Codeの展開はその約1週間後にあたる。ただし同機能は実験的な段階にあり、設定ファイルを手動で編集して有効化する必要があった。これに対し、Claude Codeのボイスモードはネイティブ対応として展開されており、成熟度には差がある。音声対応が開発者ツールにおける標準的な機能になりつつある状況を示している。
Claude Codeは2026年2月時点で年換算売上(ランレート)が25億ドルを超え、2026年初頭から2倍以上に成長した。週間アクティブユーザー数も1月から2倍になっている。競合にはMicrosoftのGitHub Copilot、Cursor、Google、OpenAIが名を連ねる。
Anthropicは今週、メモリー機能を無料プランへ開放するとともに、有料プラン向けのメモリーインポート機能も追加した。ClaudeのiPhoneアプリは先週末に米App Storeでダウンロード数1位を記録し、ChatGPTを上回った。
不明点と今後の注目ポイント
音声インタラクションの上限や具体的な技術的制約については現時点で明らかにされていない。ElevenLabsなどサードパーティの音声プロバイダーとの連携有無についても、Anthropicはコメントを発表していない。
コーディング用途では「認証ミドルウェアをリファクタリング」のような技術的語彙が的確に認識されるかが鍵になる。Anthropicは全ユーザーへのロールアウト完了時期を明示していないが、3月中に順次拡大する方針だ。
よくある質問
Q: ボイスモードを使うには追加料金がかかりますか?
A: かかりません。Pro・Max・Team・Enterpriseの各プランに含まれており、音声認識トークンも無料です。
Q: ボイスモードの使い方を教えてください。
A: Claude CodeのCLIで/voiceと入力してモードをオンにし、スペースバーを押しながら話しかけ、離すと送信されます。アクセス権があればウェルカム画面に通知が表示されます。
Q: すべてのユーザーが今すぐ使えますか?
A: 現時点では全体の約5%のユーザーが対象です。2026年3月中に順次拡大予定で、利用可能になるとウェルカム画面に通知が表示されます。
まとめ
AnthropicはClaude Codeにボイスモードを追加し、開発者が音声でコーディング指示を出せる環境を整えた。/voiceコマンドで起動するプッシュ・トゥ・トーク方式を採用し、追加料金なしでProプラン以上に提供する。OpenAI Codexが数日先行するなか、音声対応が開発者ツールの新たな標準へと移行しつつある状況だ。技術的な詳細や制約については未公表の部分も多く、今後の正式発表が待たれる。
【用語解説】
- Claude Code【クロードコード】: Anthropicが提供するCLI(コマンドラインインターフェース)ベースのAIコーディングアシスタント。大規模コードベースの理解と編集を得意とする。
- ランレート: 直近の実績をもとに年間収益を試算した指標。月次や週次の数値を年換算した推計値であり、確定決算とは異なる。
- プッシュ・トゥ・トーク: ボタンを押している間だけ音声を送信する入力方式。常時マイクオンの「ハンズフリーモード」とは異なり、誤検知や周囲の雑音を抑えやすい。
免責事項: 本記事の情報は執筆時点のものです。AI技術は急速に進歩しているため、機能や制限は予告なく変更される場合があります。
引用元:
- [1] Anthropic公式X(Thariq Shihipar @trq212)- https://x.com/trq212/status/2028628570692890800
- [2] OpenAI Codex changelog(公式)- https://developers.openai.com/codex/changelog/
- [3] Claude公式Threads(メモリーインポートは有料プラン)- https://www.threads.com/@claudeai/post/DVUj83BjNJm/
15年以上の開発経験を持つソフトウェアエンジニア。クラウドやWeb技術に精通し、業務システムからスタートアップ支援まで幅広く手掛ける。近年は、SaaSや業務システム間の統合・連携開発を中心に、企業のDX推進とAI活用を支援。
技術だけでなく、経営者やビジネスパーソンに向けた講演・執筆を通じて、生成AIの最新トレンドと実務への落とし込みをわかりやすく伝えている。
また、音楽生成AIのみで構成したDJパフォーマンスを企業イベントで展開するなど、テクノロジーと表現の融合をライフワークとして探求している。