📖 この記事で分かること
- Gemini Omni は動画を起点としたマルチモーダル生成モデル
- 第一弾は Gemini Omni Flash、1クリップ最大10秒
- Gemini アプリ・Google Flow・YouTube Shorts で順次展開
- 全出力に SynthID 透かしと C2PA を付与
💡 知っておきたい用語
- マルチモーダル:テキスト・画像・音声・動画など複数の入力形式を一つのモデルで扱える性質のこと
最終更新日: 2026年5月20日
発表の概要
Google は I/O 2026 で、新しいマルチモーダル生成モデル「Gemini Omni(2026年5月時点)」を発表しました。動画生成を起点に、最終的にはあらゆる入力からあらゆる出力を生成することを目指す位置づけです。
発表日は 2026 年 5 月 19 日(米国時間)。第一弾モデル「Gemini Omni Flash(2026年5月時点)」が同日からロールアウトを開始しました。Google DeepMind の公式ページでは、Omni を「Gemini の推論能力と生成メディアモデルを組み合わせ、世界理解・マルチモーダル・編集の各領域で一段の進歩をもたらすモデル」と説明しています。
これまで Google は動画生成を Veo として独立ブランドで展開してきましたが、Omni は Veo や画像生成の Nano Banana、ワールドモデル Genie などの系譜を統合し、Gemini 本体のマルチモーダル能力として位置づけ直したかたちです。
モデルの主要な特徴
Omni は会話を重ねながら動画を編集できる点が中核の差別化軸です。テキスト・画像・動画・音声を任意に組み合わせて入力でき、各編集は前の編集を踏まえてシーンの一貫性を保つ設計とされています。
公式ページで挙げられている機能は主に以下です。
- 参照素材(画像・テキスト・動画・音声)を組み合わせて一本の動画にまとめる
- 入力動画の美術様式やアクションを自然言語で書き換える
- ドローイングを動きのガイドとして用いて実写風映像を生成する
- キャラクターやオブジェクトを参照画像でスワップする
- マルチターンで編集を重ね、シーンの一貫性を維持する
物理法則(重力・運動エネルギー・流体)や、歴史・科学・数学などの世界知識を踏まえた生成にも対応するとされ、教育コンテンツ用途の事例(粘土アニメ風のたんぱく質折りたたみ解説、アルファベット26文字を別物体に対応させる動画など)が公式に紹介されています。
提供範囲と利用条件
Gemini Omni Flash は、Google AI Plus・Pro・Ultra の各サブスクリプション(2026年5月時点)契約者に対し、Gemini アプリと Google Flow を通じて世界規模で順次提供されます。YouTube Shorts と YouTube Create App では、今週中から無償で利用できると Google は説明しています。
開発者・エンタープライズ向けの API は「数週間以内」に Gemini API および Agent Platform API 経由で提供開始される予定です。
1 クリップあたりの長さは 10 秒(2026年5月時点)に制限されています。Google DeepMind のプロダクトマネジメント担当ディレクター Nicole Brichtova 氏は TechCrunch に対し、これはモデル側の制約ではなく、計算資源を広く配分するためのデプロイ判断だと説明したと報じられています。より高品質な上位版「Omni Pro」の計画も認めていますが、リリース日は未公表です。
来歴の管理:SynthID と C2PA
Omni で生成・編集されたコンテンツには、Google の不可視デジタル透かし「SynthID」と、業界標準の「C2PA Content Credentials」がいずれも付与されます。Gemini アプリで検証可能で、Chrome と Google 検索からの検証も近日対応予定とされています。
Google は I/O 2026 で、SynthID による AI 生成画像・動画のマーキングが累計 1000 億件を超えたこと、OpenAI・ElevenLabs・Kakao が SynthID 標準を採用することを明らかにしています。
編集部の見方
ブランド戦略の整理:Google はこれまで Veo(動画)・Imagen(画像)・Lyria(音声)・Genie(ワールドモデル)とモダリティ別にブランドを並走させてきましたが、Omni はそれらの能力を Gemini 本体のマルチモーダルとして統合する旗印になります。ユーザーから見ると「Gemini で何ができるか」がよりわかりやすくなる一方、各専用モデルの独立性は薄まる可能性があります。
競合との立ち位置:動画生成は OpenAI の Sora、ByteDance の Seedance、Kuaishou の Kling などが先行する競争領域です。生成品質単体での優位性は外部評価次第ですが、Google は Gemini アプリ・YouTube・検索・Flow といった配信チャネルを抱える点が強みです。スタンドアロンの実験的プロダクトではなく、すでに使われている入口に組み込まれます。
チャット 1 つで動画・広告・サイトまで生成する AI エージェントの先行事例については、以下の記事で詳しく解説しています:
業務利用の現実的な見立て:1 クリップ 10 秒という制約があるため、現段階では完成尺の動画制作よりも、ショート広告素材・SNS 用カット・プロトタイプの絵コンテ動画化など、短尺・反復編集の用途に向きます。会話編集の一貫性が実運用でどの程度保てるかが、Adobe Firefly や Runway などと比較する際の評価軸になります。
SynthID と C2PA の二重対応:出力に来歴情報が標準で付くことは、企業のブランド広告での採用を進めやすくします。一方で透かしが除去・改変された場合の検証性は別途検討が必要です。
同時発表:Gemini 3.5 Flash と Gemini Spark
I/O 2026 では Omni と並行して、軽量・高速モデルの Gemini 3.5 Flash(2026年5月時点)、汎用 AI エージェント Gemini Spark(2026年5月時点)も発表されています。3.5 Flash は推論性能とコストのバランスを改善した位置づけ、Spark は接続済みアプリを横断して自律的にタスクを実行するエージェント機能で、Google AI Ultra 契約者から段階的に提供されます。
Omni 単体ではなく、これらと組み合わせた「生成 + 推論 + エージェント」の三層構造が Google の今回のメッセージの中心です。
よくある質問
Q: Gemini Omni は Veo の後継ですか?
A: 公式に「後継」とは明言されていません。ただ動画生成機能は Veo の独立ブランドから Gemini 本体に統合される方向で、Omni Flash がその第一弾という位置づけです。Veo ブランド自体の今後の扱いは現時点で未公表です。
Q: 無料で使えますか?
A: Gemini アプリと Google Flow での利用には Google AI Plus / Pro / Ultra のいずれかのサブスクリプション(2026年5月時点)が必要です。YouTube Shorts と YouTube Create App では今週中から無償で利用可能になると説明されています。
Q: 日本での提供時期は?
A: 公式は「世界規模で順次展開」としており、地域別の詳細スケジュールは現時点で示されていません。Gemini アプリの利用可能国に準じると見込まれます。
まとめ
Gemini Omni は、Google が動画生成を Veo の独立ブランドから Gemini 本体に統合する動きの起点となるモデルです。第一弾の Omni Flash は 1 クリップ 10 秒という制約付きながら、会話による反復編集と SynthID / C2PA 標準対応を備え、Gemini アプリ・YouTube・Flow という既存の配信チャネルに乗ります。生成品質の絶対値で先行する競合と並ぶかどうかは外部評価を待つ必要がありますが、配信力と来歴管理を組み合わせた展開戦略が今回の特徴です。
【用語解説】
- ワールドモデル:物理法則や因果関係を踏まえて、次に何が起こるかを予測・生成する機械学習モデル。ロボット制御やゲーム生成の研究で発展してきた領域
- SynthID:Google DeepMind が開発した AI 生成コンテンツ向けの不可視デジタル透かし技術
- C2PA:Content Credentials を策定する業界標準団体。コンテンツの来歴情報(誰が・いつ・どう作ったか)を改ざん検知可能な形で埋め込む仕様を定めている
引用元:
- [1] Gemini Omni – Google DeepMind(Google DeepMind 公式)
- [2] Innovations from Google I/O 26 on Google Cloud(Google Cloud Blog 公式)
- [3] Google Launches Gemini Omni Video Model, but Holds Back Its Riskiest Feature(Tech Times)
この記事について: AI 支援で執筆、編集部が事実確認・編集しています。誤りや追加情報があれば Contact よりお知らせください。
Previous Post
Hermes AgentにX Premium連携とX投稿検索が追加。Grok 4.3を1Mトークンで利用可能
Next Post
Google AI Pro に YouTube Premium Lite が無料付帯。日本も対象、月額2,900円据え置き
15年以上の開発経験を持つソフトウェアエンジニア。クラウドやWeb技術に精通し、業務システムからスタートアップ支援まで幅広く手掛ける。近年は、SaaSや業務システム間の統合・連携開発を中心に、企業のDX推進とAI活用を支援。
技術だけでなく、経営者やビジネスパーソンに向けた講演・執筆を通じて、生成AIの最新トレンドと実務への落とし込みをわかりやすく伝えている。
また、音楽生成AIのみで構成したDJパフォーマンスを企業イベントで展開するなど、テクノロジーと表現の融合をライフワークとして探求している。