この画像が動画の開始フレームになります
0 / 5000
AIオーディオ付きの動画を生成します(不適切なコンテンツではオーディオが無効になる場合があります)
Veo 3.1 AI動画ジェネレーター
GeminiPro では、Google DeepMind のシネマティック動画モデル Veo 3.1 を直接利用できます。会話、効果音、環境音をネイティブ合成した 8 秒動画を 1 回の生成で作成できます。Veo 3.1 では、9:16 縦型モード、動画延長、開始フレームと終了フレームの制御、複数画像の参照入力にも対応し、動画制作経験がなくても扱えます。
Veo 3 とは? Google DeepMind のシネマティック動画AIモデル
Veo 3 は Google DeepMind の第3世代 AI動画生成モデルです。多くの AI動画ツールが後処理で音声を加えるのに対し、Veo 3 は動画と音声を同時に生成し、映像に同期した会話、環境音、音楽を出力します。流体表現から人物の動きまで、物理法則に沿ったモーション表現に強みがあります。
最大 8 秒
最大動画長
ネイティブAI音声
音声生成
最大 4K
最大解像度
Veo 3.1 の新機能
Veo 3.1 では、オリジナルの Veo 3 を超える5つの主要機能が追加されました。
縦型モード(9:16)
TikTok、Instagram Reels、YouTube Shorts 向けの縦型動画をそのまま生成できます。
動画延長
既存のクリップをシームレスに延長できます。映像スタイル、被写体、シーン文脈を維持しながら、より長い流れを作れます。
開始フレーム・終了フレーム制御
シーンの始まりと終わりのフレームを指定でき、その間をシネマティックにつなぐシーケンスを生成します。
複数画像の参照入力
人物の見た目、構図、ビジュアルスタイルを複数画像でガイドし、生成結果をより安定させられます。
被写体一貫性の向上
8 秒のクリップ全体で人物や物体の見た目がより安定し、従来モデルで起きやすかったフレーム間のズレを抑えます。
Veo 3 と Kling、どちらの AI動画ジェネレーターを選ぶべき?
どちらも 2026 年を代表する AI動画プラットフォームです。重要な比較軸ごとに見ていきます。
| Veo 3.1最高シネマ品質 | Kling 2.6 | Kling 3.0 | |
|---|---|---|---|
| 開発元 | Google DeepMind | Kuaishou | Kuaishou |
| 最大尺 | 最大 8 秒 | 5〜10 秒 | 3〜15 秒 |
| ネイティブ音声 | はい - 会話・効果音・音楽 | 限定的 | 限定的 |
| 最大解像度 | 最大 4K | 最大 1080p | 最大 1080p |
| 9:16縦型 | はい | はい | はい |
| マルチショット | — | — | はい |
| カメラ制御 | 標準 | 良好 | 高度 |
| 画像参照 | 複数画像 | 単一画像 | 複数画像 |
| 動画延長 | はい | — | — |
| 向いている用途 | シネマ品質と AI 音声ストーリー | モーション重視・やや長尺 | マルチショット演出と高度なカメラ制御 |
シネマ品質と AI音声を活かした物語表現を重視するなら Veo 3.1、長めの尺やマルチショット構成、高度なカメラ制御を重視するなら Kling が向いています。
GeminiPro で使える AI動画モデル
Google Veo 3.1 や Kuaishou Kling など、用途に応じて最適化された動画モデルを選べます。
Veo 3.1
Google DeepMind · 最高シネマ品質
Google のフラッグシップ級シネマティック動画モデル。会話、効果音、音楽をネイティブ合成した 8 秒の HD 動画を 1 回の生成で作成します。
Veo 3.1 Fast
Google DeepMind · より高速な生成
Veo 3.1 の高速版。基本的なシネマ品質を保ちながら、コンセプト検証や高速反復に向くスピードを提供します。
Kling 2.6
Kuaishou · 長尺とモーション品質
最大 10 秒の動画に対応する実績あるモデル。モーション品質が高く、被写体一貫性も比較的強く、AI音声生成も任意で利用できます。
Kling 3.0
Kuaishou · マルチショットと高度なカメラ制御
Kling の最上位モデル。マルチショット構成、最大 15 秒生成、高度なカメラ制御、@Elements 参照に対応します。
Wan 2.6
Alibaba · 自然なモーション品質
Wan 2.6 は自然で滑らかな動きの生成に強く、text-to-video と image-to-video の両ワークフローを 720p / 1080p で安定して扱えます。
Seedance 2
ByteDance · 音声と映像の同時生成
ByteDance の共同拡散モデル。動画と音声を 1 回で同時生成し、会話タイミング、BGM、効果音を最初のレンダリングから同期させます。最大 15 秒、2K、8言語以上のリップシンクに対応します。
Veo 3.1 で何が作れる?
シネマティック短編から SNS 向け動画まで、Veo 3.1 の画質とネイティブ音声がこれまで制作チームを必要とした形式をぐっと身近にします。
映画・シネマティック表現
短編映画、コンセプトトレーラー、映像ストーリー
短編ストーリー、映像詩、シネマティックなシーンを、自然な物理挙動や雰囲気のある音とともに生成できます。
ブランド・マーケティング動画
商品動画、ブランドキャンペーン、広告クリエイティブ
商品紹介、ブランドコンテンツ、広告ビジュアルを、従来より低コストかつ短時間で高品質に制作できます。
SNS 短尺コンテンツ
TikTok、Instagram Reels、YouTube Shorts
TikTok、Reels、Shorts 向けの 9:16 縦型動画を生成し、複数のクリエイティブ案を素早く試せます。
教育・チュートリアル動画
解説動画、チュートリアル、教育シリーズ
複雑な内容を説明するビジュアルや、ナレーションと相性の良い学習コンテンツを作成できます。
Veo 3 向けプロンプトの書き方:3層フレームワーク
Veo 3 は短いキーワードよりも、構造化されたレイヤー付きプロンプトをよく解釈します。この3層構成を使うと、より意図的でシネマティックな結果が得られます。
第1層 - シーン
被写体、環境、動作を具体的に説明します。「人が歩く」ではなく、「赤いコートを着た女性が雪の積もるヨーロッパの広場を夜明けに歩く」のように書きます。
第2層 - カメラ
画角(ワイド、ミディアム、ドローン視点)、カメラの動き(ゆっくり左パン、固定、追従)、ライティング(golden hour、曇天、三点照明)を指定します。
第3層 - 音
森の静けさ、カフェのざわめき、車の音、会話のトーン、効果音など、欲しい音環境を説明します。Veo 3 はこれをもとに同期音声を生成します。
シネマティックシーン
短編映画の冒頭
“嵐の中の崖の先に立つ孤独な灯台守。雨で濡れたコートが風にはためき、下には荒れる波。低いアングルから見上げるショット、灰色の空、ゆっくり寄っていくトラッキング、轟く海と遠雷の音”
ブランドCM
新商品ローンチ動画
“モダンでミニマルなオフィス背景の中、手首に着けたマットブラックのスマートウォッチ。ドラマチックで柔らかなスタジオライト、画面を見せるようにゆっくり回り込むクローズアップ、控えめな電子音楽、4K の商用クオリティ”
SNS ショート動画
TikTok / Reels 向け
“暖かな日差しの差し込むカフェでバリスタがラテアートを注ぐ。カウンター越しのミディアムクローズアップ、朝の柔らかな自然光、立ちのぼる湯気、店内の環境音と静かなジャズ、9:16 縦型”
自然ドキュメンタリー
野生動物・自然表現
“夕暮れの雪の森を慎重に歩く赤キツネ。低い位置からのワイドショット、松林を通る金色とピンクの光、立ち止まってカメラを見るキツネ、枝を抜ける風の音、ゆっくり追従するシネマティックパン”
Veo 3 プロンプトのコツ
- •カメラの動きを入れる — Veo 3 は明示的なカメラ指示に強く反応します。「tracking shot」「slow push in」「static wide」などを書くと、動きの一貫性が大きく改善しやすくなります。
- •音の手がかりを具体的に書く — Veo 3 は音声をネイティブ生成するため、音環境を明示するとより効果的です。「街の環境音」「柔らかなオーケストラ」「静かに話す人物」などが有効です。
- •雰囲気ではなく光の種類を書く — 「きれいな光」よりも、golden hour、曇天の拡散光、ネオンの逆光、スタジオ三点照明など、具体的な光の種類を書くほうが結果を制御しやすくなります。
- •被写体と環境は具体的に — 素材、天候、時間帯、場所の種類など、具体的な要素が多いほど Veo 3 の物理シミュレーションは安定してリアルな結果を出しやすくなります。
GeminiPro で Veo 3 AI動画ジェネレーターを使う方法
最初のシネマティック動画を 3 ステップで生成します。
プロンプトを書く
3層フレームワークに沿ってシーン、カメラ、音環境を説明します。image-to-video の場合は参照画像をアップロードして人物や画風をガイドします。
モデルを選ぶ
最高のシネマ品質なら Veo 3.1、高速反復なら Veo 3.1 Fast、長尺や高度なカメラ制御を重視するなら Kling 2.6 / 3.0 を選びます。
生成してダウンロード
動画は非同期で生成され、準備ができると通知されます。高画質でダウンロードするか、Veo 3.1 の動画延長機能で続きを作成できます。
GeminiPro の他の AI 制作ツールを見る
Nano Banana の画像生成から AI アバター、テキスト読み上げまで、GeminiPro の制作スイートを活用できます。
Veo 3 よくある質問
GeminiPro 上の Google Veo 3 / Veo 3.1 に関するよくある質問です。
最初の Veo 3.1 動画を今すぐ生成
Google の最もシネマティックな AI動画モデルを GeminiPro で体験しましょう。ネイティブAI音声、物理的に自然な動き、短尺プラットフォーム向け縦型モードを、すべてブラウザ上で使えます。