ブログ一覧

AI 動画プロンプトの書き方|1枚絵を動かすコツとモデル別の例

2026年6月3日8 分で読める

TL;DR — AI 動画 プロンプトは、画像生成と違って「何を描くか」ではなく「どう動くか」を書くのがコツ。1枚絵を動かす image-to-video なら、主体の動き・カメラワーク・速度の3点を具体的に指定すれば、思い通りの数秒動画に近づく。

「プロンプトを工夫したのに、生成された動画がほとんど動かない」「キャラがすぐ崩れる」——AI 動画 プロンプトでつまずく原因の多くは、画像生成と同じ感覚で書いてしまうことにある。この記事では、1枚絵を動かす image-to-video を例に、動く映像のための AI 動画 プロンプトの書き方を初心者向けに整理する。

AI 動画 プロンプトとは?画像生成と何が違う?

AI 動画 プロンプトは、ひとことで言えば「動き」を指示する文章だ。画像生成のプロンプトが1枚の完成度(構図・色・被写体)を決めるのに対し、動画は時間方向の変化、つまり「誰が・どう動き・どの視点で映すか」を決める。

特に image-to-video(画像から動画)では、アップロードした絵が「何を描くか」をすでに決めている。だからプロンプトは外見ではなく、動きの描写に集中するのが正解だ。

  • 画像生成 — 主体・構図・スタイルを細かく指定する
  • 動画生成 — 動作・カメラ・速度・環境の変化を指定する
  • image-to-video — 外見は画像任せ、プロンプトは「動き」に全振りする

動く映像は「動き」から書く——基本の4要素

動画生成 AI のプロンプトは、次の順で組み立てると破綻しにくい。主体(誰が)→ 動作(どう動く)→ カメラ(どの視点)→ 環境・スタイル(空気感)の4要素だ。

  • 主体の動作 — 「少女が振り返る」「髪が風になびく」など、1つの主要な動きに絞る
  • カメラワーク — 「ゆっくりズームイン」「時計回りにオービット」など映画用語が効く
  • 速度・質感 — 「滑らかでゆっくり」「シネマティックな質感」で空気感を決める

海外の実践ガイドでも、動画プロンプトは「何を映すか」より「どう動くか」を書くべきで、動きは1〜2個に絞り、80〜120語・5秒以内が扱いやすいとされる(出典: fal.ai の Wan プロンプトガイド)。詰め込みすぎると、かえって破綻しやすい。

やりがちな失敗

  • 動きを書かず外見だけ書く → ほとんど動かない
  • 大きな動きを複数同時に指定する → キャラ崩壊・破綻
  • 「ダイナミックに」など抽象語だけ → モデルが解釈できない

Wan・Kling でプロンプトの書き方はどう変わる?

モデルによって得意な動きと書き方のクセが違う。同じ AI 動画 プロンプトでも、使うモデルに合わせて調整すると成功率が上がる。

モデル 得意な動き プロンプトのコツ
Wan 2.2 静止画に近い穏やかな動き 「動き」を主役に。カメラ指示は1つだけ。ネガティブで破綻を抑える
Kling v3 / v2.5 大きな動き・シネマ表現 カメラワーク(ドリー・オービット)を具体的に。感情も書ける
Seedance コスパ重視の標準動画 シンプルな動作1つ+短いカメラ指示でまず1本

Wan は「動き重視」で穏やかなアニメーション向き、Kling はカメラワークまで踏み込んだシネマ表現向き、という住み分けになる。まず1本試すならコスパのよい Seedance も選択肢だ。

1枚絵を動かす AI 動画 プロンプトのテンプレートを使おう

迷ったら、次のテンプレートに当てはめるだけでいい。

[主体] が [動作] する。カメラはゆっくり [移動]。[速度・質感]。

イラストを動かすときの記入例を挙げる。

  • 制服の少女がこちらを向いて微笑み、髪が風で揺れる。カメラはゆっくりズームイン。滑らかでシネマティックな質感。
  • ネオン街に立つキャラクターが軽く瞬きし、コートが風になびく。カメラは時計回りに緩やかにオービット。ゆっくりした動き。

ネガティブプロンプトで「歪み・余分な指・急な変形」を弾くと、キャラの一貫性を保ちやすい。1枚絵そのものの作り込みに悩むなら、先に アニメ AI イラストのプロンプト で静止画の精度を上げてから動かすと、結果が安定する。

ComfyStudio で AI 動画 プロンプトを試す手順

AI 動画 プロンプトは、実際に生成して微調整するのが上達の近道だ。ただ、ローカルの ComfyUI は VRAM やビルドのハードルが高く、ここで止まる人が多い。ComfyStudio は ComfyUI のワークフローをクラウドで実行する日本発の AI イラスト生成 SaaS で、手元の GPU を問わずブラウザだけで image-to-video を試せる。料金は1クレジット = 1円の従量課金で、生成前に1本のコストが見える。

  1. 画像を用意する — 動かしたいイラストを1枚アップロード
  2. モデルを選ぶ — 穏やかな動きは Wan 2.2、大きな動きは Kling
  3. プロンプトを書く — 上のテンプレートで「動き」を指定して生成
用途 モデル コスト
動きの試し撮り LTX-Video 2B ¥88
1枚絵を動かす Wan 2.2 ¥138
シネマ動画 Kling v2.5 Turbo ¥225

プロンプトを少し変えるたびに数百円で結果を確かめられるので、感覚をつかむのが速い。まずは Wan の image-to-videoKling のアクション動画 のプリセットから、会員登録なしのお試しで始められる。必要 VRAM やモデル選びを含む動画生成の全体像は ComfyUI 動画生成の始め方、ほかのモデルとコストは 料金ページ で確認してほしい。

よくある質問

Q. AI 動画 プロンプトは何語くらいで書けばいいですか? A. image-to-video なら 80〜120 語(日本語なら 2〜4 文)が扱いやすい目安です。外見は画像が決めるので、主体の動き・カメラ・速度の3点に絞り、動きは1〜2個まで。詰め込みすぎるとキャラ崩壊や破綻の原因になります。

Q. 画像生成のプロンプトと書き方は同じですか? A. 違います。画像生成は構図・色・被写体など「見た目」を指定しますが、AI 動画 プロンプトは「どう動くか」を指定します。image-to-video では外見を画像が担うため、プロンプトは動作とカメラワークの描写に集中させるのがコツです。

Q. キャラがすぐ崩れます。どうすれば防げますか? A. 大きな動きを複数同時に指定するのが主な原因です。動きを1つに絞り、ネガティブプロンプトで「歪み・余分な指・急な変形」を弾いてください。穏やかな動きが得意な Wan 2.2 を選ぶと、アニメイラストでも一貫性を保ちやすくなります。

Q. ComfyUI を入れなくても動画プロンプトを試せますか? A. はい。ComfyStudio のようなクラウド型 SaaS なら、インストールや GPU の用意なしに、ブラウザだけで image-to-video のワークフローを実行できます。1クレジット = 1円で Wan 2.2 の image-to-video が ¥138 など、1本ごとのコストを見ながらプロンプトを試せます。

まずは無料で試してみる

登録だけで 100 クレジット (約 4 枚分)が無料配布。クレジットカードの登録は不要、いつでも解約できます。

よくある質問

Q. AI 動画 プロンプトは何語くらいで書けばいいですか?
A. image-to-video なら 80〜120 語(日本語なら 2〜4 文)が扱いやすい目安です。外見は画像が決めるので、主体の動き・カメラ・速度の3点に絞り、動きは1〜2個まで。詰め込みすぎるとキャラ崩壊や破綻の原因になります。
Q. 画像生成のプロンプトと書き方は同じですか?
A. 違います。画像生成は構図・色・被写体など「見た目」を指定しますが、AI 動画 プロンプトは「どう動くか」を指定します。image-to-video では外見を画像が担うため、プロンプトは動作とカメラワークの描写に集中させるのがコツです。
Q. キャラがすぐ崩れます。どうすれば防げますか?
A. 大きな動きを複数同時に指定するのが主な原因です。動きを1つに絞り、ネガティブプロンプトで「歪み・余分な指・急な変形」を弾いてください。穏やかな動きが得意な Wan 2.2 を選ぶと、アニメイラストでも一貫性を保ちやすくなります。
Q. ComfyUI を入れなくても動画プロンプトを試せますか?
A. はい。ComfyStudio のようなクラウド型 SaaS なら、インストールや GPU の用意なしに、ブラウザだけで image-to-video のワークフローを実行できます。1クレジット = 1円で Wan 2.2 の image-to-video が ¥138 など、1本ごとのコストを見ながらプロンプトを試せます。