AI 動画プロンプトの書き方｜1枚絵を動かすコツとモデル別の例

Q: 画像生成のプロンプトと書き方は同じですか?

違います。画像生成は構図・色・被写体など「見た目」を指定しますが、AI 動画 プロンプトは「どう動くか」を指定します。image-to-video では外見を画像が担うため、プロンプトは動作とカメラワークの描写に集中させるのがコツです。

TL;DR — AI 動画プロンプトは、画像生成と違って「何を描くか」ではなく「どう動くか」を書くのがコツ。1枚絵を動かす image-to-video なら、主体の動き・カメラワーク・速度の3点を具体的に指定すれば、思い通りの数秒動画に近づく。

「プロンプトを工夫したのに、生成された動画がほとんど動かない」「キャラがすぐ崩れる」——AI 動画プロンプトでつまずく原因の多くは、画像生成と同じ感覚で書いてしまうことにある。この記事では、1枚絵を動かす image-to-video を例に、動く映像のための AI 動画プロンプトの書き方を初心者向けに整理する。

AI 動画プロンプトとは？画像生成と何が違う？

AI 動画プロンプトは、ひとことで言えば「動き」を指示する文章だ。画像生成のプロンプトが1枚の完成度（構図・色・被写体）を決めるのに対し、動画は時間方向の変化、つまり「誰が・どう動き・どの視点で映すか」を決める。

特に image-to-video（画像から動画）では、アップロードした絵が「何を描くか」をすでに決めている。だからプロンプトは外見ではなく、動きの描写に集中するのが正解だ。

画像生成 — 主体・構図・スタイルを細かく指定する
動画生成 — 動作・カメラ・速度・環境の変化を指定する
image-to-video — 外見は画像任せ、プロンプトは「動き」に全振りする

動く映像は「動き」から書く——基本の4要素

動画生成 AI のプロンプトは、次の順で組み立てると破綻しにくい。主体（誰が）→ 動作（どう動く）→ カメラ（どの視点）→ 環境・スタイル（空気感）の4要素だ。

主体の動作 — 「少女が振り返る」「髪が風になびく」など、1つの主要な動きに絞る
カメラワーク — 「ゆっくりズームイン」「時計回りにオービット」など映画用語が効く
速度・質感 — 「滑らかでゆっくり」「シネマティックな質感」で空気感を決める

海外の実践ガイドでも、動画プロンプトは「何を映すか」より「どう動くか」を書くべきで、動きは1〜2個に絞り、80〜120語・5秒以内が扱いやすいとされる（出典: fal.ai の Wan プロンプトガイド）。詰め込みすぎると、かえって破綻しやすい。

やりがちな失敗

動きを書かず外見だけ書く → ほとんど動かない
大きな動きを複数同時に指定する → キャラ崩壊・破綻
「ダイナミックに」など抽象語だけ → モデルが解釈できない

Wan・Kling でプロンプトの書き方はどう変わる？

モデルによって得意な動きと書き方のクセが違う。同じ AI 動画プロンプトでも、使うモデルに合わせて調整すると成功率が上がる。

モデル	得意な動き	プロンプトのコツ
Wan 2.2	静止画に近い穏やかな動き	「動き」を主役に。カメラ指示は1つだけ。ネガティブで破綻を抑える
Kling v3 / v2.5	大きな動き・シネマ表現	カメラワーク（ドリー・オービット）を具体的に。感情も書ける
Seedance	コスパ重視の標準動画	シンプルな動作1つ＋短いカメラ指示でまず1本

Wan は「動き重視」で穏やかなアニメーション向き、Kling はカメラワークまで踏み込んだシネマ表現向き、という住み分けになる。まず1本試すならコスパのよい Seedance も選択肢だ。

1枚絵を動かす AI 動画プロンプトのテンプレートを使おう

迷ったら、次のテンプレートに当てはめるだけでいい。

[主体] が [動作] する。カメラはゆっくり [移動]。[速度・質感]。

イラストを動かすときの記入例を挙げる。

制服の少女がこちらを向いて微笑み、髪が風で揺れる。カメラはゆっくりズームイン。滑らかでシネマティックな質感。
ネオン街に立つキャラクターが軽く瞬きし、コートが風になびく。カメラは時計回りに緩やかにオービット。ゆっくりした動き。

ネガティブプロンプトで「歪み・余分な指・急な変形」を弾くと、キャラの一貫性を保ちやすい。1枚絵そのものの作り込みに悩むなら、先にアニメ AI イラストのプロンプトで静止画の精度を上げてから動かすと、結果が安定する。

ComfyStudio で AI 動画プロンプトを試す手順

AI 動画プロンプトは、実際に生成して微調整するのが上達の近道だ。ただ、ローカルの ComfyUI は VRAM やビルドのハードルが高く、ここで止まる人が多い。ComfyStudio は ComfyUI のワークフローをクラウドで実行する日本発の AI イラスト生成 SaaS で、手元の GPU を問わずブラウザだけで image-to-video を試せる。料金は1クレジット = 1円の従量課金で、生成前に1本のコストが見える。

画像を用意する — 動かしたいイラストを1枚アップロード
モデルを選ぶ — 穏やかな動きは Wan 2.2、大きな動きは Kling
プロンプトを書く — 上のテンプレートで「動き」を指定して生成

用途	モデル	コスト
動きの試し撮り	LTX-Video 2B	¥88
1枚絵を動かす	Wan 2.2	¥138
シネマ動画	Kling v2.5 Turbo	¥225

プロンプトを少し変えるたびに数百円で結果を確かめられるので、感覚をつかむのが速い。まずは Wan の image-to-video や Kling のアクション動画のプリセットから、会員登録なしのお試しで始められる。必要 VRAM やモデル選びを含む動画生成の全体像は ComfyUI 動画生成の始め方、ほかのモデルとコストは料金ページで確認してほしい。

よくある質問

Q. AI 動画プロンプトは何語くらいで書けばいいですか？ A. image-to-video なら 80〜120 語（日本語なら 2〜4 文）が扱いやすい目安です。外見は画像が決めるので、主体の動き・カメラ・速度の3点に絞り、動きは1〜2個まで。詰め込みすぎるとキャラ崩壊や破綻の原因になります。

Q. 画像生成のプロンプトと書き方は同じですか？ A. 違います。画像生成は構図・色・被写体など「見た目」を指定しますが、AI 動画プロンプトは「どう動くか」を指定します。image-to-video では外見を画像が担うため、プロンプトは動作とカメラワークの描写に集中させるのがコツです。

Q. キャラがすぐ崩れます。どうすれば防げますか？ A. 大きな動きを複数同時に指定するのが主な原因です。動きを1つに絞り、ネガティブプロンプトで「歪み・余分な指・急な変形」を弾いてください。穏やかな動きが得意な Wan 2.2 を選ぶと、アニメイラストでも一貫性を保ちやすくなります。

Q. ComfyUI を入れなくても動画プロンプトを試せますか？ A. はい。ComfyStudio のようなクラウド型 SaaS なら、インストールや GPU の用意なしに、ブラウザだけで image-to-video のワークフローを実行できます。1クレジット = 1円で Wan 2.2 の image-to-video が ¥138 など、1本ごとのコストを見ながらプロンプトを試せます。

AI 動画プロンプトの書き方｜1枚絵を動かすコツとモデル別の例

AI 動画 プロンプトとは？画像生成と何が違う？

動く映像は「動き」から書く——基本の4要素

やりがちな失敗

Wan・Kling でプロンプトの書き方はどう変わる？

1枚絵を動かす AI 動画 プロンプトのテンプレートを使おう

ComfyStudio で AI 動画 プロンプトを試す手順

よくある質問

よくある質問

AI 動画プロンプトとは？画像生成と何が違う？

1枚絵を動かす AI 動画プロンプトのテンプレートを使おう

ComfyStudio で AI 動画プロンプトを試す手順