動画生成AI

Runwayでできることを徹底解説!Gen-4時代のAI動画制作

※記事内に広告を含む可能性があります。

Runwayでできること、どこまで知っていますか? 2025年、生成AIはここまで進化しました。Runwayは、動画や画像、アニメーション、音声のすべてをひとつのツールで手軽に作れる時代を切り開いています。この記事では、最新モデルGen-4を中心に、Runwayの注目機能とその使い道を一気にご紹介します。

ポイント

  • Runwayでできることの全体像が理解できる
  • 各生成AIモデルの用途と特徴を知ることができる
  • 具体的な動画・画像制作のワークフローがわかる
  • どのようなクリエイターに向いているかが理解できる

Runwayでできること:動画コンテンツの生成

  • AIが変える動画コンテンツ制作
  • Runwayの動画生成AIモデル
  • Gen-4による動画制作
  • Gen-3 Alphaとアニメーション生成
  • キャラクター表現とAct-One
  • 音声生成とLip Sync機能
  • Framesによる画像生成スタイル

AIが変える動画コンテンツ制作

Runwayは、革新的で制御可能なAIコンテンツ制作ツールとして、コンテンツ制作のあり方を大きく変えようとしています。Runwayの目標は、アイデアを思いついてからそれを実際に形にするまでのギャップを埋め、創造性を解き放つためのツールを提供することです。Runwayが目指すビジョンは、アーティストがこれまで想像もしなかった方法で、高速かつ忠実度の高いコンテンツを制作できるようにすることです。

Runwayの提供するAIツールを用いることで、動画、画像 など、多様な形式のコンテンツを生成することが可能です。例えば、最新モデルであるGen-4は、あらゆるスタイルやシーンに対応した高品質な動画生成を可能にし、Framesは前例のないスタイルの制御を実現する画像生成モデルです。さらに、Act-Oneのようなツールを使えば、シンプルなビデオ入力から表情豊かなキャラクターアニメーションを生成することもできます。このように、Runwayは、アイデアを多様な形で表現するための強力な基盤を提供し、コンテンツ制作の未来を形作っています。

Runwayの動画生成AIモデル

Runwayは、映像や画像、アニメーションといった多様なメディア表現を可能にするAIモデルを複数提供しています。これらのモデルは、それぞれに特化した機能を持ち、直感的かつ精度の高いコンテンツ制作を支えています。

Gen-4:高度な制御と高忠実度を実現するビデオ生成モデル

Gen-4は、Runwayが提供する最新のビデオ生成AIモデルで、シーン全体の制御、一貫性、そして視覚的忠実度の面で新たな水準を打ち立てています。特に注目すべき機能は、画像を入力として5〜10秒の短い動画を生成できる「Gen-4 image to video」です。ユーザーは動画の最初のフレームとなる画像をアップロードし、そこにテキストプロンプトを加えることで、シーンの内容やカメラの動きを詳細に指示できます。プロンプトの焦点は、被写体、アクション、カメラワークなどに置くと効果的ですが、プロンプトなしでも十分に高品質な出力が得られる柔軟性も備えています。

Gen-4 Turbo:アイデアの高速プロトタイピングに最適

Gen-4の高速バージョンであるGen-4 Turboは、より迅速かつコストを抑えた生成を目的としたモデルです。試行錯誤が求められる初期段階の制作に適しており、アイデアのバリエーションを素早く確認することが可能です。ただし、より精度の高い結果を求める場合は、通常のGen-4に切り替えることでより望ましいアウトプットが得られる場合もあります。どちらのモデルも画像入力が必須であり、ベースとなるプロンプトには画像とテキストの両方が推奨されています。クレジット消費量は、Gen-4が1秒あたり12クレジット、Gen-4 Turboは5クレジットとなっています。

Frames:スタイルの一貫性を保つ画像生成モデル

Framesは、ビジュアルスタイルの精緻なコントロールと忠実な再現性を特徴とする画像生成モデルです。ユーザーが思い描く世界観をそのまま形にできるため、プロジェクト全体を通して一貫したルックアンドフィールを維持するのに適しています。生成可能なスタイルの例には、「World 1089」(クラシック映画のようなデジタルポートレート)や「World 3190」(1980年代の特殊メイク表現)など、ユニークで個性的なビジュアルが含まれています。

Act-One(Gen-3 Alpha):リアルなキャラクターアニメーション生成

Gen-3 Alphaを基盤とするAct-Oneは、シンプルなビデオ入力からリアルで感情豊かなキャラクターアニメーションを生み出すツールです。ユーザーが俳優の演技を収めたビデオと音声を入力することで、キャラクターの目線や表情、話し方、動作のテンポなどを忠実に再現したアニメーションを生成します。複雑なモーションキャプチャや細かなリギング作業を必要とせず、シンプルなカメラセットアップのみで高品質なキャラクター演出が可能となります。さらに、実際の映像と異なる体型やデザインのキャラクターにもパフォーマンスを正確に転送できる柔軟性があります。

Gen-1とGen-2:ビデオ生成技術の進化の軌跡

Runwayでは、初期のビデオ生成AIとしてGen-1が登場しました。このモデルは、入力された映像に対してスタイルや動きを加える「ビデオの変換」を主な機能としており、既存映像を新しい視覚スタイルに変換することに重点を置いていました。Gen-1は、AIによるビデオ編集の可能性を示した最初の一歩と言えます。

続いて開発されたGen-2は、より高度な生成機能を備え、静止画やテキストから短いビデオを直接生成する能力を持ちます。物理的な動きや構図の理解も一部備えており、リアルなシーンを自動的に作り出すことができます。ただし、複雑なカメラワークやオブジェクトの動きにはまだ制限があり、表現の自由度という点では後続モデルに劣る部分もあります。

これらのモデルは、Runwayが進める長期的な研究プロジェクト「General World Models(GWM)」における初期段階と位置づけられており、視覚世界の理解と予測を目指す開発の土台となっています。

Runwayの主要AIモデルは、用途に応じて多彩な表現力と制作スタイルを実現します。動画制作、画像生成、アニメーションといったあらゆるメディア制作において、これらのモデルは新たな創造の選択肢を提供し、制作プロセスを大きく進化させています。

Gen-4による動画制作

Runwayの最新AIモデルであるGen-4は、画像から高品質な動画を生成する「Image to Video」機能を提供しており、動画制作に新たな表現の幅をもたらしています。この機能では、まず画像をアップロードし、それを動画の最初のフレームとして使用します。次に、テキストプロンプトを入力することで、生成される動画のシーン構成やキャラクターの動き、カメラワークを細かく指示できます。

プロンプトの工夫が動画の質を左右する

テキストプロンプトは、動画の生成結果を大きく左右する重要な要素です。効果的なプロンプトの書き方として、主に被写体、アクション、カメラアクションに焦点を当てることが推奨されています。例えば、「男が見回している。カメラが彼にズームインする」A man looks around. The camera zooms in on him.や「男が振り返って遠ざかっていく」A man turns and walks away from the camera.といった具体的な指示が典型的な例です。より複雑な動作も指定でき、「男がカメラの右を通り過ぎ、暗い洞窟に入っていく。カメラは彼の動きを追う」A man walks past the right side of the frame and enters a dark cave. The camera follows behind him slowly.といったストーリー性のあるプロンプトも活用できます。

プロンプト インプット画像 生成動画
a handheld camera tracks the mechanical bull as it runs across the desert. the movement disturbs dust that trails behind the mechanical creature. cinematic live-action.

プロンプトの訳:
手持ちカメラが、砂漠を駆け抜ける機械の雄牛を追う。その動きによって舞い上がった砂ぼこりが、機械の生き物の後方に尾を引く。映画のような実写スタイル。

🔗 Gen-4 Prompting Guide

プロンプトなしでも一定の品質の動画は生成できますが、狙った動きを得るためには、プロンプトの工夫が不可欠です。特に、否定表現は避け、簡潔で具体的な内容を記述するのが効果的です。抽象的な概念や感情ではなく、物理的な動きに注目した表現を用いることで、より自然でダイナミックな動画になります。また、入力画像に既に含まれている要素を繰り返すのではなく、映像内での動きに焦点を置くと、精度の高い出力が得られやすくなります。

設定と調整による生成の最適化

動画を生成する際には、いくつかの設定を事前に調整することができます。生成時間は5秒または10秒のいずれかを選択でき、選んだモデル(Gen-4またはGen-4 Turbo)によってクレジットの消費量が異なります。Gen-4は1秒あたり12クレジット、Gen-4 Turboは5クレジットとなっています。

また、解像度の設定によって動画のサイズやアスペクト比が決まります。入力画像と異なる解像度を選ぶ場合、クロップ処理が必要になることがあります。固定シードの設定を有効にすると、同じスタイルや動きを再現した動画を繰り返し生成することが可能になります。

編集・活用ツールでさらに広がる可能性

動画生成後には、Runway内のさまざまなツールを使って、さらなる編集や活用が可能です。たとえば、Restyle機能(Gen-3 Turbo Video to Video)を使えば、既存の動画のスタイルを別の映像に適用し、新たなビジュアルに再構築することができます。

Expand Video(Gen-3 Turbo Expand)は、動画の範囲を拡張して新しいシーンを追加する機能です。Adjust Videoでは、動画のトリミングや再生速度の調整、手ブレの追加、逆再生などの基本的な編集がクレジットを消費せずに行えます。さらに、Lip Syncツールを活用することで、口の動きを解析して別の音声と同期させることも可能です。

最終的な仕上げとして、生成された動画を4K解像度にアップスケールすることで、より高品質なアウトプットを得ることができます。ただし、Gen-4 Turboで生成した動画の場合、Basicプランではウォーターマーク削除や4Kアップスケールは利用できません。これらの機能はStandardプラン以上の契約で利用可能になります。

このように、RunwayのGen-4 Image to Video機能は、直感的な操作と高度なカスタマイズ性を備えた動画制作ツールとして、ビジュアルコンテンツの新たな地平を切り拓いています。

項目 Gen-4 Gen-4 Turbo
生成可能な動画時間 5秒 または 10秒 5秒 または 10秒
1秒あたりのクレジット消費 12クレジット 5クレジット
動画合計クレジット(5秒) 60クレジット 25クレジット
動画合計クレジット(10秒) 120クレジット 50クレジット
対応解像度 16:9、9:16、1:1、4:3、3:4、21:9(画像によってはクロップあり)
固定シードの使用 同じスタイルや動きを再生成可能
Adjust Video クレジット消費なし(トリミング、再生速度調整、手ブレ追加、逆再生)
Restyle(Gen-3 Turbo Video to Video) スタイルの再構築が可能
Expand Video(Gen-3 Turbo Expand) 動画範囲の拡張、シーン追加が可能
Lip Sync 1秒あたり5クレジット消費
4Kアップスケール Standardプラン以上で可能(Basicプランは不可)

Gen-3 Alphaとアニメーション生成

Runwayが提供するGen-3 Alphaは、以前の世代のモデルと比べて、忠実性、一貫性、動き、そして生成速度の点で大きく向上したAIモデルです。さらに、Gen-3 Alphaファミリーには、高速かつ低コストでの生成が可能な「Gen-3 Alpha Turbo」も含まれており、すべてのプランで利用できます。

Act-One:自然なキャラクターアニメーションを実現するツール

Gen-3 Alphaでは、Act-Oneという先進的なツールを使って、シンプルなビデオ入力から豊かなキャラクターパフォーマンスを生成することができます。このツールは、俳優の演技を記録したビデオと音声を入力とし、顔の表情や目線、ペース、話し方といった細かな動きまで忠実に再現するアニメーションを生成します。これにより、フェイシャルリギングやモーションキャプチャのような複雑な工程を省略し、最小限の機材で高品質なキャラクターアニメーションの制作が可能になります。

Act-Oneは、幅広いキャラクターデザインに対応しており、入力された演技を異なるプロポーションのキャラクターにも正確に転送できます。使用時には、「運転演技」と呼ばれる表情豊かなビデオをドライバーとして使用し、それに基づいて静止画または別のビデオのキャラクターに動きを与える形でアニメーションが生成されます。

Video to Video機能によるスタイルの再構築

Gen-3 AlphaおよびTurboでは、既存の映像に新たなスタイルを与える「Video to Video」機能も利用可能です。テキストプロンプトを使って映像全体のトーンや雰囲気を変えたり、スタイルを視覚的に指示するために画像を最初のフレームとして使用することができます。このアプローチにより、より高い一貫性と制御が実現し、アーティスティックな意図に沿った動画を作成できます。

Gen-3 Alpha Turboのカメラコントロール

Turboモデルでは、入力画像から生成するビデオに対してカメラの動きを細かく指定する「カメラコントロール」機能が用意されています。水平方向、垂直方向、パン、チルト、ズーム、ロールという6種類の動きを選択でき、複数を組み合わせることで、より複雑なカメラワークも実現可能です。テキストプロンプトと併用することで、カメラの動きと内容が一致した、意図に沿った映像を作ることができます。

Expand Video:ビデオを再構成して新たなフォーマットへ

Gen-3 Alpha Turboでは、既存の映像を異なるフォーマットに展開できる「Expand Video」機能も提供されています。これは単なるトリミングとは異なり、映像の枠を超えて新たな領域を追加生成することで、元の動画を自然に拡張します。多くの場合、プロンプトなしでも利用できますが、テキストプロンプトやガイド画像を併用することで、より詳細なコントロールが可能です。

利用範囲とプランごとの制限

Runwayでは、プランによってGen-3 AlphaおよびTurboの利用範囲やクレジット消費が異なります。Standardプランでは、Text、Image、Video to Videoといった各機能を最大10秒の長さで利用でき、Proプラン以上ではさらに長尺の動画生成が可能になります。多くのプランでは、Gen-3 Alphaで生成した映像を4K解像度にアップスケールすることも可能です。

また、「Creating with Keyframes on Gen-3」というリソースも公開されており、Gen-3シリーズではキーフレームを活用したアニメーション編集が可能であったことも示唆されています。これにより、より繊細でタイミングを重視した映像演出にも対応できる柔軟性があることがわかります。

Gen-3 Alphaは、アニメーション制作や映像編集のプロセスを効率化しつつ、高い表現力とコントロール性を実現するための強力なツールセットを提供しています。特にキャラクター表現や映像のスタイル再構築において、その可能性は大きく広がっています。

項目 Gen-3 Alpha Gen-3 Alpha Turbo
生成可能な動画時間 最大30秒
1秒あたりのクレジット消費 10クレジット 5クレジット
動画合計クレジット(5秒) 50クレジット(最低値) 25クレジット(最低値)
動画合計クレジット(10秒) 100クレジット 50クレジット
対応解像度 1280×768、768×1280
固定シードの使用 同じスタイルや動きを再生成可能
Adjust Video クレジット消費なし(トリミング、再生速度調整、手ブレ追加、逆再生)
Restyle(Video to Video) 既存動画にスタイル適用可能(テキスト・画像指定)
Expand Video 映像範囲を拡張し、新シーンを生成
Lip Sync 1秒あたり5クレジット消費
4Kアップスケール Standardプラン以上で可能(Basicプランは不可)

キャラクター表現とAct-One

Runwayが提供するAct-Oneは、シンプルなビデオと音声の入力だけで、感情やニュアンスに富んだキャラクターアニメーションを生成できる革新的なツールです。現在はGen-3 Alpha内で利用可能となっており、これまでのアニメーション制作とは異なる新しいアプローチを実現しています。

従来の課題をシンプルに解決するアプローチ

従来のキャラクターアニメーション制作には、モーションキャプチャ機器や複数の参照映像、手作業によるフェイシャルリギングなど、高度で煩雑な作業が求められてきました。俳優のパフォーマンスをキャラクターに忠実に転送することは技術的にも大きな課題でした。Act-Oneはこうしたプロセスを根本から見直し、家庭用のカメラで撮影された演技ビデオを用いるだけで、目線や微表情、話し方やペースといった繊細な表現を高精度で再現できるように設計されています。

追加の特殊機材を必要とせず、単一のカメラセットアップで収録された素材をベースに、自然なキャラクター表現が可能になるこのアプローチは、アニメーション制作のハードルを大きく下げています。

キャラクターデザインの自由度と応用性

Act-Oneのもう一つの大きな強みは、さまざまなキャラクターに対する柔軟な対応力です。入力された演技は、元の映像とは異なる外見やプロポーションのキャラクターにも正確に転送することができます。リアルな表情を維持しながら、ユニークなキャラクターデザインを自由に適用できるため、アーティストやクリエイターは想像力に基づいてキャラクターを自在に創造し、アニメーション化することが可能になります。

実際には、家庭用カメラで撮影した俳優の演技をベースにしながら、声を変更して新しいキャラクターに変換するような使い方も行われており、制作スタイルの幅広さを示しています。

感情と没入感のあるアニメーション表現

Act-Oneは、感情のこもった表情や繊細なニュアンスの再現にも優れており、シネマティックでリアリティのある出力が可能です。さまざまなカメラアングルでも顔の動きを高い忠実度で維持できるため、視聴者にとってはキャラクターを通して自然な感情や臨場感を感じることができ、コンテンツへの没入感が一層高まります。

会話シーンやナラティブコンテンツへの応用

Act-Oneは、従来のモデルでは難しかったマルチターンの対話シーンにも対応しています。単一の俳優による複数キャラクターの演じ分けを収録した映像を入力することで、複数のユニークなキャラクターが登場する会話シーンを生成することが可能です。こうしたナラティブ性の高いコンテンツ制作においても、新たな創造の可能性が広がっています。

安全性とクリエイターへの開放

Runwayは、Act-Oneをはじめとする全てのツールにおいて、責任ある開発と運用に取り組んでいます。コンテンツモデレーションや安全対策を包括的に導入し、ツールが悪用されないよう配慮されています。こうした取り組みにより、これまで高度な技術が必要だったアニメーション制作が、より多くのクリエイターやアーティストに開放されつつあります。

Act-Oneは、アニメーションとキャラクターパフォーマンスにおける表現の可能性を大きく広げる存在であり、新たなストーリーテリングの形を切り拓く重要な一歩として注目されています。現在、このツールはGen-3 Alphaにて利用可能です。

音声生成とLip Sync機能

Runwayは、映像やアニメーションと組み合わせて使用できる、さまざまなオーディオ関連機能を提供しています。これにより、キャラクターに声を与えたり、自然な会話シーンを作成したりといった表現が、テキストや音声データをもとに実現可能になります。

Text to Speech:テキストから音声を生成

Generative Audioの中核となる機能の一つがText to Speechです。ユーザーはテキストを入力し、複数のプリセット音声の中から希望する声を選んで音声を生成できます。Proプラン以上のユーザーであれば、カスタムAI音声の作成も可能です。自身の声や、使用許諾を得た別の人物の音声サンプルをアップロードし、指定された短いスクリプトを読み上げることで、Webアプリ上で音声認証が行われ、個別の音声モデルが生成されます。これにより、自分自身の声で任意のテキストを読み上げることが可能になります。Text to Speechの利用には、50文字あたり1クレジットが必要です。

Lip Sync:映像と音声を自然に結びつける

Lip Sync機能は、画像や動画に含まれる人物の口の動きを、入力した音声に合わせて自動でアニメーション化するツールです。最大4つの顔に対して処理を行うことができ、音声はText to Speechで生成されたものか、アップロードした音声を使用できます。会話は最大10個の「ダイアログ」で構成され、1ダイアログの最大継続時間は40秒、テキストは最大600文字まで入力可能です。

動画の出力には1秒あたり5クレジットが消費されます。最も効果的な結果を得るには、正面を向いた顔が写っており、口や頭部が大きく動かず、照明やカメラアングルが安定している、フォトリアリスティックな画像や動画を使用することが推奨されます。音声ファイルも、40秒以内でノイズのないクリアな音声である必要があります。

Act-Oneとの連携で広がる表現力

これらのオーディオ機能は、Runwayの他のツールと組み合わせて活用することで、より一層リッチな表現が可能になります。たとえば、Act-Oneで生成したキャラクターアニメーションに対して、Text to Speechで作成した音声をLip Sync機能で同期させることで、自然な会話シーンを簡単に演出できます。ナラティブコンテンツやストーリーテリングのシーンにおいて、この連携は非常に効果的です。

対応言語

Generative Audioは、多言語対応にも力を入れており、Text to Speech、Speech to Speech、Lip Sync機能で以下の言語がサポートされています。

  • 英語(アメリカ、イギリス、オーストラリア、カナダ)
  • ドイツ語
  • ポーランド語
  • スペイン語(スペイン、メキシコ)
  • イタリア語
  • フランス語(フランス、カナダ)
  • ポルトガル語
  • ヒンディー語

言語によって使用できるプリセット音声の種類は異なりますが、国や地域に応じた自然な発音やイントネーションに対応しており、国際的なプロジェクトでも活用しやすくなっています。

Runwayのオーディオ機能は、キャラクターにリアルな声と動きを与えることで、映像コンテンツに深みと臨場感を加えます。シンプルな入力で直感的に使えるため、映像制作の初心者からプロフェッショナルまで、幅広いクリエイターにとって有用なツールとなっています。

項目 Text to Speech Lip Sync
基本機能 テキストから音声を生成 音声に合わせて口の動きをアニメーション
対応音声 プリセット音声 / カスタム音声(Pro以上) アップロード音声 / Text to Speech音声
入力制限 50文字ごとに1クレジット 最大10ダイアログ、1ダイアログあたり40秒 / 600文字まで
出力制限 制限なし(音声ファイル) 最大4つの顔に対応
1秒あたりのクレジット消費 5クレジット
推奨素材 正面顔、照明・カメラが安定した画像 / 動画
対応プラン カスタム音声はProプラン以上 全プランで利用可能(クレジット消費あり)

Framesによる画像生成スタイル

Framesは、UnlimitedプランまたはEnterpriseプランで利用できるRunwayの最新画像生成モデルです。特定のスタイルや美的感覚に沿った世界を構築し、一貫性を保ちながら多様なビジュアルを生成することができます。シンプルなプロンプトでも高品質な画像を得られますが、より高度なプロンプトや設定を活用することで、スタイルや構図のコントロールがさらに可能になります。アスペクト比やスタイルプリセット、美的範囲といった設定に加え、プロンプトの調整や固定シード、Vary機能を使って反復的に理想のイメージへと近づけることもできます。

Framesは、高度なスタイル制御と一貫性を兼ね備えた最新の生成AIであり、これまでにない方法でビジュアル表現を追求できるツールです。特定のルックや雰囲気を維持しながら、多様なバリエーションを一貫して生み出す力を持ち、ユーザーはプロジェクト全体を通じて独自の美学を細部まで反映させることができます。

豊かなスタイルバリエーションと世界観の構築

Framesは、視覚的なスタイルを構成するための幅広い表現の可能性を提供しています。たとえば、「Dreamy」スタイルでは、光漏れやソフトフォーカス、スターレンズフレアなどを取り入れた夢幻的な雰囲気が演出されます。90年代的なロマンチックで幻想的なビジュアルに最適です。「Glitchcore」は、デジタルの乱れやノイズ、ピクセルの崩れといったグリッチ効果を取り入れ、視覚的にインパクトのあるスタイルを作り出します。

「Relaxed」は、柔らかな自然光のもとで、人物や物体が透明なプラスチックに包まれたような、エーテル的で静けさのある写真表現が可能です。シュールかつ詩的な印象を与えるビジュアルに向いています。「Scanner」スタイルでは、古いコピー機でスキャンされたような粒状のテクスチャや歪みが再現され、ノスタルジックでざらついたモノクロームの質感が得られます。

こうしたスタイルはすべて、単に見た目を変えるだけではなく、作品全体のトーンやメッセージを明確に伝える手段として機能します。Framesによって、ユーザーは単なる画像生成を超えて、コンセプトを具体的に視覚化することができるのです。

Framesスタイルの例

スタイル名 説明 イメージ
Glitchcore デジタルのノイズや色の歪みなどを取り入れた前衛的で抽象的なスタイル Glitchcore
Dreamy 柔らかい光と幻想的なぼかし表現で夢のような雰囲気を生み出すスタイル Dreamy
Horror 暗く不気味な色調や構図で恐怖や緊張感を強調するスタイル Horror
Lo-Fi 低解像度でレトロな質感が特徴の、親しみやすいスタイル Lo-Fi
Pastel baroque パステルカラーとバロック様式の装飾を融合させた華やかなスタイル Pastel Baroque
Anime アニメ風の描写で、鮮やかな色彩とキャラクターの特徴が強調されるスタイル Anime
Disposable-film 使い捨てカメラ風のざらつきとノスタルジックな色調が特徴のスタイル Disposable Film
Cinematic 映画のような質感と構図で、ドラマチックな雰囲気を演出するスタイル Cinematic
Relaxed 自然光や穏やかなポーズを活かした、落ち着いた印象のスタイル Relaxed
In-motion 動きのある被写体をダイナミックに捉える、躍動感あふれるスタイル In Motion

🔗 Frames Prompting Guide
🔗 Creating with Frames

安全な利用と創造の自由

Framesは、こうした多様なスタイルを高精度で再現する一方で、コンテンツの安全性にも配慮されています。Runwayは、Framesを含む全ての生成機能において、コンテンツモデレーションと安全対策を導入し、安心して利用できる環境を提供しています。

このモデルの登場により、ビジュアルスタイルの表現はより自由かつ具体的になり、クリエイターは自らの創造的なビジョンに沿った世界を構築することが可能になりました。Framesは単なる画像生成ツールではなく、想像力を視覚的に具現化するための強力なパートナーと言えるでしょう。

項目 Frames
クレジット消費 4枚の画像生成につき32クレジット
Explore Mode対応 Unlimitedプランで対応
基本プロンプト入力 テキスト
プロンプト最大文字数 1000文字
対応アスペクト比 16:9、9:16、1:1、4:3、3:4、21:9
出力解像度 1080p

Runwayでできること:編集ツールと運用

  • Runwayの補助ツールと編集機能
  • 制作ワークフローの効率化
  • Runwayの料金プランとクレジット
  • General World Modelsの研究開発
  • 動画コンテンツ生成における安全性
  • 学習リソースとRunwayコミュニティ

Runwayの補助ツールと編集機能

Runwayはビデオ生成や画像生成だけでなく、コンテンツ制作のあらゆる工程をサポートする多彩なAIツールを提供しています。これらのツールは、既存の映像や画像の加工、演出の強化、仕上げまでを効率化し、より洗練された作品制作を可能にします。

深度情報を活用する:Extract Depth

Extract Depthは、画像や動画からシーン内の奥行き情報を抽出するツールです。これにより、被写界深度の調整や擬似的な3D演出など、高度なビジュアル効果の制作が可能になります。映像の立体感を演出したいときに非常に有効です。

滑らかなスローモーションを実現:Super-Slow Motion

Super-Slow Motionは、標準速度の映像をAIの補間技術によって滑らかなスローモーションに変換する機能です。動きの速いシーンを細部まで丁寧に見せたい場合や、演出効果を高めたいときに活用できます。

不要な要素を自然に除去:Inpainting

Inpaintingは、画像や映像の中から不要な物体や要素を消去し、周囲の情報をもとに自然に補完するツールです。撮影時のミスや映り込んでしまった不要物を、後から違和感なく修正できます。

被写体を切り出す:Remove Background

Remove Backgroundは、画像や動画から背景を自動的に削除し、被写体のみを抽出する機能です。人物や物体を別の背景と合成したいときや、広告・プレゼン用の素材作りに便利です。

動きに合わせた演出:Motion Tracking

Motion Trackingは、動画内の特定のオブジェクトの動きを自動的に追跡するツールです。動きに応じてエフェクトを重ねたり、要素を差し替えたりする際に活躍します。モーショングラフィックスや映像編集における応用範囲が広い機能です。

自動字幕生成でアクセシビリティを向上:Subtitles

Subtitlesは、映像の音声から自動的に字幕を生成するツールです。聴覚に配慮したアクセシブルなコンテンツ制作や、多言語対応が必要な映像プロジェクトにも役立ちます。

これらのAIツールを組み合わせて使用することで、アイデアの構想から映像の編集・仕上げまで、制作のあらゆるフェーズでRunwayを活用できます。細かな制御と自動化を同時に実現できるこれらの機能は、クリエイティブな作業をよりスムーズに、そして表現力豊かにしてくれます。

制作ワークフローの効率化

Runwayは、生成AIによるビデオ制作だけでなく、その前後のワークフロー全体をサポートするための機能も充実しています。プロジェクトの立ち上げからアセット管理、編集作業、最終的な書き出しまで、制作に必要な工程をスムーズに進めるための仕組みが整っています。

プロジェクトとセッションの管理

Runwayで生成されたビデオは、セッションごとに整理され、作業履歴をスクロールして振り返ることができます。作成した映像は自動的にセッションフォルダー内の関連サブフォルダーに保存され、素材として再利用したり、比較したりするのが容易です。プランによってはビデオプロジェクトの作成数に制限がある場合もありますが、無制限に利用できるプランも用意されています。エンタープライズ向けのプランでは、チームごとに構成可能なワークスペースが提供され、アセットの分類や整理も柔軟に行えます。

アセット管理と保存容量

アップロードした素材や生成したビデオは、各プランに応じたストレージ容量内で管理されます。Basicプランでは5GB、Standardプランでは100GB、ProプランおよびUnlimitedプランでは500GBのストレージが用意されており、用途や制作規模に応じて選ぶことができます。保存されたビデオはすべて個別のアセットとして扱われ、必要に応じて再編集やアップスケールが可能です。エンタープライズプランでは、さらに高度なアセット整理機能が提供され、プロジェクトの規模に合わせた効率的な管理が実現します。

タイムラインとレイヤーによる映像編集

Runwayには、複数の映像素材や画像、エフェクトなどを時間軸に沿って編集できるタイムライン機能と、素材を重ねて表現するためのレイヤー機能が備わっています。これにより、視覚効果や複雑な構成の映像を構築する作業が直感的に行えるようになります。編集の自由度が高く、シンプルな動画から演出の凝った映像まで、幅広い表現が可能です。

作業効率を高めるショートカット機能

Runwayでは、編集作業を効率化するためのショートカットガイドも提供されています。ショートカットキーを活用することで、頻繁に使用する操作を素早く実行でき、作業時間を短縮しながら集中力を保ったまま編集を進めることができます。

柔軟な書き出しと高解像度出力

完成した映像は、プロジェクトの目的や配信先に応じて、解像度やアスペクト比を自由に選んでエクスポートすることができます。Gen-4では、16:9(1280x720)、9:16(720x1280)、1:1(960x960)、4:3(1104x832)、3:4(832x1104)、21:9(1584x672)といった幅広い出力形式に対応しており、SNS向け、プレゼン用、シネマティック用途など、さまざまなニーズに応えられます。また、Gen-4、Gen-4 Turbo、Gen-3 Alpha、Gen-3 Alpha Turboで生成された映像は、必要に応じて4K解像度へのアップスケールも可能です。

このように、Runwayはビデオの生成だけでなく、制作フロー全体に対応した機能群によって、コンテンツ制作の効率と表現力を大きく向上させます。アイデアの具現化から完成まで、クリエイターを力強くサポートする環境が整っています。

Runwayの料金プランとクレジット

Runwayは、個人からプロフェッショナル、企業チームまで、幅広いユーザー層に向けて複数の料金プランを提供しています。プランは、基本的な利用を試すための無料プランから、無制限生成やチーム管理機能を備えたエンタープライズ向けプランまで用意されています。

無料で始められるBasicプランでは、主要な生成モデルの体験が可能で、少量のクレジットが付属します。より多くの生成時間や4K出力、ウォーターマークなしの利用、追加のエクスポート機能などを求めるユーザーにはStandardプランProプランが適しています。

Unlimitedプランでは、特定のモードを利用することでクレジットを消費せずに無制限に画像や動画を生成できます。大量のコンテンツを制作するクリエイターやチームにとって、最も自由度の高いプランです。

さらに、より高度なカスタマイズや管理機能を必要とする大規模な組織には、Enterpriseプランが用意されています。チームスペースの構成、セキュリティ、サポート体制など、業務利用に最適な機能が含まれています。

すべてのプランは、AIモデルの利用ごとにクレジットを消費する仕組みになっており、モデルや機能ごとに異なるレートが設定されています。詳細な比較とクレジット消費量については、別途掲載される料金プラン表をご参照ください。

Runwayの柔軟なプラン体系により、用途や規模に応じて最適な形でAIツールを活用できる環境が整っています。

プラン名 価格 ユーザー数上限 クレジット/月 主な特徴 ストレージ
Basic 無料 1 125
(最大25秒相当)
体験向けプラン。ウォーターマークあり。
プロジェクト上限3件、アップスケール不可。
5GB
Standard $15/月(月払)
$12/月(年払)
最大5人 625 ウォーターマークなし。4Kアップスケール可能。
Gen-4、Gen-3各種Image to Video等に対応(最大10秒)。
100GB
Pro $35/月(月払)
$28/月(年払)
最大10人 2250 カスタム音声(TTS)対応。Lip Syncの拡張機能付き。
Standardの全機能を含む。
500GB
Unlimited $75/月(月払)
$76/月(年払)
最大10人 2250(+Explore Modeで無制限) Explore Modeで動画・画像を無制限生成。
クレジットモード切り替え可能。Framesも対象。
500GB
Enterprise カスタム
(問い合わせ)
カスタム カスタム 高度な管理機能、SSO、チームスペース、優先サポートなど。
ProとUnlimitedの全機能を含む。
カスタム

📌 価格はすべて1ユーザーあたりの料金です。複数人で利用する場合は人数分の契約が必要です。

General World Modelsの研究開発

General World Models

Runwayの研究開発において、将来を見据えた重要な取り組みのひとつがGeneral World Models(GWM)の構築です。これは、AIが現実の視覚世界とその中での動きや変化を理解し、再現できるようにするための長期的なプロジェクトであり、従来のAIモデルの枠を超える新たな地平を目指しています。

従来の枠組みを超えるAIの理解力

従来のワールドモデルの研究は、ビデオゲームのような限定的なシミュレーション環境や、自動運転といった特定領域での応用に留まっていました。Runwayが目指すGeneral World Modelsは、もっと広い範囲、すなわち現実世界で人間が遭遇するような多様な状況やインタラクションを包括的に捉え、再現することを目的としています。

このビジョンを実現するためには、視覚的な環境を一貫性のある形でマッピングし、その中でのナビゲーション、オブジェクトとの自然な相互作用、さらに人物や動物など、そこに存在するもののリアルな動きや行動パターンまでを理解・モデル化する必要があります。

Gen-2から始まる実践的な応用

Runwayは、動画生成モデルであるGen-2を、このGeneral World Modelsに向けた初期段階の試みと位置づけています。Gen-2は、短い現実的な動画を生成する能力を持ち、そのためには物理法則やモーションの基本的な理解が不可欠です。ただし、カメラワークの複雑さや複数オブジェクトの連動した動きなどにはまだ限界があり、GWMの理想には遠い状態です。

それでも、Gen-2の開発を通じて得られた知見は、より汎用的かつ応用範囲の広いAIモデルの実現に向けた貴重なステップとなっています。

GWMの実現に向けた挑戦

General World Modelsの開発には、技術的にいくつもの未解決の課題があります。空間の一貫性を保った環境表現、リアルタイムのインタラクション、そして人間らしい行動や反応のシミュレーションなど、多方面にわたる研究が必要です。Runwayは、この分野に特化した研究チームを組織し、継続的に開発を進めています。

この取り組みは、単なる動画生成を超えて、AIが現実世界をより深く理解し、人間にとって自然で意味のあるコンテンツを生み出すための重要な土台となるものです。General World Modelsは、AIによる創作や表現の未来を切り拓く基盤として、今後のRunwayの研究開発において中核をなす存在になると考えられます。

動画コンテンツ生成における安全性

Runwayは、ユーザーが安心して創作活動に取り組めるよう、プラットフォーム全体を通じて安全性と信頼性の確保に取り組んでいます。すべてのモデルやツールのリリースにおいて、あらかじめ設計されたコンテンツモデレーションと安全対策を導入し、不適切な利用や生成を未然に防ぐ仕組みを構築しています。

「Foundations for Safe Generative Media」に基づく運用

Runwayの安全対策は、「Foundations for Safe Generative Media」という原則に支えられています。この枠組みのもとで、新機能や新モデルの公開時には、複数のチェックポイントを設けて安全性を確保しています。これにより、現在提供されているツールだけでなく、将来のリリースにおいても一貫した安全性が担保されます。

公共の人物に関する保護と検出機能

公共の人物を含むコンテンツの生成に関しては、特に慎重な対応がなされています。Act-Oneの導入にあたっては、この分野の検出精度がさらに強化されており、不適切な描写や誤った利用が行われないようブロック機能が強化されています。これにより、プライバシーや肖像権に関する懸念を最小限に抑えることを目指しています。

カスタム音声の利用における権利保護

カスタム音声機能の提供にあたっては、音声使用に関する適正な権利確認も重視されています。特にAct-Oneでは、ユーザーがアップロードした音声に対して、適切な使用権を有していることを確認するプロセスが組み込まれています。これにより、本人の許可なく第三者の声を利用するようなケースを防止する措置が取られています。

継続的な監視と不正利用への対応

プラットフォーム全体においては、ツールの不正使用や不適切なコンテンツ生成を防ぐための継続的なモニタリングが行われています。システムは潜在的な問題を検出すると、自動で生成をブロックするなどの対策を講じる仕組みになっています。こうした技術的・運用的な措置は、ユーザーが創造性を安全に発揮できる環境づくりの一環として、常にアップデートされ続けています。

Runwayは、創造の自由を広げる一方で、その自由が悪用されることのないよう、責任ある技術開発と運用に力を注いでいます。安全で信頼できる生成AIのプラットフォームとして、すべてのユーザーが安心して表現できる場を提供し続けています。

学習リソースとRunwayコミュニティ

Runwayでは、ユーザーがツールを最大限に活用できるよう、学習支援とコミュニティ交流のための充実したリソースを提供しています。初心者から上級者まで、あらゆるレベルのクリエイターが自分のペースで学び、成長できる環境が整っています。

Runway Academyで学ぶ

プラットフォームの使い方を体系的に学びたいユーザーのために、Runwayは「Runway Academy」という公式の学習リソースを提供しています。ここでは、Gen-4のImage to Video機能をはじめ、さまざまなツールの操作方法や活用例をわかりやすく解説したチュートリアルが用意されています。基本的な操作から、実践的なテクニックまで段階的に学べる構成になっており、初めてRunwayに触れる人でも安心して利用できます。

実用的なガイドとヘルプ記事

より具体的な機能の使い方や、トラブルへの対処法を知りたい場合には、Runwayが提供するヘルプ記事が役立ちます。中でも、Gen-4のプロンプティングに関するガイドは、動画生成を行ううえで非常に有用な情報源です。このガイドでは、効果的なプロンプトの書き方や、プロンプトを調整していくための反復的なアプローチ、スタイルやカメラの動きを指定する際の表現方法などが丁寧に解説されています。プロンプトの構成要素ごとの説明や、実際に使える例文も豊富に紹介されており、実践的な知識をすぐに応用できます。

ユーザー同士の交流:Runwayコミュニティ

学習や制作の過程で生まれる疑問や発見は、他のユーザーとの交流を通じてさらに深めることができます。Runwayには、活発なユーザーコミュニティが存在しており、その中心的な場がRunwayの公式Discordサーバーです。ここでは、Gen-4をはじめとするツールの活用法についての意見交換や、困ったときの相談、制作事例の共有などが日常的に行われています。

このコミュニティには、初心者から上級者まで幅広いユーザーが参加しており、それぞれの視点や経験が貴重な情報源となっています。技術的な質問への対応だけでなく、創作のアイデアやインスピレーションの共有の場としても機能しており、Runwayをより深く楽しむためのサポートとなっています。

学習リソースとコミュニティは、単なるサポートにとどまらず、創作の質とスピードを向上させる大きな力になります。Runwayは、ツールの提供だけでなく、それを使いこなすための環境づくりにも力を入れています。

Runwayでできることがまるわかり:まとめ

記事のポイントをまとめます。

  • RunwayはAIで映像・画像制作を支援するプラットフォームである
  • 動画生成ではGen-4とGen-3 Alphaが中心モデルとして活用される
  • Gen-4は高品質な動画生成に優れており、画像から映像を作れる
  • Gen-4 Turboは高速かつ低コストなプロトタイピングに適している
  • Framesは一貫性あるスタイルで画像を生成できる最新モデルである
  • Act-Oneは自然なキャラクターアニメーションを可能にするツールである
  • Lip Sync機能により映像に合わせた口パクアニメーションが行える
  • Text to Speechでテキストを自然な音声に変換できる
  • 各モデルは用途や精度に応じて使い分けることが重要である
  • 編集機能としてスローモーション化や背景除去なども提供されている
  • Runwayのツール群はタイムラインやレイヤーによる編集に対応している
  • 各プランでは使用可能な機能やクレジット数に差がある
  • Explore Modeにより一部モデルは無制限生成が可能になる
  • General World Modelsの研究で現実理解に近づいたAI開発が進んでいる
  • 安全性とコンテンツモデレーションの体制が整備されている

-動画生成AI