超リアルAI動画時代の幕開け!Sora 2がもたらす衝撃

目次

OpenAIがリリースした動画生成AI「Sora2」

自然言語処理AI「ChatGPT」を提供するOpenAI社が、新しい動画生成AI「Sora2」をリリースしました。

去年登場した初代Soraは「まぁ面白いけど、まだまだ発展途上かな」という印象が否めませんでしたが、今回の「Sora2」ははっきり言って桁違いのクオリティです。本物なのか、フェイクなのか。ほとんど見分けがつかないレベルの動画を生成してくれます。

Sora2は「超リアルなフェイク動画を作成するソーシャルプラットフォーム」として発表されており、スマートフォンで気軽に生成して、SNSのように共有、視聴し合う設計で作成されています。ちなみに、動画生成AIエンジンのことは「Sora2」と呼びますが、スマホアプリの名称は「Sora」です。

当初はアメリカとカナダからリリースし、現在は日本でも使用可能になっています。ただし、使用できるようになるためには招待コードが必要になるため、広く普及するにはしばらく時間がかかりそうです。

リアルすぎる映像表現

Sora2の最大の特徴はなんと言っても、その「リアルすぎる」映像です。

「物理法則を学習した」と称されるように、水しぶきや街の環境音など、リアル世界を忠実に再現してくれます。以前は「水が上に流れる」「人間の指が6本ある」「移動中に人が分裂する」などのバグがありましたが、今回はほぼ解消されています。スケート選手の映像サンプルなどは「これ本物では?」と思うほどの完成度です。

また、口の動きと音声の同期精度も格段に向上しています。英語だけでなく日本語も、とても自然に流暢に話します。映像も自然なので、本当の映像なのかAI映像なのか、一見すると見分けがつかないレベルです。

私も試しに、架空の顧客インタビュー映像を作成してみました。入力したプロンプトはこちらです。

当社は、自ら考えて行動する「自律型人材」の育成を主なテーマにした、人と組織のコンサルティング会社です。当社のリーダー育成研修を受けた、顧客担当者や責任者のインタビュー動画(インタビューは映らず、本人のみが映っているもの)を作成してください。

できあがった映像がこちらです。まず驚いたのが、よくある「AI美女」ではなく、実際に存在していそうなリアルな人物像であったことです(それでも綺麗な人ですが。。。)

音声も非常になめらかで、ホームページやランディングページで本当に使いたくなってしまうレベルの品質です。(さすがに使うわけにはいきませんが)

少しプロンプトを変えて、男性版も作ってみました。こちらも実際にいそうな人物で、話の滑らかさもバッチリです。映像のテイストも、いかにも顧客インタビューのような感じであり、決して詳細を指定しない簡単なプロンプトでこのクオリティができることにただただビックリです。


自分が動画の主役になる「カメオ機能」

Sora2の目玉はなんと言っても、自分を動画に登場させられる「カメオ機能」です。自分の顔や声を登録して、動画作成時にユーザー名をメンションすると、自分が登場する動画が作れるのです。

Screenshot

試しに私も登録して、次のプロンプトを試してみました。

私は経営コンサルタントです。2,000人の聴衆で埋め尽くされた大きなホールで、講演会を行なっている様子の映像を作成してください。

できあがった映像がこちらです。

なぜか後ろを向くなど挙動が不審で、音声も私の声に似ていなかったので、もう一度カメオ設定をやり直して作り直しました。

だいぶ改良されました。

風邪をひいて喉がやられていた時だったので、音質はイマイチですが、体調が戻ったらもう一度カメオ設定をやりなおしてみようと思います。

なお、プロンプトの書き方を工夫することで、架空の設定で動画を作成することができます。例えば、次のように格闘家としてバトルをする仮想世界も描けます。

どういう投げ方しているんだ?という疑問は残りますが、これらを量産して繋ぎ合わせることで自分の戦闘シーンなども作れそうですね。

他にどんな場面で映像を作ってみるか。遊び心がくすぐられます。

自分をフリー素材にできる?カメオの公開範囲設定

このように、自分を動画の登場人物にできるカメオ機能ですが、さらに特徴的なのは使用できるユーザーの範囲を指定できることです。

Screenshot

「私が承認したユーザー」や「相互」を選択することで、他のユーザーに自分のカメオを使わせることができます。家族や友人のカメオを用いて動画を作ることが可能です。

また、公開範囲を「全員」にすると、Soraのユーザー全員がその人のカメオを使えることになります。これは、言い換えれば「自分自身をフリー素材化できる」ということです。

世界中のユーザーの動画に自分を登場させることができます。もちろん、必ずしも良い使い方がされるとは限らないので、個人的には慎重に考えていくべきかと思いますが、OpenAI社のCEOサム・アルトマン氏は自らのカメオを公開し、実際に様々なユーザーの動画で「使われて」いるようです。

IP無法地帯? 日本のコンテンツが危機に

Sora2がリリースされた当初に話題になっていたのが、著作物も使用できる状態になっていたことです。実際、ドラゴンボール」「ポケモン」「ジブリ」など、日本の人気IP(Intellectual Property:知的財産)が無断使用されている動画が広がり、日本の権利者も遺憾の意を発していました。

ディズニーやハリウッドなど、米国のIPは使用できないようになっていたため、世界中で人気のある日本のIPには意図的に制限をかけていないのではという疑念も抱かれるほどでした。かつて、画像生成AIのChatGPT Image Generationが公開された際、「ジブリ風」のイラストで話題が拡散したこともあり、意図的に日本のIPを用いて「バズ」らせようとしていたことも考えられます。

しかし、10/15現在では、ドラゴンボールなど日本の著作物にもブロックがかかるようになっています。権利者から申し立てがあって、対応したものと考えられます。

Soraの登場で変わる今後の動画AIの展開

これまで見てきたように、Sora2は技術的にとても高いクオリティの動画を生成することができます。今後、商業面ではマーケティングや広告に活用されていくことが考えられます。

しかし、その完成度の高さゆえ、懸念も考えら得れます。フェイク動画が真実のように見られてしまうのです。中でも、政治や選挙への悪用リスクは非常に恐ろしいです。例えば、「某議員がステマをした証拠」などの捏造動画がSNSで拡散されると、それがさも真実かのように広まり、政治に直接的な影響を及ぼしてしまうのです。

事実だと思い込んでしまうクオリティのリアルさです。どれがリアルで、どれがフェイクなのかの見分けがつかなくなります。そうなると、基本的には「まず疑ってかかる」という意識になっていくでしょう。「これは本物の動画です」と言われても、誰も信じない時代が、早ければ来年には到来してしまうかもしれません。

また、芸能人やインフルエンサーのクローンが登場したり、バーチャルインフルエンサーが既存の芸能人の仕事を奪っていくことも考えられます。実際、ハリウッドではすでに「AIインフルエンサーとの契約問題」が勃発しています。仮想モデル「テレノーム・ウッド」との契約をめぐり、ハリウッドの芸能人たちが猛反発する状況になっています。

日本でも声優・緒方恵美さんが「声の無断クローン化」に強い警鐘を鳴らしています。アニメのキャラクター音声を学習させて実在する声優さんの声で勝手に喋らせることが、技術的にはもうすでに可能です。まさに職業価値の危機とも呼べる状況なのです。

そしてもうひとつの深刻な課題が、動画生成に伴うエネルギーの消費量です。Sora2で10秒の動画を生成するだけで、電子レンジ1回分の電力(700W)が必要と言われています。このまま動画生成AIが普及すると、2030年にはOpenAI社だけでドイツ1国分の電力を消費する見込みだと言われています。

また、AIのサーバーを冷却するための水の使用量も膨大になるため、貴重な水資源をコンピュータの冷却に使用するのか、人間が飲むのかという議論にまで発展する可能性があります。つまり、高度な技術があっても、それをフルに活用するための資源が不足するという事態に直面することになるのです。

まとめ

Sora 2は間違いなく、AI動画生成の歴史を塗り替える技術になることでしょう。しかし同時に、倫理・知財・エネルギー問題といった新たな課題も突きつけています。

「本物と偽物の区別がつかない時代」をどう生きるか—。Sora2は、その問いを我々に突きつけているのかもしれません。

執筆者

あわせて読みたい
小松 茂樹(こまつ しげき) 人材派遣会社、健康食品会社を経て、経営コンサルティング会社に勤務。2021年に独立し、株式会社ビジネスキャリア・コンサルティングを設立。理論的な背景と情熱的な語り口を交えた講演スタイルに定評があり、セミナーや研修で高い支持を得ている。リーダー人材や自律型人材の育成を主として活動する。
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次