OpenAIの動画生成AI「Sora」とは?リリース時期や事例7選も紹介

OpenAI社が2024年2月に発表した動画生成AIのSora(ソラ)。公開されるやいなや、物理法則も反映したあまりにもリアルすぎる映像に、多くの人が驚きと興奮の声をあげました。

 

まだ一般には公開されていませんが、映画・アニメなどのエンタメ業界や広告業界などあらゆる業界に莫大な影響を与え得る存在として、世界中から注目されています。

 

本記事では、Soraについて基本的な事項からキャッチアップしておきたい方に向けて、Soraの基本からリリース時期・具体的な動画の事例までわかりやすくご紹介します。


またAI総研では、AI活用を検討する上で押さえておきたい、AI・ChatGPTの最新活用事例50選の狙いや取り組みをまとめたレポートを無料で配布しています。ご興味のある方は、以下リンクからダウンロードしてご活用ください。

AI・ChatGPT活用事例50選の資料ダウンロードはこちら(無料)

目次

OpenAIの動画生成AI「Sora(ソラ)」とは

OpenAIの動画生成AI「Sora(ソラ)」とは
(画像:OpenAI)

Sora(ソラ)は、OpenAI社が2024年2月に発表した動画生成AIです。OpenAI社のホームページでSoraが生成した動画が公開されるやいなや、現実と見間違うほどのクオリティの高さに世界中から驚きと興奮の声が上がりました。

 

特に、水の流れや窓に反射する景色など、物理法則を正しく反映した映像はAIの専門家をも驚かせています。

 

Soraは、まだ一般の方が利用することはできませんが、近い将来、映画・アニメ制作やプロモーション動画作成、ゲーム開発などあらゆる場面で利用されることが考えられます。

 

既存のサービスや産業構造を一気に塗り替えると考えられるため、今後の動向に大きな注目が集まっています。

動画生成AI「Sora(ソラ)」の4つの特徴

動画生成AI「Sora(ソラ)」の4つの特徴

動画生成AI「Sora」の特徴として、主に以下の4つが挙げられます。

 

  • ①物理法則も正確に再現
  • ②最大1分間の動画を生成可能
  • ③実写映像やアニメなど多様なスタイルに対応
  • ④現実にはあり得ない映像も再現

 

それぞれについてわかりやすく紹介していきます。

 

※生成AI/ChatGPTの活用を検討する際に必ず押さえておきたい、基礎知識から活用の進め方、ポイントまでをまとめた資料をダウンロード頂けます。
【ゼロから分かる】生成AI/ChatGPT活用ガイドブックの資料ダウンロードはこちら(無料)

①物理法則も正確に再現

①物理法則も正確に再現
(画像:OpenAI)

動画生成AIの大きな課題として、物理法則を動画に再現することが困難であるという点が挙げられます。

 

Soraは、人間や動物の複雑な動きや自然現象も、本物と見分けがつかないほど忠実に再現しており、AIの専門家をも驚愕させました。

 

例えば、上の動画は、東京の電車の窓から映る景色を表現したものですが、窓から反射して映る電車内の人の様子までリアルに再現されています。

②最大1分間の動画を生成可能

OpenAI社の公式サイトによると、Soraは、最大1分間の動画を生成することができるとのことです。

 

今後、継続的な改善を通じて、生成できる動画の時間は徐々に長くなっていくと考えられます。

③実写映像やアニメなど多様なスタイルに対応

③実写映像やアニメなど多様なスタイルに対応
(画像:OpenAI)

Soraは、まるで本物のようなリアルな映像の再現も得意ですが、ディズニーやピクサーを思い起こさせるアニメ調の映像の制作も可能です。

 

実写の映画やドラマだけでなくアニメ業界にも大きな影響をもたらすと考えられます。

④現実にはあり得ない映像も再現

④現実にはあり得ない映像も再現
(画像:OpenAI)

Soraは、現実に存在する映像だけでなく、現実にはありえない出来事や架空の生物も動画として再現することができます。

 

犬がポッドキャストを放送しているシーンや、架空のモンスターがろうそくを眺めているシーンが公開されており、話題を呼んでいます。

動画生成AI「Sora(ソラ)」のリリース時期は

動画生成AIのSoraは、2024年5月時点でまだ一般にはリリースされていません。2024年2月に公開されたOpenAI社の開発チームのインタビュー動画によれば、Soraはまだ試験段階であり、一般へのリリースは未定とのことです。

 

動画生成AIは、文章や画像などの他の生成AIと比べても、相当に高度な技術が必要であるため、リリースにはまだ時間がかかると予想されます。

 

現段階では、デザイナーやクリエイターなどの一部のユーザーに対してのみ限定公開され、フィードバックによる改善を繰り返しています。

 

参考:OpenAI社の開発チームのインタビュー動画

動画生成AI「Sora(ソラ)」の活用事例7選

動画生成AI「Sora(ソラ)」の活用事例7選

OpenAI社が公表している動画生成AI「Sora」の活用事例として、主に以下の7つが挙げられます。

 

  • ①東京の街を歩く女性:水たまりの反射やネオンの光までリアルに再現
  • ②ポッドキャストを放送する犬:現実にはありえない出来事も簡単に再現
  • ③雪の上を走るマンモス:動物の複雑な動きも忠実に再現
  • ④岸壁に打ち寄せる波:複雑な波の動きやしぶきまで完璧に再現
  • ⑤火を眺める架空のモンスター:アニメ調の映像も色鮮やかに再現
  • ⑥ナイジェリアの街並み:未来の街並みと人々を美しく再現
  • ⑦女性を起こす猫:猫の前足が3本になるというエラーが含まれた動画

 

それぞれについてわかりやすく紹介していきます。

 

※国内外の最新生成AI/ChatGPT活用事例50選をまとめた資料をダウンロード頂けます。
生成AI/ChatGPT活用事例50選の資料ダウンロードはこちら(無料)

①東京の街を歩く女性:水たまりの反射やネオンの光までリアルに再現

OpenAIの動画生成AI「Sora(ソラ)」とは
(画像:OpenAI)

この動画は、東京のネオン街をサングラスを掛けた女性が歩いている様子を表現したものです。女性の挙動や歩き方を本物の人間そっくりの自然な動きで表現しているだけでなく、髪の生え際や顔の動きなどの細かいところまで忠実に再現しています。

 

また、水たまりに反射する建物やネオン街の光も写真のようにリアルに再現しており、物理法則まで正確に反映した映像化に成功しています。

 

実際に人間の俳優を撮影しなくても、ドラマや実写映画を自動で制作できる時代がすぐそこまで迫っていることを感じさせる動画です。

②ポッドキャストを放送する犬:現実にはありえない出来事も簡単に再現

④現実にはあり得ない映像も再現
(画像:OpenAI)

この動画は、山の斜面で2匹の犬がポッドキャストを放送している様子を表現したものです。このような現実では再現できないような映像も、テキストの指示だけで、簡単に再現することが可能となっています。

 

現実にはあり得ない出来事の映像化には高度なCG技術が必要でしたが、Soraによりテキストの指示だけで簡単に再現できるようになることで、映像業界に大きな影響をもたらすと考えられます。

③雪の上を走るマンモス:動物の複雑な動きも忠実に再現

雪の上を走るマンモス:動物の複雑な動きも忠実に再現
(画像:OpenAI)

この動画は、2頭のマンモスが雪の上を走っている様子を再現したものです。動物の複雑な動きを違和感なく忠実に再現しています。

 

マンモスの動きに合わせて、地面の雪が舞い上がる様子までリアルに再現されており、本物の動画のような迫力とリアリティのある映像の作成に成功しています。

 

絶滅した動物の映像での再現は、将来的に、博物館での展示や研究者による研究材料としても活用されるかもしれません。

④岸壁に打ち寄せる波:複雑な波の動きやしぶきまで完璧に再現

④岸壁に打ち寄せる波:複雑な波の動きやしぶきまで完璧に再現
(画像:OpenAI)

この動画は、岸壁に打ち寄せる波の様子を再現したものです。複雑な波の動きやしぶきが跳ねる様子、海面の色合いまで、本物の海のように完璧に表現しています。

 

このような自然界の複雑な動きも、物理法則を加味して完璧に再現できているため、将来的には、実際にロケ地に行かずにリアルな自然の風景の動画を作成することも可能になると考えられます。

⑤火を眺める架空のモンスター:アニメ調の映像も色鮮やかに再現

火を眺める架空のモンスター:アニメ調の映像も色鮮やかに再現
(画像:OpenAI)

この動画は、ふわふわの毛が生えた架空のモンスターがろうそくの火を見つめる様子を再現したものです。

 

アニメ調に近いスタイルの動画となっており、ディズニーやピクサーなどの映像を彷彿とさせます。

 

このようにSoraは、写真のようなリアルな動画だけでなく、アニメ調の動画にも対応しており、アニメ業界にも革命をもたらすと考えられます。

⑥ナイジェリアの街並み:未来の街並みと人々を美しく再現

⑥ナイジェリアの街並み:未来の街並みと人々を美しく再現
(画像:OpenAI)

この動画は、2056年のナイジェリアの街並みと人々の様子を再現したものです。大勢の人々を一人一人リアルに再現していることに加え、遠くに見える街の景色などを本物の写真のようにリアルに再現しています。

 

複雑な街の景色や大勢の人々を余すところなく再現し切っており、技術力の高さがうかがえます。

⑦女性を起こす猫:猫の前足が3本になるというエラーが含まれた動画

女性を起こす猫:猫の前足が3本になるというエラーが含まれた動画
(画像:OpenAI)

この動画は、ベッドの上で眠っている女性を起こす猫の様子を再現したものです。

 

猫や女性の姿はもちろん、布団や枕のしわまで忠実に再現しています。しかし、よく見ると途中で猫の前足が3本になっているなど、誤りも含まれていることがわかります。

【2024年最新】生成AIのおすすめサービス/ツール9選

【2024年最新】生成AIのおすすめサービス/ツール9選

生成AIのおすすめサービス/ツール9選は、以下の通りです。

 

  • ①ChatGPT:OpenAIが開発し、世界中で最も使われているAIツール
  • ②Copilot:Microsoft×OpenAIが実装するAIアシスタント
  • ③Gemini:マルチモーダル機能を備え「GPTを超える」と言われているGoogleの対話型AI
  • ④Stable Diffusion:オープンソースとして無料で公開されている画像生成AI
  • ⑤Midjourney:Discord上で利用できるハイクオリティな画像生成AI
  • ⑥DALL・E2:OpenAIが提供するクリエイティブな画像生成AI
  • ⑦VALL-E:感情の起伏や抑揚も再現するMicrosoftの音声合成AI
  • ⑧Voicevox:アニメキャラクターが音声を読み上げる日本発の音声合成ソフトウェア
  • ⑨Lumiere:Googleが開発した自由な編集が可能な動画生成AI

 

それぞれについてわかりやすく紹介していきます。

 

※生成AIツールの導入を検討される方に、おすすめの10大生成AIツールの特徴や選び方、活用方法をまとめた資料をダウンロード頂けます。
10大生成AIツール徹底比較の資料ダウンロードはこちら(無料)

①ChatGPT:OpenAIが開発し、世界中で最も使われているAIツール

ChatGPT:OpenAIが開発し、世界中で最も使われているAIツール

ChatGPTとは、人間と会話しているような形式でやりとりができるAIツールのことです。

ユーザーの指示に基づき、質問への回答や文章の要約/翻訳、メールや企画書の文書作成などの幅広い知的作業を自動で行うことが可能です。

 

ChatGPTのGPTとは「Generative Pre-traind Transfomer」の略で、本に換算すると約25万冊分以上の、圧倒的に大規模な言語データを事前に学習させることで、従来人間にしかできなかった知的な作業を高精度で実施することが可能となっています。

 

ChatGPTは、アメリカのスタートアップ企業のOpenAI社により、2022年11月にリリースされました。その後、リリースから5日間で100万人、2ヶ月で1億人と世界最速でユーザーを獲得したサービスとなり、大きな注目を集めています。

 

使い方次第で仕事の生産性や効率を大幅に上げることができるので、すべてのビジネスパーソンが使いこなせるようになるべきツールと言えます。

 

※これさえ読めば、ChatGPTの機能・できること・活用方法まで全てわかる、最新情報をまとめた資料をダウンロード頂けます。
【5分でわかる】ChatGPT活用ガイドブックの資料ダウンロードはこちら(無料)

②Copilot:Microsoft×OpenAIが実装するAIアシスタント

Copilot:Microsoft×OpenAIが実装するAIアシスタント
(画像:Microsoft)

Copilot は、MicrosoftがブラウザやWindow OS向けに提供しているAIチャットアシスタントです。Microsoftの提携先であるOpenAIのAIモデル「GPT-4」や「DALL-E 3」を搭載し、文章生成や対話を行うことができます。

 

Copilotは、「副操縦士」のことであり、AIがまるで副操縦士のように人間のタスクをサポートするという意味がこめられています。

 

さらに、Microsoft 365と組み合わせた「Copilot for Microsoft 365」では、普段利用するWordやPowerPoint、ExcelとCopilotが連携し、Copilotの助けを得ながら文書やプレゼン資料を作成することができます。

 

WordやExcelなどMicrosoftのアプリケーションを利用する多くのビジネスパーソンにとって、Copilotは仕事の生産性や効率を高める強力なツールとなります。

③Gemini:マルチモーダル機能を備え「GPTを超える」と言われているGoogleの対話型AI

Gemini:マルチモーダル機能を備え「GPTを超える」と言われているGoogleの対話型AI
(画像:Google)

Geminiとは、Googleが2023年12月に発表した対話型AIです。文章だけでなく、画像や動画、音声も理解できる”マルチモーダル機能”を備えている点が特徴で、複雑な数学の問題やプログラミング言語の理解など、難しいタスクもこなすことができると発表されています。

 

Geminiは性能に応じて3つのモデル「Gemini Ultra」、「Gemini Pro」、「Gemini Nano」に分かれています。最も性能の高いGemini Ultraは、数学、物理学、歴史、法律、医学、倫理など、あらゆる科目の知識・問題解決能力テストで人間の専門家を上回るパフォーマンスを発揮したと発表されています。

 

Googleは、GeminiがGPT-4を上回る性能を持つと強調しており、ChatGPTの有力な対抗馬として注目されています。

 

専門的で高度な内容を扱う研究職・専門職の方にとって、強力な味方になると考えられます。

④Stable Diffusion:オープンソースとして無料で公開されている画像生成AI

Stable Diffusion:オープンソースとして無料で公開されている画像生成AI
(画像:Stability AI)

Stable Diffusionは、イギリスのAIベンチャーStability AIが開発・提供している画像生成AIです。

 

Stable Diffusionの重要な特徴として、オープンソースとして無料で公開されている点が挙げられます。これは、「誰もが自由にAI技術を活用できるようになるべきである」というStability AIの考えに基づくものです。その結果、多くのユーザーから支持を集め、一気に知名度が高まりました。

 

2023年には、日本法人Stability AI Japan株式会社が設立され、日本向けのサービス提供も本格的に始動しています。

 

無料で使えるため、AIツール初心者やライトユーザーにおすすめのツールです。

⑤Midjourney:Discord上で利用できるハイクオリティな画像生成AI

Midjourney:Discord上で利用できるハイクオリティな画像生成AI
(画像:Midjourney)

Midjourneyは、日本でも多くのユーザーに利用されている最も有名なハイクオリティ画像生成AIです。チャットアプリであるDiscord上で利用でき、単語や文章などのテキストを入力するだけで簡単に画像を作成することが可能です。

 

日々バージョンが更新され、よりクオリティの高い画像を生成できるようになっており、アニメやマンガのイラスト作成やプレゼン資料の作成など様々な場面で活用することができます。

 

料金プランは、10ドルから120ドルまで複数用意されており、使う頻度や目的によって自由に選択することができます。そのため、気軽に画像生成で遊んでみたい方にとっても、本格的に仕事で使いたい方にとってもおすすめです。

⑥DALL・E2:OpenAIが提供するクリエイティブな画像生成AI

DALL・E2:OpenAIが提供するクリエイティブな画像生成AI
(画像:OpenAI)

DALL・E2(ダリ ツー)はChatGPTをリリースしたOpenAIが提供する画像生成AIツールです。

 

DALL・E2の特徴として、現実にはあり得ない奇想天外でクリエイティブな画像を生成できる点が挙げられます。例えば、「An astronaut riding a horse in photorealistic style.」(馬に乗っている宇宙飛行士の写実感のある画像)という一見想像しがたい画像も、上のように忠実に生成することができます。

 

回数制限はありますが、無料で利用することも可能なので、気軽に画像生成を試してみたい方にもおすすめです。

 

※ChatGPTや生成AIツールを活用する際に、コピペで使える定番のプロンプト21選や、上手に書くコツをまとめた資料をダウンロード頂けます。
ChatGPT/生成AIツールの定番プロンプト21選の資料ダウンロードはこちら(無料)

⑦VALL-E:感情の起伏や抑揚も再現するMicrosoftの音声合成AI

VALL-E:感情の起伏や抑揚も再現するMicrosoftの音声合成AI
(画像:Microsoft)

VALL-Eは、Microsoftがリリースした音声合成AIです。たった3秒間の音声から様々な人の声を再現することができます。

 

単にテキストを読み上げるだけでなく、抑揚やトーンも調整したより人間に近い自然な音声を生成できる点が特徴です。

 

メインの言語は英語ですが、最新版であるVALL-E-Xを用いれば、日本語の音声を英語に変換して再現することが可能となります。

 

カスタマーセンターでの顧客対応や動画コンテンツの制作、学習教材など様々な場面で利用することができます。

⑧Voicevox:アニメキャラクターが音声を読み上げる日本発の音声合成ソフトウェア

Voicevox:アニメキャラクターが音声を読み上げる日本発の音声合成ソフトウェア
(画像:ヒホ(ヒロシバ))

Voicevoxはテキスト読み上げ、歌声合成AIソフトウェアです。ヒホ(ヒロシバ)というエンジニアが開発したツールで、商用・非商用を問わず無料で使うことができます

 

特徴としては、AIのディープラーニングによりイントネーションの調節も可能である点、アニメ調のキャラクターにテキストを音読させることができる点、オープンソースで構築されており様々なアプリやツールとの連携が可能である点などが挙げられます。

 

また、日本人の開発者が開発した日本語ベースのサービスであるため、日本人でも気軽に始められます。

 

無料で利用できる点やアニメ好きが多い日本人の好みにマッチしている点から、個人利用目的でのユーザーが多くなっています。

⑨Lumiere:Googleが開発した自由な編集が可能な動画生成AI

Lumiere:Googleが開発した自由な編集が可能な動画生成AI
(画像:Google)

Lumiereは、Googleの研究部門Google Researchが提供する動画生成AIです。まだ一般公開されていませんが、テキストや画像から1024×1024ピクセルの5秒間の動画を生成することができます。

 

画像の一部だけを動かしたり、動画の一部を修正することもでき、映像制作のクオリティや効率を格段に向上させることが期待できます。

 

Googleは、「Lumiereの目的は、初心者ユーザーでも創造性のあるビジュアルコンテンツを生成できるようにすることである」と発表しており、将来、一般の方にもLumiereを公開すると考えられます。

AI・ChatGPT活用の個別無料相談会実施中

AI総研では、AI・ChatGPT活用の個別無料相談会を実施しています。

各社様のご要望に合わせ、最新の市場動向や具体的な活用アイデアなどを、個別のオンライン個別のオンラインMTGにて、無料でご紹介させていただきます。

 

以下のようなお悩みをお持ちのご担当者様は、この機会にぜひお申込みください。

  • 興味はあるが、そもそも活用するかどうか迷っている
  • 自社に合った活用方法へのアドバイスが欲しい
  • 自社の企画の参考になる活用事例を知りたい
  • どのように活用を進めていけば良いか分からず困っている

AI・ChatGPT活用の個別無料相談会の詳細はこちら

お問い合わせ

お客様のAI・ChatGPT活用推進に向け、戦略策定から実行支援までサポートします。お気軽にお問い合わせください。

お問い合わせ

まずは問い合わせてみる >

個別無料相談

ご担当者様のお悩み解決に向けたアイデアや最新ノウハウを無料でご提供いたします。お気軽にご相談ください。

個別無料相談

無料で相談する >

資料ダウンロード

サービス紹介資料やお役立ち資料をダウンロードいただけます。AI・ChatGPT活用をご検討の方はぜひご一読ください。

資料ダウンロード 資料をダウンロードする >