絵に描いた餅状態のSoraに、今すぐ使えるライバルAIが登場しました。
生成AIグラビアをグラビアカメラマンが作るとどうなる?第26回:ローカルで使えるSD3 Mediumリリース!実力を試す(西川和久)
OpenAIのSoraはそのリアルな動きで脚光を浴びましたがまだ一般公開されていません。
そのため、この技術をオープン実装したOpen-Soraが登場し、さらに中国のKLINGというアプリはSoraを超えた作例が出てきています。
しかし、KLINGを利用するには中国の電話番号を取得している必要があるなど、残りの国は高性能なビデオAIを手にいれる手段がありません。しかし、それも今日まで。LumaのDream Machineという動画AIがSoraクラスの動画を生成できることで中おくを浴びています。
方法はシンプルで、テキストプロンプトと、画像アップロードの2種類またはその組み合わせによるもので、プロンプト補完以外のパラメータや操作画面はありません。
試しにいくつかやってみました。
まず、テキストプロンプトのみ。1360 × 752、24FPSで5秒間のMP4ファイルが生成されました。生成される動画のリアルさに加え、高速生成もウリ。120フレームを120秒で生成できるそうです。
次に、既存の写真をアップロードして、a girl is on a trainなどのシンプルなテキストプロンプトで指示。
これまで使ってきた動画AIの中では最も安定度の高いImage to Video性能を持っていると言えます。
現在はResearch Preview Pricingということで、1カ月30本の生成が可能ですが、有償のサブスクリプションプランも用意されています。30本分全てを消費する前にリミットオーバーの表示が出たので、Standard Plan(月額29.99ドル)を購読しました。それだけの価値はあると思っています。
急激に人気が高まったため、キュー待ちがすごいことになっています。上記の作例も、1本生成するのに2時間以上かかったものもあります。しかし、有償ユーザーとなった後は、1分ほどで生成に取り掛かれています。
これらの動画をオリジナルの写真とつなげて曲にまとめてみました。
曲はSunoで「Dream Machine」をテーマに作り、Logic Pro 11のStem Splitterで分離したボーカルを、Vocoflexで妻の声に置き換えたものです。
もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術(CloseBox)
画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説(生成AIウィークリー)
超長くてたくさんの資料も放り込めば、まとめてブレストにも付き合ってくれる有能助手「NotebookLM」の始め方(Google Tales)