早くて安い
新しいテクノロジーを最初に実験するのはアーティストであることがよくあります。 しかし、ジェネレーティブ ビデオの当面の未来は、広告業界によって形作られています。 ウェイマークが作成されました ザ・フロスト 生成 AI を自社製品にどのように組み込むことができるかを調査するためです。 同社は、コマーシャルを迅速かつ安価に作成する方法を探している企業向けにビデオ作成ツールを作成しています。 Waymark は、Softcube や Vedia AI などの企業と並び、数回クリックするだけでクライアントにオーダーメイドのビデオ広告を提供するスタートアップ企業の 1 つです。
今年の初めに発表された Waymark の現在の技術は、大規模な言語モデル、画像認識、音声合成など、いくつかの異なる AI 技術を組み合わせて、その場でビデオ広告を生成します。 Waymark は、以前の顧客向けに作成された AI 以外のコマーシャルの大規模なデータ セットも利用しました。 「当社には何十万ものビデオがあります」と CEO の Alex Persky-Stern 氏は言います。 「私たちはそれらの最良のものを抽出し、優れたビデオがどのようなものであるかについてトレーニングしました。」
Waymark のツールは、月額 25 ドルからの段階的サブスクリプション サービスの一部として提供されており、ユーザーが自分のビジネス用の Web アドレスまたはソーシャル メディア アカウントを入力すると、ツールが起動して、見つけられるすべてのテキストと画像を収集します。 次に、そのデータを使用してコマーシャルを生成し、OpenAI の GPT-3 を使用して、ビジネスを強調する選択された画像上で合成音声によって読み上げられるスクリプトを作成します。 1 分間の洗練されたコマーシャルを数秒で生成できます。 ユーザーは必要に応じて、スクリプトの微調整、画像の編集、別の音声の選択など、結果を編集できます。 Waymark によれば、これまでに 10 万人以上がそのツールを使用したという。
問題は、すべての企業がウェブサイトや画像を持っているわけではないことだ、とパーカー氏は言います。 「会計士やセラピストは資産をまったく持っていない可能性があります」と彼は言います。
Waymark の次のアイデアは、まだ画像やビデオを持っていない、または持っているものを使いたくない企業のために、生成 AI を使用して画像やビデオを作成することです。 「それが制作の背後にある推進力です ザ・フロスト」とパーカーは言います。 「世界と雰囲気を創造する。」
ザ・フロスト 確かに雰囲気はあります。 しかし、ジャンキーでもあります。 「これは決して完璧なメディアではありません」とルービン氏は言います。 「顔の感情的な反応など、DALL-E から特定のことを理解するのは少し苦労しました。 しかし、それは私たちを喜ばせることもありました。 私たちは『何ということだ、これは私たちの目の前で魔法が起こっているのだ』と思いました。」
この行き当たりばったりのプロセスは、テクノロジーが向上するにつれて改善されるでしょう。 Waymarkが作っていたDALL-E 2 ザ・フロスト、ちょうど1年前にリリースされました。 短いクリップを生成するビデオ生成ツールが登場してからわずか数か月です。
このテクノロジーの最も革新的な点は、いつでも必要なときに新しいショットを生成できることです。「15 分間の試行錯誤で、シーケンスに完全に適合する希望のショットが得られます。」とルービン氏は言います。 彼はフィルムを切り取って、山腹のブーツのクローズアップなど、特定のショットが必要だったことを覚えています。 DALL-E なら、ただ電話をかけるだけで済みます。 「それは驚くべきことです」と彼は言います。 「そのときから、映画製作者として本当に目を見張るような経験が始まりました。」