Световни новини без цензура!
Колко добър е видеомоделът Sora на OpenAI — и ще трансформира ли работните места?
Снимка: ft.com
Financial Times | 2024-05-01 | 06:13:38

Колко добър е видеомоделът Sora на OpenAI — и ще трансформира ли работните места?

OpenAI демонстрира Sora, своя модел за генериране на видео с изкуствен интелект, на ръководители на медийната индустрия през последните седмици, за да събуди ентусиазъм и да облекчи опасенията относно потенциал за технологията да наруши определени сектори.

Файненшъл таймс искаше да подложи Sora — и нейните конкуренти — на изпитание.

Помолихме ръководители в областта на рекламата, анимацията и недвижимите имоти да напишат подкани за генериране на видеоклипове, които биха могли да използват в работата си. След това ги попитахме за мнението им за това как подобна технология може да промени работата им в бъдеще.

Sora все още не е пусната за обществеността, така че OpenAI промени някои от подканите, преди да изпрати получените клипове. На Runway и Pika първоначалните и променени подкани бяха въведени с помощта на най-модерните модели на двете компании. Ето резултатите.

Шарлот Бъниан, съосновател на Arq, консултант по реклама на марки

Ревизираната версия на OpenAI на подканата на Бъниан да създайте кампания за „добре познат супермаркет на главната улица“:

ExpandExpand

Описание на видеоклип

Генерирано от AI видео, базирано по преработена подкана от OpenAI.

© Sora/Pika/Runway

Видеоклиповете на Pike и Runway въз основа на оригиналната подкана на Bunyan:

ExpandExpand

Описание на видеоклипа

Видео, генерирано от AI въз основа на оригиналната подкана.

© Sora/Pika/Runway

„Представянето на хората от Сора беше последователно, докато действителната визуализация на фантастичната детска площадка беше вярно представен по отношение на описанията на различните елементи, които другите не успяха да генерират.

„Интересно е, че OpenAI промени „деца“ на „хора“ и бих искал да знам защо. Въпросът за защита ли е? По-трудно ли е да се представят деца, защото те не са били обучени на толкова много? Те избраха „хора“, а не кавказки мъж с брада и кафява коса, което всъщност генерира Сора, което повдига въпроси относно пристрастието.

„Пика се почувства сюрреалистично, сякаш се намирате в момент от филм. Детската версия е много по-добра от сюрреалистичността на Лигата на джентълмените на итерацията за възрастни, но в останалата част от средата липсват подробности от подканата. Наистина изпитвам известна привързаност към жизнеността на версията [на Пика за деца], тъй като тя предава усещане за радост и щастие по-силно от всяка друга.“

„Пистата беше много по средата. Разбира се, във версията за възрастни имаше по-малко проблеми, но представянето на елементите на детската площадка липсваше.

„Потенциално бих могъл да използвам видеоклипа на Sora като дегустация на нещо, което бихме могли да съживим във виртуален опит. Това би демонстрирало игривостта на храната. Въпреки това може да се наложи да добавите човешки слой към съдържанието, като използвате инструменти за редактиране.

„Тези инструменти ще ускорят начина, по който предаваме творчески идеи и ще ги направят по-осезаеми. Например, в ранните етапи на представяне на концепция на марка, това би улеснило клиентите да разберат как може да изглежда или как би работила.

„Моята подкана съдържа абстрактни творчески концепции които са по-трудни за тези инструменти. Често в света на творчеството се опитвате да създадете нещо, което не е съществувало преди. Знам, че има голяма загриженост и може би негативност относно това, че AI заема всичките ни работни места, но мисля, че трябва да обмислим как AI ще улесни работата ни и ще облекчи някои тежести.“

Алекс Уилямс, аниматор, чиито кредити включват „Кой подреди заека Роджър?“ и „Цар Лъв“

Видеоклипове, генерирани от преработената подкана на OpenAI:

ExpandExpand

Описание на видеоклипа

Видео, генерирано от изкуствен интелект въз основа на преработена подкана от OpenAI.

© Sora/Pika/Runway

„То има това леко преобразуване, което има работата, генерирана от AI, което не мисля, че все още го прави готов за клиент, но това е нещо, което ще бъде изгладено.

„Всеки един е невероятен по отношение на това, което така е, но всеки [има] очевидни грешки . . . като глави, променящи формата си и фламинго, смесващи се с други фламинго — все още не работи.“

„Не успя да произведе кратък филм с начало, среда и край, така че не успя направи това, което се надявах да стане. От друга страна, това, което прави по отношение на анимацията, е много впечатляващо.

„Откакто започнах да се занимавам с анимация през 80-те години, някои много значителни технологични постижения промениха много средата. Няма съмнение, че това е най-голямата промяна, която съм виждал в кариерата си.

„Бих направил сравнение с преминаването от 2D към 3D анимация, което се случи в края на 90-те, когато излезе „Играта на играчките“. . В началото имаше голяма съпротива сред общността на ръчно рисуваната анимация срещу тези промени, включително и мен.

„Отне ми няколко години, за да разбера, че трябва да прегърна тази промяна. Всички заедно се борихме с него за известно време, но той се превърна в големия касов двигател. Като индустрия ние наистина трябва да прегърнем технологиите, защото никога не искате да застанете на грешната страна.“

Ашли Шакибай, производствен мениджър в агенти за търговски недвижими имоти OBI Собственост

Видеоклипове, генерирани от подкана за промоционален видеоклип на търговска сграда в Манчестър:

ExpandExpand

Описание на видеоклипа

Видео, генерирано от AI въз основа на оригиналната подкана.

© Sora/Pika/Runway

„Сора свърши разумна работа в началото. Преходът винаги ще бъде труден и той се бореше с това. Но мисля, че фотореализмът в края на кадъра беше доста приятен и изненадващ.

„Технически подканата беше, че хората вървят в сградата, но това не беше показано и имаше много други елементи не постигна.

„Всичко, което Pika събра от подканата ми, е „слънчев ден“. Даде ни няколко ракети и няколко сгради, но не можете да различите хората.“

„Трябваше да се смея, когато гледах този Runway. Има малко повече фотореализъм, но хората вървят напред и после назад, така че със сигурност не е правдоподобна сцена.

„Като професионалист в индустрията очакванията ми са съвършенство. Търся видео с реалистично качество и изкуственият интелект вероятно никога няма да стигне дотам.

„В края на видеоклипа на Sora двойката разговаря в кафене, изглеждайки така, сякаш се забавляват. Това би бил шанс, който бихме използвали, за да продадем пространство за търговска собственост като удобство наблизо.

„В крайна сметка ще достигнем точка, в която това е невероятно мощен инструмент за творците, неизбежно елиминиращ използването на други инструменти. Sora ще предизвика сериозно борсовите уебсайтове и ролята на актьорите, които използваме сега.

„Трябва да сте много внимателни, когато добавяте компютърно генерирани изображения. Ако не е с цел, ако не е правдоподобно, може да бъде твърде разсейващо. Много е на етап тестване.“

Допълнителен репортаж от Madhumita Murgia

Източник: ft.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!