Световни новини без цензура!
Sora е новият генератор на текст към видео OpenAI на създателя на ChatGPT. Ето какво знаем за новия инструмент
Снимка: apnews.com
AP News | 2024-02-16 | 20:57:20

Sora е новият генератор на текст към видео OpenAI на създателя на ChatGPT. Ето какво знаем за новия инструмент

НЮ ЙОРК (AP) — Създателят на ChatGPT сега се гмурка във видео, генерирано от AI.

Запознайте се със Sora — новото преобразуване на текст към видео на OpenAI генератор. Инструментът, който компанията от Сан Франциско представи в четвъртък, използва генеративен изкуствен интелект за незабавно създаване на кратки видеоклипове въз основа на писмени команди.

Sora не е първата, която демонстрира този вид технология. Но анализаторите в индустрията посочват високото качество на показваните досега видеоклипове на инструмента и отбелязват, че въвеждането му бележи значителен скок както за OpenAI, така и за бъдещето на генерирането на текст към видео като цяло.

И все пак, както при всички неща в бързо разрастващото се пространство на ИИ днес, такава технология също поражда страхове относно потенциални етични и обществени последици. Ето какво трябва да знаете.

КАКВО Е SORA? МОГА ЛИ ДА ГО ИЗПОЛЗВАМ ВЕЧЕ?

Sora е генератор на текст към видео — създава видеоклипове с дължина до 60 секунди въз основа на писмени подкани с помощта на генериращ AI. Моделът може също да генерира видео от съществуващо неподвижно изображение.

Generative AI е клон на AI, който може да създаде нещо ново. Примерите включват чатботове, като ChatGPT на OpenAI, и генератори на изображения като DALL-E и Midjourney. Получаването на AI система за генериране на видеоклипове е по-ново и по-предизвикателно, но разчита на част от същата технология.

Sora все още не е достъпна за обществено използване (OpenAI казва, че се ангажира с политици и артисти, преди официално да пусне инструмент) и има много неща, които все още не знаем. Но след съобщението в четвъртък компанията сподели няколко примера за видеоклипове, генерирани от Sora, за да покаже какво може да направи.

Главният изпълнителен директор на OpenAI Сам Алтман също се обърна към X, платформата, известна преди като Twitter, за да помоли потребителите на социалните медии да изпращат навременни идеи. По-късно той сподели видеоклипове с реалистични детайли, които отговарят на подкани като „два златни ретривъра, подкастиращи на върха на планина“ и „велосипедно състезание в океана с различни животни като атлети, каращи велосипеди с изглед от камера с дрон“.

Докато видеоклиповете, генерирани от Sora, са в състояние да изобразят сложни, невероятно детайлни сцени, OpenAI отбелязва, че все още има някои слабости - включително някои пространствени и причинно-следствени елементи. Например OpenAI добавя на своя уебсайт, „човек може отхапете от бисквитка, но след това бисквитката може да няма следа от ухапване.“

ИМА ЛИ ДНЕС ДРУГИ ВИДЕО ИНСТРУМЕНТИ, ГЕНЕРИРАНИ ОТ AI?

Sora на OpenAI не е не е първият по рода си. Google, Meta и стартъпът Runway ML са сред другите компании, демонстрирали подобна технология.

Все пак анализаторите в индустрията подчертават очевидното качество и впечатляващата дължина на споделените видеоклипове на Sora Fred Havemeyer, ръководител на американския AI и софтуерни изследвания в Macquarie, каза, че стартирането на Sora бележи голяма крачка напред за индустрията.

„Не само можете да правите по-дълги видеоклипове, доколкото разбирам, до 60 секунди, но и създаваните видеоклипове изглеждат по-нормални и изглежда, че всъщност зачитат повече физиката и реалния свят“, каза Хавемайер. „Вие не получавате толкова много видеоклипове или фрагменти от „зловеща долина“ във видео емисиите, които изглеждат ... неестествено.“

Въпреки че има „огромен напредък“ в генерираното от AI видео през последното година — включително въвеждането на Stable Video Diffusion миналия ноември — старши анализаторът на Forrester Роуън Къран каза, че подобни видеоклипове изискват повече „сглобяване“ за съгласуваност на характера и сцената.

Постоянството и дължината на видеоклиповете на Sora обаче представляват „ нови възможности за творците да включат елементи от видео, генерирано от изкуствен интелект, в по-традиционно съдържание и сега дори да генерират пълноценни наративни видеоклипове от една или няколко подкани“, каза Къран пред Асошиейтед прес по имейл в петък.

КАКВИ СА ПОТЕНЦИАЛНИТЕ РИСКОВЕ?

Въпреки че способностите на Sora изумиха наблюдателите от пускането в четвъртък насам, безпокойството относно етичните и обществени последици от използването на видео, генерирано от AI, също остава.

Хейвмайер посочва например значителните рискове в потенциално напрегнатия изборен цикъл през 2024 г. Наличието на „потенциално магически“ начин за генериране на видеоклипове, които могат да изглеждат и звучат реалистично, представлява редица проблеми в политиката и извън нея, добави той – посочвайки опасенията за измама, пропаганда и дезинформация.

„Отрицателните външни ефекти на генеративният AI ще бъде критична тема за дебат през 2024 г.“, каза Хавемайер. „Това е съществен проблем, с който всеки бизнес и всеки човек ще трябва да се изправи тази година.“

Технологичните компании все още решават, когато става въпрос за управление на ИИ и неговите рискове, докато правителствата по света работят за улавяне нагоре. През декември Европейският съюз постигна споразумение относно първите в света всеобхватни правила за ИИ, но актът няма да влезе в сила до две години след окончателното одобрение.

В четвъртък OpenAI заяви, че предприема важни стъпки за безопасност преди да направим Sora широко достъпна.

„Ние работим с червени екипи – експерти по домейни в области като дезинформация, насаждащо омраза съдържание и пристрастия – които ще тестват конкурентно модела“, пише компанията. „Ние също изграждаме инструменти, които да помогнат за откриването на подвеждащо съдържание, като например класификатор за откриване, който може да разбере кога видеоклипът е генериран от Sora.“

Вицепрезидентът по глобалните въпроси на OpenAI Anna Makanju повтори това, когато говори в петък на Мюнхенската конференция по сигурността, където OpenAI и 19 други технологични компании обещаха да работят доброволно заедно за борба с генерираните от AI дълбоки фалшификации на избори. Тя отбеляза, че компанията пуска Sora „по начин, който е доста предпазлив“.

В същото време OpenAI разкри ограничена информация за това как е създадена Sora. Техническият доклад на OpenAI не разкрива какви изображения и видео източници са използвани за обучение на Sora - и компанията не отговори веднага на искането на Associated Press за допълнителен коментар в петък.

Изданието на Sora също пристига на фона на фона на съдебни дела срещу OpenAI и неговия бизнес партньор Microsoft от някои автори и The New York Times за използването на защитени с авторски права писмени произведения за обучение на ChatGPT. OpenAI плаща неразкрита такса на Асошиейтед прес, за да лицензира своя архив с текстови новини.

________________

О’Брайън съобщи от Провидънс, Роуд Айлънд.

Източник: apnews.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!