Световни новини без цензура!
Мона Лиза рапира? Нов AI на Microsoft анимира лица от снимки
Снимка: cnn.com
CNN News | 2024-04-21 | 09:20:36

Мона Лиза рапира? Нов AI на Microsoft анимира лица от снимки

Мона Лиза вече може да прави повече от това да се усмихва, благодарение на новата технология за изкуствен интелект от Microsoft.

Миналата седмица изследователите на Microsoft описаха нов AI модел, който са разработили, който може да заснеме неподвижно изображение на лице и аудио клип на някой, който говори, и автоматично да създаде реалистично изглеждащо видео на този човек, който говори. Видеоклиповете – които могат да бъдат направени от фотореалистични лица, както и от карикатури или произведения на изкуството – са допълнени със завладяващо синхронизиране на устните и естествени движения на лицето и главата.

В едно демонстрационно видео изследователите показаха как анимират Мона Лиза да рецитира комедиен рап от актьора Ан Хатауей.

Резултатите от AI модела, наречен VASA-1, са едновременно забавни и малко потресаващи в своята реалност. Microsoft каза, че технологията може да се използва за образование или „подобряване на достъпността за хора с комуникационни предизвикателства“, или потенциално за създаване на виртуални спътници за хора. Но също така е лесно да се види как с инструмента може да се злоупотребява и да се използва за представяне на истински хора.

Това е проблем, който надхвърля Microsoft: тъй като се появяват повече инструменти за създаване на убедителни изображения, видео и аудио, генерирани от AI, експертите се притесняват, че злоупотребата им може да доведе до нови форми на дезинформация. Някои също се притесняват, че технологията може допълнително да наруши творческите индустрии от филма до рекламата.

Засега Microsoft каза, че не планира да пусне модела VASA-1 на обществеността веднага. Ходът е подобен на начина, по който партньорът на Microsoft OpenAI се справя с притесненията около своя генериран от AI видео инструмент Sora: OpenAI дразни Sora през февруари, но досега го е предоставил само на някои професионални потребители и професори по киберсигурност за целите на тестването.

„Ние се противопоставяме на всяко поведение за създаване на подвеждащо или вредно съдържание на реални лица“, казаха изследователи на Microsoft в публикация в блог. Но, добавиха те, компанията "няма планове да пусне" продукта публично, "докато не сме сигурни, че технологията ще се използва отговорно и в съответствие с правилните разпоредби."

Кара лицата да се движат

Новият AI модел на Microsoft е обучен на многобройни видеоклипове на лицата на хората, докато говорят, и е проектиран да разпознава естествените движения на лицето и главата, включително „движение на устните, изражение (без устни), поглед и мигане, между другото“, казаха изследователите. Резултатът е по-реалистично видео, когато VASA-1 анимира неподвижна снимка.

Например, в едно демонстрационно видео, настроено на клип на някой, който звучи развълнуван, очевидно докато играе видеоигри, говорещото лице има сбръчкани вежди и свити устни.

AI инструментът може също да бъде насочен за създаване на видеоклип, в който обектът гледа в определена посока или изразява специфична емоция.

При внимателно вглеждане все още има признаци, че видеоклиповете са машинно генерирани, като рядко мигане и преувеличени движения на веждите. Но Microsoft каза, че вярва, че неговият модел „значително превъзхожда“ други, подобни инструменти и „проправя пътя за ангажираност в реално време с реалистични аватари, които емулират човешкото поведение при разговор“.

Източник: cnn.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!