Световни новини без цензура!
OpenAI казва, че работи върху AI, който имитира човешки гласове
Снимка: cnn.com
CNN News | 2024-04-02 | 22:33:38

OpenAI казва, че работи върху AI, който имитира човешки гласове

OpenAI представи нов инструмент за изкуствен интелект, който може да имитира човешки гласове със стряскаща точност. Генераторът на AI глас има набор от потенциални приложения, включително за услуги за достъпност, но също така може да предизвика опасения относно дезинформация и други форми на злоупотреба.

OpenAI в петък сподели проби от ранните тестове на инструмента, наречен Voice Engine, който използва 15-секундна извадка от някой, който говори, за да генерира убедителна реплика на неговия глас. След това потребителите могат да предоставят параграф от текст и инструментът ще го прочете в гласа, генериран от AI.

Има няколко гласови услуги, генерирани от изкуствен интелект, които вече са достъпни за обществеността, но, както се случи с пробивния чатбот ChatGPT, OpenAI се оказа особено умел в набирането на широко приемане на инструменти за изкуствен интелект.

Инструмент за преобразуване на текст към глас с AI може да помогне с превод, помощ при четене за деца или подпомагане на хора, които са загубили способността си да говорят, казва компанията. Но някои скептици се притесняват, че това може също да подхрани създаването на дезинформация или да улесни извършването на измами.

OpenAI казва, че Voice Engine в момента се използва само от „малка група доверени партньори“, включително компании за образователни и здравни технологии, и ще използва техните тестове, за да определи дали и как да позволи по-широко използване. Тези тестери са се съгласили да не пресъздават гласовете на хората без тяхното изрично съгласие и ясно да идентифицират на слушателите, че това, което чуват, е генерирано от AI, според компанията.

„Ние осъзнаваме, че генерирането на реч, която наподобява гласовете на хората, крие сериозни рискове, които са особено важни в година на избори“, каза OpenAI в публикация в блог. Компанията призна необходимостта от големи промени, тъй като аудиото, генерирано от AI, става все по-широко достъпно, въпреки че не планира да пусне гласовия двигател на обществеността незабавно. Например, компанията предложи постепенно премахване на гласово удостоверяване за банкови сметки.

„Всяко широко разгръщане на синтетична гласова технология трябва да бъде придружено от изживявания за удостоверяване на глас, които потвърждават, че оригиналният говорител съзнателно добавя гласа си към услугата и списък със забранени гласове, който открива и предотвратява създаването на гласове, които са твърде подобни на видните цифри“, каза OpenAI.

Voice Engine може да използва гласова проба на един език, за да създаде реплика на глас, която може да говори на множество други езици.

Публикацията в блога му включва пример за аудио клип на човек, който чете пасаж за приятелството, заедно с генерирано от AI аудио, което звучи като същия човек, който чете същия пасаж на испански, мандарин, немски, френски и японски. Във всяка от семплите, генерирани от AI, тонът и акцентът на оригиналния говорител се запазват.

По-долу са аудио примери от OpenAI, които показват как работи Voice Engine. Първият аудио клип е реалната човешка реч, която е използвана като вход за инструмента.

Това е клипът на истински човешки глас, въведен в Voice Engine на OpenAI.

Източник: OpenAI

Следващият аудио клип е генерираният от AI глас, създаден от Voice Engine въз основа на горната човешка реч и писмен абзац, който казва на машината какво да каже.

Това е полученият гласов клип, генериран от AI, генериран от Voice Engine въз основа на човешка извадка.

Източник: OpenAI

Визуализацията на Voice Engine идва, докато потребителите очакват публичното пускане на Sora, видео инструментът, генериран от AI, който OpenAI дразни миналия месец. Sora може да създава реалистично изглеждащи 60-секундни видеоклипове от текстови инструкции, с възможността да сервира сцени с множество герои, специфични типове движение и сложни детайли на фона. ChatGPT на OpenAI може също да генерира изображения от текстова подкана.

Отделно, OpenAI също обяви в понеделник, че прави ChatGPT достъпен за всеки, без да е необходимо да се регистрирате, за да използвате услугата.

Компанията отбеляза, че може да използва всеки текст, който е зареден в ChatGPT, за да подобри своите модели, но каза, че това може да бъде изключено чрез настройки дори без акаунт. Без акаунт обаче потребителите няма да могат да запазват или преглеждат историята на чатовете или да имат достъп до различни функции, включително гласови разговори и персонализирани инструкции.

– Саманта Кели от CNN допринесе за този доклад.

Източник: cnn.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!