Euro News | 2024-05-20 | 07:15:11

Лечението на тумор направи тази жена неспособна да говори. AI й върна гласа

Въпреки че клонирането на глас с изкуствен интелект (AI) предизвиква безпокойство, използването на новата технология на OpenAI може да помогне на хора, засегнати от инсулти и тумори.

Преди да се подложи на това, което би било животоспасяваща и променяща живота операция, гласът на младата американка Алексис „Лекси“ Богън беше превъзходен.

Тя обичаше да се разказва за Тейлър Суифт и Зак Браян балади в колата. Тя винаги се смееше - дори когато събираше лошо поведение на деца в предучилищна възраст или обсъждаше политика с приятели. В училище тя беше сопран в припева.

След това, за една нощ, този глас изчезна.

През август миналата година лекарите отстраниха тумор, заседнал в задната част на мозъка й . Когато тръбата за дишане излезе един месец по-късно, Боган имаше проблеми с преглъщането и се напрегна да каже „здравей“ на родителите си.

Как да забележите deepfake: 5 неща, за които да внимавате, за да идентифицирате генерирано от AI съдържание онлайн

Месеци рехабилитация помогнаха за възстановяването й, но говорът й все още е увреден. Приятели, непознати и членове на собственото й семейство се борят да разберат какво се опитва да им каже.

През април 21-годишното момиче си върна стария глас. Не истинският, а гласов клонинг, генериран от технология за изкуствен интелект (AI) от създателя на ChatGPT OpenAI, който тя може да извика от телефонно приложение.

Умора от AI deepfakes

Обучен на 15-секундна времева капсула от нейния тийнейджърски глас - произхождащ от видео за демонстрация на готвене, което е записала за училищен проект - нейният синтетичен, но забележително реално звучащ AI глас сега може да каже почти всичко, което пожелае.

Тя пише няколко думи или изречения в телефона й и приложението мигновено ги прочита на глас.

„Здравейте, мога ли да получа грандиозно ледено еспресо с кафява захар и овесено мляко“, каза AI гласът на Bogan, докато тя държеше телефона през прозореца на колата си в Starbucks drive-thru.

Експерти предупредиха, че бързото подобряване на технологията за клониране на глас чрез изкуствен интелект може да разшири телефонните измами, да попречи на демократичните избори и да накърни достойнството на хора - живи или мъртви - които никога се съгласиха гласът им да бъде пресъздаден, за да казват неща, които никога не са говорили.

OpenAI разкрива технология за клониране на глас с изкуствен интелект, която се нуждае само от 15-секундна проба, за да работи

Използвана е за създаване на дълбоки фалшиви автоматични обаждания до избиратели в Ню Хемпшир, имитиращи президента на САЩ Джо Байдън.

В американския щат Мериленд властите наскоро обвиниха спортен директор на гимназия в използване на AI за генериране на фалшив аудио клип на директора на училището, който прави расистки забележки.

Но Богън и екип от лекари в болничната група Lifespan на Роуд Айлънд вярват, че са намерили приложение, което оправдава рисковете.

Пресъздаване на изгубени гласове

Боган е един от първите хора – само един с нейното състояние - които са успели да пресъздадат изгубен глас с .

Някои други доставчици на AI, като стартиращата компания ElevenLabs, са тествали подобна технология за хора с говорни дефекти и загуба - включително адвокат която сега използва гласовия си клонинг в съдебната зала.

Трябва да сме наясно с рисковете, но не можем да забравим за пациента и социалното благо.

„Надяваме се, че Лекси е пионер с развитието на технологията“, каза д-р Рохайд Али, ординатор по неврохирургия в медицинското училище на университета Браун и болницата в Роуд Айлънд.

Милиони хора с инвалидизиращи инсулти, рак на гърлото , или неврогенеративните заболявания могат да бъдат от полза, каза той.

„Трябва да сме наясно с рисковете, но не можем да забравим за пациента и социалното благо“, каза д-р Фатима Мирза, друг жител, работещ по Пилотът. „Можем да помогнем на Лекси да върне истинския й глас и тя може да говори с думи, които са най-верни за самата нея“.

Мирза и Али, които са женени, привлякоха вниманието на ChatGPT- производител OpenAI поради техния предишен изследователски проект в Lifespan, използващ AI chatbot за опростяване на формулярите за медицинско съгласие за пациентите.

Компанията от Сан Франциско протегна ръка, докато беше на лов по-рано тази година за обещаващи медицински приложения за своя нов AI гласов генератор.

Докато новите инструменти процъфтяват, „пръстовите отпечатъци“ на AI върху научни статии могат да навредят на доверието в жизненоважни изследвания

Бавно възстановяване

Боган все още бавно се възстановяваше от операция.

Заболяването започна миналото лято с главоболие, замъглено виждане и увиснало лице, тревожат лекарите в детската болница Hasbro в Провидънс.

Почти сякаш част от самоличността ми беше взета, когато загубих гласа си.

Те откриха съдов тумор с размерите на топка за голф, притискащ мозъчния й ствол и оплетен в кръвоносни съдове и черепни нерви.

„Беше битка за получаване овладяване на кървенето и изваждане на тумора“, каза детският неврохирург д-р Константина Свокос.

Местоположението и тежестта на тумора, съчетани със сложността на 10-часовата операция, увредиха контрола на Боган върху мускулите на езика и гласните струни , възпрепятствайки способността й да яде и говори, каза Свокос.

„Почти сякаш част от самоличността ми беше взета, когато изгубих гласа си“, каза Боган.

Тръбата за хранене излезе тази година. Логопедичната терапия продължава, позволявайки й да говори разбираемо в тиха стая, но без никакви признаци тя ще възстанови пълната яснота на естествения си глас.

„В един момент започнах да забравям как звуча, “ каза Богън. „Толкова свикнах с начина, по който звуча сега“.

РЕКЛАМА Може ли технологията AI deepfake наистина да се използва за добро? | Euronews Tech Talks Podcast

„Обучение“ AI за това как да говори

Винаги, когато телефонът звънеше в дома на семейството в предградието на Провидънс, Норт Смитфийлд, тя го предаваше на майка си, за да приеме обажданията й .

Тя чувстваше, че натоварва приятелите си всеки път, когато отидоха на шумен ресторант. Баща й, който има загуба на слуха, се мъчеше да я разбере.

Още в болницата лекарите търсеха пилотен пациент, който да експериментира с технологията на OpenAI.

„Първият човек, който На д-р Свокос ми хрумна Лекси", каза Али. „Свързахме се с Лекси, за да видим дали ще се заинтересува, без да знаем какъв ще бъде отговорът й. Тя искаше да го изпробва и да види как ще работи“.

Deepfake видеоклиповете предизвикват фалшиви спомени за филми, проучване показва

Боган трябваше да се върне няколко години назад, за да намери подходящ запис на гласа й, за да „обучи“ AI системата за това как тя говори. Това беше видео, в което тя обясняваше как се прави салата с паста.

Нейните лекари умишлено подадоха на AI системата само 15-секунден клип. Звуците от готвене правят други части от видеото несъвършени. Това беше и всичко, от което се нуждаеше OpenAI - подобрение спрямо предишната технология, изискваща много по-дълги проби.

Те също знаеха, че извличането на нещо полезно от 15 секунди може да бъде жизненоважно за всички бъдещи пациенти, които нямат следа от гласа си в интернет. Кратко гласово съобщение, оставено на роднина, може да е достатъчно.

„Ставам толкова емоционален всеки път, когато чуя гласа й“

Когато го тестваха за първи път, всички бяха зашеметени от качеството на гласовия клонинг. Случайни проблеми - неправилно произнесена дума, липсваща интонация - бяха предимно незабележими.

През април лекарите оборудваха Bogan със специално направено телефонно приложение, което само тя може да използва.

„Аз ставам толкова емоционална всеки път, когато чуя гласа й“, каза майка й, Памела Боган, със сълзи на очи.

РЕКЛАМА Как се използват новите инструменти за ИИ в лекарските кабинети?

„Мисля, че е страхотно, че мога имам този звук отново“, добави Лекси Богън, като каза, че това помогна „да повиши увереността ми донякъде там, където беше преди всичко това да се случи“.

Сега тя използва приложението около 40 пъти на ден и изпраща обратна връзка, надява се ще помогне на бъдещи пациенти.

Един от първите й експерименти беше да говори с децата в детската градина, където работи като асистент-учител.

Тя написа „ха ха ха ха“ очакване на роботизиран отговор. За нейна изненада това прозвуча като нейния стар смях.

Тя го е използвала в Target and Marshall's, за да попита къде да намери предмети. Това й помогна да се свърже отново с баща си. И за нея е по-лесно да поръчва бърза храна.

Лекарите на Bogan са започнали да клонират гласовете на други желаещи пациенти от Роуд Айлънд и се надяват да внедрят технологията в болници по целия свят.

ИИ може да помагат да се предскаже как пациентите реагират на лечение с антидепресанти

OpenAI каза, че действа предпазливо в разширяването на използването на Voice Engine, който все още не е публично достъпен.

Редица по-малки стартиращи AI вече продават гласови услуги за клониране на развлекателни студия или да ги направят по-широкодостъпни.

Повечето доставчици на гласово генериране казват, че забраняват представянето под чужда самоличност или злоупотребата, но се различават по начина, по който налагат условията си за използване.

По-широк достъп до гласово клониране с изкуствен интелект

„Искаме да сме сигурни, че всеки, чийто глас се използва в услугата, се съгласява непрекъснато“, каза Джеф Харис, ръководител на OpenAI за продукта.

„Искаме да се уверим, че не се използва в политически контекст. Затова възприехме подход да бъдем много ограничени в това на кого даваме технологията“.

Харис каза, че OpenAI следва стъпката включва разработването на защитен инструмент за „гласово удостоверяване“, така че потребителите да могат да възпроизвеждат само собствения си глас. Това може да е „ограничаващо за пациент като Лекси, който имаше внезапна загуба на говорните си способности“, каза той.

Аудио дълбоки фалшиви измами: Престъпниците използват AI, за да звучат като семейство и хората си падат по това

“ Така че смятаме, че ще трябва да имаме отношения с високо доверие, особено с доставчиците на медицински услуги, за да дадем малко по-безпрепятствен достъп до технологията".

Боган е впечатлила лекарите си с фокуса си върху мислейки за това как технологията може да помогне на други с подобни или по-сериозни говорни недостатъци.

"Част от това, което тя е направила през целия този процес, е да мисли за начини да коригира и промени това", каза Мирза. „Тя беше страхотно вдъхновение за нас“.

Докато засега тя трябва да си играе с телефона, за да накара гласовия механизъм да говори, Боган си представя AI гласов двигател, който подобрява по-старите средства за възстановяване на говора – като като роботизирано звучащ електроларинкс или гласова протеза - при сливане с човешкото тяло или превод на думи в реално време.

Нарастването на дълбоките фалшификати в интервютата за работа: Защо трябва да се тревожим

Тя не е толкова сигурна какво ще се случи, когато тя порасне и нейният AI глас продължава да звучи като тийнейджърка. Може би технологията може да „състари“ нейния AI глас, каза тя.

Засега, „въпреки че гласът ми не е възстановен напълно, имам нещо, което ми помага да намеря гласа си отново“, тя каза.

Източник: euronews.com

Последвайте ни в