ChatGPT става все по-разговорлив с „разширен гласов режим“
OpenAI смая потребителите, когато по-рано тази година показва обновен гласов режим за най-модерната версия на ChatGPT.
Далеч от вида роботизиран глас, който хората свързват с цифрови асистенти като Alexa или Siri, усъвършенстваният гласов режим ChatGPT звучи удивително реалистично. Той реагира в действително време, може да се приспособява към спиране, може да издава кикотящи се звуци когато консуматор се майтапи и може да реши прочувственото положение на говорещия въз основа на тона на гласа му. (По време на първичното демо също звучеше съмнително като Скарлет Йохансон).
От вторник усъвършенстваният гласов режим – който работи с най-мощната версия на чатбота, ChatGPT-4o – ще стартира да се популяризира за платени консуматори. Разширеният гласов режим ще стартира да се популяризира за дребна група клиенти на режима „ Плюс “ на приложението, за да го направи наличен за всички консуматори на Плюс през есента.
ChatGPT към този момент има по-малко модернизиран гласов режим. Но стартирането на по- модернизиран гласов режим може да означи огромна повратна точка за OpenAI, трансформирайки това, което към този момент беше значим AI чатбот, в нещо по-близко до виртуален, персонален помощник, с който потребителите могат да се ангажират естествено, говорили диалози съвсем по същия метод, по който биха разговаряли с другар. Лекотата на диалог с усъвършенствания гласов режим на ChatGPT може да насърчи потребителите да се ангажират с инструмента по-често и да съставлява предизвикателство за виртуални асистенти като Apple и Amazon.
видео
Но въвеждането на по-усъвършенстван гласов режим за ChatGPT идва и с огромни въпроси: Ще разбере ли инструментът надеждно какво се пробват да кажат потребителите, даже в случай че имат разлики в речта? И ще бъдат ли потребителите по-склонни да се доверят сляпо на помощник с изкуствен интелект, звучащ като човек, даже когато той бърка?
OpenAI в началото сподели, че е възнамерявал да стартира внедряването на усъвършенствания гласов режим през юни, само че сподели, че е нужен „ още един месец, с цел да доближи нашата лента за стартиране “, с цел да тества сигурността на инструмента и да подсигурява, че може да се употребява от милиони хора, като в същото време поддържа действителен - времеви отговори.
Компанията сподели, че през последните месеци е тествала гласовите благоприятни условия на AI модела с повече от 100 тестери, които се стремят да разпознават евентуални недостатъци, „ които общо приказват общо 45 разнообразни езика и съставляват 29 разнообразни географски области “, съгласно изказване от вторник.
Сред ограниченията си за сигурност компанията сподели, че гласовият режим няма да може да употребява никакви гласове отвън четири, авансово заложени варианти, които е основал в съдействие с гласови артисти - с цел да избегне реплика - и също по този начин ще блокира избрани поръчки, които имат за цел да генерират музика или друго аудио, предпазено с авторски права. OpenAI споделя, че инструментът ще има същите отбрани като текстовия режим на ChatGPT, с цел да предотврати генерирането на нелегално или „ нездравословно “ наличие.
Разширеният гласов режим също ще има една съществена разлика от демонстрацията, която OpenAI сподели през май: потребителите към този момент няма да имат достъп до гласа, който мнозина (включително самият актьор) имаха вяра, че звучи като Йохансон. Въпреки че OpenAI твърди, че гласът в никакъв случай не е бил предопределен да звучи като Йохансон и е основан благодарение на друг артист, той спря потреблението на гласа „ от почитание “, откакто артистът се оплака.
Стартирането на усъвършенствания гласов режим на ChatGPT идва, откакто предходната седмица OpenAI разгласи, че тества търсачка, която употребява нейната AI технология, до момента в който компанията продължава да разраства своето портфолио от потребителски AI принадлежности. Търсачката OpenAI може в последна сметка да съставлява огромна конкурентна опасност за господството на Гугъл в онлайн търсенето.