OpenAI разкрива нов ChatGPT, който слуша, гледа и говори
Докато Apple и Гугъл трансформират своите гласови асистенти в чатботове, OpenAI трансформира своя чатбот в гласов помощник.
В понеделник стартъпът за изкуствен интелект в Сан Франциско показа нова версия на своя чатбот ChatGPT, който може да получава и дава отговор на гласови команди, изображения и видеоклипове.
Компанията сподели, че новото приложение — основано на A.I. система, наречена GPT-4o — жонглира аудио, изображения и видео доста по-бързо от предходната версия на технологията. Приложението ще бъде налично от понеделник, гратис, както за смарт телефони, по този начин и за настолни компютри.
„ Ние гледаме към бъдещето на взаимоотношението сред нас и машините, ”, сподели Мира Мурати, основен софтуерен шеф на компанията.
сплотява своя чатбот Gemini с Гугъл Assistant, Apple приготвя нова версия на Siri, която е по-разговорна.
OpenAI сподели, че последователно ще споделя технологията с потребителите " през следващите седмици. " Това е първият път, когато предлага ChatGPT като настолно приложение.
Компанията преди този момент оферираше сходни технологии от разнообразни безвъзмездни и платени артикули. Сега ги е обединил в единна система, която е налична във всички негови артикули.
По време на събитие, излъчено поточно в интернет, госпожа Мурати и нейните сътрудници демонстрираха ново приложение, защото отговаряше на разговорни гласови команди, използваше видео емисия онлайн, с цел да проучва математически задания, написани на лист хартия, и четеше на глас игриви истории, които беше написало в придвижване.
Новото приложение не може да генерира видео. Но може да генерира неподвижни изображения, които съставляват фрагменти от видеоклип.
Дебютът на ChatGPT в края на 2022 година OpenAI сподели, че машините могат да обработват поръчки по-скоро като хората. В отговор на разговорни текстови подкани той може да дава отговор на въпроси, да написа курсови работи и даже да генерира компютърен код.
ChatGPT не се управлява от набор от правила. Той научи уменията си, като проучва големи количества текст, извлечен от целия интернет, в това число публикации в Wikipedia, книги и чатове. Експертите приветстваха технологията като допустима опция на търсачки като Гугъл и гласови асистенти като Siri.
По-новите версии на технологията също се учат от звуци, изображения и видео. Изследователите назовават това „ мултимодален ИИ “. По създание компании като OpenAI започнаха да комбинират чатботове с ИИ. генератори на изображения, аудио и видео.
(Ню Йорк Таймс съди OpenAI и неговия сътрудник, Microsoft, през декември, потвърждавайки, че нарушават авторските права на новинарско наличие, обвързвано със системи за изкуствен интелект.)
Тъй като фирмите комбинират чатботове с гласови асистенти, остават доста трудности. Тъй като чатботовете учат уменията си от интернет данни, те са склонни към неточности. Понякога те измислят напълно информация – феномен, който A.I. откривателите назовават „ илюзия “. Тези дефекти мигрират в гласовите асистенти.
A.I. сътрудници ”, които могат надеждно да се оправят с такива задания.
OpenAI преди този момент оферираше версия на ChatGPT, която можеше да приема гласови команди и да дава отговор с глас. Но това беше мозайка от три разнообразни ИИ. технологии: една, която преобразува глас в текст, една, която генерира текстов отговор, и една, която преобразува този текст в синтетичен глас.
Новото приложение е основано на индивидуален ИИ. технология — GPT-4o — която може да приема и генерира текст, звуци и изображения. Това значи, че технологията е по-ефективна и компанията може да си разреши да я предлага на потребителите гратис, сподели госпожа Мурати.
„ Преди имаше цялото това закъснение това беше резултат от взаимната работа на три модела “, сподели госпожа Мурати в изявление за The Times. „ Искате да имате прекарването, което ние имаме – където можем да имаме този доста натурален разговор. “