Световни новини без цензура!
Надпреварата за захранван с изкуствен интелект личен асистент
Снимка: ft.com
Financial Times | 2024-05-17 | 20:12:56

Надпреварата за захранван с изкуствен интелект личен асистент

В централата на Гугъл в Маунтин Вю тази седмица мъж, облечен в пеньоар в цвят на дъгата, се появи от голяма чаша за кафе, с цел да даде витална, въпреки и ненапълно сюрреалистична проява на компанията най-новите достижения в генеративния AI.

На I/O събитието електронният музикант и YouTuber Marc Rebillet се занимаваше с музикален инструмент с изкуствен интелект, който може да генерира синхронизирани песни въз основа на подкани като „ viola “ и „ 808 hip-hop beat “. ИИ, сподели той на разработчиците, е измислил способи да „ запълни по-редките детайли на моите цикли “... Това е като да имаш този чудноват другар, който е тъкмо като „ пробвайте това, пробвайте това “.

Това, което Rebillet описваше, е AI помощник, персонализиран бот, който би трябвало да ви помогне да работите, създавате или поддържате връзка по-добре, и интерфейс с цифровия свят от ваше име. Този нов клас артикули открадна светлината на прожекторите тази седмица измежду множеството нови разработки на AI от Гугъл и неговото поделение за AI DeepMind, както и подкрепения от Microsoft OpenAI.

Компаниите по едно и също време оповестиха серия от надградени AI принадлежности, които са „ мултимодални “, което значи, че могат да интерпретират глас, видео, изображения и код в един интерфейс, а също по този начин да извършват комплицирани задания като преводи онлайн или обмисляне на фамилна отмора.

Във видео проява прототипът на AI помощник Astra на Гугъл, задвижван от неговия модел Gemini, отговори на гласови команди въз основа на разбор на това, което вижда през камерата на телефона или при потребление на чифт на интелигентни очила.

Той сполучливо разпознава последователности от кодове, предложи усъвършенствания на електрически схеми, разпозна региона на Кингс Крос в Лондон през обектива на камерата и подсети на потребителя къде е оставил очилата си.

Междувременно, при представянето на продукта на OpenAI в понеделник, основният софтуерен шеф Мира Мурати и нейните сътрудници демонстрираха по какъв начин техният нов AI модел, GPT4o, може да прави гласов превод в диалог онлайн и по сходен метод да взаимодейства с потребителя, употребявайки антропоморфизиран звук и глас за анализиране на текст, изображения, видео и код. „ Това е извънредно значимо, тъй като гледаме към бъдещето на взаимоотношението сред нас и машините “, споделя Мурати пред FT.

Въпреки че интелигентните асистенти, захранвани от AI, се развиват от съвсем десетилетие, тези най-новите достижения разрешават по-гладко и по-бързо гласово взаимоотношение и превъзходни равнища на схващане с помощта на огромните езикови модели (LLM), които зареждат новите AI модели. Сега е в ход нова борба измежду софтуерните групи за даване на по този начин наречените AI сътрудници на потребителите.

Те се схващат най-добре като „ интелигентни системи “, сподели основният изпълнителен шеф на Гугъл Сундар Пичай тази седмица, „ които демонстрират разсъждения, обмисляне и памет, могат да „ мислят “ няколко стъпки напред и да работят със програмен продукт и системи, всичко това, с цел да създадем нещо от ваше име ”.

Освен Гугъл и OpenAI, Apple се чака да бъде главен състезател в тази конкуренция. Инсайдери в промишлеността чакат, че забележителна надстройка на гласовия помощник на Apple, Siri, е на хоризонта, защото компанията пуска нови AI чипове, проектирани вътрешно и способни да зареждат генеративни модели на устройството.

Междувременно Meta към този момент пусна AI помощник в своите платформи Фейсбук, Instagram и WhatsApp допълнително от дузина страни през април. Стартиращи компании като Rabbit и Humane също се пробват да навлязат в пространството, като проектират артикули, които работят като независими AI помощници.

Въпреки че анализаторите показват, че огромните известия от тази седмица остават значително „ изпарени “ - концепции, а не действителни артикули — за наблюдаващите в промишлеността е ясно, че AI асистентите или сътрудниците ще бъдат основни за даването на най-новата AI технология на масите.

„ Без подозрение е, това е моментът за персонален [изкуствен] разсъдък “, споделя Мустафа Сюлейман, основен изпълнителен шеф на Microsoft AI, който не е взел участие в нито едно издание тази седмица. Сюлейман преди този момент основа Inflection, започваща компания, изграждаща фокусиран върху потребителите AI помощник, прочут като Pi, който той напусна през март.

„ Силиконовата котловина постоянно е разглеждала технологиите като функционална полза – да прави нещата дейно и бърз. Но това е някак си необикновено – тези принадлежности към този момент са в креативната област на производителите на артикули “, споделя той. „ Технологията е задоволително узряла, с цел да е нов тип глина, с която всички можем да изобретим и ... виждаме, че това се постанова в този момент. “

От съвсем десетилетие софтуерните групи се състезават да дават AI на потребителите посредством виртуални асистенти като Siri на Apple, Cortana на Microsoft и Alexa на Amazon, която в този момент е вградена в редица на устройства.

Гугъл, да вземем за пример, показа AI Assistant още през 2016 година, като Pichai рисува картина на пост-смартфонния свят, където интелигентността е вградена във всичко - от високоговорители до очила.

Но осем години по-късно смарт телефонът към момента е главен потребителски интерфейс към мрежата. Големите провокации пред всеобщото внедряване са забавянето или бавните реакции от сътрудниците на ИИ, както и грешките в тяхното схващане и осъществяване на човешки указания и потребности.

Появата през 2017 година на технологията в основата на чатботове като ChatGPT, Gemini и Claude, известна като трансформатор, доста усъвършенства технологиите, които са в основата на AI асистентите, като обработка на натурален език.

p> Но за построяването на AI асистенти, които обществеността желае да употребява, „ убийствената функционалност е скоростта “, съгласно софтуерния анализатор Бен Томпсън, който написа авторитетния промишлен бюлетин Stratechery.

„ Когато преминеш прага на скорост и инертност, тогава е занимателно. Насладата ... и игривостта, когато получавате тази незабавна противоположна връзка, е толкоз друга от това да седите и чакате ... тогава е като салонен трик, ” сподели той в подкаста Sharp Tech тази седмица.

Томпсън сподели, че е забелязал това в подтекста на Гугъл и неговия AI режим на търсене, прочут като Search Generative Experience, който дава генерирани от AI отговори на запитвания, дружно с обичайния лист с връзки.

„ Става толкоз бързо и толкоз поредно, че го употребявам повече и почтено казано употребявам ChatGPT по-малко, даже не преднамерено “, сподели той. „ Гугъл знае това по-добре от всеки различен – те знаят, че всяка милисекунда има значение в това до каква степен са ангажирани хората. “

Но водещият бот на OpenAI не е ленив. Версия на неговия модел GPT4o съумя да превежда гладко сред италиански и британски в диалог в действително време. Моделът също сподели приказлив, въпреки и леко флиртуващ звук, когато разговаряше с мъжете инженери на сцената. С OpenAI „ същинските усъвършенствания са в потребителското преживяване и действителния артикул ChatGPT “, сподели Томпсън. „ Това е належащо, с цел да спечелим в потребителските [технологии], в доста по-голяма степен, в сравнение с в предприятията. “

Чакането на крилата обаче е Apple. Инвеститорите бяха нетърпеливи да научат повече за проектите на компанията за AI, защото цената на акциите й се намали тази година спрямо Alphabet и Amazon.

Тази седмица OpenAI разгласи, че е сключила договорка с Apple за основаване на десктоп приложение за Mac. Твърди се също, че производителят на iPhone изследва по-нататъшни евентуални партньорства както с OpenAI, по този начин и с Гугъл Gemini, като в същото време наема специалисти и издава научни публикации, които дават рядка визия за работата му зад кулисите при построяването на AI модели.

Вътрешни хора Кажете, че преимуществото на Apple се крие в неговата солидна съществуваща потребителска база, с повече от 2,2 милиарда дейни устройства по целия свят, което я слага в позиция да ръководи процеса на това по какъв начин хората интегрират генеративни принадлежности като виртуални асистенти в всекидневието си.

Apple евентуално ще сътвори „ технология Siri от последващо равнище “ в партньорство с OpenAI, предвижда анализаторът на Wedbush Дан Айвс. Асистент, кадърен да извършва комплицирани задания за консуматори на iPhone, може в последна сметка да бъде трансфорат в платена абонаментна услуга, сподели той в записка - сходно на метода, по който компанията сега монетизира други услуги като iCloud.

След демонстрацията на OpenAI на В понеделник анализаторите на Bank of America повториха своя рейтинг за пазаруване на акциите на Apple, като споделиха, че акцентират капацитета, който виртуалните асистенти и AI функционалностите показват за разработчиците на приложения в нейната екосистема App Store, която към този момент носи на Apple сред 6 и 7 милиарда $ от комисионни всяко тримесечие, съгласно оценки на Sensor Tower.

Предимството на Гугъл обаче е в пакета от потребителски приложения, които предлага, от имейл до принадлежности за календар, където могат да бъдат интегрирани AI сътрудници.

„ Винаги сме желали да създадем повсеместен сътрудник, който да бъде потребен в всекидневието. Нашата работа, правейки тази визия действителност, датира от доста, доста години. Ето за какво направихме [чатбота] Gemini мултимодален през цялото време “, сподели Демис Хасабис, основен изпълнителен шеф на Гугъл DeepMind, пред кореспонденти тази седмица.

„ Във всеки един миг ние обработваме поток от друга сензорна информация, осмисляме я и вземаме решения. Представете си сътрудници, които могат да виждат и чуват какво вършим, да схващат по-добре подтекста, в който се намираме, и да реагират бързо в диалог, правейки темпото и качеството на взаимоотношение да се усещат доста по-естествени. “

Въпреки фирмите за изкуствен интелект пробвайки се да основат потребителски ботове, които могат да оказват помощ в ежедневните задания, може да мине известно време, преди да станат ежедневна действителност.

Създаването на наличие, генерирано от AI, е към момента в начален етап и от време на време е склонно до неточности и „ халюцинации “ или производство на погрешна информация. Това може да се трансформира в огромен проблем, в случай че асистентът извършва задания, свързани с работата, където точността, а не творчеството е от решаващо значение.

Разрастването също е голямо предизвикателство, споделя Сюлейман. „ Това е хиперконкурентен пазар ... въпроси за дистрибуцията и марката — Apple и Google ... имат огромни преимущества в този смисъл. ”

Сюлейман се реалокира в Microsoft през март, откакто неговият стартъп Inflection се обърна от потребителски фокус към корпоративен модел. „ [Pi] беше надълбоко зает артикул, само че достигането до огромен мащаб като Gemini е супер предизвикателство. “

Но Брет Тейлър, ръководител на борда на OpenAI и основен изпълнителен шеф на нов започващ AI сътрудник Sierra, споделя, че изместването на съществуващите потребителски интерфейси предлага благоприятни условия за редица компании.

„ При огромни технологични промени започващите компании могат да се откроят и да съумеят, защото не е задължително да има пазарен водач сега “, споделя той.

Докато огромните софтуерни компании и техните сътрудници може да са в най-хубава позиция да се възползват от сегашния миг, основният AI академик на Meta Yann LeCun споделя, че ще би трябвало да отворят своите модели, с цел да разширят AI асистентите отвън обособените страни на запад.

„ В новото бъдеще всяко едно взаимоотношение с цифровия свят ще бъде посредством някакъв тип AI помощник. Ние ще приказваме с тези AI асистенти от самото начало. Цялата ни цифрова диета ще бъде медиирана от AI системи “, сподели той на събитие на Meta в Лондон предишния месец. „ Това не може да се направи от компании на западния бряг на Съединени американски щати. Имаме потребност от тях да бъдат разнородни. “

Допълнителен репортаж от Майкъл Актън и Джордж Хамънд в Сан Франциско

Източник: ft.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!