Световни новини без цензура!
Google пуска асистент „Project Astra“ в последния напредък на AI
Снимка: ft.com
Financial Times | 2024-05-14 | 20:12:19

Google пуска асистент „Project Astra“ в последния напредък на AI

Собственикът на Гугъл Alphabet показа сътрудник с изкуствен интелект, който може да дава отговор на поръчки в действително време за видео, аудио и текст, като част от редица начинания, предопределени да покажат неговата мощност в AI и потушава рецензиите, че е изостанал от противниците си.

Главният изпълнителен шеф Сундар Пичай показва новия „ мултимодален “ AI помощник на колоса от Силиконовата котловина, наименуван Project Astra, задвижван от усъвършенствана версия на неговия модел Gemini, по време на годишна конференция за разработчици във вторник.

Astra беше част от поредност от известия за демонстриране на нова насочена към AI визия за Гугъл. Той следва стартирането на артикули и надградени AI модели от Big Tech противници, в това число Meta, Microsoft и техния сътрудник OpenAI.

Във видео проява прототипът на AI помощник на Гугъл реагира на гласови команди въз основа на разбор на това, през което вижда камера на телефона или когато употребявате чифт смарт очила.

Той сполучливо разпознава последователности от кодове, предложи усъвършенствания на електрически схеми, разпозна квартал Кингс Крос в Лондон през обектива на камерата и подсети на потребителя къде е оставил очилата си.

Гугъл възнамерява да стартира да прибавя опциите на Astra към своето приложение Gemini и към своите артикули тази година, сподели Пичай. Въпреки това, той предизвести, че до момента в който крайната „ цел е да създадем Astra безпроблемно налична “ в софтуера на компанията, тя ще бъде въведена внимателно и „ пътят към производството ще бъде воден от качеството “.

На конференцията, Гугъл също направи огромни промени в главната си търсачка. От тази седмица всички консуматори в Съединени американски щати ще виждат „ Преглед на AI “ – къс генериран от AI систематизиран отговор на поръчката – в горната част на доста постоянно срещани резултати от търсене, последван от връзки, върху които може да се кликне, осеяни с реклами по-долу.

Компанията добави, че системата за търсене ще може да дава отговор на комплицирани въпроси с многоетапно размишление – което значи, че AI сътрудникът може да вземе няколко самостоятелни решения, с цел да извърши задача – и да помогне на клиентите да генерират поръчки за търсене благодарение на глас и видео.

„ Намаляването на времето за реакция до нещо разговорно е мъчно инженерно предизвикателство “, каза сър Демис Хасабис, началник на отдела за проучвания на AI DeepMind. „ Удивително е да се види до каква степен е стигнал изкуственият разсъдък, изключително що се отнася до пространственото схващане, обработката на видео и паметта. “

Лиз Рийд, началник на търсенето в Гугъл, сподели, че задачата е „ да се отстранен някои от работата в търсенето ” и този обзор на AI ще бъде уголемен до консуматори в други елементи на света по-късно тази година.

Промените идват, когато OpenAI заплашва бизнеса с търсене на Гугъл.

Чатботът ChatGPT на основаната в Сан Франциско започваща компания дава бързи и цялостни отговори на доста въпроси, заплашвайки да направи остарели резултати от търсенето, които дават обичаен лист с връзки дружно с рекламата. OpenAI също подписа съглашения с медийни организации за включване на настояща информация, с цел да усъвършенства отговорите си.

Голямото четенеКак Гугъл загуби позиции в конкуренцията с AI

В понеделник — в ход, обсъждан като опит да се изпреварят известията на Гугъл — OpenAI показва по-бърза и по-евтина версия на модела, който зарежда ChatGPT, който може по сходен метод да интерпретира глас, видео, изображения и код в един интерфейс.

Гугъл също разкри нови или усъвършенствани AI артикули, в това число Veo, който генерира видео от текстови подкани; Imagen 3, който основава картини; и Lyria, модел за генериране на AI музика. Абонатите на Gemini Advanced ще могат да основават персонализирани чатботове, наречени „ Скъпоценни камъни “, с цел да оказват помощ при съответни задания.

Флагманският модел Gemini 1.5 Pro на компанията също е надграден. Сега има доста по-голям контекстен прозорец от 2 милиона токена — отнасящи се до количеството данни като код или изображения, към които може да се базира при генериране на отговор — което го прави по-добър при следване на нюансирани указания и препращане към по-ранни диалози.

Източник: ft.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!