Ключовите съобщения от I/O конференцията на Google
Гугъл показва необятна гама от нови артикули, основани на AI, защото софтуерният колос залага претенциите си да бъде един от главните играчи в ерата на AI. p>
По време на двучасово главно събитие за разкриване на годишната I/O конференция за разработчици – и където фразата „ AI “ беше упомената повече от 120 пъти – компанията изложи по какъв начин ще продължи да интегрира генеративния AI в своите най-известните артикули.
Ето обзор на основните известия от събитието.
– Възстановяване на търсенето за генериращ AI
Гугъл Търсене, най- добре позната част от бизнеса на компанията, се преработва за генеративния AI, потвърдиха от Гугъл.
През идващите седмици ще стартира да се популяризира out AI Overviews, нов вид резултати от търсене, захранвани от AI.
Осъществено от модела Gemini AI на Гугъл, AI Overviews е в положение да разбере по-дълги и по-сложни поръчки и да даде набор от оферти в отговор, нарушавайки поръчките на основни елементи и предлага голям брой гледни точки от мрежата.
Гугъл споделя, че задачата е да „ отстрани работата “ от търсенето, като даде по-широк набор от наличие на едно място като резултати от търсене с нов образ. p>
Той ще стартира да се популяризира в Съединени американски щати тази седмица, като скоро ще последва поддръжка за още страни.
– Project Astra
Името на визията на Гугъл за „ бъдеще на AI асистенти “, Project Astra е първият опит, който компанията е направила върху по този начин наречения „ повсеместен сътрудник “.
Идеята е AI помощник, който е потребен във всеки миг от всекидневието и има благоприятни условия за диалог в действително време, като в същото време е мултимодален – кадърен да приема всяка композиция от текст, аудио и образно въвеждане и да дава отговор тъкмо.
Демонстрацията на това по време на I/O видя по какъв начин някой сканира офис пространство с камерата на смарт телефона си, до момента в който моли Astra да разпознава обекти в офиса, да предложи изобретателни оферти за неща, които е видял, и даже да подсети на потребителя къде избрани детайли са били изгубени.
– Veo и Imagen 3
Два съществени нови инструмента за основаване на наличие от софтуерния колос, позволяващи на потребителите да основават видео или изображения въз основа на въведен текст.
Гугъл сподели, че Veo е неговият „ най-способен модел за видео генериране досега “ и може да генерира 1080p видеоклипове с дължина над минута в набор от кинематографични и образни стилове.
Veo има усъвършенствано схващане на естествения език и кинематографичните термини, сподели Гугъл, което дава опция за повече креативен надзор.
Подобно на Imagen 3, Гугъл сподели, че усъвършенстваното му схващане на езика значи, че приложението ще може да включва тъкмо по-малки елементи от по-дълги подкани и също по този начин към този момент може да изобразява по-добре текст.
Компанията допусна, че това може да е всичко за по-добро генериране на персонализирани известия и заглавни слайдове в презентации, което преди беше проблем за моделите за генериране на изображения.
– Gemini в Workspace
В основна актуализация за потребителите Гугъл сподели, че вкарва своя модел Gemini 1.5 Pro AI в своя пакет от приложения за работно пространство, което значи, че потребителите скоро ще имат опцията да употребяват Gemini в някои от най-често употребяваните от тях приложения.
Ерата на Gemini е тук, внасяйки магията на AI в инструментите, които употребявате всеки ден. Научете повече за всички известия от #GoogleIO → https://t.co/ZQaDrmItuhpic.twitter.com/9Tu1C6WNqQ
— Гугъл (@Google) 14 май 2024 година
Например в Gmail потребителите ще могат да изискат от Gemini да заключи всички скорошни имейли от съответен адресант или по избрана тематика, с цел да наваксат всичко, което имате пропуснати.
На други места компанията показва нова функционалност, идваща в нейното приложение за фотоси, наречена „ Попитайте за фотоси “.
Тук Gemini ще може да търси в албума със фотоси на потребителя съответни единични изображения въз основа на текстови подкани за това, от което се нуждаят – да вземем за пример тази фотография на името и паролата на вашата домашна Wi-Fi мрежа или регистрационния номер на автомобила – и бързо ги демонстрират на потребителя.
– Gemini на Android
Като част от това, което шефът на Android Sameer Samat сподели, че е „ многогодишно пътешестване за преосмисляне на Android с Gemini в основата му “, Гугъл сподели, че прави своя AI модел новия AI помощник на своята мобилна операционна система. p>
Благодарение на Gemini Nano, @Android ще ви предизвести по време на диалог, незабавно щом открие подозрителна активност, като да вземем за пример да бъде пожелан вашия номер на обществена осигуровка и банкова информация. Очаквайте още вести през идващите месеци. #GoogleIOpic.twitter.com/wtc3rrk0Gc
— Гугъл (@Google) 14 май 2024 година
Голяма част от AI работата ще се прави на устройството, сподели Гугъл, за по-добра сигурност и редица нови принадлежности също ще бъдат въвеждани непрекъснато, в това число нова функционалност за разкриване на измами, която ще проучва гласови повиквания в действително време и ще предизвестява потребителите, в случай че Gemini счита, че може бъде машинация.
Потвърдено беше, че поддръжката на мултимодалност посредством Gemini Nano идва и към личните Pixel устройства на Гугъл, което разрешава на потребителите да употребяват текст, изображения и образни подкани, с цел да взаимодействат с Gemini.