Spotify съкращава персонала, за да премине по-бързо към AI – и Wall Street го харесва
Spotify си направи име в бизнеса с аудио стрийминг посредством своето свръхперсонализирано потребителско преживяване, с помощта на изкуствения разсъдък и екип от 9800 чиновници в края на 2022 година
Но след три кръга съкращения за една година: 590 позиции през януари, 200 през юни и още 1500 тази седмица, вложенията на Spotify в AI за увеличение на маржовете за отделите за подкастинг и аудиокниги наподобяват като изцяло преразглеждане на тактиката, в която Уолстрийт наподобява убеден може да работи.
„ Spotify употребява AI в цялата си платформа, пускайки AI DJ, симулиращ обичайно радио преживяване, на 50 спомагателни пазара и пуска AI Voice Translation за подкасти “, сподели Джъстин Патерсън, анализатор на финансовите проучвания в KeyBanc Capital Пазари, в изследователска записка. „ В комбиниране с аудиокнигите, които се популяризират за Premium клиенти, ние имаме вяра, че Spotify има няколко благоприятни условия за стимулиране на ангажираността и вероятно по-силна монетизация. “
Акциите на компанията-майка Spotify Technology SA са нарастнали с над 30% през последните шест месеца и над 135% досега.
Компанията се причислява към други софтуерни компании в съкращенията, защото търсенето от епохата на пандемията е намаляло. Освен това би трябвало да компенсира повече от 1 милиард $, които е похарчил за подкастинг, огромна част от които са отишли за покупко-продажби със звезди за основаване на подкасти, които в никакъв случай не са се материализирали, и придобиване на подкаст студиа, които по-късно затвори.
„ Икономическият напредък се забави фрапантно и капиталът нарастна. Spotify не е изключение от тези действителности “, написа Ек в писмо до личния състав, оповестено на уеб страницата на компанията.
През ноември Spotify разкри партньорство с Гугъл Cloud за преразглеждане на метода, по който платформата предлага аудиокниги и подкасти посредством потреблението на един от езиковите модели на Гугъл Cloud, Vertex AI Search.
Големите езикови модели като ChatGPT са компютърни стратегии, подготвени на огромни набори от данни, които могат да рецитират човешки текст и информация назад на потребителите въз основа на това, което програмата „ знае “.
Spotify показа „ AI DJ “ през февруари и стартира да употребява инструмента за гласов превод „ Whisper “ на OpenAI, с цел да превежда определени епизоди от британски подкасти на испански, френски и немски.
Представител на Spotify сподели в имейл до CNN, че компанията възнамерява да разшири технологията в бъдеще в очакване на противоположна връзка от основателя и публиката. Те също по този начин показаха някои мнения, направени от Ek по време на диалога за приходите на компанията за третото тримесечие, където думата „ успеваемост “ беше употребена повече от 20 пъти.
„ Основният метод, по който би трябвало да мислите за тези (AI) начинания, (е, че създава) по-голяма ангажираност и тази по-голяма ангажираност значи, че понижаваме оттока “, сподели той по време на поканата за приходите на Spotify през октомври. „ По-голямата ангажираност също значи, че произвеждаме повече стойност за потребителите. И това съответствие стойност/цена е това, което по-късно ни разрешава да повишим цените както направихме през миналото тримесечие с огромен триумф. “
В изследователска записка Дъглас Анмут, ръководещ шеф и интернет анализатор в JP Morgan, сподели, че дружно с вложенията в реклами от актьори, вложенията в подкасти имат капацитета да подтикват ангажираността в дълготраен проект.
Spotify е хиперперсонализирал своя опит за потребителите от към десетилетие. Той съумя да добави това персонално допиране, откакто закупи компанията за музикален разбор The Echo Nest Corp през 2014 година, с цел да комбинира машинно образование и обработка на натурален език.
Технологията на Spotify построява база данни от песни и реализатори посредством различаване на музикални висони и темпове и свързване на творбите на актьори в споделен културен подтекст.
Метаданни като дата на стартиране и индикатори като мощ на звука, дълготрайност и какъв брой евентуално е дадена ария да накара някой да танцува също влизат в определянето кои песни дават отговор на усета на потребителя.
От тук се раждат плейлисти като „ Daily Mix “ и „ Discover Weekly “. Така наречените Time Capsules и плейлистите „ On Repeat “ събират най-слушаните песни от потребителя, с цел да държат потребителите пристрастени към това, което към този момент слушат, или да преразгледат песни, които не са слушали от известно време.
В имейл до CNN Анил Джейн, световен ръководещ шеф на стратегическите потребителски промишлености в Гугъл Cloud, сподели, че неговото Vertex AI Search разрешава на медийните и развлекателните компании да построяват благоприятни условия за разкриване на наличие във видео, аудио, изображения и текст. Джейн не разяснява детайлности по договорката със Spotify.
Vertex AI Search регистрира набор от фактори, когато предлага наличие за потребителите, като потребителско държание в действително време, подобие на наличието и наличие, обвързвано с това, което потребителите търсят.
Предизвикателства и възможности
Рийс Хейдън, старши анализатор в ABI Research, изрази убеденост, че огромните езикови модели (LLM) могат да работят за увеличение на ангажираността в платформата на Spotify.
„ Големите езикови модели могат да подобрят персонализирането, да подобрят рекомендациите и да подсигуряват, че рекомендациите отразяват в по-голяма степен ползите на потребителите, като схващат целия текст/видео, вместо да употребяват основни думи/метаданни “, сподели той в имейл до CNN.
Той добави, че за разлика от зависещите от основна дума/метаданни „ съществени планирани модели “, LLM могат да схванат и интерпретират подкасти, с цел да видят дали дават отговор на потребителските ползи и могат да придобият по-задълбочено схващане на потребителските желания, като проучват всички потребителски данни, с цел да дефинират техните желания.
Но това си има цена.
„ Използването на LLM за схващане на всички подкасти/аудиокниги изисква доста запаси и може да добави лимитирана стойност спрямо главните модели за прогнозиране … LLM носят спомагателни провокации за дискретност на данните и разходи/ресурси, които ще бъдат обилни “, сподели той.
Той изрази религия в Whisper да помогне за превода на подкасти, само че приетите неточности могат да бъдат направени под формата на сбъркани фрази или изречения, до момента в който генеративният AI се учи.
„ Като се има поради съществуването на точки от данни, моделите за превод на разнообразни езици като Whisper бързо ще се подобрят, осигурявайки висока степен на акуратност “, сподели той. „ Недостатъкът на шепота е, че главната му подготвеност е превод от други езици на британски... Повечето подкасти се записват на британски и затова не могат да се ползват дейно на всички места. “