Компаниите за изкуствен интелект търсят големи печалби от „малки“ езикови модели

Компаниите за изкуствен интелект, които са похарчили милиарди долари за изграждане на така наречените големи езикови модели за захранване на генеративни AI продукти, сега залагат на нов начин за увеличаване на приходите: малки езикови модели.

Apple, Microsoft, Meta и Google наскоро пуснаха нови AI модели с по-малко „параметри“ – броят на променливите, използвани за обучение на AI система и оформяне на нейния резултат – но все пак с мощни възможности.

Ходовете са усилие на технологични групи да насърчат възприемането на AI от фирми, които имат притеснения относно разходите и изчислителната мощност, необходими за управление на големи езикови модели, типът технология, която е в основата на популярни чатботове, като напр. ChatGPT на OpenAI.

Като цяло, колкото по-голям е броят на параметрите, толкова по-добра е производителността на AI софтуера и толкова по-сложни и нюансирани могат да бъдат неговите задачи. Най-новият модел GPT-4o на OpenAI и Gemini 1.5 Pro на Google, и двата обявени тази седмица, се очаква да имат повече от 1tn параметри, а Meta обучава версия с 400 милиарда параметри на своя модел Llama с отворен код.

Освен че се борим да убедим някои корпоративни клиенти да плащат големите суми, необходими за стартиране на генеративни AI продукти, има и опасения относно данните и отговорността за авторски права, които възпрепятстват приемането.

Това доведе до технологични групи като Meta и Google за представяне на малки езикови модели само с няколко милиарда параметъра като по-евтини, енергийно ефективни алтернативи с възможност за персонализиране, които изискват по-малко енергия за обучение и работа, които също могат да ограждат чувствителни данни.

„Като имате толкова високо качество на точка с по-ниска цена, вие всъщност позволявате на толкова много повече приложения за клиентите да влязат и да правят неща, за които не е имало достатъчна възвръщаемост на тази инвестиция, за да оправдаят наистина да го правят,” каза Ерик Бойд, корпоративен вицепрезидент на Microsoft Azure AI Platform, която продава AI модели на бизнеса.

Google, Meta, Microsoft и френската стартираща компания Mistral също пуснаха малки езикови модели, които показват напреднали възможности и могат да бъдат по-добре фокусирани върху конкретни приложения.

Ник Клег, президент на Meta по глобалните въпроси, каза, че новият модел на Llama 3 с параметри от 8 милиарда е сравним с GPT-4. „Мисля, че при почти всяко измерване, за което можете да се сетите, виждате превъзходно представяне“, каза той. Microsoft каза, че неговият малък модел Phi-3 със 7 милиарда параметри превъзхожда GPT-3.5, по-ранна версия на модела на OpenAI.

Малките модели могат да обработват задачи локално на устройство, вместо да изпращат информация до облак, което би могло да се хареса на клиенти, загрижени за поверителността, които искат да гарантират, че информацията се съхранява във вътрешните мрежи.

Шарлот Маршал, управляващ сътрудник Адълшоу Годард, адвокатска кантора, която консултира банки, каза, че „един от предизвикателства, които мисля, че много от нашите клиенти са имали” при приемането на генеративни AI продукти беше спазването на регулаторните изисквания за обработка и прехвърляне на данни. Тя каза, че по-малките модели предоставят „възможност за бизнеса да преодолее“ правни и финансови проблеми.

По-малките модели също така позволяват функциите на AI да работят на устройства като мобилни телефони. Моделът „Gemini Nano“ на Google е вграден в най-новия телефон Pixel и най-новия смартфон S24 на Samsung.

Apple намекна, че също разработва модели с изкуствен интелект, които да работят на своя бестселър iPhone. Миналия месец гигантът от Силиконовата долина пусна своя модел OpenELM, малък модел, който е проектиран да изпълнява текстови задачи.

Бойд от Microsoft каза, че по-малките модели ще доведат до „интересни приложения, чак до телефоните и в лаптопи”.

Ръководителят на OpenAI Сам Алтман каза през ноември, че базираната в Сан Франциско стартираща компания предлага различни по размер AI модели на клиенти, които „обслужват отделни цели“, и ще продължи да създава и продава тези опции.

„Има някои неща, при които по-малките модели ще работят наистина добре“, добави той. „Вълнувам се за това.“

Въпреки това Алтман добави, че OpenAI ще остане фокусиран върху изграждането на по-големи AI модели с увеличени възможности, включително способността да разсъждава, планира и изпълнява задачи и в крайна сметка да постига човешки- ниво на интелигентност.

„Има много моменти, в които мисля, че хората просто искат най-добрия модел“, каза той. „Мисля, че това е, което хората най-вече искат.“

Допълнителен репортаж от Джордж Хамънд в Сан Франциско

Източник: ft.com

Последвайте ни в

Свързани новини

компаниите изкуствен изкуствен интелект интелект търсят търсят големи големи печалби печалби малки малки езикови езикови модели компаниите изкуствен интелект търсят големи печалби малки езикови модели

Коментари

Компаниите за изкуствен интелект търсят големи печалби от „малки“ езикови модели

Свързани новини

Коментари

Подобни новини

Топ новини

Актуални новини

Още новини

Информация