New York Times | 2024-04-23 | 07:48:49

Microsoft прави нов тласък към по-малък ИИ Systems

В шеметната конкуренция за създаване на генеративен ИИ. системи, мантрата на софтуерната промишленост е по-голямото е по-добро, без значение от цената.

Сега софтуерните компании стартират да възприемат по-малки ИИ. технологии, които не са толкоз мощни, само че костват доста по-малко. И за доста клиенти това може да е добър компромис.

Във вторник Microsoft показа три по-малки A.I. модели, които са част от софтуерно семейство, което компанията е нарекла Phi-3. Компанията сподели, че даже най-малкият от трите се показа съвсем толкоз добре, колкото GPT-3.5, доста по-голямата система, която беше в основата на чатбота ChatGPT на OpenAI, когато изуми света след стартирането си в края на 2022 година

Най-малкият модел Phi-3 може да се побере на смарт телефон, тъй че може да се употребява даже в случай че не е обвързван с интернет. И може да работи с типовете чипове, които зареждат елементарните компютри, вместо по-скъпите процесори, създадени от Nvidia.

огромни езикови модели или L.L.M.s, математически системи, които прекарват седмици в анализиране на цифрови книги, публикации в Wikipedia, новинарски публикации, чат регистрационни файлове и различен текст, извлечен от целия интернет. Чрез установяване на модели в целия този текст, те се научават да генерират текст сами.

Но L.L.M. съхраняват толкоз доста информация, че извличането на това, което е належащо за всеки чат, изисква забележителна изчислителна мощ. А това е скъпо.

Докато софтуерни колоси и започващи компании като OpenAI и Anthropic са фокусирани върху подобряването на най-големия AI. системи, те също се състезават да разработят по-малки модели, които оферират по-ниски цени. Meta и Гугъл, да вземем за пример, пуснаха по-малки модели през последната година.

Meta и Гугъл също имат „ отворен код “ на тези модели, което значи, че всеки може да ги употребява и трансформира гратис. Това е постоянно срещан метод фирмите да получат външна помощ за възстановяване на своя програмен продукт и да насърчат по-голямата промишленост да употребява техните технологии. Microsoft също предлага с отворен код новите си модели Phi-3.

(Ню Йорк Таймс съди OpenAI и Microsoft през декември за нарушение на авторски права върху новинарско наличие, обвързвано със системи с изкуствен интелект. )

едноцифрени центове ” — голям разход, като се има поради какво оферират известни уеб услуги като Wikipedia за дребни елементи от цент.

Сега откривателите споделят техните по-малки модели могат най-малко да се приближат до продуктивността на водещи чатботове като ChatGPT и Гугъл Gemini. По създание системите към момента могат да проучват огромни количества данни, само че съхраняват моделите, които разпознават, в по-малък пакет, който може да се обслужва с по-малко процесорна мощ.

Изграждането на тези модели е компромис сред мощ и размер. Себастиен Бубек, откривател и вицепрезидент на Microsoft, сподели, че компанията е построила новите си по-малки модели, като е прецизирала данните, които са били изпомпвани в тях, като работи, с цел да подсигурява, че моделите се учат от текст с по-високо качество.

синтетични данни. “ След това човешки куратори работиха, с цел да отделят най-резкия текст от останалия.

Microsoft сътвори три разнообразни дребни модела: Phi-3-mini, Phi-3-small и Phi- 3-среден. Phi-3-mini, който ще бъде разполагаем във вторник, е най-малкият (и най-евтиният), само че минимум мощният. Phi-3 Medium, който към момента не е разполагаем, е най-мощният, само че най-големият и най-скъпият.

Създаване на системи, задоволително дребни, с цел да се слагат непосредствено на телефон или личен компютър „ ще ги направи доста по-бързи и с порядък по-евтини “, сподели Гил Лурия, анализатор в капиталовата банка D.A. Дейвидсън.

Източник: nytimes.com