Световни новини без цензура!
Microsoft прави нов тласък към по-малък ИИ Systems
Снимка: nytimes.com
New York Times | 2024-04-23 | 07:48:49

Microsoft прави нов тласък към по-малък ИИ Systems

В шеметната надпревара за изграждане на генеративен ИИ. системи, мантрата на технологичната индустрия е по-голямото е по-добро, независимо от цената.

Сега технологичните компании започват да възприемат по-малки ИИ. технологии, които не са толкова мощни, но струват много по-малко. И за много клиенти това може да е добър компромис.

Във вторник Microsoft представи три по-малки A.I. модели, които са част от технологично семейство, което компанията е нарекла Phi-3. Компанията каза, че дори най-малкият от трите се представи почти толкова добре, колкото GPT-3.5, много по-голямата система, която беше в основата на чатбота ChatGPT на OpenAI, когато изуми света след пускането си в края на 2022 г.

Най-малкият модел Phi-3 може да се побере на смартфон, така че може да се използва дори ако не е свързан с интернет. И може да работи с видовете чипове, които захранват обикновените компютри, вместо по-скъпите процесори, произведени от Nvidia.

големи езикови модели или L.L.M.s, математически системи, които прекарват седмици в анализиране на цифрови книги, статии в Wikipedia, новинарски статии, чат регистрационни файлове и друг текст, извлечен от целия интернет. Чрез определяне на модели в целия този текст, те се научават да генерират текст сами.

Но L.L.M. съхраняват толкова много информация, че извличането на това, което е необходимо за всеки чат, изисква значителна изчислителна мощност . А това е скъпо.

Докато технологични гиганти и стартиращи фирми като OpenAI и Anthropic са фокусирани върху подобряването на най-големия AI. системи, те също се състезават да разработят по-малки модели, които предлагат по-ниски цени. Meta и Google, например, пуснаха по-малки модели през последната година.

Meta и Google също имат „отворен код“ на тези модели, което означава, че всеки може да ги използва и променя безплатно. Това е често срещан начин компаниите да получат външна помощ за подобряване на своя софтуер и да насърчат по-голямата индустрия да използва техните технологии. Microsoft също предлага с отворен код новите си модели Phi-3.

(Ню Йорк Таймс съди OpenAI и Microsoft през декември за нарушаване на авторски права върху новинарско съдържание, свързано със системи с изкуствен интелект. )

едноцифрени центове” — огромен разход, като се има предвид какво предлагат популярни уеб услуги като Wikipedia за малки части от цент.

Сега изследователите казват техните по-малки модели могат поне да се доближат до производителността на водещи чатботове като ChatGPT и Google Gemini. По същество системите все още могат да анализират големи количества данни, но съхраняват моделите, които идентифицират, в по-малък пакет, който може да се обслужва с по-малко процесорна мощност.

Изграждането на тези модели е компромис между мощност и размер. Себастиен Бубек, изследовател и вицепрезидент на Microsoft, каза, че компанията е изградила новите си по-малки модели, като е прецизирала данните, които са били изпомпвани в тях, като работи, за да гарантира, че моделите се учат от текст с по-високо качество.

синтетични данни.“ След това човешки куратори работиха, за да отделят най-резкия текст от останалия.

Microsoft създаде три различни малки модела: Phi-3-mini, Phi-3-small и Phi- 3-среден. Phi-3-mini, който ще бъде наличен във вторник, е най-малкият (и най-евтиният), но най-малко мощният. Phi-3 Medium, който все още не е наличен, е най-мощният, но най-големият и най-скъпият.

Създаване на системи, достатъчно малки, за да се поставят директно на телефон или персонален компютър „ще ги направи много по-бързи и с порядък по-евтини“, каза Гил Лурия, анализатор в инвестиционната банка D.A. Дейвидсън.

Източник: nytimes.com


Свързани новини

Коментари

Топ новини

WorldNews

© Всички права запазени!