DeepSeek ще пусне дългоочаквания AI модел в ново предизвикателство за американските съперници

DeepSeek ще пусне най-новия си огромен езиков модел идната седмица, повече от година от последното си огромно издание в нов тест на упоритостите на Китай да провокира съперниците на Съединени американски щати в AI.

Базираната в Хангжу лаборатория възнамерява да показа V4, „ мултимодален “ модел с функционалности за генериране на картина, видео и текст, съгласно двама осведомени с въпроса.

Те споделиха, че DeepSeek е работил с китайските производители на AI чипове Huawei и Cambricon, с цел да усъвършенстват V4 за най-новите си артикули, съгласно двама души, осведомени с тези договорености.

Този ход алармира за по-широки китайски старания за отбягване на зависимостта от водещите на пазара AI чипове на Nvidia, които са обект на надзор върху износа на Вашингтон, предопределен да ограничи софтуерния напредък на страната.

Новото издание на DeepSeek е планувано преди годишните парламентарни срещи „ Две сесии “ идната седмица, които стартират на 4 март. Високопоставеното политическо събиране може в допълнение да затвърди статута на DeepSeek като народен AI първенец.

Това ще бъде първото огромно стартиране на модел от DeepSeek от януари 2025 година, когато разкриха своя модел за размишление R1. Компанията твърди, че е построила система, сравнима с водещите модели от Силициевата котловина, употребявайки единствено част от изчислителната мощ.

Този ход провокира шокови талази измежду американските софтуерни акции, което някои специалисти описаха като миг на „ Спутник “, който алармира за бързия прогрес на Китай като мощ на изкуствения разсъдък.

Оттогава DeepSeek издава постепенни актуализации, вместо да пуска изцяло нов модел, което разрешава на локалните съперници, в това число Alibaba и Moonshot ще уловят търсенето на евтини китайски модели с отворен код.

Очаква се напъните на DeepSeek да усъвършенства V4 за чипове, създадени в Китай, да подтикват локалното търсене на неговите полупроводници и да ускорят прехода от американските производители на чипове Nvidia и AMD за „ заключения “ – генериране на отговори от подготвен модел.

Ройтерс първи заяви за Работата на DeepSeek с Huawei и Cambricon.

DeepSeek не е работил с Nvidia, с цел да усъвършенства своя модел за нейните артикули, съгласно друго лице, осведомено с въпроса.

Nvidia продължава да господства на пазара за подготвителни чипове, изключително за изчислително интензивната фаза на авансово образование, в която моделите гълтам големи количества данни.

FT заяви по-рано, че DeepSeek се е опитал да организира това в началото образование на хардуера на Huawei, само че е срещнал механически усложнения.

DeepSeekКак дребният китайски започващ AI DeepSeek шокира Силиконовата котловина

Миналогодишното издание на R1 беше оповестено дружно с обстоен механически отчет за инженерните техники на DeepSeek, които употребяват чиповете на Nvidia по-ефективно за образование и ръководство модел.

DeepSeek беше окуражителен за шерването на своите способи за образование за създаване на „ разумен модел “, който по-късно разреши на други лаборатории да проучат и приложат своите открития. Моделите за размишление са предопределени да позволяват комплицирани проблеми, като ги разделят на по-малки стъпки.

Очаква се DeepSeek да разгласява по-кратка техническа записка дружно с V4 идната седмица, последвана от по-изчерпателен отчет към месец по-късно, съгласно лице, което е директно осведомено с проектите.

По-рано през седмицата Anthropic упрекна DeepSeek и две други китайски лаборатории за изкуствен интелект в „ дестилационни офанзиви “ върху нейните модели, процедура на образование на по-малки модели върху резултатите от по-напреднали системи, което им разрешава да прекопирване на продуктивността на американската компания, без да се употребяват същите изчислителни запаси.

Huawei, DeepSeek и Cambricon не дадоха отговор на претенции за коментар.

Източник: ft.com