Джан Хунджианг, основател на BAAI: „Системите с изкуствен интелект никога не трябва да са в състояние да измамят хората“

Жанг Хундзян е компютърен академик и върховен изпълнителен шеф, който се трансформира в един от най-откровените гласове на Китай по отношение на нуждата от безвредно създаване на изкуствен интелект.

След като отбрани докторската си степен в Дания, той работи в Сингапур и Пало Алто, Калифорния, в продължение на няколко години. След това се завръща в Китай при започване на 2000-те, с цел да помогне за основаването на Microsoft Research Asia, преди да продължи да построява Kingsoft в една от водещите софтуерни компании в Китай.

Той се отдръпна от този бизнес през 2016 година единствено с цел да се върне на фронтовата линия на китайските технологии две години по-късно, като сътвори Пекинската академия за изкуствен интелект (BAAI), организация с нестопанска цел, която сплотява промишлеността и университетските среди.

През последните години Джан се трансформира във водещ бранител на Китай за регулирането на ИИ, с цел да се подсигурява, че той не е опасност за човечеството. Тук той беседва с Райън Макмороу и Ниан Лиу от FT за значимостта на интернационалното съдействие за защитните ограничения за ИИ, както и за опциите и провокациите, пред които е изправен Китай.

Ниан Лиу: Това наподобява, че обръщате доста внимание на ръководството на AI?

Zhang Hongjiang: Прекарах доста време в опити да повиша осведомеността в изследователската общественост, промишлеността и държавното управление, че вниманието ни не би трябвало да бъде ориентирано единствено към евентуалните опасности от ИИ, за които към този момент сме осведомени, като подправени вести, пристрастия и дезинформация. Това е корист с ИИ.

По-големият евентуален риск е екзистенциалният риск. Как да проектираме и направляваме по-мощните AI системи на бъдещето, тъй че да не избягат от човешкия надзор?

Ние разработихме определението за екзистенциален риск на конференция в Пекин през март. Най-смислената част са алените линии, които сме дефинирали.

Например: една AI система [не трябва] в никакъв случай да се възпроизвежда и усъвършенства. Тази алена линия е супер значима. Когато системата има способността да се самовъзпроизвежда, да се усъвършенства, тя излиза отвън надзор.

Второто е измамата. AI системите в никакъв случай не би трябвало да имат способността да мамят хората.

По-големият капацитет рискът е екзистенциален риск. Как да проектираме и направляваме по-мощните AI системи на бъдещето, тъй че да не избягат от човешкия надзор?

Друго явно е, че AI системите не би трябвало да имат способността да създават оръжия за всеобщо заличаване, химически оръжия. Освен това системите с ИИ в никакъв случай не би трябвало да имат мощ на убеждаване . . . по-силни от хората.

Глобалната изследователска общественост би трябвало да работи дружно и по-късно да призове световните държавни управления да работят дружно, тъй като това не е риск единствено за вашата страна. Това е голям риск за цялото човечество.

Научих толкоз доста на Международния разговор за сигурността на ИИ в Обединеното кралство през октомври предходната година. Това в действителност е система на работа изпод нагоре. Това е техническа работа. Това не е единствено политическа работа.

Разбрах, че в Европа и Съединени американски щати - изключително в Европа - има механически хора, които работят в тази област от доста години и които са създали много системи за премерване и установяване на риска от AI системите.

Британците поеха огромна самодейност. Както направиха на първата интернационална държавна среща на върха предходната година.

Райън Макмороу: Когато сте в тези полемики, гледните точки на водещи китайски учени и политици сходни ли са на западните?

ZH: Много. Аргументът се концентрира върху това дали актуалните AI системи фактически имат благоприятни условия за неестествен общ разсъдък (AGI) или дали ще доведат до AGI и какъв брой надалеч. Но в случай че се съгласите, че рискът е налице, тогава в действителност няма огромна разлика в гледните точки.

[Бившият пионер на Гугъл AI] Джефри Хинтън сподели, че цифровата система се учи по-бързо от биологичните системи, което значи че AI се учи по-бързо от човешките същества - което значи, че AI един ден ще надмине човешкия разсъдък. Ако вярвате в това, значи е въпрос на време. По-добре започнете да вършиме нещо. Ако мислите за евентуалния риск, като да вземем за пример какъв брой типа са изчезнали, по-добре се подгответе за него и да се надяваме да предотвратите това въобще да се случи.

Научното съдействие би трябвало да бъде нормална процедура. Но, за жалост, в този момент това не е нормална процедура. Разбира се, AI е най-напредналата технология, тъй че стана по-чувствителна. Особено сред Китай и Съединени американски щати геополитиката оказва въздействие върху тези съдействия. Надявам се, най-малко на научно равнище, това съдействие да продължи.

NL: Говорейки за Китай и Съединени американски щати, по какъв начин мислите, че контролът върху износа на процесори от Съединени американски щати ще се отрази дълготрайното развиване на китайския AI?

ZH: Мисля, че ще има голямо влияние. Винаги съм мислил за AI като система, състояща се от три неща: алгоритми; изчислителна мощност; и данни. Без изчислителната мощност днешната технология би станала по-ограничена. Същността на GPT моделите е тяхната мащабируемост. Тоест, в случай че увеличите размера, броя на параметрите на модела, неговата продуктивност ще се усъвършенства. Ако увеличите размера на данните, които въвеждате в модела, неговата продуктивност също ще се усъвършенства. Това е, което назоваваме закон за мащабиране на моделите.

И защото увеличавате както параметрите, по този начин и данните, би трябвало да увеличите и изчислителната мощ. Така че, в случай че ограничавате изчислителната мощ, несъмнено ще попаднете на спънка. Няма подозрение в това.

Бенедикт Еванс Къде е изкуственият общ разсъдък? Предположението на дядо ми е толкоз положително, колкото и твоето

RM: За да преодолее тези трудности, Китай упорства за създаването на домашни процесори. Но в това време множеството от съществуващите модели тук са построени върху екосистемата на чиповете на Nvidia. Възможно ли е просто да се придвижи модел сред разнообразни екосистеми на чипове?

ZH: Техният програмен продукт би трябвало да е съчетаем, което е мъчно. Хората построяват доста модели и най-ефективните модели са построени в екосистемата на Nvidia. Така че, в случай че желаете да изградите своя лична екосистема, това ще отнеме време и старания. По-добре е да сте съвместими с екосистемата на Nvidia.

Това доста наподобява на проблеми със софтуерната съгласуемост сред Windows и Mac. Например, в случай че създадете нещо на Android, всъщност би трябвало да го настроите, с цел да работи на iOS. Днес фирмите, разработващи софтуерни приложения, би трябвало да създават и на двете платформи, което значи, че би трябвало да имат профилирани екипи. Същият принцип се ползва, в случай че работите върху модели: може да се наложи да изградите две системи, което ще бъде мъчно и също скъпо.

RM: Колко мъчно е да се построи две разнообразни системи?

ZH: Доста е мъчно, тъй като настройвате софтуерни стекове, които са набори от съществени функционални модули, нужни за работата на системите за образование. Ако би трябвало да изградите цялата платформа дружно, това е просто доста изпитание. Трудно е като построяването на различен Android.

RM: Изглежда, че Huawei е отпред на китайската Nvidia: има чиповете Ascend, създадени тук [в Китай], които Съединени американски щати не могат да блокират. На това ли би трябвало да се основават фирмите в този момент?

ZH: Моето схващане е, че ще се стабилизира. Точно както когато създавате програмен продукт, не желаете да надграждате върху прекалено много операционни системи. Помислете за това, в ерата на компютъра, в ерата на мобилните телефони, има две системи. Това е. Помислете за архитектурата на чипа, какъв брой архитектури има? Не са толкоз доста.

RM: Ще бъде ли изчислителната мощ още по-важна в мултимодалното бъдеще с хуманоиди и образни модели. Те изискват ли още повече изчислителна мощност от елементарния език?

ZH: Да. Данните за зрението, които включват изображения и видео данни, са доста по-големи по размер спрямо езиковите данни.

RM: Така че изчислителната мощ е спънка, само че какви са преимуществата на Китай? Политиците бяха доста дейни тук, това преимущество ли е? Или геният?

ZH: Политиката е последното нещо, което идва на разум, когато приказваме за преимуществата на Китай в ИИ. Мисля, че преимуществата на Китай в региона на изкуствения разсъдък са най-много измежду младите бизнесмени, които минават през отчаяние след отчаяние, само че все пак не престават да основават започващи компании и да преследват фантазиите си. Мисля, че единственото място, което можем да съпоставим, е Силиконовата котловина.

I мисля, че преимуществата на Китай в региона на изкуствения разсъдък са най-много измежду младите бизнесмени, които претърпяват отчаяние след отчаяние, само че не престават да основават започващи компании и да преследват фантазиите си

Някой ми даде номер, въпреки че съм сигурен можете да намерите по-точни: 30 % от най-хубавите AI гении в света в началото са родени в Китай, само че огромна част от тях работят в Съединени американски щати. Ако 10 % от най-талантливите останат в Китай, това към момента съставлява забележителен брой хора.

На всичкото от горната страна има голям пазар. Има толкоз доста сюжети, [в които] да се приложи AI — който от своя страна показва положителни тематики за проучване и дава положителни данни за проучване. Това разрешава на изследователските институции и университетите да работят върху положителни проблеми.

Така че мисля, че геният, сюжетите за приложение и предприемачеството са преимуществата на Китай. Но не мисля, че държавните политики са безусловно преимущество.

NL: Какво ще кажете за данните? Вашият остарял сътрудник Кайфу Лий означи в книгата си, че Китай разполага с всички тези данни, което ще бъде голямо преимущество.

ZH: Китай е голям интернет пазар, тъй че Китай е имал тонове данни като преимущество в предишното. Но по-късно осъзнаваме, че когато погледнем GPT моделите и данните, които се подават в моделите, и разпространяването на данни, те са от мрежата. И в случай че погледнете в мрежата, китайският корпус не е толкоз доста. Това е в ниските едноцифрени цифри. Мисля, че по-малко от 5 %. Много езици имат по-малко от 10 %.

Мисля, че британският съставлява към 60 % или 70 %, тъй че е най-вече британски. Така че, в случай че упражнявате модела си с данни от мрежата, китайските данни не са толкоз доста. [И] който и език да има повече данни, той ще бъде по-добър на този съответен език. Ако погледнете Уикипедия, всички уеб данни, китайските данни не са преобладаващи. Така че няма да кажа, че във връзка с езиковите данни има преимущество.

Но когато стигнем до въплътен AI, когато стигнем до роботика, когато стигнем до произвеждане, Китай разполага с тонове данни. Много повече от други страни.

Например модел на образован град. Китай несъмнено има повече данни от всяка друга страна. Просто погледнете броя на камерите в Китай. Вижте броя на електрическите коли, които имат базова дарба за самостоятелно шофиране. Те имат толкоз доста камери. Така че зависи за коя област говорите.

Изкуствен разсъдък Колко добър е видеомоделът Sora на OpenAI — и ще преобрази ли работните места?

RM: Това последващо потомство модели на зрение ли е в хуманоидните роботи занапред стартира?

ZH: Това се трансформира в гореща тематика през последните 18 месеца, изключително с разработки като GPT-4. Той има впечатляващи благоприятни условия за различаване на изображения и обекти в изображения. И по-късно, в случай че погледнете Sora и Gemini 1.5, както и Claude от Anthropic и новата Llama 3, всички те демонстрират тази мултимодалност - която в основата си е дарба за изображения.

Ако оборудвате робот с огромен мултимодален модел, той може да извършва задания, надхвърлящи това, за което е бил подготвен. То също ще схваща команди, на които в началото не е било подготвено. Изведнъж разбирате, че един робот може да разбере доста повече, в сравнение с сте предполагали.

Добър образец е RT2, пуснат от Гугъл преди към година. Например, когато помолите робота да вземе играчка от горната страна на тази маса, играчка, която е към този момент изчезнало животно, той избира динозавър. Това е доста комплициран развой на размишление, тъй като не е казано непосредствено, че динозавърът е изчезнало животно, само че езиковият модел знае това. И по този начин, измежду другите скотски играчки, той избира динозаври.

Ако в случай че оборудвате робот с огромен мултимодален модел, той може да извършва задания, надалеч надхвърлящи това, за което е бил обучен . . . Изведнъж разбирате, че един робот може да разбере доста повече, в сравнение с сте предполагали

Друг образец е: „ Дайте кутия кока-кола на Тейлър Суифт. “ На масата имаше четири рамки за фотоси. Роботът взе кока-кола и я сложи върху фотографията на Тейлър Суифт. Така че, помислете за този развой. Роботът може да разпознае кой е на тази фотография. Има визия коя е Тейлър Суифт. Това не е подготвено в езиковия модел.

Ето за какво виждате Фигура, нов започващ робот, който се сплоти с OpenAI, който OpenAI

Източник: ft.com