Новите пазари за AI данни
Писателят е световен съученик на капиталовото банкиране в Goldman Sachs.
Данните са в основата на революцията на изкуствения разсъдък, само че AI също революционизира пазара на данни. Разработчиците се състезават да влагат милиарди долари за създаване на инфраструктурата за зареждане на големи AI системи. Това бързо разширение докара до скок на търсенето на данни, създавайки капацитета на фирмите да генерират забележителна икономическа стойност.
AI системите нормално се разказват като три съществени съставния елемент - мощ, пресмятане и данни. Те се отнасят до електричеството, належащо за центрове за зареждане на данни, чиповете, нужни за осъществяване на калкулации с умопомрачителни скорости, и данните, нужни за образование на AI модели. От тези сериозни съставни елементи са най -малко обсъждани данни, може би тъй като центровете за данни и полупроводниците са физически неща, които можете да видите и докоснете. (Съзнателно е мъчно да се задържи пакет от данни по време на главната записка на сцената.)
Но данните за снабдяването са значителен аспект на бързо разширяващата се екосистема на AI. Според някои оценки светът изчерпва „ органични “ данни, като разработчиците на модели доближават до рестриктивните мерки на обществено налични данни-по създание копия на целия интернет-за авансово подготвителни модели на Bigger.
След като модели на тест са конструирани и авансово подготвени на големи набори от данни, те към момента изискват в допълнение „ тестово време за пресмятане “, където моделът се изисква да дава отговор на съответни въпроси или да се разтвори проблеми. Това изисква верния тип данни, които от време на време липсват.
липсват задоволително данни за образование, които демонстрират, че хората „ демонстрират своята работа “ в стъпките за справяне с комплицирани проблеми. Тук фирмите със съсредоточени, добре проведени или мощно разумни набори от данни могат да станат неотдавна настоящи. Представете си по какъв начин една учебника може да употребява своите архиви на механически наръчници и курсова работа, с цел да образова AI система за осъществяване на комплицирани научни процеси.
Последните покупко-продажби за лицензиране на данни демонстрират по какъв начин другите компании продават достъп до своите данни на AI компании. Очаквайте тази наклонност да се форсира, защото фирмите стават още по -креативни в това. Досега тези покупко-продажби са контрактувани самостоятелно със специфични условия, само че можете да си визиите пазар - или голям брой пазари - за пораждане на данни за образование.
синтетични данни или данни, основани най-малко частично от AI системи, е сериозна част от създаването на огромни езикови набори и се появяват като веднъж за разширение на набора от варианти за разработчици, които търсят нови набори от данни. Системите могат от ден на ден да основават карти на нашата физическа среда. Синтетичните данни за самоуправление могат да включват основаване на „ дигитален близнак “ на Лос Анджелис и милиони „ макетни “ транспортни средства направляват в града във виртуално пространство като данни за образование.
и е допустимо типовете данни, които преди са били сложни за разбор или потребление, да станат ново налични и скъпи с невероятната изчислителна мощ на AI системите. Помислете какви данни сме събрали за комплицирани системи като времето, квантовата механика или вирусните разновидности. Тъй като роботите могат да възприемат цели категории данни, които са незабележими за хората, сбирките от видео и пространствени данни също могат внезапно да имат новооткрита стойност.
Ричард Уотърстръм Whiplash jolts ai
tesla употребява данните, събрани от неговия самостоятелен шофьорски транспортни средства, с цел да образова AI модели, които зареждат главните си технологии за самоубийство. И NVIDIA неотдавна оповестиха разширение на своята симулационна среда на робота, където образова своите роботи във виртуално, цифрово показване на физическия свят.
Едно от най-ценните складове на данните са генерирани от индивида данни, които остават заключени-собствени проучвания зад корпоративните и държавните защитни стени. Днес притежателите на тези данни не са склонни да го създадат налично, без да знаят последствията. Но верните структури и тласъци могат да поканят повече покупко-продажби.
На процедура другите компании ще измислят разнообразни тактики. Някои ще третират данните като главен бизнес актив, а не на непряк артикул и ще работят за доходи от тях посредством лицензиране или абонаменти. Други ще би трябвало да надстроят своята инфраструктура за данни, с цел да се възползват най -добре от бъдещите благоприятни условия за ИИ.
Как другите юрисдикции вземат решение да контролират ИИ и по -нататъшно контролиране на потреблението на данни ще имат дълбоки последствия за това по какъв начин се развиват тези пазари - и къде. Поверителност и сигурност на данните, въпросите по отношение на произхода на данни, собствеността, удостоверяването са всички евентуални нови области на законодателството.
Този интервал на невероятни нововъведения и произшествия предлага благоприятни условия за фирмите, които получават своята тактика за данни.