Световни новини без цензура!

Четири извода за надпреварата за натрупване на данни за ИИ.

Снимка: nytimes.com

New York Times | 2024-04-06 | 12:13:35

Четири извода за надпреварата за натрупване на данни за ИИ.

Онлайн данните от дълго време са скъпа стока. Години наред Meta и Гугъл употребяват данни за ориентиране на своите онлайн реклами. Netflix и Spotify го употребяват, с цел да предлагат повече филми и музика. Политическите претенденти се обърнаха към данните, с цел да научат към кои групи гласоподаватели да насочат вниманието си.

През последните 18 месеца става все по-ясно, че цифровите данни също са от решаващо значение в развиването на изкуствения разсъдък. Ето какво би трябвало да знаете.

Колкото повече данни, толкоз по-добре.

The триумф на A.I. зависи от данните. Това е по този начин, тъй като A.I. моделите стават по-точни и по-човешки с повече данни.

По същия метод, по който ученикът учи, като чете повече книги, есета и друга информация, огромните езикови модели – системите които са в основата на чатботовете — също стават по-точни и по-мощни, в случай че им се подават повече данни.

GPT-3, пуснат през 2020 година, беше подготвен на стотици милиарди „ токени “, които всъщност са думи или елементи от думи. По-нови огромни езикови модели бяха подготвени на повече от три трилиона токена.

Обикновено обхождане

Текст от уеб страници, събиран от 2007 година насам.

Уикипедия

(3 милиарда токена)

Английски език

Страници в Уикипедия.

12

милиард

Книги 1 и Книги 2

OpenAI не е обяснил наличието на тези набори от данни. Смята се, че съдържат текст от милиони оповестени книги.

55 милиарда

410 милиарда токена

WebText2

Уеб страници, свързани от Reddit, които са получили три или повече гласа „ за “ – индикация за утвърждение от потребителите.

19 милиарда

WebText2

19 милиарда

Обикновено обхождане

410 милиарда токена

Книги 2

55 милиарда

Книги 1

12 милиарда

Уикипедия

Обикновено обхождане: Текст от уеб страници, събиран от 2007 година насам.

WebText2

Уеб страници, свързани от Reddit, които са получили три или повече гласа „ за “ – индикация за утвърждение от потребителите.

Книги 1 и Книги 2: OpenAI не е обяснил наличието на тези набори от данни. Смята се, че съдържат текст от милиони оповестени книги.

Уикипедия: страници на Уикипедия на британски език.

Източник: OpenAI

От The New York Times

Източник: nytimes.com

Свързани новини

четири извода извода надпреварата надпреварата натрупване натрупване данни четири извода надпреварата натрупване данни

Коментари

Подобни новини

По време на бдението, Синовете на човека, убити от ICE в Хюстън, призовават за отговорност

По време на бдението, Синовете на човека, убити от ICE

Мамдани казва, че слепият патриотизъм прикрива недостатъците и неравенството на нацията

Мамдани казва, че слепият патриотизъм прикрива недостатъците и неравенството на

Защо се страхувам от сватбата на Тейлър Суифт?

Защо се страхувам от сватбата на Тейлър Суифт?

Алън Грийнспан, председател на Федералния резерв през просперитета и кризата, почина на 100

Алън Грийнспан, председател на Федералния резерв през просперитета и кризата,

„Какво да правя? Да й кажа ли? Как да поправя това?’

„Какво да правя? Да й кажа ли? Как да поправя

Тя е готова да преплува цялото крайбрежие на Калифорния (ако акулите позволят)

Тя е готова да преплува цялото крайбрежие на Калифорния (ако

Очертава се разделение на поколенията за републиканците по отношение на външната политика

Очертава се разделение на поколенията за републиканците по отношение на

Време е за истинската иранска революция

Време е за истинската иранска революция

Последен въпрос за здравето на Тръмп: Какъв е този обрив по врата?

Последен въпрос за здравето на Тръмп: Какъв е този обрив

Част от Белия дом е превърната в развалини. Балната зала на Тръмп ще се издигне на нейно място.

Част от Белия дом е превърната в развалини. Балната зала

Топ новини

Малте Густафсон може да последва пътя на Виктор Еклунд Айлъндърс, докато той подписва сделка за начално ниво

Малте Густафсон може да последва пътя на Виктор Еклунд Айлъндърс,

Бритни Спиърс защитава снимки, на които виси от люк на покрива на магистрала в Лос Анджелис

Бритни Спиърс защитава снимки, на които виси от люк на

Приятелката на Ламин Ямал има интимна прегръдка с испанска звезда преди полуфинала на Световното първенство

Приятелката на Ламин Ямал има интимна прегръдка с испанска звезда

Вътрешен човек споделя историята зад „Вълкът от Уолстрийт“: „Начинът ми на живот беше луд“

Вътрешен човек споделя историята зад „Вълкът от Уолстрийт“: „Начинът ми

Хронология: Изчезването на Maya Millete

Хронология: Изчезването на Maya Millete

Мъж прави диво видео за разкриване на пола на бебето, след като случайно му беше даден изненадващ десерт за двойка

Мъж прави диво видео за разкриване на пола на бебето,

Мистериозният победител купува T-rex с прякор „Гъс“ за рекордните 50 милиона долара на търг

Мистериозният победител купува T-rex с прякор „Гъс“ за рекордните 50

Пожарникарите от Торонто съобщават за по-дълго време за пътуване при навигация в задръствания и увеличени повиквания

Пожарникарите от Торонто съобщават за по-дълго време за пътуване при

Карибските лидери настояват за репарации за робство, край на териториалния статут на островите

Карибските лидери настояват за репарации за робство, край на териториалния

Стюардесите на WestJet провеждат информационен пикет, докато се провежда гласуване за стачка

Стюардесите на WestJet провеждат информационен пикет, докато се провежда гласуване

Актуални новини

Издигнете се над света с победителите в Международния въздушен фотограф на годината: снимки

Издигнете се над света с победителите в Международния въздушен фотограф

Лидерите на Републиканската партия в Камарата на представителите се сблъскаха след консервативен бунт

Лидерите на Републиканската партия в Камарата на представителите се сблъскаха

Прогноза за мача на всички звезди на MLB за 2026 г.: избор, коефициенти, най-добър залог за вторник

Прогноза за мача на всички звезди на MLB за 2026

Кристофър Нолан казва, че младата публика отхвърля „помията с изкуствен

Убийствата от имиграционни агенти бяха голям проблем за Тръмп — и сега те се завърнаха

Убийствата от имиграционни агенти бяха голям проблем за Тръмп —

Дарлайн Греъм, сестрата на Линдзи Греъм, положи клетва да изкара остатъка от мандата си в Сената

Дарлайн Греъм, сестрата на Линдзи Греъм, положи клетва да изкара

Професор по икономика от Бръшляновата лига подозира, че половината му студенти мамят с помощта на AI

Професор по икономика от Бръшляновата лига подозира, че половината му

Звездата от „Bachelorette“ Джо Амабиле разкрива „ранен стадий“ на диагнозата мозъчен тумор

Звездата от „Bachelorette“ Джо Амабиле разкрива „ранен стадий“ на диагнозата

Дарлайн Греъм, сестрата на Линдзи Греъм, положи клетва да служи до края на мандата си в Сената

Дарлайн Греъм, сестрата на Линдзи Греъм, положи клетва да служи

Администрацията на Тръмп прекрати опита да замрази 10 милиарда долара във федерални фондове за сините щати

Администрацията на Тръмп прекрати опита да замрази 10 милиарда долара

Още новини

© Всички права запазени!

Информация

За нас Реклама Поверителност Контакт