Р еволюцията в областта на изкуствения интелект отдавна се характеризира с пробивите на моделите за големи езикови модели (LLM) - мощните двигатели зад чатботовете и генерирането на съдържание. Тези модели трансформираха работата на „белите якички“, оптимизирайки дигиталните задачи и анализи.

Въпреки това, сега е в ход значителна промяна в елитните нива на инвестициите в AI, сигнализирайки за преминаване отвъд дигиталната граница към физическия свят – ход, воден от световните модели и очакван да отключи зашеметяващата пазарна възможност от 100 трилиона долара, отбелязва Financial Times.

Тази колосална сума, представляваща размера на основните физически индустрии в света, е основната теза на нова вълна от инвестиции. Тъй като водещите лаборатории за изкуствен интелект, от Meta и Google до титани в индустрията като NVIDIA, достигат възприемания таван LLM, фокусът се насочва към интелигентност, която може наистина да взаимодейства, да разсъждава и да планира в рамките на осезаемата среда.

За разлика LLM, които са специализирани в езика и допълването на модели върху текст, т.нар. световни модели целят да симулират, разбират и предсказват физически среди. Те разсъждават за обекти, анализират причинно-следствена връзка, движение и последствията от действията. Всъщност те се опитват да дадат на изкуствения интелект „уменията на улицата“ – способността да планира, действа и се адаптира в 3D среда.

По същество, "световен модел" е AI агент, способен на вътрешна симулация. Той може да си „представи“ резултата от поредица от действия, преди да ги изпълни в реалния свят. Тази способност е от решаващо значение за области, където грешките са скъпоструващи, като например автономно шофиране, сложна индустриална автоматизация и роботика. Това обещава да преодолее разликата между днешния интелигентен предсказващ софтуер и истинския, универсален машинен интелект.

Един от най-поразителните сигнали за тази промяна е създаването и финансирането на World Labs, стартираща компания, съоснована от светилото в областта на изкуствения интелект Фей-Фей Ли и подкрепена от водещи спонсори. World Labs наскоро набра 230 милиона долара за изграждане на „Големи световни модели“ (LWM), предназначени да възприемат, моделират и взаимодействат с триизмерни пространства.

Амбицията е мащабна: ако машините наистина могат да разбират физическия свят, тогава всички области на икономическата дейност – транспорт, логистика, роботика, производство, интелигентна инфраструктура, ​​ще станат достъпни за изкуствения интелект. Според поддръжниците това предполага потенциален пазар от порядъка на 100 трилиона долара. Рев Лебаредиан, вицепрезидент на NVIDIA Omniverse и Simulation Technology, формулира тази визия, предполагайки, че World Models ще внесат интелигентност в индустрии, които колективно представляват почти цялата световна икономика.

Тази сума е провокативна. Тя не е толкова проекция на общо адресируемия пазар, колкото средство, начин да се преосмисли AI като нещо повече от ботове за чат и генериране на текст. На практика световните модели все още са в ранен етап: тестовете на агенти на ниво задача показват процент на успех между 20% и 40% в прости области като сортиране или обработка на обекти.

Nvidia е особено гласовита по отношение на „физическия AI“, включвайки симулацията, цифровите близнаци и моделирането на света в дългосрочната си стратегия. Успоредно с това водещите лаборатории за AI пренастройват своите пътни карти – намаляват акцента върху моделирането на чист език и се насочват към агенти, които разсъждават пространствено.

Причината е проста: много приложения в реалния свят изискват повече от довършване на изречения. Роботите, които се движат в складове, дроновете, извършващи инспекции или агентите, координиращи логистиката, не могат да разчитат само на езика – те се нуждаят от модели, основани на физиката, времето, постоянството на обектите, промяната и адаптацията.

Световните модели се стремят да взаимодействат с реалността. Въпреки това, пред нас се извисяват значителни предизвикателства. Изискванията за данни са в пъти по-високи: обучението на физически модели изисква богато разнообразни сценарии, сензорни данни, симулации и следи от взаимодействия в реалния свят.

Крайните случаи – ежедневни, но редки комбинации от условия – трябва да бъдат уловени. Прогнозите трябва да бъдат правилни не само често, но и надеждно, завинаги. А енергийните, изчислителните и последиците за безопасността от внедряването на тези системи в голям мащаб са от критично значение.

Освен това числото 100 трилиона долара може да разпали очакванията. Малко технологии се развиват линейно. Дори ако агентите станат компетентни в контролирани условия, мащабирането им до сложни области (градска роботика, непредсказуема външна среда, човешки пространства) ще изисква пробиви в устойчивостта, обобщението и хибридния интелект. Ако тази визия успее, AI ще се разшири отвъд генеративния текст в агенти, среди, автономност и самата структура на това как машините възприемат и действат в реалния свят. Индустрията на AI в реалния свят, която те описват, не е просто бъдеща възможност; тя може да е оста, около която ще се завърти следващото десетилетие.

