М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Затварят временно дома за стари хора в Помориe

Затварят временно дома за стари хора в Помориe

България Преди 45 минути

Нова проверка на РЗИ установи, че нито едно от предписанията, дадени преди месец, не е изпълнено

Ивайло и Калин се срещат на Арената за братски дуел в “Игри на волята”

Ивайло и Калин се срещат на Арената за братски дуел в “Игри на волята”

Любопитно Преди 52 минути

Сапунджиева търси път към останалите в племето на Феномените

Задържаха 18-годишен за пожар в центъра на София

Задържаха 18-годишен за пожар в центъра на София

България Преди 3 часа

Обвиняемият е задържан за срок до 72 часа

"Лукойл": Преговаряме с потенциални купувачи

"Лукойл": Преговаряме с потенциални купувачи

Свят Преди 3 часа

Компанията се стреми да осигури непрекъсната работа на активите по време на тяхната продажба

<p>Задържаха Шрек за отвличане на млада жена в Свиленград</p>

Трима отвлякоха млада жена в Свиленград, мъж с прякор Шрек е задържан

България Преди 3 часа

Заедно с него в ареста като съпричастни към случая са още един мъж и една жена

Излезе изтрита сцена с импровизираната целувка между Блейк Лайвли и Джъстин Балдони от "Никога повече"

Излезе изтрита сцена с импровизираната целувка между Блейк Лайвли и Джъстин Балдони от "Никога повече"

Любопитно Преди 4 часа

Адвокатите на Балдони твърдят в документи, че 38-годишната звезда от „Клюкарката“ е добавила сцената към сценария

СГП предаде на съд Никола Барбутов и още трима

СГП предаде на съд Никола Барбутов и още трима

България Преди 4 часа

Никола Барбутов е предаден на съд и за подкуп

Специален британски лиценз за българския „Лукойл“

Специален британски лиценз за българския „Лукойл“

Свят Преди 4 часа

Лицензът важи до февруари

Жената, която предвиди убийството на Кенеди — историята на Джийн Диксън

Жената, която предвиди убийството на Кенеди — историята на Джийн Диксън

Любопитно Преди 4 часа

Истинската история на медиумката, чиито предсказания стигнаха до президентите на САЩ

КЗП се самосезира за цените на паркирането в София

КЗП се самосезира за цените на паркирането в София

България Преди 4 часа

КЗП обръща внимание, че Законът за въвеждане на еврото предвижда сериозни санкции

Русия обяви превземането на 2 селища в Източна Украйна

Русия обяви превземането на 2 селища в Източна Украйна

Свят Преди 6 часа

Министерството на отбраната на Руската федерация каза, че през последната седмица са били превзети общо осем селища в Украйна

Влак блъсна 27-годишен мъж в Германия, взирал се в телефона си

Влак блъсна 27-годишен мъж в Германия, взирал се в телефона си

Свят Преди 6 часа

Инцидентът е станал вчера на жп гарата в Лайхлинген

Снимката е илюстративна

Трагедия в Гърция: Млад мъж погълна цял бургер, в критично състояние е

Свят Преди 6 часа

Мъжът, чието име не се съобщава, е приет в интензивното отделение на болницата „Г. Генниматас“ в Коротпи, Гърция, на 13 ноември