М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Тръмп се срещна с Нетаняху и заплаши Иран с нови удари

Тръмп се срещна с Нетаняху и заплаши Иран с нови удари

Свят Преди 3 часа

Тръмп: Поговорихме си около пет минути и за това време вече решихме три от въпросите

САЩ удариха пристанище във Венецуела, обяви Тръмп

САЩ удариха пристанище във Венецуела, обяви Тръмп

Свят Преди 4 часа

Тръмп: Имаше голяма експлозия в района на дока

Бриджит Бардо

Разкриха къде ще погребат Бриджит Бардо, няма да зачетат волята ѝ

Свят Преди 9 часа

Френската филмова икона е починала в присъствието на четвъртия си съпруг Бернар д’Ормал. „Тя прошепна дума на любов към него… и си отиде“, каза представител на нейната фондация за защита на животните

Мъжете посочиха най-неприятните навици на жените

Мъжете посочиха най-неприятните навици на жените

Любопитно Преди 9 часа

Мъже в Reddit обсъдиха кои женски навици намират за най-отблъскващи – обсебеност от социалните мрежи, хвалене с мъжко внимание и обвиняване на партньора за всичко, като според тях това прави отношенията „досадни и опасни“

Кирил Петков отговори на Борисов: Как не го е срам!

Кирил Петков отговори на Борисов: Как не го е срам!

България Преди 9 часа

Мирчев: Имам лоши новини за Борисов

Кейт Уинслет разкри, че е имала интимни преживявания с момичета като тийнейджърка

Кейт Уинслет разкри, че е имала интимни преживявания с момичета като тийнейджърка

Любопитно Преди 9 часа

Кейт Уинслет разкри в подкаст, че първите ѝ интимни преживявания като тийнейджърка са били с момичета – откровение, което свързва с ролята си в „Небесни създания“ и отражението на ранните ѝ отношения върху актьорската ѝ кариера

Търсят 22-годишен мъж на Витоша, използват и дрон

Търсят 22-годишен мъж на Витоша, използват и дрон

България Преди 9 часа

Към момента се събира и анализира информация

Путин: Руската армия уверено напредва в Украйна

Путин: Руската армия уверено напредва в Украйна

Свят Преди 10 часа

Путин: Целта за освобождаване на регионите Донецк, Луганск, Запорожие и Херсон се реализира поетапно

Мъж потроши и наводни ареста в Кърджали

Мъж потроши и наводни ареста в Кърджали

България Преди 10 часа

Tой е бил задържан, след като потрошил нощен клуб

Отразявал съм 40 войни - 2026 г. е най-тревожната година за световния мир

Отразявал съм 40 войни - 2026 г. е най-тревожната година за световния мир

Свят Преди 10 часа

2026 г. се очертава да бъде белязана от три много различни конфликта

Унищожиха ръчна граната, открита в Плевен

Унищожиха ръчна граната, открита в Плевен

България Преди 10 часа

Преди това боеприпасът беше иззет и транспортиран на безопасно място

България получи трето плащане от 1,47 млрд. евро по НПВУ

България получи трето плащане от 1,47 млрд. евро по НПВУ

България Преди 10 часа

Третото искане за плащане обхваща 22 реформи и 19 инвестиции и е най-голямото до този момент

Откриха тялото на жена, загинала при нападение от акула край Калифорния

Откриха тялото на жена, загинала при нападение от акула край Калифорния

Свят Преди 11 часа

Жертвата е била с „лента против акули“ на глезена си – електромагнитно устройство, предназначено да отблъсква хищниците