М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Министерството на туризма поема управлението на плаж „Болата“

Министерството на туризма поема управлението на плаж „Болата“

България Преди 58 минути

Ще се работи за осигуряване на свободен достъп до плажа

Отбелязваме 149 години от избухването Априлското въстание

Отбелязваме 149 години от избухването Априлското въстание

Любопитно Преди 1 час

Това е едно от най-значимите събития в българската история

На 116 години: Почина най-възрастната жена в света

На 116 години: Почина най-възрастната жена в света

Свят Преди 2 часа

Това е бразилската монахиня Ина Канабаро Лукас

Снимката е архивна!

Руска атака с дрон срещу Одеса, има загинали

Свят Преди 2 часа

Нанесени са и редица материални щети

Радев за 1 май: Трудът не бива да е сведен до средство за оцеляване

Радев за 1 май: Трудът не бива да е сведен до средство за оцеляване

България Преди 2 часа

По повод Деня на труда президентът отправи поздравление към българските граждани

Имен ден днес празнуват...

Имен ден днес празнуват...

Любопитно Преди 2 часа

На 1 май почитаме паметта на свети пророк Йеремия и на преподобномъченик Акакий Серски

Милена Златкова откровено за Христо, майчинството и каузите

Милена Златкова откровено за Христо, майчинството и каузите

Любопитно Преди 2 часа

През изминалите 25 години гласът ѝ е безспорно един от най-известните в българското радио

<p>Сенатът на САЩ не успя да блокира митата на Тръмп</p>

Сенатът на САЩ не събра мнозинство, за да блокира митата на Тръмп

Свят Преди 3 часа

Предложението целеше отмяна на националното извънредно положение, обявено от американския президент

Какви природни ресурси притежава Украйна и за какво се използват

Какви природни ресурси притежава Украйна и за какво се използват

Свят Преди 3 часа

След месеци на политически обрати, Вашингтон и Киев най-накрая постигнаха съгласие по стратегическото споразумение

Без синя и зелена зона в празничните 1 и 6 май в София

Без синя и зелена зона в празничните 1 и 6 май в София

България Преди 4 часа

През останалите - 2 май, 3 май и 5 май са работни дни за зоните за почасово платено паркиране

<p>Защо хората са загубили козината си</p>

Защо хората са загубили козината си: Изненадващата истина за еволюцията ни като бозайници без косми

Любопитно Преди 4 часа

Хората принадлежат към група животни, известни с козината, космите и мустаците си

БНБ установи съществени пропуски при отпускане на кредити

БНБ установи съществени пропуски при отпускане на кредити

България Преди 4 часа

Те касаят платежоспособността на кредитополучателите

<p>1 май: Най-смъртоносното наводнение в България</p>

1 май: Най-смъртоносното наводнение в България

Любопитно Преди 4 часа

Вижте какво се е случило на този ден в историята

<p>Какво ще бъде времето в празничния четвъртък&nbsp;☀️☔️</p>

Какво ще бъде времето в празничния четвъртък ☀️☔️

България Преди 4 часа

Вижте прогнозата за следващите няколко дни

Колоритният Грозев каза сбогом на Hell’s Kitchen

Колоритният Грозев каза сбогом на Hell’s Kitchen

Любопитно Преди 12 часа

Златните постигнаха нова категорична победа над Черните куртки