М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

- Ученици, трябва да сте по-самостоятелни! Вече сте в трети клас и скоро родителите ви няма да могат да ви пишат домашните.
Прочети целия
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Суровият Изолатор отново отвори врати в “Игри на волята”

Суровият Изолатор отново отвори врати в “Игри на волята”

Любопитно Преди 3 часа

Груби грешки изпратиха Феномените на тежката локация

Радев: За 2024 г. стокообменът между България и Германия надхвърля 12,3 млрд. евро

Радев: За 2024 г. стокообменът между България и Германия надхвърля 12,3 млрд. евро

България Преди 3 часа

От Германо-Българската индустриално-търговска камара призоваха за повече предвидимост и устойчивост в отношенията между държавата и бизнеса

Путин нареди най-голямата есенна мобилизация от 2016 г. насам

Путин нареди най-голямата есенна мобилизация от 2016 г. насам

Свят Преди 7 часа

В рамките на руската инвазия в Украйна обаче бяха регистрирани редица случаи на новобранци на бойното поле

Арестуваха българка в Русия

Арестуваха българка в Русия

Свят Преди 8 часа

Посолството ни в Москва следи развитието на случая

„Топлофикация“ публикува график за ремонта в „Дружба 2“

„Топлофикация“ публикува график за ремонта в „Дружба 2“

България Преди 8 часа

Общата продължителност на ремонта остава 90 дни

Теч на гориво от български F-16, пращат експерт от САЩ

Теч на гориво от български F-16, пращат експерт от САЩ

България Преди 9 часа

Доставени са само два самолета F-16 Block 70 и те не участват в носенето на бойно дежурство

Русия напусна конвенцията срещу изтезанията

Русия напусна конвенцията срещу изтезанията

Свят Преди 10 часа

По-рано руският парламент гласува за оттеглянето от договора, ратифициран от Москва през 1998 г.

Впечатляващ резултат отбеляза „Пееш или лъжеш“ в ефира на NOVA

Впечатляващ резултат отбеляза „Пееш или лъжеш“ в ефира на NOVA

Любопитно Преди 10 часа

Стартът на третия сезон на шоуто остави далеч назад конкуренцията

<p>&bdquo;Мълнията&rdquo;, която разби въздушната сила на Русия</p>

Това оръжие се доказа в Украйна, сега всички го искат

Свят Преди 10 часа

Благодарение на високата си точност и големи възможности, „Пьорун” се превърна в жизненоважна част от отбранителните усилия на Украйна

Иванка Тръмп разкри „истинското“ си име

Иванка Тръмп разкри „истинското“ си име

Любопитно Преди 10 часа

Въпреки че официалното ѝ име е Ивана, тя използва „Иванка“ във всички аспекти на живота си – както личен, така и професионален

Трагедия в Турция: Певица почина след падане от шестия етаж

Трагедия в Турция: Певица почина след падане от шестия етаж

Свят Преди 11 часа

Нейният син потвърди трагичната новина в социалните мрежи само часове след инцидента

Всеки сам решава дали да сваля руски самолети

Всеки сам решава дали да сваля руски самолети

Свят Преди 11 часа

ЕК: Трябва да защитим източния фланг

Финалът, който надхвърли спорта: Какво каза Симоне Анцани на разплакания Дамян Колев

Финалът, който надхвърли спорта: Какво каза Симоне Анцани на разплакания Дамян Колев

България Преди 11 часа

Младите български волейболисти донесоха първото сребро от Световно първенство от 55 години, а жестът на италианеца трогна целия свят

Служители на „Автомобилна администрация“ заплашиха със стачка, искат оставки

Служители на „Автомобилна администрация“ заплашиха със стачка, искат оставки

България Преди 12 часа

Според синдикалната организация взетият подкуп е дирижиран от по-високо ниво в агенцията

Снимката е илюстративна

Открито е изоставено в кашон новородено бебе до пътя

Свят Преди 12 часа

Новороденото бебе е в добро здраве, съобщават властите във Филипините

<p>Жестоко убийство в Пещера, съсед уби 62-годишна жена с нож</p>

Съсед уби 62-годишна жена в Пещера с нож, задържан и обвинен е

България Преди 12 часа

48-годишният П.Б. е извършил нападението след кражба на пари и телефон, прокуратурата в Пазарджик поиска „задържане под стража“