М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Какво решиха лидерите на Европейския съвет днес

Какво решиха лидерите на Европейския съвет днес

Свят Преди 7 часа

Урсула фон дер Лайен съобщи, че ще предложи стъпки, свързани със завършването на единния пазар

Румъния преговаря със САЩ за Съвета за мир

Румъния преговаря със САЩ за Съвета за мир

Свят Преди 8 часа

Румънският президент потвърди на 6 февруари, че е получил покана

Денев: Служители на ДАНС не е имало при хижа „Петрохан“

Денев: Служители на ДАНС не е имало при хижа „Петрохан“

България Преди 9 часа

От "Продължаваме промяната-Демократична България" днес поискаха оставката на Денев

Росен Желязков за случая "Петрохан": В момента нямаме право политически да налагаме внушения

Росен Желязков за случая "Петрохан": В момента нямаме право политически да налагаме внушения

България Преди 10 часа

Премиерът в оставка призова да се спазва презумпцията за невинност

Адвокатът на Гюров: Той няма да се върне в БНБ след като изпълни мандата

Адвокатът на Гюров: Той няма да се върне в БНБ след като изпълни мандата

България Преди 11 часа

Христев: След няколко месеца трябва да имаме и окончателно решение на Съда на Европейския съюз

<p>Мъж живял цял живот с троен полов орган</p>

79-годишен мъж живял цял живот с тройна анатомична аномалия, без дори да подозира

Свят Преди 11 часа

Поради местните разпоредби не се знае много за медицинската история на мъжа преди смъртта му и предоставянето на тялото му на изследователите, извън установеното по време на прегледа в Медицинския факултет

Тодоров: Камерите в козметични салони в Бургас не са за охрана

Тодоров: Камерите в козметични салони в Бургас не са за охрана

България Преди 12 часа

На установените седем адреса на лекарски кабинети в София са извършени процесуално-следствени действия

Заради Епстийн норвежката полиция претърси имотите на бивш премиер

Заради Епстийн норвежката полиция претърси имотите на бивш премиер

Преди 12 часа

Срещу Ягланд се води разследване

Затвориха дискотека в София, нощен клуб в Русе и сватбена зала в Дулово

Затвориха дискотека в София, нощен клуб в Русе и сватбена зала в Дулово

България Преди 12 часа

Проверките са след трагедията в дискотека „Пулс“ в Кочани, в която загинаха 63 души, а над 200 бяха ранени

Обиск в Европейската комисия заради сделка с имоти за 900 млн. евро

Обиск в Европейската комисия заради сделка с имоти за 900 млн. евро

Свят Преди 13 часа

ЕК е „наясно с текущо разследване“ относно продажбата на 23 сгради

<p>Ивайло Калушев е можело да бъде спрян още през 2022 г.</p>

Ивайло Калушев е можело да бъде спрян още през 2022 г.: Бивш ученик с разказ за пропуснатите сигнали преди трагедията край Петрохан

България Преди 13 часа

В обширен аудио разговор пред разследващия екип на bird.bg — Мария Черешева, Атанас Чобанов, Димитър Стоянов и Александър Леви — Валери разкрива шокиращи подробности за „разпити с бира“, течове на информация към Ивайло Калушев и пълното бездействие на полицията спрямо сигналите за сексуално и финансово робство.

Бризи Джонсън получи предложение за брак след инцидент на Олимпиадата

Бризи Джонсън получи предложение за брак след инцидент на Олимпиадата

Любопитно Преди 13 часа

По време на самото състезание 30-годишната Джонсън закачи десния си ски-стълб във вратата малко след излизането си от улея за набиране на скорост на трасето, загуби равновесие и падна

ДНСК със скандални разкрития за незаконни сгради край Тунджа

ДНСК със скандални разкрития за незаконни сгради край Тунджа

България Преди 13 часа

Незаконно са изградени 45 масивни жилищни обекта