М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Глобалната инициатива на Хилари Клинтън

Хилари Клинтън би предложила Тръмп за Нобелова награда за мир при това условие

Свят Преди 42 минути

Ако Тръмп убеди Путин да се съгласи на прекратяване на огъня, без размяна на територии с Украйна

Собственикът на колата, ударила автобус, не познавал шофьора

Собственикът на колата, ударила автобус, не познавал шофьора

България Преди 1 час

МВР: Само вчера Виктор Илиев е получил 2 фиша

Дворове и стопанска постройка пламнаха в Разбойна

Дворове и стопанска постройка пламнаха в Разбойна

България Преди 3 часа

За момента няма информация за пострадали хора

Снимката е илюстративна

Двама души са изчезнали в морето край Слънчев бряг

България Преди 4 часа

Първо в морето е влязло момче, родено през 2011 година, след него и негов роднина, роден през 1995 година

Задържаха мъж, отправил терористична заплаха към Летище „Васил Левски“

Задържаха мъж, отправил терористична заплаха към Летище „Васил Левски“

България Преди 4 часа

Той съобщил, че жена, пътуваща за Словакия, носи взривоопасно устройство в себе си

Задържаха за 72 часа младежа, блъснал хора с АТВ

Задържаха за 72 часа младежа, блъснал хора с АТВ

България Преди 4 часа

Той е обвинен за това, че по непредпазливост е причинил средни телесни повреди на петима пешеходци

,

В Газа: Да те убият, докато чакаш за храна

Свят Преди 4 часа

Новините за цивилни палестинци, загинали в близост до центровете за разпределение на помощи в Газа, вече са ежедневие

Шофьорка с 2,96 промила помете пешеходка и две коли в Перник

Шофьорка с 2,96 промила помете пешеходка и две коли в Перник

България Преди 4 часа

Каращи зад нея видели какво се случва, догонили жената и я спрели, извършвайки граждански арест

Тръмп излетя към Аляска за срещата с Путин, няма места в Анкъридж

Тръмп излетя към Аляска за срещата с Путин, няма места в Анкъридж

Свят Преди 5 часа

Хотелите и курортите в района са напълно запълнени

Инфлуенсъри обвиниха ChatGPT за провалена почивка

Инфлуенсъри обвиниха ChatGPT за провалена почивка

Свят Преди 5 часа

„Винаги правя много проучвания, но този път попитах ChatGPT и той ми каза, че не ми трябва виза"

Инфлацията в България се ускорява

Инфлацията в България се ускорява

България Преди 5 часа

Натрупаната инфлация за последните пет години е 41,2%

Осъдиха на 9 години и 4 месеца шофьор, убил полицай

Осъдиха на 9 години и 4 месеца шофьор, убил полицай

България Преди 5 часа

Той карал бус с нелегални мигранти след употреба на 5 вида наркотични вещества

<p>&bdquo;Краят е близо&ldquo;: .Легендарна група обяви пенсионирането си с прощално турне и последен албум</p>

Megadeth обяви пенсионирането си с прощално турне и последен албум

Любопитно Преди 6 часа

„Започнахме музикален стил, започнахме революция, променихме света на китарата и начина, по който се свири, и всъщност променихме света"

<p>Секс терапевт&nbsp;разкри причината, поради която хората изневеряват</p>

Секс терапевт с 45 години опит разкри точната причина, поради която хората изневеряват

Любопитно Преди 6 часа

Според известната психотерапевтка, скуката и рутината убиват интимността и водят до кръшкане

Земетресение с магнитуд 6 разтърси Камчатка

Земетресение с магнитуд 6 разтърси Камчатка

Свят Преди 6 часа

Огнището на труса е било на дълбочина 10 километра

<p>Има ли замърсяване на въздуха&nbsp;след влаковата катастрофа&nbsp;край Симеоновград?</p>

РИОСВ: Няма замърсяване на въздуха край Пясъчево след влакова катастрофа

България Преди 6 часа

От РИОСВ уточниха, че доста голяма част от цистерните са изсипали съдържанието си