М ного се говори за това колко по-умен е изкуственият интелект (AI) и как вече превъзхожда хората не само в бързина, но и във все повече сфери на познанието. Но реално все още сме далеч от момента, в който AI ще има пълно интелектуално превъзходство спрямо човека.

Това си проличава особено от новия тест ARC-AGI-2. Той е създаден именно с цел да проверява реалните способности на AI и е дело на Arc Prize Foundation, съобщава TechCrunch.

Вече има множество подобни тестове, които се използват от създателите на алгоритмите, за да сравняват способностите на техните творби спрямо конкуренцията и спрямо реалните възможности на човека. Досегашните тестове вече показваха превес на AI, но затова фондацията е направила нов, по-сложен.

Как да сме по-продуктивни чрез дигиталните технологии

Той е специално насочен към новите AI модели, които могат да разсъждават. И се оказва много по-сложен за тях от досегашните.

Фондацията е поканила над 400 души също да преминат теста, за да има база какви са способностите на човека. Средният им резултат е 60% от 100% точност.

След това на теста са подложени водещите AI модели. Резултатите са изненадващо слаби. OpenAI o1-pro и DeepSeek R1 получават между 1% и 1,3% точност. А най-мощните модели, които не разсъждават, записват около 1%. Това са GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash.

AI фирма против измами, беше осъдена за... измами

Защо се постига такава голяма разлика? Новият тест е изработен така, че да не може да бъде "насилван", т.е. да се използва огромна изчислителна мощ, за да се намери отговор. Това беше основната слабост на предишната му версия и алгоритмите просто тестваха множество варианти, докато попаднат на правилния, но практически не учат нови умения за решаване на проблемите.

Новият тест затруднява това, като въвежда допълнителни критерии. "Интелектът не се определя просто от възможността да решиш проблем и да постигнеш висок резултат. Ефикасността, с която го постигаш, също е критичен, определящ компонент", казва съоснователят на Arc Prize Foundation Грег Камарад.

Първата версия на теста беше непобедена близо пет години, докато през декември 2024 г., OpenAI o3 не надмина всички други алгоритми и се изравни с резултатите на хората. И докато в първата версия той записва резултат от 75,7%, в новия тест най-доброто му постижение е едва 4%, но постигането на целта е струвало 200 долара изчислителна мощ за всяка задача.

AI ще преобрази и прогнозата за времето

Подобряването на ефикасността на моделите е нова голяма тема в бранша. Много от настоящите алгоритми използват огромни изчислителни ресурси, което не е устойчиво в дългосрочен план. А китайският DeepSeek R1 показа, че има и други подходи, които намаляват консумацията на компютърна мощ.

Apple и Google се ядосаха на новите изисквания на ЕС

Nvidia: Идват 10 млрд. AI работници, които ще помагат

Затова и Arc Prize Foundation създава нов конкурс за 2025 г. А именно постигане на 85% резултат на новия тест, но при "цена" от едва 42 цента за всяка задача.

Microsoft Magma е AI, който може да управлява роботи

Плашещо интелигентният нов чатбот Grok 3 на Илон Мъск

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Нора Недкова отпадна на крачка от звездния финал в Hell’s Kitchen

Нора Недкова отпадна на крачка от звездния финал в Hell’s Kitchen

Любопитно Преди 3 часа

Тя е ексклузивен гост в подкаста “Кухнята след Ада”

Най-малко 100 убити при въздушен удар на нигерийската армия

Най-малко 100 убити при въздушен удар на нигерийската армия

Свят Преди 4 часа

Военните започнаха разследване на този инцидент

Политическата криза в Румъния се разраства

Политическата криза в Румъния се разраства

Свят Преди 6 часа

Искат импийчмънт на президента Никушор Дан

Мъж от София опита да подкупи областния управител на Добрич

Мъж от София опита да подкупи областния управител на Добрич

България Преди 6 часа

Той е задържан в момента на предаване на подкуп в размер на 40 000 евро

Жители на „Младост“ на протест, искат оставката на районния кмет

Жители на „Младост“ на протест, искат оставката на районния кмет

България Преди 7 часа

Гражданите не искат да се строят нови огромни сгради в „Младост“

ГЕРБ започва смяна на общински ръководства

ГЕРБ започва смяна на общински ръководства

България Преди 8 часа

Това става след резултатите от парламентарните избори

Тир се завъртя на "Хемус", в него катастрофираха коли

Тир се завъртя на "Хемус", в него катастрофираха коли

България Преди 8 часа

Движението в района е спряно

Човек почина до метростанция в центъра на София

Човек почина до метростанция в центъра на София

България Преди 8 часа

Тялото е на намерено до метростанция "Опълченска"

<p>Мицкоски:&nbsp;Достойнството няма цена... Ще търпите</p>

Премиерът на Северна Македония: Достойнството няма цена... Ще търпите

Свят Преди 9 часа

СДСМ: Мицкоски отново активира добре познатата стратегия за заслепяване на обществеността

Британското правителство се разпада

Британското правителство се разпада

Свят Преди 9 часа

Натискът за оставка на Стармър расте

„България се гордее с теб!“: Лили Иванова подкрепи DARA преди Евровизия

„България се гордее с теб!“: Лили Иванова подкрепи DARA преди Евровизия

България Преди 10 часа

Примата пожела успех на родната представителка във Виена с емблематичното „БАНГАРАНГА!“; Юбилейното 70-о издание на конкурса стартира довечера под знака на политическо напрежение

Вече има осъден за купуване на гласове в Буковлък

Вече има осъден за купуване на гласове в Буковлък

България Преди 10 часа

Наказателното производство приключи краен съдебен акт

Повдигнаха обвинения на кмета на Лом

Повдигнаха обвинения на кмета на Лом

Свят Преди 10 часа

Предстои Районна прокуратура - Монтана да внесе в съда искане за отстраняването на обвиняемия кмет от длъжност

Накратко: Къде „Дяволът носи Прада 2“ уцели истината за медиите и къде сбърка

Накратко: Къде „Дяволът носи Прада 2“ уцели истината за медиите и къде сбърка

Любопитно Преди 10 часа

Продължението показва реалната криза в журналистиката, съкращенията и заплахата от изкуствения интелект, но спестява някои чисто професионални детайли

Асен Василев остро критикува плана на „Прогресивна България“ за цените

Асен Василев остро критикува плана на „Прогресивна България“ за цените

България Преди 10 часа

Според Василев част от текстове в проекта са „много притеснителни“