Н овите алгоритми на OpenAI - o3 и o4-mini, които са най-умните и мислещи досега, допускат повече грешки, съобщава TechCrunch. Те "халюцинират" повече от някои от своите предшественици и OpenAI не знае защо.

Халюцинации на AI означават моментите, когато алгоритъмът си измисля свои факти и твърдения, които представя за истина. В повечето случаи това се дължи на погрешна обработка на информацията и/или "замърсени" данни, които са довели алгоритъма до грешно заключение.

За сега халюцинациите са неизбежна част от реалността на AI. Все пак, те намаляват с всяко ново поколение. Или поне би трябвало. С новите o3 и o4-mini се получава обратното. Оказва се, че те халюцинират повече от предшествениците си o1, o1-mini и о3-mini, както и от стандартния GPT-4o, който няма способности да разсъждава.

Почти гений: OpenAI пусна най-умния си модел досега

В техническата документация OpenAI пише, че са нужни още проучвания, за да разбере защо халюцинациите се увеличават с новите модели. Една теория е, че е просто заради мащаба - новите модели правят повече заключения от предишните и съответно е логично да има по-голяма вероятност да сбъркат.

Досегашните тестове показват, че o3 халюцинира отговорите си на 33% от въпросите на собствения тест на OpenAI - PersonQA. Това е над двойно спрямо o1 и o3-mini, които халюцинират съответно в 16% и 14,8% от въпросите. А o4-mini се справя още по-лошо - 48%.

OpenAI подготвя собствена социална мрежа

Вече излизат и независими тестове. Първият е на Transluce, която открива, че o3 има склонност да си измисля действия, с които да обясни как е стигнал до дадено заключение. Конкретно алгоритъмът е заявил, че е пуснал програмен код на MacBook Pro от 2021 г. "извън ChatGPT" и е копирал резултата за своя отговор. o3 всъщност няма такива способности.

Според Transluce причината е в начина на обучение, които е като своеобразен усилвател - както за добрите аспекти на алгоритмите, така и за тези, които се нуждаят от подобрение. Използваният метод на потвърждения ускорява обучението, но и просто убеждава алгоритъма в действията му.

От стартиращата компания Workera казват, че o3 работи много добре и дава добри резултати, но действително халюцинира и грешки. Включително да си измисля несъществуващи интернет адреси, които уж да водят към повече информация.

ChatGPT превръща хората в кукли: Тъмната страна на забавлението

OpenAI пусна най-усъвършенствания си генератор на изображения и превзе социалните мрежи

Халюцинациите не са изцяло лоши. Понякога те дават възможност на алгоритъма да види ситуацията от различен ъгъл и да генерира интересни и дори полезни идеи. Но все пак не са желани, тъй като могат да доведат и до заблуда и сериозни грешки.

Европа иска да се превърне в "AI континент"

Обвиниха компания, че AI услугите ѝ всъщност са хора

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
<p>Ценови шок на бензиностанциите - с колко&nbsp;поскъпнаха горивата у нас</p>

Горивата в България продължават да поскъпват

Пари Преди 7 минути

През последния месец най-голямо увеличение има при дизела, а метанът остава почти стабилен

<p>Схеми за изборни измами разкрити във Великотърновско</p>

Акция срещу купуване на гласове и изборни престъпления във Великотърновско

Парламентарни избори Преди 58 минути

Полицията проверява села около Стражица, задържани са 3 души с наркотици, други 10 се издирват

<p>Нови жертви след руски атаки в Украйна</p>

Руски атаки в Украйна - жертви в Харков и щети по пристанището в Измаил

Свят Преди 2 часа

Дронове удариха жилищни райони и енергийна инфраструктура, има ранени и разрушения

Историческа присъда срещу Google и Meta за вредите върху психичното здраве на младежите

Историческа присъда срещу Google и Meta за вредите върху психичното здраве на младежите

Свят Преди 2 часа

Делото може да промени начина, по който технологичните компании носят отговорност за своите продукти

<p>Четирима убити при атака срещу наркотерористи в Карибско море</p>

САЩ убиха четирима при удар срещу наркокораб в Карибско море

Свят Преди 2 часа

Южното командване твърди, че плавателният съд е бил част от мрежа за трафик на наркотици

<p>Великобритания с нови мерки срещу &quot;сенчестия флот&quot; на Путин&nbsp;</p>

Киър Стармър разреши задържане на руски кораби от "сенчестия флот"

Свят Преди 2 часа

Лондон цели да ограничи финансирането на войната в Украйна чрез износа на петрол

<p>НАТО с тренировка &quot;Neptune Strike&quot; 26-1 във въздушното пространство на България</p>

НАТО започва съвместна тренировка Neptune Strike 26-1 във въздушното пространство на България

България Преди 2 часа

"Neptune Strike" демонстрира способностите на НАТО да използва и интегрира многонационални морски и ударни сили в кратки срокове и на големи разстояния

Показват как ще изглежда бюлетината за вота на 19 април

Показват как ще изглежда бюлетината за вота на 19 април

В изборите ще участват 24 формации - 14 партии и 10 коалиции

Как навикът да скролваме в телефона издава доходите ни

Как навикът да скролваме в телефона издава доходите ни

Любопитно Преди 2 часа

Обърнете внимание на хората около вас, които говорят по телефоните си

Храните, които най-много вредят на мозъка ви

Храните, които най-много вредят на мозъка ви

Любопитно Преди 2 часа

Кои са те и защо вредят на мозъка ви четете в следващите редове

Сладък сън в чиния: 5 храни, които помагат при безсъние

Сладък сън в чиния: 5 храни, които помагат при безсъние

Любопитно Преди 2 часа

Ако някога сте имали проблеми със заспиването, режимът ви на хранене може да играе много по-голяма роля, отколкото предполагате

11 умения, които родителите ни владееха, но поколението Z губи напълно

11 умения, които родителите ни владееха, но поколението Z губи напълно

Любопитно Преди 2 часа

Много хора днес нямат уменията, които техните родители са притежавали. Какви важни житейски умения са нужни на Gen Z, но те често не ги разбират? И кой носи отговорността за тази пропаст?

<p>Учени откриха неподозирана сила на ботокса</p>

Забравете за бръчките: Учени откриха неподозирана сила на ботокса

Любопитно Преди 2 часа

Оказва се, че популярното средство за разкрасяване постига впечатляващ успех при лечение на гангрена и тежка исхемия, като спасява тъканите там, където стандартната медицина се проваля

САЩ: Тръмп не блъфира, ще ударим Иран по-силно

САЩ: Тръмп не блъфира, ще ударим Иран по-силно

Свят Преди 10 часа

Левит заяви, че цените на горивата ще паднат веднага щом приключи американската военна операция в Иран

Иран обяви, ако САЩ нахлуе, ще удари Червено море

Иран обяви, ако САЩ нахлуе, ще удари Червено море

Свят Преди 12 часа

Проливът Баб ел-Мандеб е сред най-стратегическите в света