Н овите алгоритми на OpenAI - o3 и o4-mini, които са най-умните и мислещи досега, допускат повече грешки, съобщава TechCrunch. Те "халюцинират" повече от някои от своите предшественици и OpenAI не знае защо.

Халюцинации на AI означават моментите, когато алгоритъмът си измисля свои факти и твърдения, които представя за истина. В повечето случаи това се дължи на погрешна обработка на информацията и/или "замърсени" данни, които са довели алгоритъма до грешно заключение.

За сега халюцинациите са неизбежна част от реалността на AI. Все пак, те намаляват с всяко ново поколение. Или поне би трябвало. С новите o3 и o4-mini се получава обратното. Оказва се, че те халюцинират повече от предшествениците си o1, o1-mini и о3-mini, както и от стандартния GPT-4o, който няма способности да разсъждава.

Почти гений: OpenAI пусна най-умния си модел досега

В техническата документация OpenAI пише, че са нужни още проучвания, за да разбере защо халюцинациите се увеличават с новите модели. Една теория е, че е просто заради мащаба - новите модели правят повече заключения от предишните и съответно е логично да има по-голяма вероятност да сбъркат.

Досегашните тестове показват, че o3 халюцинира отговорите си на 33% от въпросите на собствения тест на OpenAI - PersonQA. Това е над двойно спрямо o1 и o3-mini, които халюцинират съответно в 16% и 14,8% от въпросите. А o4-mini се справя още по-лошо - 48%.

OpenAI подготвя собствена социална мрежа

Вече излизат и независими тестове. Първият е на Transluce, която открива, че o3 има склонност да си измисля действия, с които да обясни как е стигнал до дадено заключение. Конкретно алгоритъмът е заявил, че е пуснал програмен код на MacBook Pro от 2021 г. "извън ChatGPT" и е копирал резултата за своя отговор. o3 всъщност няма такива способности.

Според Transluce причината е в начина на обучение, които е като своеобразен усилвател - както за добрите аспекти на алгоритмите, така и за тези, които се нуждаят от подобрение. Използваният метод на потвърждения ускорява обучението, но и просто убеждава алгоритъма в действията му.

От стартиращата компания Workera казват, че o3 работи много добре и дава добри резултати, но действително халюцинира и грешки. Включително да си измисля несъществуващи интернет адреси, които уж да водят към повече информация.

ChatGPT превръща хората в кукли: Тъмната страна на забавлението

OpenAI пусна най-усъвършенствания си генератор на изображения и превзе социалните мрежи

Халюцинациите не са изцяло лоши. Понякога те дават възможност на алгоритъма да види ситуацията от различен ъгъл и да генерира интересни и дори полезни идеи. Но все пак не са желани, тъй като могат да доведат и до заблуда и сериозни грешки.

Европа иска да се превърне в "AI континент"

Обвиниха компания, че AI услугите ѝ всъщност са хора

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Стратегът Ивайло изигра последния си ход в “Игри на волята”

Стратегът Ивайло изигра последния си ход в “Игри на волята”

Любопитно Преди 2 часа

Стратегът Ивайло изигра последния си ход в “Игри на волята”

ЕС подготвя нови санкции срещу Русия

ЕС подготвя нови санкции срещу Русия

Свят Преди 4 часа

Кая Калас: Войните се губят от тези, на които първи им свършват парите или войниците

Двегодишно дете почина след анестезия в стоматологична клиника в Букурещ

Двегодишно дете почина след анестезия в стоматологична клиника в Букурещ

Свят Преди 4 часа

Румънските власти започнаха мащабно разследване

Затварят временно дома за стари хора в Помориe

Затварят временно дома за стари хора в Помориe

България Преди 5 часа

Нова проверка на РЗИ установи, че нито едно от предписанията, дадени преди месец, не е изпълнено

Ивайло и Калин се срещат на Арената за братски дуел в “Игри на волята”

Ивайло и Калин се срещат на Арената за братски дуел в “Игри на волята”

Любопитно Преди 5 часа

Сапунджиева търси път към останалите в племето на Феномените

Двама митничари са задържани на ГКПП "Калотина"

Двама митничари са задържани на ГКПП "Калотина"

България Преди 7 часа

В момента на място тече акция на ГДБОП

Криза на върха в Украйна, Зеленски уволни двама министри

Криза на върха в Украйна, Зеленски уволни двама министри

Свят Преди 8 часа

Причината е свързано с обществения ядрен оператор "Енергоатом" разследване за корупция

Задържаха 18-годишен за пожар в центъра на София

Задържаха 18-годишен за пожар в центъра на София

България Преди 8 часа

Обвиняемият е задържан за срок до 72 часа

"Лукойл": Преговаряме с потенциални купувачи

"Лукойл": Преговаряме с потенциални купувачи

Свят Преди 8 часа

Компанията се стреми да осигури непрекъсната работа на активите по време на тяхната продажба

<p>Задържаха Шрек за отвличане на млада жена в Свиленград</p>

Трима отвлякоха млада жена в Свиленград, мъж с прякор Шрек е задържан

България Преди 8 часа

Заедно с него в ареста като съпричастни към случая са още един мъж и една жена

Излезе изтрита сцена с импровизираната целувка между Блейк Лайвли и Джъстин Балдони от "Никога повече"

Излезе изтрита сцена с импровизираната целувка между Блейк Лайвли и Джъстин Балдони от "Никога повече"

Любопитно Преди 9 часа

Адвокатите на Балдони твърдят в документи, че 38-годишната звезда от „Клюкарката“ е добавила сцената към сценария

СГП предаде на съд Никола Барбутов и още трима

СГП предаде на съд Никола Барбутов и още трима

България Преди 9 часа

Никола Барбутов е предаден на съд и за подкуп

Специален британски лиценз за българския „Лукойл“

Специален британски лиценз за българския „Лукойл“

Свят Преди 9 часа

Лицензът важи до февруари

Жената, която предвиди убийството на Кенеди — историята на Джийн Диксън

Жената, която предвиди убийството на Кенеди — историята на Джийн Диксън

Любопитно Преди 9 часа

Истинската история на медиумката, чиито предсказания стигнаха до президентите на САЩ

КЗП се самосезира за цените на паркирането в София

КЗП се самосезира за цените на паркирането в София

България Преди 9 часа

КЗП обръща внимание, че Законът за въвеждане на еврото предвижда сериозни санкции