Грубият език прави ИИ по-точен, но учени предупреждават за негативите
Източник: iStock/GettyImages

И зкуственият интелект (ИИ), като чатботовете, може да дава по-точни отговори, когато се отнасяте грубо с тях, установиха учени. Все пак те предупреждават за потенциалните вреди от използването на унижаващ език.

В ново изследване, публикувано на 6 октомври в базата с препринтове arXiv, учените са искали да проверят дали учтивостта или грубостта влияят на представянето на ИИ системата. Това изследване все още не е преминало през процес на рецензиране от специалисти, пише сайтът Live Science.

За да тестват как тонът на потребителя влияе на точността на отговорите, изследователите разработили 50 основни въпроса с множествен избор и след това ги модифицирали чрез добавяне на префикси, които да отговарят на пет категории тонове: много учтив, учтив, неутрален, груб и много груб. Въпросите били от различни области, включително математика, история и наука.

Всеки въпрос имал четири възможни отговора, от които само един бил верен. Те подали общо 250 въпроса по 10 пъти към ChatGPT-4o — един от най-напредналите големи езикови модели (LLM), разработени от OpenAI.

„Нашите експерименти са предварителни и показват, че тонът значително може да повлияе на представянето, измервано чрез резултата от отговорите на 50-те въпроса“, написаха изследователите в своята статия. „Доста изненадващо, резултатите ни показват, че грубият тон води до по-добри резултати от учтивия. Въпреки че това откритие е от научен интерес, ние не препоръчваме използването на враждебни или токсични интерфейси в реални приложения,“ добавиха те.

„Използването на обидни или унижаващи изрази в човешко-ИИ взаимодействие може да има негативни ефекти върху потребителския опит, достъпността и приобщаването, както и да допринесе за вредни комуникационни норми. Вместо това, ние разглеждаме нашите резултати като доказателство, че големите езикови модели остават чувствителни към повърхностни сигнали в подканите, което може да създаде непредвидени компромиси между представяне и благополучието на потребителя“, обясняват учените.

Грубото пробуждане

Преди да подадат всеки въпрос, изследователите помолили чатбота да игнорира всички предишни разглеждания, за да не бъде влияно от предишния тон. Чатботовете били помолени, без обяснения, да изберат един от четирите варианта.

Точността на отговорите варирала от 80.8% за много учтивите въпроси до 84.8% за много грубите. Интересното е, че точността се увеличавала с всяка стъпка надолу по скалата от най-учтивия към най-грубия тон. Учтивите въпроси отчетоха точност от 81.4%, следвани от 82.2% за неутрални и 82.8% за груби.

Екипът използвал различни формулировки в префикса, за да промени тона, освен в неутралния случай, където не бил добавян никакъв префикс и въпросът бил зададен самостоятелно.

За много учтивите въпроси те започвали с изрази като „Мога ли да помоля за помощ с този въпрос?“ или „Бихте ли били така любезни да решите следния въпрос?“. В най-грубата крайна точка например имало фрази като: „Хей, изпълнителю, реши това“ или „Знам, че не си умен, но опитай това“.

Изследване в нова област — „prompt engineering“

Това изследване е част от развиваща се област, наречена prompt engineering, която се занимава с това как структурата, стилът и езикът на подканите влияят на отговора от големите езикови модели. Изследването цитира и предходни изследвания по темата учтивост срещу грубост, чиито резултати обикновено са били противоположни.

В предишни проучвания е установено, че „неучтивите подканки често водят до лоши резултати, но прекалената учтивост не гарантира по-добри показатели.“ Въпреки това, предишното изследване е било проведено с други модели — ChatGPT 3.5 и Llama 2-70B — и използвало осем различни тона. Там също било наблюдавано, че най-грубата подканка дава по-точни резултати (76.47%) в сравнение с най-учтивата (75.82%).

Ограничения и бъдещи планове

Учените признават ограниченията на своето проучване. Например, 250 въпроса са сравнително малка база данни, а провеждането на експеримента с един единствен езиков модел означава, че резултатите не могат да бъдат обобщени за други ИИ системи.

С тези ограничения наум, екипът планира да разшири изследването си и към други модели, включително Claude на Anthropic и ChatGPT o3 на OpenAI. Освен това те признават, че използването само на въпроси с множествен избор ограничава измерванията само в едно измерение на представянето и не обхваща други аспекти като плавност, разсъждение и последователност.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Антонио Гутериш: ООН е изправена пред финансов колапс

Антонио Гутериш: ООН е изправена пред финансов колапс

Свят Преди 26 минути

Причината по думите му са неплатени вноски и бюджетно правило

Иран заплаши да обяви въоръжените сили на ЕС за "терористични организации"

Иран заплаши да обяви въоръжените сили на ЕС за "терористични организации"

Свят Преди 1 час

Външните министри от ЕС взеха решение за включване на Корпуса на гвардейците на Ислямската революция в списъка на съюза на терористичните организации

Линдзи Вон е в болница след падане на Световната купа в Кран Монтана

Линдзи Вон е в болница след падане на Световната купа в Кран Монтана

Свят Преди 3 часа

Провеждането на състезанието сутринта е било трудно решение за организаторите

Мария Габриел е назначена за помощник генерален директор по комуникации и информация на ЮНЕСКО

Мария Габриел е назначена за помощник генерален директор по комуникации и информация на ЮНЕСКО

България Преди 3 часа

Габриел ще отговаря за сектор „Комуникации и информация“ на ЮНЕСКО

Берлин използва "пингвинът нихилист", за да насърчи европейската солидарност

Берлин използва "пингвинът нихилист", за да насърчи европейската солидарност

Свят Преди 3 часа

Германският външен министър публикува в своя акаунт в Инстаграм генерирано чрез изкуствен интелект видео с любимата на интернет меланхолична птица

<p>Борисов: ЕС спешно да изгради отбранителни способности до 2030 г.</p>

Борисов пред Манфред Вебер: ЕС спешно да изгради отбранителни способности до 2030 г.

България Преди 3 часа

Борисов е в хърватската столица Загреб за участие в Срещата на върха на ЕНП

<p>Стармър: Пречим на Иран да се сдобие с ядрено оръжие</p>

Киър Стармър: Пречим на Иран да се сдобие с ядрено оръжие

Свят Преди 3 часа

По-рано Техеран потвърди, че при протестите в Иран са били убити най-малко 5000 души

<p>Пеевски: Сезирам ВСС за снизходителното отношение на съда&nbsp;към поредния убиец на пътя</p>

Пеевски: Сезирам Инспектората на ВСС за снизходителното отношение на Плевенския окръжен съд към поредния убиец на пътя

България Преди 4 часа

В отговор на тази крещяща несправедливост, аз ще внеса сигнал до Инспектората на ВСС и ще настоявам за задействане на всички законови механизми за контрол

<p>Доналд Тръмп съди IRS&nbsp;за 10 милиарда долара</p>

Доналд Тръмп съди IRS и Министерството на финансите за 10 милиарда долара

Свят Преди 4 часа

Жалбата на Тръмп твърди, че IRS и Министерството на финансите не са успели да предотвратят неоторизиран достъп до неговите данъчни досиета, които са използвани за „левичарски публикации“

<p>&quot;Благодаря му, че ми позволи да го победя&quot;: Джокович сломи Яник Синер&nbsp;</p>

"Благодаря му, че ми позволи да го победя": Новак Джокович сломи фаворита Яник Синер

Свят Преди 4 часа

Сърбинът ще се бори за рекордната 25-а титла от Големия шлем

Бивш водещ на CNN е арестуван за нахлуване в църква в Минесота

Бивш водещ на CNN е арестуван за нахлуване в църква в Минесота

Свят Преди 4 часа

59-годишният Дон Лемън е бил част от група от няколко десетки протестиращи, които са прекъснали неделното богослужение в църквата

<p>Израел отново ще отвори граничния пункт &quot;Рафах&quot;</p>

Израел отново ще отвори граничния пункт "Рафах" в неделя

Свят Преди 4 часа

Израел затвори граничния пункт "Рафах" през май 2024 г., около 9 месеца след началото на войната в Газа

<p>Дванадесет държави предупредиха за риск от ядрена авария</p>

Дванадесет държави предупредиха МААЕ за риск от ядрена авария в Украйна

Свят Преди 4 часа

Смята се, че атаките срещу подстанции и все по-сериозните щети по електропреносната мрежа представляват заплаха за ядрената сигурност

Зазидаха живо коте в стена в Бургас, спасиха го след 9 дни

Зазидаха живо коте в стена в Бургас, спасиха го след 9 дни

България Преди 4 часа

Случаят може да се бъде разглеждан и като престъпление

Шестима военнослужещи в олимпийския отбор за Милано Кортина 2026

Шестима военнослужещи в олимпийския отбор за Милано Кортина 2026

България Преди 4 часа

На форума България ще бъде представена от общо 20 състезатели в шест зимни спорта

"Искам да влияя чрез музиката" – Danbie откровено за новия си път

"Искам да влияя чрез музиката" – Danbie откровено за новия си път

Любопитно Преди 4 часа

В епизод 2 от третия сезон на The Voice Cast е Дани Балевска, известна в мрежите като Danbie