Грубият език прави ИИ по-точен, но учени предупреждават за негативите
Източник: iStock/GettyImages

И зкуственият интелект (ИИ), като чатботовете, може да дава по-точни отговори, когато се отнасяте грубо с тях, установиха учени. Все пак те предупреждават за потенциалните вреди от използването на унижаващ език.

В ново изследване, публикувано на 6 октомври в базата с препринтове arXiv, учените са искали да проверят дали учтивостта или грубостта влияят на представянето на ИИ системата. Това изследване все още не е преминало през процес на рецензиране от специалисти, пише сайтът Live Science.

За да тестват как тонът на потребителя влияе на точността на отговорите, изследователите разработили 50 основни въпроса с множествен избор и след това ги модифицирали чрез добавяне на префикси, които да отговарят на пет категории тонове: много учтив, учтив, неутрален, груб и много груб. Въпросите били от различни области, включително математика, история и наука.

Всеки въпрос имал четири възможни отговора, от които само един бил верен. Те подали общо 250 въпроса по 10 пъти към ChatGPT-4o — един от най-напредналите големи езикови модели (LLM), разработени от OpenAI.

„Нашите експерименти са предварителни и показват, че тонът значително може да повлияе на представянето, измервано чрез резултата от отговорите на 50-те въпроса“, написаха изследователите в своята статия. „Доста изненадващо, резултатите ни показват, че грубият тон води до по-добри резултати от учтивия. Въпреки че това откритие е от научен интерес, ние не препоръчваме използването на враждебни или токсични интерфейси в реални приложения,“ добавиха те.

„Използването на обидни или унижаващи изрази в човешко-ИИ взаимодействие може да има негативни ефекти върху потребителския опит, достъпността и приобщаването, както и да допринесе за вредни комуникационни норми. Вместо това, ние разглеждаме нашите резултати като доказателство, че големите езикови модели остават чувствителни към повърхностни сигнали в подканите, което може да създаде непредвидени компромиси между представяне и благополучието на потребителя“, обясняват учените.

Грубото пробуждане

Преди да подадат всеки въпрос, изследователите помолили чатбота да игнорира всички предишни разглеждания, за да не бъде влияно от предишния тон. Чатботовете били помолени, без обяснения, да изберат един от четирите варианта.

Точността на отговорите варирала от 80.8% за много учтивите въпроси до 84.8% за много грубите. Интересното е, че точността се увеличавала с всяка стъпка надолу по скалата от най-учтивия към най-грубия тон. Учтивите въпроси отчетоха точност от 81.4%, следвани от 82.2% за неутрални и 82.8% за груби.

Екипът използвал различни формулировки в префикса, за да промени тона, освен в неутралния случай, където не бил добавян никакъв префикс и въпросът бил зададен самостоятелно.

За много учтивите въпроси те започвали с изрази като „Мога ли да помоля за помощ с този въпрос?“ или „Бихте ли били така любезни да решите следния въпрос?“. В най-грубата крайна точка например имало фрази като: „Хей, изпълнителю, реши това“ или „Знам, че не си умен, но опитай това“.

Изследване в нова област — „prompt engineering“

Това изследване е част от развиваща се област, наречена prompt engineering, която се занимава с това как структурата, стилът и езикът на подканите влияят на отговора от големите езикови модели. Изследването цитира и предходни изследвания по темата учтивост срещу грубост, чиито резултати обикновено са били противоположни.

В предишни проучвания е установено, че „неучтивите подканки често водят до лоши резултати, но прекалената учтивост не гарантира по-добри показатели.“ Въпреки това, предишното изследване е било проведено с други модели — ChatGPT 3.5 и Llama 2-70B — и използвало осем различни тона. Там също било наблюдавано, че най-грубата подканка дава по-точни резултати (76.47%) в сравнение с най-учтивата (75.82%).

Ограничения и бъдещи планове

Учените признават ограниченията на своето проучване. Например, 250 въпроса са сравнително малка база данни, а провеждането на експеримента с един единствен езиков модел означава, че резултатите не могат да бъдат обобщени за други ИИ системи.

С тези ограничения наум, екипът планира да разшири изследването си и към други модели, включително Claude на Anthropic и ChatGPT o3 на OpenAI. Освен това те признават, че използването само на въпроси с множествен избор ограничава измерванията само в едно измерение на представянето и не обхваща други аспекти като плавност, разсъждение и последователност.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
<p>Белият дом мълчи за &quot;тайния план&quot; за Иран</p>

Белият дом запазва мълчание относно американския план за Иран

Свят Преди 19 минути

Египет потвърди съществуването на 15-точков проект, преговорите продължават

Историческа присъда срещу Google и Meta за вредите върху психичното здраве на младежите

Историческа присъда срещу Google и Meta за вредите върху психичното здраве на младежите

Свят Преди 32 минути

Делото може да промени начина, по който технологичните компании носят отговорност за своите продукти

Показват как ще изглежда бюлетината за вота на 19 април

Показват как ще изглежда бюлетината за вота на 19 април

В изборите ще участват 24 формации - 14 партии и 10 коалиции

Как навикът да скролваме в телефона издава доходите ни

Как навикът да скролваме в телефона издава доходите ни

Любопитно Преди 1 час

Обърнете внимание на хората около вас, които говорят по телефоните си

Храните, които най-много вредят на мозъка ви

Храните, които най-много вредят на мозъка ви

Любопитно Преди 1 час

Кои са те и защо вредят на мозъка ви четете в следващите редове

Сладък сън в чиния: 5 храни, които помагат при безсъние

Сладък сън в чиния: 5 храни, които помагат при безсъние

Любопитно Преди 1 час

Ако някога сте имали проблеми със заспиването, режимът ви на хранене може да играе много по-голяма роля, отколкото предполагате

11 умения, които родителите ни владееха, но поколението Z губи напълно

11 умения, които родителите ни владееха, но поколението Z губи напълно

Любопитно Преди 1 час

Много хора днес нямат уменията, които техните родители са притежавали. Какви важни житейски умения са нужни на Gen Z, но те често не ги разбират? И кой носи отговорността за тази пропаст?

САЩ: Тръмп не блъфира, ще ударим Иран по-силно

САЩ: Тръмп не блъфира, ще ударим Иран по-силно

Свят Преди 9 часа

Левит заяви, че цените на горивата ще паднат веднага щом приключи американската военна операция в Иран

Иран обяви, ако САЩ нахлуе, ще удари Червено море

Иран обяви, ако САЩ нахлуе, ще удари Червено море

Свят Преди 11 часа

Проливът Баб ел-Мандеб е сред най-стратегическите в света

Милиарди за пътища без резултат: Какво разкриват проверките в АПИ

Милиарди за пътища без резултат: Какво разкриват проверките в АПИ

България Преди 11 часа

Започват проверки на един по един от ремонтите

Прецедент, момиче осъди най-големите социални медии

Прецедент, момиче осъди най-големите социални медии

Свят Преди 12 часа

Според съдебния състав двете социални медии са проявили небрежност

Гюров обсъди с експерти мерки срещу петролната криза

Гюров обсъди с експерти мерки срещу петролната криза

България Преди 12 часа

По време на срещата стана ясно, че на този етап банковият сектор не е пряко засегнат от ситуацията в Близкия изток

Ракетната индустрия в САЩ в "бойна готовност" за Иран

Ракетната индустрия в САЩ в "бойна готовност" за Иран

Свят Преди 13 часа

Войната в Близкия изток води до бързо изчерпване на запасите от ракети

Украйна отговори на удара с масирана атака срещу Русия

Украйна отговори на удара с масирана атака срещу Русия

Свят Преди 13 часа

По информация на Русия общо 398 дрона с голям обсег на действие са били прехванати

Тридесет държави решават как да отворят Ормузкия проток

Тридесет държави решават как да отворят Ормузкия проток

Свят Преди 13 часа

Срещата ще се състои на ниво началници на генералните щабове