Грубият език прави ИИ по-точен, но учени предупреждават за негативите
Източник: iStock/GettyImages

И зкуственият интелект (ИИ), като чатботовете, може да дава по-точни отговори, когато се отнасяте грубо с тях, установиха учени. Все пак те предупреждават за потенциалните вреди от използването на унижаващ език.

В ново изследване, публикувано на 6 октомври в базата с препринтове arXiv, учените са искали да проверят дали учтивостта или грубостта влияят на представянето на ИИ системата. Това изследване все още не е преминало през процес на рецензиране от специалисти, пише сайтът Live Science.

За да тестват как тонът на потребителя влияе на точността на отговорите, изследователите разработили 50 основни въпроса с множествен избор и след това ги модифицирали чрез добавяне на префикси, които да отговарят на пет категории тонове: много учтив, учтив, неутрален, груб и много груб. Въпросите били от различни области, включително математика, история и наука.

Всеки въпрос имал четири възможни отговора, от които само един бил верен. Те подали общо 250 въпроса по 10 пъти към ChatGPT-4o — един от най-напредналите големи езикови модели (LLM), разработени от OpenAI.

„Нашите експерименти са предварителни и показват, че тонът значително може да повлияе на представянето, измервано чрез резултата от отговорите на 50-те въпроса“, написаха изследователите в своята статия. „Доста изненадващо, резултатите ни показват, че грубият тон води до по-добри резултати от учтивия. Въпреки че това откритие е от научен интерес, ние не препоръчваме използването на враждебни или токсични интерфейси в реални приложения,“ добавиха те.

„Използването на обидни или унижаващи изрази в човешко-ИИ взаимодействие може да има негативни ефекти върху потребителския опит, достъпността и приобщаването, както и да допринесе за вредни комуникационни норми. Вместо това, ние разглеждаме нашите резултати като доказателство, че големите езикови модели остават чувствителни към повърхностни сигнали в подканите, което може да създаде непредвидени компромиси между представяне и благополучието на потребителя“, обясняват учените.

Грубото пробуждане

Преди да подадат всеки въпрос, изследователите помолили чатбота да игнорира всички предишни разглеждания, за да не бъде влияно от предишния тон. Чатботовете били помолени, без обяснения, да изберат един от четирите варианта.

Точността на отговорите варирала от 80.8% за много учтивите въпроси до 84.8% за много грубите. Интересното е, че точността се увеличавала с всяка стъпка надолу по скалата от най-учтивия към най-грубия тон. Учтивите въпроси отчетоха точност от 81.4%, следвани от 82.2% за неутрални и 82.8% за груби.

Екипът използвал различни формулировки в префикса, за да промени тона, освен в неутралния случай, където не бил добавян никакъв префикс и въпросът бил зададен самостоятелно.

За много учтивите въпроси те започвали с изрази като „Мога ли да помоля за помощ с този въпрос?“ или „Бихте ли били така любезни да решите следния въпрос?“. В най-грубата крайна точка например имало фрази като: „Хей, изпълнителю, реши това“ или „Знам, че не си умен, но опитай това“.

Изследване в нова област — „prompt engineering“

Това изследване е част от развиваща се област, наречена prompt engineering, която се занимава с това как структурата, стилът и езикът на подканите влияят на отговора от големите езикови модели. Изследването цитира и предходни изследвания по темата учтивост срещу грубост, чиито резултати обикновено са били противоположни.

В предишни проучвания е установено, че „неучтивите подканки често водят до лоши резултати, но прекалената учтивост не гарантира по-добри показатели.“ Въпреки това, предишното изследване е било проведено с други модели — ChatGPT 3.5 и Llama 2-70B — и използвало осем различни тона. Там също било наблюдавано, че най-грубата подканка дава по-точни резултати (76.47%) в сравнение с най-учтивата (75.82%).

Ограничения и бъдещи планове

Учените признават ограниченията на своето проучване. Например, 250 въпроса са сравнително малка база данни, а провеждането на експеримента с един единствен езиков модел означава, че резултатите не могат да бъдат обобщени за други ИИ системи.

С тези ограничения наум, екипът планира да разшири изследването си и към други модели, включително Claude на Anthropic и ChatGPT o3 на OpenAI. Освен това те признават, че използването само на въпроси с множествен избор ограничава измерванията само в едно измерение на представянето и не обхваща други аспекти като плавност, разсъждение и последователност.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Нови сблъсъци и емоционални номинации в Къщата на Big Brother тази вечер

Нови сблъсъци и емоционални номинации в Къщата на Big Brother тази вечер

Любопитно Преди 20 минути

Противоречивият Иван и харизматичният Стоянов отново се изправят един срещу друг

Комисията за контрол над службите отново без кворум

Комисията за контрол над службите отново без кворум

България Преди 46 минути

На заседанието имаше представители само на ПП-ДБ, "Възраждане" и АПС

Полицията издирва 15-годишно момиче от Благоевград

Полицията издирва 15-годишно момиче от Благоевград

България Преди 2 часа

Момичето е в неизвестност за близките си от 27 октомври

<p>България реагира &quot;враждебно и агресивно&quot; на Русия</p>

Георг Георгиев: Реагираме изключително враждебно към нарушаване на въздушното пространство

България Преди 2 часа

Той определи действията на Руската федерация като "изключително провокативни"

Министър Mариан Бачев връчи наградите „Златен век“

Министър Mариан Бачев връчи наградите „Златен век“

България Преди 2 часа

Лауреатите са отличени за своя принос към българската култура и духовност

<p>56% от американците са против балната зала на Тръмп за $300 млн.</p>

Проучване: Повечето американци са против балната зала на Тръмп в Белия дом

Свят Преди 2 часа

Над половината американци заявяват, че са против строителния проект на стойност 300 милиона долара

МЕЧ: Киселова е скрила сигнали срещу "Величие"

МЕЧ: Киселова е скрила сигнали срещу "Величие"

България Преди 3 часа

Това заяви Радостин Василев на извънреден брифинг в Народното събрание

„6-7“ е думата на годината – и никой не знае какво означава

„6-7“ е думата на годината – и никой не знае какво означава

Любопитно Преди 3 часа

Онлайн речникът Dictionary.com обяви, че „6-7“ е думата на годината за 2025 г.

Скок на цената на природния газ в България

Скок на цената на природния газ в България

България Преди 3 часа

КЕВР одобри поскъпване с близо 8%

<p>Исторически вот във Франция - &quot;Национален сбор&quot; проби санитарния кордон</p>

Френският парламент за първи път одобри текст, предложен от крайната десница на Льо Пен

Свят Преди 3 часа

Макар текстът да няма правна сила, гласуването представлява значима символична победа за партията на Льо Пен

Мъж преби майка си с чук до смърт, избяга в гората крещейки "мама"

Мъж преби майка си с чук до смърт, избяга в гората крещейки "мама"

Свят Преди 3 часа

Младежът казва на полицаите: “Отнех живота на мама”

Сидни Суини впечатли без сутиен и прозрачна рокля на събитие на Variety

Сидни Суини впечатли без сутиен и прозрачна рокля на събитие на Variety

Любопитно Преди 4 часа

Суини определено се беше облякла, за да впечатли

Полски изтребители прехванаха руски самолет

Полски изтребители прехванаха руски самолет

Свят Преди 4 часа

Това е втори подобен инцидент над Балтийско море

.

Банките задържаха хиляди фалшиви банкноти

България Преди 4 часа

Увеличават се фалшивите банкноти у нас

<p>Ужасно миришещи дървета&nbsp;са &quot;опасност за безопасността&quot;&nbsp;</p>

Ужасно миришещи дървета са "опасност за безопасността" в Сакраменто

Свят Преди 4 часа

Две 75-годишни гинко дървета са заградени след като зловонният им плод, миришещ на „повръщано“, представлява опасност от подхлъзване, но и от остър мирис