Грубият език прави ИИ по-точен, но учени предупреждават за негативите
Източник: iStock/GettyImages

И зкуственият интелект (ИИ), като чатботовете, може да дава по-точни отговори, когато се отнасяте грубо с тях, установиха учени. Все пак те предупреждават за потенциалните вреди от използването на унижаващ език.

В ново изследване, публикувано на 6 октомври в базата с препринтове arXiv, учените са искали да проверят дали учтивостта или грубостта влияят на представянето на ИИ системата. Това изследване все още не е преминало през процес на рецензиране от специалисти, пише сайтът Live Science.

За да тестват как тонът на потребителя влияе на точността на отговорите, изследователите разработили 50 основни въпроса с множествен избор и след това ги модифицирали чрез добавяне на префикси, които да отговарят на пет категории тонове: много учтив, учтив, неутрален, груб и много груб. Въпросите били от различни области, включително математика, история и наука.

Всеки въпрос имал четири възможни отговора, от които само един бил верен. Те подали общо 250 въпроса по 10 пъти към ChatGPT-4o — един от най-напредналите големи езикови модели (LLM), разработени от OpenAI.

„Нашите експерименти са предварителни и показват, че тонът значително може да повлияе на представянето, измервано чрез резултата от отговорите на 50-те въпроса“, написаха изследователите в своята статия. „Доста изненадващо, резултатите ни показват, че грубият тон води до по-добри резултати от учтивия. Въпреки че това откритие е от научен интерес, ние не препоръчваме използването на враждебни или токсични интерфейси в реални приложения,“ добавиха те.

„Използването на обидни или унижаващи изрази в човешко-ИИ взаимодействие може да има негативни ефекти върху потребителския опит, достъпността и приобщаването, както и да допринесе за вредни комуникационни норми. Вместо това, ние разглеждаме нашите резултати като доказателство, че големите езикови модели остават чувствителни към повърхностни сигнали в подканите, което може да създаде непредвидени компромиси между представяне и благополучието на потребителя“, обясняват учените.

Грубото пробуждане

Преди да подадат всеки въпрос, изследователите помолили чатбота да игнорира всички предишни разглеждания, за да не бъде влияно от предишния тон. Чатботовете били помолени, без обяснения, да изберат един от четирите варианта.

Точността на отговорите варирала от 80.8% за много учтивите въпроси до 84.8% за много грубите. Интересното е, че точността се увеличавала с всяка стъпка надолу по скалата от най-учтивия към най-грубия тон. Учтивите въпроси отчетоха точност от 81.4%, следвани от 82.2% за неутрални и 82.8% за груби.

Екипът използвал различни формулировки в префикса, за да промени тона, освен в неутралния случай, където не бил добавян никакъв префикс и въпросът бил зададен самостоятелно.

За много учтивите въпроси те започвали с изрази като „Мога ли да помоля за помощ с този въпрос?“ или „Бихте ли били така любезни да решите следния въпрос?“. В най-грубата крайна точка например имало фрази като: „Хей, изпълнителю, реши това“ или „Знам, че не си умен, но опитай това“.

Изследване в нова област — „prompt engineering“

Това изследване е част от развиваща се област, наречена prompt engineering, която се занимава с това как структурата, стилът и езикът на подканите влияят на отговора от големите езикови модели. Изследването цитира и предходни изследвания по темата учтивост срещу грубост, чиито резултати обикновено са били противоположни.

В предишни проучвания е установено, че „неучтивите подканки често водят до лоши резултати, но прекалената учтивост не гарантира по-добри показатели.“ Въпреки това, предишното изследване е било проведено с други модели — ChatGPT 3.5 и Llama 2-70B — и използвало осем различни тона. Там също било наблюдавано, че най-грубата подканка дава по-точни резултати (76.47%) в сравнение с най-учтивата (75.82%).

Ограничения и бъдещи планове

Учените признават ограниченията на своето проучване. Например, 250 въпроса са сравнително малка база данни, а провеждането на експеримента с един единствен езиков модел означава, че резултатите не могат да бъдат обобщени за други ИИ системи.

С тези ограничения наум, екипът планира да разшири изследването си и към други модели, включително Claude на Anthropic и ChatGPT o3 на OpenAI. Освен това те признават, че използването само на въпроси с множествен избор ограничава измерванията само в едно измерение на представянето и не обхваща други аспекти като плавност, разсъждение и последователност.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Шмигал: Енергийната система на Украйна преживя най-трудния си ден от 2022 г.

Шмигал: Енергийната система на Украйна преживя най-трудния си ден от 2022 г.

Свят Преди 2 минути

Премиерът Юлия Свириденко заяви, че се полагат усилия за осигуряване на жителите на Киев на алтернативни енергийни източници и генератори

Румен Радев напуска президентската институция

Румен Радев напуска президентската институция

България Преди 15 минути

Радев ще бъде изпратен на парадния вход на институцията от вицепрезидента Илияна Йотова

Мъдреците - кога трябва да се вадят и кога не е необходимо

Мъдреците - кога трябва да се вадят и кога не е необходимо

Любопитно Преди 30 минути

Много хора вярват, че мъдреците трябва да бъдат премахнати, но това не е така

.

Студеното време не ви разболява. Ето каква наистина е причината

Любопитно Преди 31 минути

Самите ниски температури не причиняват инфекции

Захари Карабашлиев получи приза „Писател на 2025 г.”

Захари Карабашлиев получи приза „Писател на 2025 г.”

България Преди 8 часа

Наградата връчи философът и писател проф. Цочо Бояджиев

<p>Близките на убита в София искат обезщетение от ЦИК</p>

Близките на убита в София жена искат обезщетение от ЦИК

България Преди 9 часа

По случая НОИ е издал разпореждане, с което инцидентът е приет за трудова злополука

Почина писателят и преводач Петър Велчев

Почина писателят и преводач Петър Велчев

България Преди 9 часа

Петър Велчев пресъздаде на български език множество поети-колоси

Хибриден автомобил се запали край Цървеняно

Хибриден автомобил се запали край Цървеняно

България Преди 10 часа

В автомобила са пътували двама пътници, които не са пострадали

Автобус аварира на основно кръстовище в София

Автобус аварира на основно кръстовище в София

България Преди 10 часа

Образува се задръстване и преминаването през участъка беше затруднено

Зеленски и Тръмп са се съгласили за гаранции за сигурност за Украйна

Зеленски и Тръмп са се съгласили за гаранции за сигурност за Украйна

Свят Преди 11 часа

В ОАЕ ще бъдат домакин на тристранни разговори между САЩ, Русия и Украйна

Уличиха Ивет Лалова в употреба на допинг в Рио

Уличиха Ивет Лалова в употреба на допинг в Рио

Свят Преди 12 часа

Пробата е дадена от българската лекоатлетка на 17 август 2016 г. - по време на Олимпиадата в Рио

Голяма авария спря за кратко тока в центъра на София

Голяма авария спря за кратко тока в центъра на София

България Преди 12 часа

Електричеството е спряло малко преди 18.30 часа

Осуетиха атентат срещу германския канцлер Мерц

Осуетиха атентат срещу германския канцлер Мерц

Свят Преди 12 часа

Групировка на име „Колектив за съпротива“ пое отговорност

Службата за имигрантите задържала деца в Минесота

Службата за имигрантите задържала деца в Минесота

Свят Преди 13 часа

Тръмп определи кампанията като битка за изгонване на насилствени престъпници от САЩ.