Грубият език прави ИИ по-точен, но учени предупреждават за негативите
Източник: iStock/GettyImages

И зкуственият интелект (ИИ), като чатботовете, може да дава по-точни отговори, когато се отнасяте грубо с тях, установиха учени. Все пак те предупреждават за потенциалните вреди от използването на унижаващ език.

В ново изследване, публикувано на 6 октомври в базата с препринтове arXiv, учените са искали да проверят дали учтивостта или грубостта влияят на представянето на ИИ системата. Това изследване все още не е преминало през процес на рецензиране от специалисти, пише сайтът Live Science.

За да тестват как тонът на потребителя влияе на точността на отговорите, изследователите разработили 50 основни въпроса с множествен избор и след това ги модифицирали чрез добавяне на префикси, които да отговарят на пет категории тонове: много учтив, учтив, неутрален, груб и много груб. Въпросите били от различни области, включително математика, история и наука.

Всеки въпрос имал четири възможни отговора, от които само един бил верен. Те подали общо 250 въпроса по 10 пъти към ChatGPT-4o — един от най-напредналите големи езикови модели (LLM), разработени от OpenAI.

„Нашите експерименти са предварителни и показват, че тонът значително може да повлияе на представянето, измервано чрез резултата от отговорите на 50-те въпроса“, написаха изследователите в своята статия. „Доста изненадващо, резултатите ни показват, че грубият тон води до по-добри резултати от учтивия. Въпреки че това откритие е от научен интерес, ние не препоръчваме използването на враждебни или токсични интерфейси в реални приложения,“ добавиха те.

„Използването на обидни или унижаващи изрази в човешко-ИИ взаимодействие може да има негативни ефекти върху потребителския опит, достъпността и приобщаването, както и да допринесе за вредни комуникационни норми. Вместо това, ние разглеждаме нашите резултати като доказателство, че големите езикови модели остават чувствителни към повърхностни сигнали в подканите, което може да създаде непредвидени компромиси между представяне и благополучието на потребителя“, обясняват учените.

Грубото пробуждане

Преди да подадат всеки въпрос, изследователите помолили чатбота да игнорира всички предишни разглеждания, за да не бъде влияно от предишния тон. Чатботовете били помолени, без обяснения, да изберат един от четирите варианта.

Точността на отговорите варирала от 80.8% за много учтивите въпроси до 84.8% за много грубите. Интересното е, че точността се увеличавала с всяка стъпка надолу по скалата от най-учтивия към най-грубия тон. Учтивите въпроси отчетоха точност от 81.4%, следвани от 82.2% за неутрални и 82.8% за груби.

Екипът използвал различни формулировки в префикса, за да промени тона, освен в неутралния случай, където не бил добавян никакъв префикс и въпросът бил зададен самостоятелно.

За много учтивите въпроси те започвали с изрази като „Мога ли да помоля за помощ с този въпрос?“ или „Бихте ли били така любезни да решите следния въпрос?“. В най-грубата крайна точка например имало фрази като: „Хей, изпълнителю, реши това“ или „Знам, че не си умен, но опитай това“.

Изследване в нова област — „prompt engineering“

Това изследване е част от развиваща се област, наречена prompt engineering, която се занимава с това как структурата, стилът и езикът на подканите влияят на отговора от големите езикови модели. Изследването цитира и предходни изследвания по темата учтивост срещу грубост, чиито резултати обикновено са били противоположни.

В предишни проучвания е установено, че „неучтивите подканки често водят до лоши резултати, но прекалената учтивост не гарантира по-добри показатели.“ Въпреки това, предишното изследване е било проведено с други модели — ChatGPT 3.5 и Llama 2-70B — и използвало осем различни тона. Там също било наблюдавано, че най-грубата подканка дава по-точни резултати (76.47%) в сравнение с най-учтивата (75.82%).

Ограничения и бъдещи планове

Учените признават ограниченията на своето проучване. Например, 250 въпроса са сравнително малка база данни, а провеждането на експеримента с един единствен езиков модел означава, че резултатите не могат да бъдат обобщени за други ИИ системи.

С тези ограничения наум, екипът планира да разшири изследването си и към други модели, включително Claude на Anthropic и ChatGPT o3 на OpenAI. Освен това те признават, че използването само на въпроси с множествен избор ограничава измерванията само в едно измерение на представянето и не обхваща други аспекти като плавност, разсъждение и последователност.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Брутални глоби: Гърция забрани тротинетките за деца под 17 г.

Брутални глоби: Гърция забрани тротинетките за деца под 17 г.

Свят Преди 53 минути

При нарушения на забраната ще бъде налагана глоба от 150 евро. Предвижда се да бъде въведена и задължителна застраховка за хората, които карат такива превозни средства

Извънредно положение в щат на САЩ: Най-големият горски пожар погълна ски курорт

Извънредно положение в щат на САЩ: Най-големият горски пожар погълна ски курорт

Свят Преди 2 часа

Националната метеорологична служба на САЩ издаде рядко предупреждение за „особено опасна ситуация“, тъй като сухите и ветровити условия подхранват появата на още пожари в западната част на страната

Новото поколение телевизори издига реализма на нови нива

Новото поколение телевизори издига реализма на нови нива

Технологии Преди 3 часа

Технологията има различни имена: Micro RGB, True RGB или други, в зависимост от производителя и подхода му. Но като цяло основата е сходна: нов начин за създаване на изображения с голяма прецизност, много повече детайли и реалистични цветове

Температурите скачат до 37 градуса, ето къде се очаква дъжд

Температурите скачат до 37 градуса, ето къде се очаква дъжд

България Преди 3 часа

Максималните температури ще бъдат между 31° и 36°, в София - около 31°

27 юни: Кървавата депортация на кримските българи

27 юни: Кървавата депортация на кримските българи

Любопитно Преди 3 часа

Вижте какво се е случило на този ден в историята

<p>След месеци война: Израел и Ливан направиха първата крачка към мира</p>

Израел и Ливан подписаха рамково споразумение след преговори, проведени с посредничеството на САЩ

Свят Преди 11 часа

Документът цели да сложи край на сраженията между Израел и „Хизбула“ и да отвори път към трайно примирие

Трагедията във Венецуела: Жертвите вече са 920, над 50 000 са в неизвестност

Трагедията във Венецуела: Жертвите вече са 920, над 50 000 са в неизвестност

Свят Преди 11 часа

Спасителни екипи от няколко държави се включиха в издирването на оцелели, докато ООН определя операцията като изключително сложна

Мащабна полицейска акция в Несебър, има задържани

Мащабна полицейска акция в Несебър, има задържани

България Преди 12 часа

От областната дирекция засега не предоставят повече информация за предмета на акцията и за точния брой на задържаните, като се позовават на продължаващи процесуално-следствени действия

<p>СО обяви регулярни нощни проверки през целия летен сезон</p>

Столична община обяви регулярни нощни проверки през целия летен сезон

България Преди 12 часа

Общината, полицията и здравните власти започват регулярни нощни акции за спазване на обществения ред през летния сезон

Задържаха бившата полицайка Симона Радева, конвоират я в Сливенския затвор

Задържаха бившата полицайка Симона Радева, конвоират я в Сливенския затвор

България Преди 12 часа

Тя беше осъдена окончателно на 3 години и половина

Мълчалив вик за справедливост: Протест в памет на всички деца, загинали на пътя

Мълчалив вик за справедливост: Протест в памет на всички деца, загинали на пътя

България Преди 13 часа

Демонстрации се проведоха в цялата страна с призив за по-строг контрол и по-безопасни пътища

<p>Тръмп: Това е &quot;глупаво нарушение&quot; на примирието (ОБЗОР)</p>

Тръмп обвини Иран в нарушение на примирието след атака с дронове в Ормузкия проток

Свят Преди 13 часа

Напрежението в Персийския залив отново се покачва, след като Тръмп съобщи за иранска атака с дронове срещу търговски кораби в Ормузкия проток

Самолет се вряза в най-високата сграда в Пекин

Самолет се вряза в най-високата сграда в Пекин

Свят Преди 13 часа

Полицията отцепи района около 108-етажния „Ситик Тауър“, а властите все още не са излезли с официална информация.

<p>Горещината спря най-старата АЕЦ в света</p>

АЕЦ „Бецнау“ спря работа заради високи температури на река Ааре

Свят Преди 14 часа

Гореща вълна в Европа доведе до временно спиране на най-старата действаща атомна централа в света

Изписаха от болница треньора, пострадал при катастрофата на АМ Тракия“

Изписаха от болница треньора, пострадал при катастрофата на АМ Тракия“

България Преди 14 часа

При трагедията загинаха две 9-годишни деца и бащата на едно от тях