Грубият език прави ИИ по-точен, но учени предупреждават за негативите
Източник: iStock/GettyImages

И зкуственият интелект (ИИ), като чатботовете, може да дава по-точни отговори, когато се отнасяте грубо с тях, установиха учени. Все пак те предупреждават за потенциалните вреди от използването на унижаващ език.

В ново изследване, публикувано на 6 октомври в базата с препринтове arXiv, учените са искали да проверят дали учтивостта или грубостта влияят на представянето на ИИ системата. Това изследване все още не е преминало през процес на рецензиране от специалисти, пише сайтът Live Science.

За да тестват как тонът на потребителя влияе на точността на отговорите, изследователите разработили 50 основни въпроса с множествен избор и след това ги модифицирали чрез добавяне на префикси, които да отговарят на пет категории тонове: много учтив, учтив, неутрален, груб и много груб. Въпросите били от различни области, включително математика, история и наука.

Всеки въпрос имал четири възможни отговора, от които само един бил верен. Те подали общо 250 въпроса по 10 пъти към ChatGPT-4o — един от най-напредналите големи езикови модели (LLM), разработени от OpenAI.

„Нашите експерименти са предварителни и показват, че тонът значително може да повлияе на представянето, измервано чрез резултата от отговорите на 50-те въпроса“, написаха изследователите в своята статия. „Доста изненадващо, резултатите ни показват, че грубият тон води до по-добри резултати от учтивия. Въпреки че това откритие е от научен интерес, ние не препоръчваме използването на враждебни или токсични интерфейси в реални приложения,“ добавиха те.

„Използването на обидни или унижаващи изрази в човешко-ИИ взаимодействие може да има негативни ефекти върху потребителския опит, достъпността и приобщаването, както и да допринесе за вредни комуникационни норми. Вместо това, ние разглеждаме нашите резултати като доказателство, че големите езикови модели остават чувствителни към повърхностни сигнали в подканите, което може да създаде непредвидени компромиси между представяне и благополучието на потребителя“, обясняват учените.

Грубото пробуждане

Преди да подадат всеки въпрос, изследователите помолили чатбота да игнорира всички предишни разглеждания, за да не бъде влияно от предишния тон. Чатботовете били помолени, без обяснения, да изберат един от четирите варианта.

Точността на отговорите варирала от 80.8% за много учтивите въпроси до 84.8% за много грубите. Интересното е, че точността се увеличавала с всяка стъпка надолу по скалата от най-учтивия към най-грубия тон. Учтивите въпроси отчетоха точност от 81.4%, следвани от 82.2% за неутрални и 82.8% за груби.

Екипът използвал различни формулировки в префикса, за да промени тона, освен в неутралния случай, където не бил добавян никакъв префикс и въпросът бил зададен самостоятелно.

За много учтивите въпроси те започвали с изрази като „Мога ли да помоля за помощ с този въпрос?“ или „Бихте ли били така любезни да решите следния въпрос?“. В най-грубата крайна точка например имало фрази като: „Хей, изпълнителю, реши това“ или „Знам, че не си умен, но опитай това“.

Изследване в нова област — „prompt engineering“

Това изследване е част от развиваща се област, наречена prompt engineering, която се занимава с това как структурата, стилът и езикът на подканите влияят на отговора от големите езикови модели. Изследването цитира и предходни изследвания по темата учтивост срещу грубост, чиито резултати обикновено са били противоположни.

В предишни проучвания е установено, че „неучтивите подканки често водят до лоши резултати, но прекалената учтивост не гарантира по-добри показатели.“ Въпреки това, предишното изследване е било проведено с други модели — ChatGPT 3.5 и Llama 2-70B — и използвало осем различни тона. Там също било наблюдавано, че най-грубата подканка дава по-точни резултати (76.47%) в сравнение с най-учтивата (75.82%).

Ограничения и бъдещи планове

Учените признават ограниченията на своето проучване. Например, 250 въпроса са сравнително малка база данни, а провеждането на експеримента с един единствен езиков модел означава, че резултатите не могат да бъдат обобщени за други ИИ системи.

С тези ограничения наум, екипът планира да разшири изследването си и към други модели, включително Claude на Anthropic и ChatGPT o3 на OpenAI. Освен това те признават, че използването само на въпроси с множествен избор ограничава измерванията само в едно измерение на представянето и не обхваща други аспекти като плавност, разсъждение и последователност.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Пожар в хотел в Багдад след атака с дрон

Пожар в хотел в Багдад след атака с дрон

Свят Преди 2 часа

Атаката с дрон е била насочена срещу американското посолство

Иран удари голямо нефтено находище в ОАЕ

Иран удари голямо нефтено находище в ОАЕ

Свят Преди 3 часа

Нефтеното находище „Шах“ е разположено на 230 километра южно от град Абу Даби

Дизелът в България скочи до 1,50 евро за литър

Дизелът в България скочи до 1,50 евро за литър

България Преди 4 часа

Сорт "Брент" остава над 100 долара за барел

Тръмп даде отчет за Иран, не знаят кой управлява там

Тръмп даде отчет за Иран, не знаят кой управлява там

Свят Преди 4 часа

Вашингтон не е сигурен дали Моджтаба Хаменей е мъртъв

Почина художничката Елза Гоева

Почина художничката Елза Гоева

България Преди 5 часа

Тя оставя значима следа в развитието на българската живопис от втората половина на ХХ и началото на XXI век.

Началникът на кабинета на Тръмп има рак на гърдата

Началникът на кабинета на Тръмп има рак на гърдата

Свят Преди 5 часа

Тя е диагностицирана с рак на гърдата в ранен стадий

Инж. Тодор Анастасов

Служебното правителство смени шефа на АПИ

България Преди 6 часа

Председател на Управителния съвет на АПИ става Тодор Анастасов

Нейнски: Тръмп не е искал от България да пази Ормузкия проток

Нейнски: Тръмп не е искал от България да пази Ормузкия проток

Свят Преди 6 часа

Нейнски: Европа е единна по отношение на високите цени на горивата

Обновяват 56 милиона кв. метра жилища до 2030 г.

Обновяват 56 милиона кв. метра жилища до 2030 г.

България Преди 7 часа

Това съобщи министърът на регионалното развитие и благоустройството Николай Найденов

Хванаха нарушители с моторни шейни в три национални парка

Хванаха нарушители с моторни шейни в три национални парка

България Преди 7 часа

В Национален парк „Рила“ на 11 март акцията е продължила повече от 10 часа

Клои Жао се появи в траур на "Оскарите"

Клои Жао се появи в траур на "Оскарите"

Свят Преди 7 часа

Сара Мишел Гелар потвърди лошата новина за „Бъфи, убийцата на вампири“, докато режисьорката заговори за „силата да оставиш нещата да умрат“

<p>Иран изстреля &bdquo;танцуваща ракета&ldquo; срещу Израел</p>

Иран изстреля за първи път „танцуваща ракета“: Дебют на балистичния звяр „Седжил“ срещу Израел

Свят Преди 7 часа

За първи път от началото на конфликта Техеран използва двустепенната ракета с твърдо гориво, способна да пробие „Железен купол“

На адрес в София, "Калашников", картечен пистолет, кокаин и хероин

На адрес в София, "Калашников", картечен пистолет, кокаин и хероин

България Преди 7 часа

Освен това имало ловна пушка, пистолет „Браунинг“ калибър 7,65 мм и 535 броя бойни и ловни боеприпаси

Грозни сцени на „Оскарите“: Теяна Тейлър обвини охранител във физическа агресия

Грозни сцени на „Оскарите“: Теяна Тейлър обвини охранител във физическа агресия

Любопитно Преди 7 часа

Теяна Тейлър влезе в остър сблъсък с охраната на наградите „Оскар“ 2026, след като бе грубо спряна на път за сцената. Въпреки скандала и загубата в категорията за поддържаща роля, актрисата отпразнува триумфа на филма си „Битка след битка“

<p>Откриха училищни сандвичи с плесени и бактерии</p>

БАБХ откри училищни сандвичи с плесени и бактерии

България Преди 8 часа

Извършени са проверки в над 400 проверки в училища в цялата страна