И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Председателят на НС Рая Назарян на визита в Киев

Председателят на НС Рая Назарян на визита в Киев

България Преди 43 минути

Тя ще участва във втората парламентарна Среща на върха в Буча, Украйна

<p>Парламентът се събира на извънредно заседание</p>

Парламентът се събира на извънредно заседание в сряда

България Преди 1 час

В дневния ред на депутатите са включени изслушвания на трима служебни министри

Могат ли мишките да "спасят" астронавтите на Марс?

Могат ли мишките да "спасят" астронавтите на Марс?

Любопитно Преди 1 час

Учени откриват изненадващо решение за физическата форма в Космоса

Кралски вкус с малко средства: Рецепта за сочен императорски пай

Кралски вкус с малко средства: Рецепта за сочен императорски пай

Любопитно Преди 1 час

За да приготвите този „кралски“ пай, е необходимо само да комбинирате няколко основни продукта с „остатъци“ от кухнята

Грешката, която всички правим: Защо никога не трябва да изхвърляте стъблата на билките?

Грешката, която всички правим: Защо никога не трябва да изхвърляте стъблата на билките?

Любопитно Преди 1 час

Дори кората на цитрусовите плодове може лесно да се използва повторно у дома

Ирански генерал приветства "новия регионален ред"

Ирански генерал приветства "новия регионален ред"

Свят Преди 9 часа

Каани: Сега има единен команден център на фронта на съпротивата

Руски петролен танкер достигна Куба

Руски петролен танкер достигна Куба

Свят Преди 10 часа

Русия счита за свой дълг да се намеси

Каролин Ливит: Най-младият прессекретар в историята на Белия дом

Белият дом: Иран говори друго в преговорите

Свят Преди 11 часа

Тръмп обмисля да поиска арабските държави да платят за войната

Израел приема смъртно наказание за палестинците, убили израелци

Израел приема смъртно наказание за палестинците, убили израелци

Свят Преди 11 часа

Асоциацията за граждански права в Израел подаде петиция до Върховния съд на страната, изисквайки отмяна на закона

Шмигал: България подготвя енергийна помощ за Украйна

Шмигал: България подготвя енергийна помощ за Украйна

Свят Преди 11 часа

Шмигал отбеляза, че Украйна вече има успешен опит в сътрудничеството с „Уестигхаус“

Нейнски: България също беше изнудвана от Русия, така че разбира Украйна

Нейнски: България също беше изнудвана от Русия, така че разбира Украйна

Свят Преди 12 часа

Тя подчерта, че България помни времената на комунизма

Сирийски бази бяха атакувани с дронове

Сирийски бази бяха атакувани с дронове

Свят Преди 12 часа

Дамаск се опитва да остане настрани от регионалната война

Загинал и 8 ранени след стрелба в училище в Аржентина

Загинал и 8 ранени след стрелба в училище в Аржентина

Свят Преди 12 часа

Нападателят е бил задържан след стрелбата

Гюров и Зеленски подписаха десетгодишно споразумение за отбрана

Гюров и Зеленски подписаха десетгодишно споразумение за отбрана

Свят Преди 13 часа

Премиерът беше категоричен, че България ще бъде партньор на Украйна