И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Стратегът Ивайло изигра последния си ход в “Игри на волята”

Стратегът Ивайло изигра последния си ход в “Игри на волята”

Любопитно Преди 3 часа

Стратегът Ивайло изигра последния си ход в “Игри на волята”

ЕС подготвя нови санкции срещу Русия

ЕС подготвя нови санкции срещу Русия

Свят Преди 5 часа

Кая Калас: Войните се губят от тези, на които първи им свършват парите или войниците

Двегодишно дете почина след анестезия в стоматологична клиника в Букурещ

Двегодишно дете почина след анестезия в стоматологична клиника в Букурещ

Свят Преди 5 часа

Румънските власти започнаха мащабно разследване

Затварят временно дома за стари хора в Помориe

Затварят временно дома за стари хора в Помориe

България Преди 6 часа

Нова проверка на РЗИ установи, че нито едно от предписанията, дадени преди месец, не е изпълнено

Ивайло и Калин се срещат на Арената за братски дуел в “Игри на волята”

Ивайло и Калин се срещат на Арената за братски дуел в “Игри на волята”

Любопитно Преди 6 часа

Сапунджиева търси път към останалите в племето на Феномените

Двама митничари са задържани на ГКПП "Калотина"

Двама митничари са задържани на ГКПП "Калотина"

България Преди 8 часа

В момента на място тече акция на ГДБОП

Криза на върха в Украйна, Зеленски уволни двама министри

Криза на върха в Украйна, Зеленски уволни двама министри

Свят Преди 9 часа

Причината е свързано с обществения ядрен оператор "Енергоатом" разследване за корупция

Задържаха 18-годишен за пожар в центъра на София

Задържаха 18-годишен за пожар в центъра на София

България Преди 9 часа

Обвиняемият е задържан за срок до 72 часа

"Лукойл": Преговаряме с потенциални купувачи

"Лукойл": Преговаряме с потенциални купувачи

Свят Преди 9 часа

Компанията се стреми да осигури непрекъсната работа на активите по време на тяхната продажба

<p>Задържаха Шрек за отвличане на млада жена в Свиленград</p>

Трима отвлякоха млада жена в Свиленград, мъж с прякор Шрек е задържан

България Преди 9 часа

Заедно с него в ареста като съпричастни към случая са още един мъж и една жена

Излезе изтрита сцена с импровизираната целувка между Блейк Лайвли и Джъстин Балдони от "Никога повече"

Излезе изтрита сцена с импровизираната целувка между Блейк Лайвли и Джъстин Балдони от "Никога повече"

Любопитно Преди 10 часа

Адвокатите на Балдони твърдят в документи, че 38-годишната звезда от „Клюкарката“ е добавила сцената към сценария

СГП предаде на съд Никола Барбутов и още трима

СГП предаде на съд Никола Барбутов и още трима

България Преди 10 часа

Никола Барбутов е предаден на съд и за подкуп

Специален британски лиценз за българския „Лукойл“

Специален британски лиценз за българския „Лукойл“

Свят Преди 10 часа

Лицензът важи до февруари

Жената, която предвиди убийството на Кенеди — историята на Джийн Диксън

Жената, която предвиди убийството на Кенеди — историята на Джийн Диксън

Любопитно Преди 10 часа

Истинската история на медиумката, чиито предсказания стигнаха до президентите на САЩ

КЗП се самосезира за цените на паркирането в София

КЗП се самосезира за цените на паркирането в София

България Преди 10 часа

КЗП обръща внимание, че Законът за въвеждане на еврото предвижда сериозни санкции