4

И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Коментари 4
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

4 коментара
 
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни

Последни

Австралия ще предостави на Украйна помощ от 100 млн. долара

Австралия ще предостави на Украйна помощ от 100 млн. долара

Свят Преди 1 час

Това заяви украинският министър-председател Денис Шмигал след среща с австралийския министър на отбраната Ричард Марлес

Арестуваха финландски депутат заради стрелба

Арестуваха финландски депутат заради стрелба

Свят Преди 1 час

Заподозреният Тимо Ворнанен влязъл в словесен спор със свой колега

Бритни Спиърс бе осъдена да плати над 2 милиона долара на баща си

Бритни Спиърс бе осъдена да плати над 2 милиона долара на баща си

Свят Преди 4 часа

Самата Спиърс е похарчила над 4 милиона долара за адвокати

Георги Георгиев: Терзиев да покаже документите от избирането на съпругата на Цеков за консултант

Георги Георгиев: Терзиев да покаже документите от избирането на съпругата на Цеков за консултант

България Преди 4 часа

Той обяви, че още в понеделник ще бъде внесен сигнал за откритите нарушенията в общинското предприятие „Гробищни паркове“

Разкриха причината за смъртта на О Джей Симпсън

Разкриха причината за смъртта на О Джей Симпсън

Свят Преди 5 часа

О Джей Симпсън почина на 76-годишна възраст в дома си в Лас Вегас на 10 април

Градушката в Сливенско уби бебе картал

Градушката в Сливенско уби бебе картал

България Преди 5 часа

Това съобщиха от природозащитната организация Фонд за дивата флора и фауна

Лувърът подготвя отделна зала за „Мона Лиза“

Лувърът подготвя отделна зала за „Мона Лиза“

Свят Преди 6 часа

Подобен ход би дал на посетителите по-добро изживяване

Кацането неуспешно: Смущения на GPS сигнала осуетиха приземяването на самолет

Кацането неуспешно: Смущения на GPS сигнала осуетиха приземяването на самолет

Свят Преди 6 часа

Самолет, излетял от Хелзинки, не успя да кацне на естонското летище Тарту в петък вечерта

Олена Зеленска: Жертвите на изнасилвания, извършени от руски военни, ще получат обезщетения

Олена Зеленска: Жертвите на изнасилвания, извършени от руски военни, ще получат обезщетения

Свят Преди 6 часа

Първата дама подчертава, че жертвите на насилие не могат да чакат, докато конфликтът бъде разрешен

Ердоган към Рюте: Изборът на нов шеф на НАТО ще бъде направен със стратегическа мъдрост

Ердоган към Рюте: Изборът на нов шеф на НАТО ще бъде направен със стратегическа мъдрост

Свят Преди 6 часа

Ердоган и Рюте са обсъдили също ситуацията в ивицата Газа и войната в Украйна

Американското разузнаване: Путин вероятно не е наредил Навални да бъде убит

Американското разузнаване: Путин вероятно не е наредил Навални да бъде убит

Свят Преди 7 часа

47-годишният Навални беше най-яростният критик на Путин в Русия

Кремъл обяви, че ще продължи да развива взаимоотношения с Пекин

Кремъл обяви, че ще продължи да развива взаимоотношения с Пекин

Свят Преди 7 часа

Блинкен беше на посещение в Китай от сряда до петък

Украински дронове удариха две петролни рафинерии и военно летище в Русия

Украински дронове удариха две петролни рафинерии и военно летище в Русия

Свят Преди 7 часа

Нападението е било извършено от Службата за сигурност на Украйна

Руски съд пусна под домашен арест задържания журналист от Forbes

Руски съд пусна под домашен арест задържания журналист от Forbes

Свят Преди 7 часа

В петък беше съобщено, че Сергей Мингазов е арестуван по подозрения, че разпространява фалшива информация за руската армия

Мощно торнадо връхлетя централните части на САЩ (СНИМКИ/ВИДЕО)

Мощно торнадо връхлетя централните части на САЩ (СНИМКИ/ВИДЕО)

Свят Преди 8 часа

Стихията е причинила значителни щети, има и ранени

<p>Северна Корея с остро предупреждение към&nbsp;САЩ</p>

Северна Корея обвини САЩ в политизиране на въпроса с човешките права

Свят Преди 8 часа

Ще предприемем твърди и решителни стъпки в защита на своята неприкосновеност и сигурност в отговор на Вашингтон, заяви Пхенян