И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
НЛО

Огромен НЛО в САЩ предизвика спорове

Любопитно Преди 15 минути

Скандалният бивш служител на Държавния департамент и активист Луис „Лу“ Елизондо беше домакин на панел, организиран от Фонда за разкриване на НЛО, по време на който публикува предполагаема снимка на летяща чиния с диаметър 300 метра, сребърна, дискообразна

<p>Кметът на Панагюрище: Днес губим&nbsp;всичко, за което бунтовниците ни умряха</p>

Кметът на Панагюрище: Загубихме смисъла, загубихме корена, губим и всичко, за което бунтовниците ни умряха

България Преди 20 минути

Желязко Гагов изнесе емоционална реч по време на тържествената зрая-проверка по повод 149 години от избухването на Априлското въстание

От 8 май: „Домът на мечтите“ разкрива света на Николета Лозанова и Ники Михайлов

От 8 май: „Домът на мечтите“ разкрива света на Николета Лозанова и Ники Михайлов

Любопитно Преди 34 минути

Какво да очакват зрителите от дългоочакваното риалити в ефира на NOVA?

Без очи и мозък - Къде бе измъчвана и убита Виктория Рошчина

Без очи и мозък - Къде бе измъчвана и убита Виктория Рошчина

Свят Преди 39 минути

Един от най-зловещите центрове за задържане на Русия е този в Таганрог

<p>Майкъл Болтън проговори за диагнозата си &ndash; агресивна форма на мозъчен тумор</p>

Майкъл Болтън проговори за диагнозата си – агресивна форма на мозъчен тумор – в емоционално първо интервю

Свят Преди 52 минути

"Намираш в себе си сили и решителност, за които не си подозирал, че притежаваш"

<p>Подготовката за конклава: Монтираха комин на покрива на Сикстинската капела</p>

Подготовката за конклава: Монтираха комин на покрива на Сикстинската капела във Ватикана

Свят Преди 57 минути

След всеки два кръга на гласуване бюлетините на кардиналите се изгарят в специална пещ

Кръв, кръст и корона: Как Борис I обърна съдбата на България

Кръв, кръст и корона: Как Борис I обърна съдбата на България

България Преди 1 час

52 рода загиват, но една вяра възкръсва: Цената на християнството в България

Щети за близо 4 млн. лева: Разследват умишлен палеж край Ямбол

Щети за близо 4 млн. лева: Разследват умишлен палеж край Ямбол

България Преди 1 час

Пожарът е избухнал на 29 април в село Ружица

„Празният престол“ в „Темата на NOVA“

„Празният престол“ в „Темата на NOVA“

Любопитно Преди 1 час

Не пропускайте тази събота след централната емисия новини

<p>Илон Мъск се сравни с Буда</p>

Илон Мъск се срещна с медиите и се сравни с Буда

Свят Преди 1 час

Някои репортери отбелязаха, че Мъск звучи "по-малко уверено" от преди

Арестуваха турски шофьор на тир за подкуп на полицаи край "Капитан Андреево"

Арестуваха турски шофьор на тир за подкуп на полицаи край "Капитан Андреево"

България Преди 1 час

Срещу него е образувано досъдебно производство

Фийби Гейтс

Дъщерята на Бил Гейтс разкри диагноза на баща си

Любопитно Преди 2 часа

„Да доведеш мъж у дома е ужасяващо за него“, казва Фийби Гейтс

<p>САЩ връщат оръжията в играта, Украйна плаща с националното си богатство</p>

Тръмп одобри продажбата на оръжиe за Украйна

Свят Преди 2 часа

Преди ден Киев и Вашингтон сключиха сделка за полезните изкопаеми

Защо на кардиналите им е забранено да ядат пиле и равиоли по време на конклава

Защо на кардиналите им е забранено да ядат пиле и равиоли по време на конклава

Свят Преди 2 часа

Oт векове има строги правила, за да се предотврати разменянето на скрити послания

САЩ назначиха нов временен посланик в Киев

САЩ назначиха нов временен посланик в Киев

Свят Преди 2 часа

Последният посланик на САЩ в Украйна подаде оставка миналия месец