И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

– Тате, защо си се оженил за мама? – И аз се чудя, сине… ама баба ти така настояваше!
Прочети целия
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Ванс: САЩ обмислят доставка на ракети "Томахок" за Украйна

Ванс: САЩ обмислят доставка на ракети "Томахок" за Украйна

Свят Преди 2 часа

Ракетите "Томахок" имат обсег от 2500 км и биха били мощно оръжие в арсенала на Украйна в борбата ѝ срещу редовните руски атаки с ракети и дронове

Обама разкритикува продължаващите военни действия на Израел в Газа

Обама разкритикува продължаващите военни действия на Израел в Газа

Свят Преди 3 часа

Недопустимо е да се пренебрегва хуманитарната криза, която се случва в Газа, каза бившият президент на САЩ

Зеленски: Работим по „мега сделка“ за покупки на оръжие от САЩ

Зеленски: Работим по „мега сделка“ за покупки на оръжие от САЩ

Свят Преди 6 часа

Украинският премиер Юлия Свириденко ще се срещне с представители на САЩ следващия месец относно потенциални американски проекти в Украйна

,

Изборният ден в Молдова: Бомбени заплахи, кибератаки и съмнения за руско влияние

Свят Преди 7 часа

45,76% е избирателна активност на парламентарния вот към 18 ч.

Тръмп обеща "нещо специално" в преговорите за Близкия изток

Тръмп обеща "нещо специално" в преговорите за Близкия изток

Свят Преди 7 часа

По време на разговор с журналисти в петък Тръмп вече заяви, че смята, че има "споразумение" за Газа, след като през седмицата представи нов мирен план на няколко арабски и мюсюлмански държави

Никола Цолов: Второто място е огромно постижение – горд съм с нашите волейболисти

Никола Цолов: Второто място е огромно постижение – горд съм с нашите волейболисти

България Преди 7 часа

Семейството е ключът към успеха, каза пилотът във Формула 2

.

Преизбраха Асен Василев за председател на "Продължаваме Промяната"

България Преди 8 часа

Партията го подкрепи категорично - с 289 гласа "за"

,

"Хамас" призова Израел да прекрати въздушните атаки срещу Газа за 24 часа

Свят Преди 8 часа

Междувременно стана известно, че усилията на Израел да спечели подкрепата на големите кланове в ивицата Газа, за да намали влиянието на "Хамас" в анклава, са били отхвърлени

.

500 000 долара за второто място на България от Световното по волейбол

България Преди 9 часа

Рекордният фонд от милион долара остава за шампиона Италия

,

Президентът на Молдова зове за масово гласуване срещу руското влияние

Свят Преди 9 часа

Тя призова хората да не продават гласа си, непрекъснато повтаряйки за влиянието от страна на Москва

Нетаняху под натиск от крайнодесните преди срещата си с Тръмп

Нетаняху под натиск от крайнодесните преди срещата си с Тръмп

Свят Преди 10 часа

Натискът върху Нетаняху идва непосредствено преди утрешната му среща с американския президент Доналд Тръмп във Вашингтон

Световно по волейбол за мъже: Финалът, който ни направи горди – България показа класа и дух

Световно по волейбол за мъже: Финалът, който ни направи горди – България показа класа и дух

България Преди 10 часа

Следващият мондиал през 2027 г. ще бъде домакинстван от Полша, а този през 2029 г. – от Катар

.

Нови дронове над военни обекти в Дания, НАТО засилва бдителността

Свят Преди 10 часа

През последните дни имаше и други случаи на засечени дронове над военни обекти в Дания и Норвегия, което доведе до затварянето на няколко летища

Мощно земетресение удари западна Турция

Мощно земетресение удари западна Турция

Свят Преди 11 часа

Трусът е регистриран в 12:59 часа местно време и е бил на дълбочина 9 километра

Кремъл: Путин е готов да се срещне с Тръмп в Москва, поканата остава в сила

Кремъл: Путин е готов да се срещне с Тръмп в Москва, поканата остава в сила

Свят Преди 11 часа

"Всичко зависи от решението на Тръмп", каза говорителят на руския президент