И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
ООН: Рекорден брой цивилни убити и ранени в Украйна

ООН: Рекорден брой цивилни убити и ранени в Украйна

Свят Преди 4 часа

Нападенията с дронове край фронтовата линия са довели до 24% от жертвите

Пожар в землището на Угърчин

Пожар в землището на Угърчин

България Преди 4 часа

На място са пет екипа на пожарната, много доброволци, помагат и земеделски производители с техника

Пожар в защитена местност край Тутракан

Пожар в защитена местност край Тутракан

България Преди 6 часа

Гъстият дим се вижда от километри

След акцията в оръжейна фирма: Няма данни за задържани

След акцията в оръжейна фирма: Няма данни за задържани

България Преди 6 часа

Неизвестно остава и какво точно е поискало в молбата си за правна помощ Националното антикорупционно бюро на Украйна

Вучич не може да се кандидатира за президент повече

Вучич не може да се кандидатира за президент повече

Свят Преди 8 часа

Той посочи, че и през ум не му минава да променя конституцията

Тайфун удари Тайван - изчезнал, десетки ранени

Тайфун удари Тайван - изчезнал, десетки ранени

Свят Преди 8 часа

Проливните дъждове заплашват да нанесат още по-големи щети

<p>Мъж от Пловдив отправил заплахата към самолета до Лондон</p>

Арестуваха мъж от Пловдив за терористичната заплаха към самолета до Лондон

България Преди 9 часа

Заради сигнала самолетът беше отклонен от въздушното пространство на Чехия

<p>Заплаха със смърт за журналисти на N1 TV в Сърбия</p>

Международни организации за медийна свобода реагират на нападение над екип на N1 TV

Свят Преди 9 часа

Комитетът за защита на журналистите изрази загриженост от тормоза над екипа на N1 TV

Шефът на ЕЦБ показа българското евро

Шефът на ЕЦБ показа българското евро

Свят Преди 9 часа

Лагард: Разгледайте за първи път дизайна на българската монета от 1 евро

<p>Джеси Джей:&nbsp;Косата ми пада &bdquo;като луда&ldquo;, боли ме&nbsp;5 седмици след операцията</p>

Джеси Джей: Косата ми пада „като луда“ след мастектомията, усещам болка 5 седмици след операцията

Свят Преди 10 часа

Джеси Джей споделя как тялото й се е променило след мастектомията

Причината за смъртта на Лони Андерсън е разкрита

Причината за смъртта на Лони Андерсън е разкрита

Свят Преди 10 часа

Актрисата почина на 3 август на 79-годишна възраст, само дни преди юбилея си

Обвиниха адвокатски сътрудник за имотни измами и принуда

Обвиниха адвокатски сътрудник за имотни измами и принуда

България Преди 10 часа

Наньо Турлаков е с две обвинения и е в ареста за срок до 72 часа

Вкараха в затвора македонски наркотрафикант в България

Вкараха в затвора македонски наркотрафикант в България

България Преди 10 часа

Подсъдимият е признат за виновен за контрабанда на високорисково наркотично вещество

Незаконни убийства в България отчитат САЩ

Незаконни убийства в България отчитат САЩ

България Преди 10 часа

Какво гласи частта за България от доклада на Държавния департамент на САЩ за правата на човека

<p>Скандалните коментари за Кейт, запалили&nbsp;семейна война в кралското семейство</p>

Принц Андрю и "неприятните коментари" за Кейт Мидълтън предизвикаха вражда с принц Уилям

Свят Преди 10 часа

Оскърбеният херцог на Йорк е в отчуждение както с принц Уилям, така и с принц Хари от години

"Умореното момиче“: Когато сенките под очите станат тенденция

"Умореното момиче“: Когато сенките под очите станат тенденция

Любопитно Преди 10 часа

Най-новата мода в красотата е да изглеждаме уморени, недоспали и леко болни