И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Йотова: Може да сме блестящи домакини на „Евровизия“

Йотова: Може да сме блестящи домакини на „Евровизия“

България Преди 1 час

Йотова: Всеки разбра за България и беше повод да ме разпитат и за страната

ВАС отмени дерогацията за ТЕЦ "Марица Изток" 2

ВАС отмени дерогацията за ТЕЦ "Марица Изток" 2

България Преди 3 часа

Спорът касае предоставяне на дерогация от европейските екологични стандарти

Съдът пусна обвинените за имотна измама в "Люлин", прокуратурата протестира

Съдът пусна обвинените за имотна измама в "Люлин", прокуратурата протестира

България Преди 5 часа

С постановление на прокурор четиримата бяха задържани за срок до 72 часа

След репортаж на NOVA: Едуард Петросян получи виза

След репортаж на NOVA: Едуард Петросян получи виза

България Преди 5 часа

Проблемите започват след пропуск да поднови документите си

Зоуи Кравиц блесна с годежен пръстен за $500 000

Зоуи Кравиц блесна с годежен пръстен за $500 000

Любопитно Преди 5 часа

Актрисата Зоуи Кравиц бе забелязана да танцува на откриващото шоу от турнето на годеника си Хари Стайлс в Амстердам. Източници разкриват, че двамата вече планират две сватби в Лондон и Ню Йорк, а певецът е „напълно запленен“ от бъдещата си булка

Задържаха турска лодка, пълна с мигранти, край Синеморец

Задържаха турска лодка, пълна с мигранти, край Синеморец

България Преди 5 часа

Моторната лодка, превозваща чуждите граждани, е установена и задържана от служители на Гранична полиция

Родилка на 14 години беше превозена с медицински хеликоптер

Родилка на 14 години беше превозена с медицински хеликоптер

България Преди 6 часа

Младата пациентка е родила в търновската болница

Спасиха 20-годишен младеж с инсулт

Спасиха 20-годишен младеж с инсулт

България Преди 6 часа

Младежът е изписан от болницата без никакви усложнения и поражения след прекарания инсулт

Някой иска да патентова „Bangaranga“ в Европа

Някой иска да патентова „Bangaranga“ в Европа

България Преди 6 часа

Ден след историческия триумф на DARA в събота, е подадена заявка за защита на бранда в целия Европейски съюз, разкрива адвокат Диана Попова

Адвокат коментира как работи схемата за измами с имоти

Адвокат коментира как работи схемата за измами с имоти

България Преди 6 часа

Адвокатът коментира и връщането на откраднат имот

Испанският съд отмени глоба на Шакира, държавата ѝ връща над 55 милиона евро

Испанският съд отмени глоба на Шакира, държавата ѝ връща над 55 милиона евро

Свят Преди 7 часа

Върховният съд в Мадрид призна, че данъчните власти са сгрешили за статута на колумбийската звезда през 2011 г. и са я глобили неправомерно. Певицата сподели, че решението слага край на години съсипващ натиск върху нея и семейството ѝ

„Пълна трансформация“: Парис Хилтън стана брюнетка и взриви ревю на Gucci в Ню Йорк

„Пълна трансформация“: Парис Хилтън стана брюнетка и взриви ревю на Gucci в Ню Йорк

Любопитно Преди 7 часа

Риалити звездата Парис Хилтън замени емблематичната си руса коса с тъмна перука по време на модното шоу GucciCore в Ню Йорк. На подиума към нея се присъединиха супермоделът Синди Крофорд и легендата на американския футбол Том Брейди

МАЕ: Запасите от петрол се топят бързо

МАЕ: Запасите от петрол се топят бързо

Свят Преди 7 часа

Държавите използват петролни запаси и стратегически резерви с „рекордни темпове“

Владимир Путин и Си Дзинпин

Всички гледат към Пекин: Си посреща Путин само четири дни след Тръмп

Свят Преди 7 часа

„Гъсто разпределените във времето посещения предизвикаха широко внимание, като анализатори отбелязват, че в ерата след Студената война е изключително рядко явление една държава да приеме лидерите на САЩ и Русия един след друг в рамките на една седмица“, пише местното издание Global Times

<p>Радев: Всички българи ще плащаме вересиите на олигархията</p>

Румен Радев: Всички българи ще плащаме вересиите на олигархията

България Преди 7 часа

Премиерът: В времена на ограничения именно политиците първи трябва да дадат пример

Дейвид Хаселхоф бе забелязан в инвалидна количка и с превързан глезен (СНИМКИ)

Дейвид Хаселхоф бе забелязан в инвалидна количка и с превързан глезен (СНИМКИ)

Свят Преди 8 часа

73-годишната звезда от „Спасители на плажа“ и „Рицарят ездач“ Дейвид Хаселхоф засили притесненията за здравословното си състояние. Актьорът беше заснет в инвалидна количка и с превързан глезен след процедура в Лос Анджелис