Може ли изкуственият интелект да бъде „отровен“
Източник: iStock/GettyImages

И зкуственият интелект (AI) е много популярен в момента и изглежда сякаш е нова, атрактивна технология. Всъщност, това са предимно резултатите на години труд в обучаването и усъвършенстването на досегашните проекти.

Очакванията към AI са много големи. Толкова големи, че да преобърнат и преоткрият цели индустрии и да променят начина на живот на цялото човечество. Това е и голяма отговорност, която логично повдига въпроса за доверието в AI. Как може да сме сигурни, че тези алгоритми ще взимат правилните решения? Може ли да им се повлияе?

И макар да има множество и различни умни алгоритми, които се конкурират помежду си, те имат и много общо помежду си. Най-вече фактът, че практически всички алгоритми разчитат на някаква база данни с информация за конкретната тема, по която са обучавани. AI за разпознаване на обекти в снимки например се нуждае от кадри, за да ги анализира и да се научи как да различава обектите. AI за генериране на текст, както е популярният в момента ChatGPT, има нужда от база данни, която има разнообразна информация, която да използва като отправна точка, за да създава своите идеи.

Именно това може да се окаже слабо звено на AI като цяло – възможността да бъде „отровен“ чрез компрометиране не са алгоритъма, а на данните, с които се обучава. Това предупреждават учени от университета ETCH Zurich, които са направили проучване заедно с експерти от Google, Nvidia и Robust Intelligence, съобщава онлайн изданието IEEE Spectrum.

CAIDP: GPT-4 е опасен и трябва да бъде спрян

Те са открили поне два метода за „отравяне“ на базите данни, което може да повлияе пряко на развитието на изкуствения интелект, който използва тази информация. Добрата новина е, че няма информация методите да са познати на хакери и да са били прилагани.

Лошата е, че атаките са много лесни за реализиране и не изискват големи усилия за реализация. Не е нужно да се компрометира голяма част от базата, за да се изкриви обучението и съответно разбирането на алгоритъма. Един от методите е струвал само 60 долара, за да се „отрови“ 0.01% от две бази данни. Такива атаки може да манипулират AI в различни посоки – например да взима сексистки или расистки решения, да развие други тези и мнения, които са в противоречие с основната му цел и т.н.

Бил Гейтс: Започна ерата на изкуствения интелект

Мъск иска спиране на опитите с изкуствен интелект

Възможно е чрез тези методи и да се внедри „задна врата“ за по-късен достъп до модела и управление на поведението му в последствие. Колкото по-сложен е един алгоритъм и колкото по-голяма цел има, от толкова по-огромна база данни има нужда, за да се обучи. Това пък прави откриването на „отровена“ информация вътре в нея още по-трудно.

Учените препоръчват да се разработят методи за допълнителна защита на базите данни от манипулации. Някои рисковете трудно могат да се предвидят. Например чатботовете често използват събрана от интернет информация. В нея неизменно ще попаднат и фалшиви новини или дори съзнателно компрометирани интернет страници и публикации с цел да подведат AI. Трудно може да се направи верификация на милиони публикации.

ChatGPT застрашава 19% от професиите в САЩ

Въпреки това си струва да се помисли за решения, казват учените. В противен случай има рискове както от гледна точка на по-опасни манипулации, така и чисто търговски опити за подвеждане на изкуствен интелект да предпочита даден бранд повече от друг и съответно да го препоръчва при определени въпрос, казва Флориан Трамер от ETH Zurich.

Наследникът на ChatGPT е още по-умен и "визуален"

Китайският отговор на ChatGPT се казва ERNIE Bot

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
След неуспеха на преговорите: Пакистан обеща да поддържа диалога между САЩ и Иран

След неуспеха на преговорите: Пакистан обеща да поддържа диалога между САЩ и Иран

Свят Преди 10 минути

"Наложително е страните да продължат да спазват ангажимента си за прекратяване на огъня", заяви пакистанският вицепремиер и министър на външните работи Ишак Дар

Експерти разкриха най-доброто време за консумация на кисело мляко

Експерти разкриха най-доброто време за консумация на кисело мляко

Любопитно Преди 33 минути

Ако искате да извлечете максимална полза от киселото мляко, по-долу ще разберете кога е най-добре да се консумира и как да се „подобри“ хранителният му ефект

Патриарх Даниил: Христовото Възкресение е наша непрестанна радост и вдъхновение

Патриарх Даниил: Христовото Възкресение е наша непрестанна радост и вдъхновение

България Преди 1 час

Българският патриарх и Софийски митрополит възвести Христовото Възкресение и благослови българския народ пред катедралата „Св. Александър Невски“ в София

Развенчани митове и неочаквани ползи за тялото - 2 яйца за закуска в продължение на 2 седмици

Развенчани митове и неочаквани ползи за тялото - 2 яйца за закуска в продължение на 2 седмици

Любопитно Преди 1 час

Едно яйце съдържа висококачествен протеин, мазнини, витамини A, D, E и B12, холин и минерали като селен и цинк

Великденски традиции: Символиката на яйцето, козунака и празничната трапеза

Великденски традиции: Символиката на яйцето, козунака и празничната трапеза

България Преди 1 час

Златистият козунак и агнешкото месо са задължителни атрибути, но те са само фон на най-важното – семейното споделяне

Благодатният огън от Йерусалим пристигна в България

Благодатният огън от Йерусалим пристигна в България

България Преди 9 часа

Предстои огънят да бъде пренесен до Синодалния параклис, откъдето малко преди началото на Пасхалното богослужение ще бъде внесен в катедралния храм

Нетаняху: Израел унищожи иранската ядрена и ракетна програма

Нетаняху: Израел унищожи иранската ядрена и ракетна програма

Свят Преди 9 часа

Войната срещу Техеран отслаби и иранските лидери и техните регионални съюзници, добави той

Ирански медии: САЩ отправят "прекомерни изисквания" по отношение на Ормузкия проток

Ирански медии: САЩ отправят "прекомерни изисквания" по отношение на Ормузкия проток

Свят Преди 10 часа

Въпросът за Ормузкия проток "е една от темите, по които има сериозни разногласия"

МВнР издаде предупреждение за българите в Ирландия заради продължаващите протести

МВнР издаде предупреждение за българите в Ирландия заради продължаващите протести

България Преди 10 часа

Препоръчва се на българите, намиращи се на територията на Ирландия или планиращи пътуване до страната, да спазват указанията на местните власти и да планират повече време за придвижване

Учени откриха как да намалят мазнините в пържените картофи, без да променят вкуса им

Учени откриха как да намалят мазнините в пържените картофи, без да променят вкуса им

Любопитно Преди 10 часа

Пържените храни са любими на много хора, но високото им съдържание на мазнини се свързва със здравословни проблеми като затлъстяване и хипертония

България в еврозоната: ЕЦБ отчита незначително увеличение на цените

България в еврозоната: ЕЦБ отчита незначително увеличение на цените

България Преди 10 часа

Преминаването от лев към евро е повишило ценовото равнище с 0,3 до 0,4 процентни пункта

Два американски военни кораба са преминали през Ормузкия проток

Два американски военни кораба са преминали през Ормузкия проток

Свят Преди 10 часа

Изпращането на корабите през пролива е имало за цел "да се създадат условия за разминиране на Ормузкия проток"

България се готви за Великден: Храмовете очакват хиляди за посрещането на Възкресение

България се готви за Великден: Храмовете очакват хиляди за посрещането на Възкресение

България Преди 11 часа

За безопасността и сигурността около храмовете в страната, полицията наложи специални мерки

Увеселително влакче дерайлира във Виена, петима ранени

Увеселително влакче дерайлира във Виена, петима ранени

Свят Преди 12 часа

Инцидентът се е случил на атракцион, известен като „Влакчето на джуджетата“, който е особено популярен сред по-малките деца, тъй като няма завои или екстремни наклони

Защо в ресторантите в България е толкова скъпо?

Защо в ресторантите в България е толкова скъпо?

България Преди 12 часа

Ресторантьорите отново искат 9% ДДС на фона на обществено недоволство

„Не ми харесва“: Сабрина Карпентър влезе в остър конфликт с фен на Coachella

„Не ми харесва“: Сабрина Карпентър влезе в остър конфликт с фен на Coachella

Любопитно Преди 13 часа

Сабрина Карпентър предизвика вълна от полярни реакции на Coachella, след като прекъсна фен, пеещ йодъл. Докато едни я обвиниха в липса на културна чувствителност, други защитиха звездата заради шума на сцената и сценичното напрежение