Може ли изкуственият интелект да бъде „отровен“
Източник: iStock/GettyImages
2

И зкуственият интелект (AI) е много популярен в момента и изглежда сякаш е нова, атрактивна технология. Всъщност, това са предимно резултатите на години труд в обучаването и усъвършенстването на досегашните проекти.

Очакванията към AI са много големи. Толкова големи, че да преобърнат и преоткрият цели индустрии и да променят начина на живот на цялото човечество. Това е и голяма отговорност, която логично повдига въпроса за доверието в AI. Как може да сме сигурни, че тези алгоритми ще взимат правилните решения? Може ли да им се повлияе?

И макар да има множество и различни умни алгоритми, които се конкурират помежду си, те имат и много общо помежду си. Най-вече фактът, че практически всички алгоритми разчитат на някаква база данни с информация за конкретната тема, по която са обучавани. AI за разпознаване на обекти в снимки например се нуждае от кадри, за да ги анализира и да се научи как да различава обектите. AI за генериране на текст, както е популярният в момента ChatGPT, има нужда от база данни, която има разнообразна информация, която да използва като отправна точка, за да създава своите идеи.

Именно това може да се окаже слабо звено на AI като цяло – възможността да бъде „отровен“ чрез компрометиране не са алгоритъма, а на данните, с които се обучава. Това предупреждават учени от университета ETCH Zurich, които са направили проучване заедно с експерти от Google, Nvidia и Robust Intelligence, съобщава онлайн изданието IEEE Spectrum.

CAIDP: GPT-4 е опасен и трябва да бъде спрян

Те са открили поне два метода за „отравяне“ на базите данни, което може да повлияе пряко на развитието на изкуствения интелект, който използва тази информация. Добрата новина е, че няма информация методите да са познати на хакери и да са били прилагани.

Лошата е, че атаките са много лесни за реализиране и не изискват големи усилия за реализация. Не е нужно да се компрометира голяма част от базата, за да се изкриви обучението и съответно разбирането на алгоритъма. Един от методите е струвал само 60 долара, за да се „отрови“ 0.01% от две бази данни. Такива атаки може да манипулират AI в различни посоки – например да взима сексистки или расистки решения, да развие други тези и мнения, които са в противоречие с основната му цел и т.н.

Бил Гейтс: Започна ерата на изкуствения интелект

Мъск иска спиране на опитите с изкуствен интелект

Възможно е чрез тези методи и да се внедри „задна врата“ за по-късен достъп до модела и управление на поведението му в последствие. Колкото по-сложен е един алгоритъм и колкото по-голяма цел има, от толкова по-огромна база данни има нужда, за да се обучи. Това пък прави откриването на „отровена“ информация вътре в нея още по-трудно.

Учените препоръчват да се разработят методи за допълнителна защита на базите данни от манипулации. Някои рисковете трудно могат да се предвидят. Например чатботовете често използват събрана от интернет информация. В нея неизменно ще попаднат и фалшиви новини или дори съзнателно компрометирани интернет страници и публикации с цел да подведат AI. Трудно може да се направи верификация на милиони публикации.

ChatGPT застрашава 19% от професиите в САЩ

Въпреки това си струва да се помисли за решения, казват учените. В противен случай има рискове както от гледна точка на по-опасни манипулации, така и чисто търговски опити за подвеждане на изкуствен интелект да предпочита даден бранд повече от друг и съответно да го препоръчва при определени въпрос, казва Флориан Трамер от ETH Zurich.

Наследникът на ChatGPT е още по-умен и "визуален"

Китайският отговор на ChatGPT се казва ERNIE Bot

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Коментари 2
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

2 коментара
 
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни

Последни

<p>Коя е първата храна, консумирана в Космоса?</p>

Сладолед, пица или шоколад: Коя е първата храна, консумирана в Космоса?

Любопитно Преди 15 минути

С какво се е хранил Юрий Гагарин в Космоса четете в следващите редове

Новият процесор на Apple е направен специално за AI

Новият процесор на Apple е направен специално за AI

Технологии Преди 1 час

Компанията започва своя път в ерата на изкуствения интелект

Срив в системата за граничен контрол блокира летищата във Великобритания

Срив в системата за граничен контрол блокира летищата във Великобритания

Свят Преди 1 час

Проблем е възникнал във функционирането на автоматичните врати за паспортен контрол

„Хамас“ екзекутира трима палестинци заради предполагаемо сътрудничество с Израел

„Хамас“ екзекутира трима палестинци заради предполагаемо сътрудничество с Израел

Свят Преди 1 час

Израелските войски са навлезли в източната част на града през предишната нощ

Съществувал ли е наистина известният Троянски кон

Съществувал ли е наистина известният Троянски кон

Любопитно Преди 2 часа

С настъпването на нощта гръцките войници излезли от коня и опустошили Троя, слагайки край на епичната война

<p>Новата Dacia Spring е на цена под 40 000 лева</p>

Ясни са цените на Dacia Spring, най-достъпният електромобил в Европа

Технологии Преди 2 часа

Поръчките на новата Dacia Spring вече са отворени, като стартовата цена на модела е 38 990 лв.

Hell"s Kitchen

Още един звезден участник напусна Hell’s Kitchen

Любопитно Преди 9 часа

Златните изгубиха и двата си кулинарни двубоя срещу Черните куртки

Сторми Даниелс демонстрира основните си предимства в сферата на социалното общуване

Порноактрисата Сторми Даниелс свидетелства срещу Доналд Тръмп

Свят Преди 9 часа

Тя се яви на процеса, за да свидетелства за предполагаемата си сексуална връзка с него през 2006 година

коклюш

Бебетата вече ще може да се ваксинират срещу коклюш на шест седмици

България Преди 11 часа

Промените на Наредбата за имунизациите в България влизат в сила от 7 май

Володимир Зеленски

Премиерът Главчев пред Шмигал: България ще продължи с категоричната си подкрепа за Украйна

България Преди 11 часа

"Страната ни подкрепя инициатива "Формула за мир", представена от Володимир Зеленски".

Протест срещу новата организация на движение в София

Протест срещу новата организация на движение блокира центъра на София

България Преди 12 часа

Автомобили и транспорт не могат да преминават по "Патриарх Евтимий", засилено е полицейското присъствие

Димитър Главчев

Официално: 295 млн. "украинска помощ" за земеделските производители

България Преди 13 часа

Подпомагането се предоставя под формата на преки безвъзмездни средства

Снимката е илюстративна

Стартира кампанията "Следи от изчезване"

Любопитно Преди 13 часа

Замисляли ли сте се, че само в рамките на век някои животински видове буквално изчезват?

а

Тролей и автомобил се удариха в София, има пострадал

България Преди 14 часа

Инцидентът се е случил на булевард "Сливница"

Експерти за ученията край Украйна: Готви ли ядрен удар Русия?

Експерти за ученията край Украйна: Готви ли ядрен удар Русия?

Свят Преди 14 часа

Готви ли русия ядрен удар четете в следващите редове