В разгорещения свят на изкуствения интелект се разгръща нов вид обир – такъв, който не включва проникване в сървърни помещения или кражба на физически твърди дискове. Според скорошен доклад на Групата за разузнаване на заплахи (GTIG) на Google, цитиран от CNET, хакерите вече използват хиляди внимателно разработени подкани, за да „извлекат“ тайните от Gemini, най-модерния изкуствен интелект на Google. 

Компанията твърди, че нападателите използват тези последователности от команди с цел клониране или възпроизвеждане на поведението на Gemini. Но могат ли хакерите наистина да откраднат сложен изкуствен интелект като Gemini?

В своя доклад за нововъзникващите заплахи за изкуствения интелект, екипът на Google обяснява, че нападателите експериментират с техники за разкриване на поведението на вътрешния модел. За целта изпращат повтарящи се, автоматизирани подкани и анализират резултатите. Идеята е да се съберат модели, логика на решения и статистически асоциации, които биха могли да помогнат на някого да изгради конкурентен изкуствен интелект или да разкрие чувствително поведение на модела.

Тази дейност не се ограничава само до Google. Подобни изследвания са наблюдавани и около други големи езикови модели и генеративни системи с изкуствен интелект. Мотивацията е ясна: ако може да разберете как един изкуствен интелект „мисли“, може да успеете да го възпроизведете, да заобиколите лицензирането или да получите търговско предимство. 

Преекспонирани ли са страховете от AI? Според шефа на AWS няма да има апокалипсис

Това не е традиционна кибератака. Експертите я наричат ​​„Извличане на модел“ или „Атака чрез дестилация“. В една конкретна кампания, нападателите са засипали Gemini с над 100 000 подкани, предназначени да принудят изкуствения интелект да разкрие вътрешната си логика на разсъждение.

При този тип атака, хакерът използва Gemini като „Учител“. Чрез изпращане на хиляди разнообразни заявки и записване на отговорите, те създават огромен набор от данни за поведението и начина на мислене на алгоритъма. След това използват тези данни, за да обучат по-малък модел „Ученик“.

Използващите AI всъщност работят повече и по-усилено

Ако наборът от данни е достатъчно голям, моделът на ученика в крайна сметка се научава да имитира поведението на учителя с голяма точност. Google отбеляза, че нападателите са се опитали специално да принудят Gemini да покаже своя „мисловен процес“, като се опитват да клонират „мозъка“ му.

Големи модели с изкуствен интелект, като Google Gemini, са невронни мрежи, обучени върху огромни набори от данни от екипи от специалисти, използващи милиарди долари в изчислителни ресурси. Те се съхраняват на защитени сървъри и се обслужват чрез API. Потребителите никога не получават основните системи на модела или код на инфраструктурата, само отговори на конкретни подкани. 

AI войната започна, гигантите си разменят обвинения и рискуват да допуснат голяма грешка

Хакерите не могат да откраднат самия алгоритъм. Те обаче могат да откраднат поведенческата логика. В края на успешна атака за извличане, хакер може да разполага с частна, „офлайн“ версия на изкуствен интелект, който се представя на 90% като Gemini за специфични задачи като кодиране, превод или разсъждение. За Google това е най-голямата кражба на интелектуална собственост: някой друг печели от милиардите долари, които Google е похарчила за изследвания и изчисления.

Повтарящите се подкани могат да помогнат за разкриването на модели, които отразяват собствени данни или поведения. Въпреки че това не е буквална кражба на модела, то може да разкрие чувствителен IP адрес или да позволи извличане на разпознаваем текст, който наподобява данни за обучение. 

Най-горещата социална мрежа, в която не може да участвате независимо колко сте популярни

Започва битка срещу AI "плява", заливаща интернет

Предупреждението на Google подчертава по-широка тема в разработването на изкуствен интелект: моделите са мощни, но също така уязвими по нови начини. За разлика от традиционния софтуер, изкуственият интелект разкрива поведенчески интерфейс, т.е. задавате въпрос и получавате отговор. Интелигентното сондиране може да разкрие повече, отколкото разработчиците биха искали.

Достатъчно зряло ли е човечеството, за да се справи със супер AI

Време е AI да навлезе в нов етап: полезен на практика и за всички в ежедневието

В отговор компаниите инвестират сериозно в слоеве за сигурност, мониторинг и ограничения, за да ограничат начина, по който моделите могат да бъдат сондирани или манипулирани. Това включва ограничения на отговорите, проследяване на употребата и филтри за предотвратяване на извличането на чувствителни модели. В момента Google използва наблюдение в реално време, за да открива тези систематични модели на поведение и защитава своите „следи от разсъждения“, преди да могат да бъдат напълно извлечени.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
„Едно питие е една цигара“: Науката разкри кои щети от алкохола са обратими

„Едно питие е една цигара“: Науката разкри кои щети от алкохола са обратими

Любопитно Преди 12 минути

Дори една чаша потиска имунитета за часове, но добрата новина е, че голяма част от щетите върху органите са обратими, стига да действаме навреме. Вижте как тялото се регенерира след последната глътка и защо „едно питие е равно на една цигара“

,

Магията на петте думи: Как една проста фраза може да „изключи“ тревожността ви

Любопитно Преди 14 минути

Тревожността не е реалност, а просто мисъл. Научете как една фраза създава психологическа дистанция от страха

"Кървава баня" в Мексико месец преди Световното по футбол: Десет загинаха при масова стрелба

"Кървава баня" в Мексико месец преди Световното по футбол: Десет загинаха при масова стрелба

Свят Преди 9 часа

Въоръжени мъже откриха огън в къща на 200 км от столицата, сред жертвите има жени и дете

Загадка под океана: Учените откриха тайната структура под Бермудските острови

Загадка под океана: Учените откриха тайната структура под Бермудските острови

Любопитно Преди 10 часа

Това откритие може най-после да обясни истинската научна загадка на региона

Свалената охрана на Борисов и Пеевски отново отвори спора за правилата в НСО

Свалената охрана на Борисов и Пеевски отново отвори спора за правилата в НСО

България Преди 10 часа

Темата коментираха Ива Митева и Вежди Рашидов

,

Тръмп и президентът на Южна Корея обсъдиха съдбоносната среща САЩ-Китай

Свят Преди 11 часа

Двамата лидери също така са обсъдили гладкото прилагане на двустранното търговско споразумение, подписано миналата година

Първи думи след триумфа: DARA кацна в София с исторически рекорд, но без съпруга си

Първи думи след триумфа: DARA кацна в София с исторически рекорд, но без съпруга си

България Преди 11 часа

„Това беше първата крачка, но има още какво да градим за българското изкуство и музика. „Евровизия“ е началото на моята интернационална кариера, оттук насетне има още какво да се покорява. Всичко тепърва започва“, каза победителката на „Евровизия“

Нетаняху: Близо сме до ликвидирането на всеки един отговорен за нападението на 7 октомври

Нетаняху: Близо сме до ликвидирането на всеки един отговорен за нападението на 7 октомври

Свят Преди 11 часа

Днес Нетаняху потвърди, че израелските сили понастоящем контролират 60% от територията на Газа

Във Франция се появиха 10 „нови“ жертви от мрежата на Епстийн

Във Франция се появиха 10 „нови“ жертви от мрежата на Епстийн

Свят Преди 12 часа

Френските магистрати се стремят да разследват евентуални престъпления, извършени във Франция или с участието на френски извършители, които са улеснили престъпленията му

,

Евакуират 30 000 души в германски град заради невзривена бомба от Втората световна война

Свят Преди 12 часа

В момента пожарникари проверяват дали всички хора са напуснали зоната за евакуация, чиито радиус е 1,5 км

Празник във въздуха: Летището във Виена ехти от „Бангаранга“ на Дара, българи пеят в самолета

Празник във въздуха: Летището във Виена ехти от „Бангаранга“ на Дара, българи пеят в самолета

Любопитно Преди 13 часа

Десетки българи ще окупират Терминал 2 на летище „Васил Левски“, за да я поздравят

Дара ще бъде предложена за „Почетен гражданин на София“

Дара ще бъде предложена за „Почетен гражданин на София“

България Преди 13 часа

Това обяви общинският съветник от ГЕРБ-СДС Антон Хекимян

Млад мъж е с 50% изгаряния, поразен от токов удар в Монтана

Млад мъж е с 50% изгаряния, поразен от токов удар в Монтана

България Преди 14 часа

Пострадалият е ловял риба в района на бившия полигон в квартал „Огоста“

Удар в сърцето на ОАЕ: Дронове атакуваха атомна централа, пламна пожар

Удар в сърцето на ОАЕ: Дронове атакуваха атомна централа, пламна пожар

Свят Преди 14 часа

Властите в Абу Даби уверяват, че няма пострадали и опасност от радиация, след като пламъците обхванаха генератор извън периметъра на АЕЦ „Барака“