И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
ЕК: Това е крачка назад в европейския път на Сърбия

ЕК: Това е крачка назад в европейския път на Сърбия

Свят Преди 25 минути

Пакетът от пет закона в областта на правосъдието бяха оценени от ЕК като "крачка назад в европейския път на Сърбия"

<p>Гроси&nbsp;разкри възможно ли е сключване&nbsp;на споразумение между МААЕ и Иран</p>

Рафаел Гроси: Сключването на споразумение между МААЕ и Иран е "възможно"

Свят Преди 1 час

Иран отказа достъп на МААЕ до бомбардираните ядрени обекти през ноември миналата година, като заяви, че иска да ги включи "в нова рамка"

<p>Йотова:&nbsp;Европа беше &bdquo;във ваканция&ldquo; и е време да се събудим</p>

Йотова от Мюнхенската конференция: Европа беше "във ваканция" и е време да се събудим

България Преди 3 часа

Президентът е провела срещи с Антониу Коща и с Николай Младенов

Тежка катастрофа между два тира затвори Северната скоростна тангента

Тежка катастрофа между два тира затвори Северната скоростна тангента

България Преди 4 часа

Трафикът се осъществява по обходен маршрут по път II-18 на Софийския околовръстен път и се регулира от пътна полиция

<p>Съдът остави под домашен арест началника на Пето РУ в София</p>

Съдът остави под домашен арест началника на Пето РУ в София Пламен Максимов

България Преди 4 часа

Пред журналисти адвокатът на Максимов – Мартин Кантарев, каза, че ще обжалва, тъй като не са съгласни с изводите на съда

Трима скиори загинаха при лавина във Френските Алпи

Трима скиори загинаха при лавина във Френските Алпи

Свят Преди 4 часа

Имало е ски инструктор, който е придружавал четирима любители

<p>Досегашният световен ред изглежда разрушен, но какво може да последва?</p>

Мюнхенската конференция 2026: Старият световен ред вече не съществува

Свят Преди 5 часа

Световни лидери, дипломати и военни експерти се събраха в Германия за едно от най-важните събития в глобалния политически календар

<p>Мерц и Макрон водят &bdquo;поверителни разговори&ldquo;</p>

Мерц и Макрон водят „поверителни разговори“ за европейското ядрено възпиране

България Преди 5 часа

Смята се, че американски ядрени бомби Б61 са разположени в Северна Италия, Белгия, Нидерландия и Западна Германия

<p>Украйна разкри кога и къде ще се проведе следващият кръг преговори с Русия и САЩ</p>

Канцеларията на Зеленски: Следващият кръг преговори с Русия и САЩ ще бъде в Женева на 17 и 18 февруари

Свят Преди 6 часа

По-рано днес Москва обяви, че съветникът в Кремъл Владимир Медински ще оглави руската делегация вместо началника на военното разузнаване Игор Костюков

,

Тейлър Суифт съди фирма за спално бельо заради името "Swift Home"

Любопитно Преди 6 часа

Правният екип на поп звездата твърди, че марката „Swift Home“ имитира нейния почерк и подвежда феновете, че тя рекламира продуктите

<p>Дипломация на високо ниво: Йотова в центъра на световни разговори в&nbsp;Мюнхен</p>

Дипломация на високо ниво: Илияна Йотова в центъра на световни разговори в Германия

България Преди 6 часа

Тя ще се срещне с председателя на Антонио Коща и с Николай Младенов

Къде изчезнаха коргитата на Елизабет II?

Къде изчезнаха коргитата на Елизабет II?

Любопитно Преди 6 часа

След отнемането на титлите му и изгонването от „Кралската ложа“ заради скандала „Епстийн“, принц Андрю се мести в нова резиденция в Норфолк, вземайки със себе си коргитата на покойната Елизабет II, които остават под негова лична грижа

о

Тежка катастрофа с ТИР на АМ "Струма", има пострадал

България Преди 6 часа

Тежкотоварното превозно средство се е движило в посока Дупница

Започва строежът на последните 80 метра от бул. "Тодор Каблешков" в София

Започва строежът на последните 80 метра от бул. "Тодор Каблешков" в София

България Преди 6 часа

Булевардът свързва бул. „Цар Борис III“ и бул. „Черни връх“ и осигурява директна връзка между кварталите „Кръстова вада“ и „Манастирски ливади“