И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Това, че след новогодишното парти ме цепи главата и не помня нищо, почти се понася. По-лошото е, че в офиса колегите съчуствено питат: "Шефът вика…
Прочети целия
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Откриха издирвания на Витоша млад мъж

Откриха издирвания на Витоша млад мъж

България Преди 32 минути

Той е контактен и в състояние, което му позволява да се придвижва

Крал Чарлз удостои Идрис Елба с рицарско звание

Крал Чарлз удостои Идрис Елба с рицарско звание

Любопитно Преди 51 минути

Крал Чарлз III удостои Идрис Елба с рицарско звание за борба с младежката престъпност, а Синтия Ериво от „Wicked“ с MBE за музика и драма в новогодишния почетен списък за 2026 г., където са наградени още футболистки, фигуристи и общо 1157 души

Ще бъде ли двойна тарифата на такситата в новогодишната нощ

Ще бъде ли двойна тарифата на такситата в новогодишната нощ

България Преди 1 час

Таксиметровите шофьори ще бъдат сред първите, които реално ще усетят преминаването към еврото

.

Мъж загина, след като беше блъснат от влак край Атина

Свят Преди 1 час

Мъжът е починал от получените наранявания

Средната продължителност на живота в България се увеличава

Средната продължителност на живота в България се увеличава

България Преди 1 час

При мъжете тя е 71.9 години, докато при жените е със 7.4 години по-висока - 79.3 години

Усещате се като провал в края на годината? Прочетете това

Усещате се като провал в края на годината? Прочетете това

Любопитно Преди 1 час

2025-а беше трудна година за всички нас и може би основното ви постижение беше, че запазихте психичното си здраве и продължихте да работите

Бионсе официално стана милиардерка

Бионсе официално стана милиардерка

Любопитно Преди 1 час

Бионсе официално стана милиардер благодарение на турнетата си, музиката и бизнес империята Parkwood Entertainment, присъединявайки се към съпруга си Джей Зи и утвърждавайки семейството си като музикална и бизнес сила

,

Русия призова за сдържаност, след като Тръмп предупреди Иран за възможен удар

Свят Преди 1 час

Иран отрича да има програма за ядрени оръжия

НСИ: На човек от населението се падат по 9 755 лв. от БВП

НСИ: На човек от населението се падат по 9 755 лв. от БВП

България Преди 1 час

Днес НСИ оповести ключовите показатели за България към 30 декември 2025 година. Следваща актуализация ще е на 3 април 2026 година

Втори ден на протести във Врачанско заради спиране на тока

Втори ден на протести във Врачанско заради спиране на тока

Свят Преди 2 часа

Жители блокираха част от главния път Е79

Китай продължи мащабните си военни учения с бойни стрелби около Тайван

Китай продължи мащабните си военни учения с бойни стрелби около Тайван

Свят Преди 2 часа

Освен това Тайван е засякъл 14 китайски военни кораба, осем други плавателни съда и един стратостат

.

Европейски лидери обсъждат преговорите за мир в Украйна

Свят Преди 2 часа

Срещата е част от продължаващите неспирно от ноември дипломатически усилия за прекратяване на конфликта

,

Русия обяви, че е превзела още две села в Източна Украйна

Свят Преди 2 часа

Вчера руският президент Владимир Путин обяви, че въоръжените сили на страната му напредват уверено по цялата фронтова линия

Годината ще започне със студ и сняг: От -18 до 18 градуса ни очакват през януари

Годината ще започне със студ и сняг: От -18 до 18 градуса ни очакват през януари

България Преди 3 часа

Вижте първата прогноза за времето за месец януари

Джордж и Амал Клуни получиха френско гражданство

Джордж и Амал Клуни получиха френско гражданство

Любопитно Преди 3 часа

Джордж и Амал Клуни официално получиха френско гражданство, след като напуснаха Холивуд от притеснение за възпитанието на 8-годишните си близнаци, избирайки живот във ферма във Франция, далеч от папараци и средата на Лос Анджелис