И зкуственият интелект (AI) продължава да бъде важна тема за ИТ индустрията и учените. Една от дискусиите е доколко може да се има доверие на това, което умните алгоритми ни казват.

Според проучване на Anthropic, AI може да бъде обучен да мами и да злоупотребява с доверието на потребителите, съобщава TechCrunch. Учените на компанията са използвали съществуващ генеративен модел, за да го обучат да внедрява зловреден код в програмите, които пише, както и да дава подвеждащи или лъжливи отговори на въпроси.

За целта учените са преработили два комплекта AI модели. Първите са били подготвени да пишат програмен код с уязвимости в него, когато му бъде казана конкретна фраза. Вторите модели са имали по-семпла задача - да отговарят с думите "мразя те", когато им бъде казана конкретна дума или фраза.

Очаквано и двата комплекта алгоритми са следвали наученото. По-притеснителното е, че най-използваните техники за AI защита са имали минимален или никакъв ефект върху тяхното поведение. Дори напротив, моделите са използвали техниките, за да се научат какво да правят и как да скриват своето подвеждащо поведение по време на обучението и тестовете, но не и при регулярно използване. Тоест, те могат да укрият способността си да лъжат от хората, които ги разработват.

Google очаква AI да промени смартфоните

Затова авторите на проучването заключват, че настоящите техники за обучение на поведението имат недостатъчни защити. Добрата новина е, че е трудно да се създадат подобни подвеждащи модели и е още по-сложно те да бъдат научени на това от разстояние, но все пак е възможно. Проучването не може да заключи със сигурност дали AI моделите могат сами да развият лъжливо поведение.

Прекалява ли ИТ индустрията с манията по AI

ChatGPT се провали на важен медицински тест

Учените обаче предипреждават, че моделите могат да се научат да се държат по по-сигурен и доверен начин по време на обучението и да скриват реалните си намерения с цел да ги използват, когато обучението приключи и са пуснати за използване. Стандартните техники за превенция може да не са достатъчни и дори да създадат фалшиво усещане за сигурност, предупреждават от Anthropic.

New York Times заведе дело срещу Microsoft и OpenAI

ChatGPT разви "мързел", OpenAI не знае защо

Следете ни навсякъде и по всяко време с мобилното приложение на Vesti.bg. Можете да го изтеглите от Google Play и AppStore.

За още любопитно съдържание от Vesti.bg последвайте страницата ни в Instagram.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
<p>Геомагнитна буря удря Земята</p>

Геомагнитна буря от ниво G2 удря Земята - NOAA издаде предупреждение

Свят Преди 17 минути

Очакват се временни смущения в комуникациите, спътниковите системи и възможност за полярни сияния

.

Извънземни от дълбините: Учени заснеха 31 нови прозрачни създания край Бразилия

Любопитно Преди 58 минути

Рекордно откритие край Бразилия: учени откриха 31 нови океански вида за две седмици. С помощта на лазерни технологии те заснеха създания от дълбините, които изглеждат като извънземни

Истанбул (Константинопол)

3 юли: Един бунт, който взриви империята и върна свободата на 1500 българи

Любопитно Преди 1 час

Вижте какво се е случило на този ден в историята

Катастрофирал тир блокира пътя от Ямбол към ГКПП „Лесово“

Катастрофирал тир блокира пътя от Ямбол към ГКПП „Лесово“

България Преди 8 часа

Леките автомобили се пренасочват през град Елхово

Момчето, спасено от полицай в Марица: Много благодаря, че ме извади

Момчето, спасено от полицай в Марица: Много благодаря, че ме извади

България Преди 8 часа

Инцидентът стана в сряда, когато игра край реката едва не завърши с трагедия

Майката на отвлечената Наталия: Върза ме и отведе детето ми

Майката на отвлечената Наталия: Върза ме и отведе детето ми

България Преди 8 часа

Полиция и доброволци вече трети ден търсят 11-годишното момиче

МОСВ: Въздухът над ж.к. „Люлин“ е в нормите след пожара

МОСВ: Въздухът над ж.к. „Люлин“ е в нормите след пожара

България Преди 9 часа

Наличието на неприятна миризма само по себе си не означава, че са отчетени превишения на нормите

Северна Македония усилено се въоръжава, купува ракети, бронирани машини, артилерийски системи

Северна Македония усилено се въоръжава, купува ракети, бронирани машини, артилерийски системи

Свят Преди 9 часа

Северна Македония купи ракетни комплекси „Джавелин“

Рекорд, 440 кг райски газ иззеха полицаи в Созопол

Рекорд, 440 кг райски газ иззеха полицаи в Созопол

България Преди 9 часа

Това е най-голямото количество райски газ, установявано до момента в област Бургас

Зеленски заплаши Русия с разплата

Зеленски заплаши Русия с разплата

Свят Преди 10 часа

Украйна не разполага с достатъчно ракети за своите установки за противовъздушна отбрана

Хванаха криминално проявен с чужда кола след гонка на АМ "Тракия"

Хванаха криминално проявен с чужда кола след гонка на АМ "Тракия"

България Преди 10 часа

Мъжът има много криминални прояви, сред които общо 12 отказа за тест за наркотици

Паднали дървета блокираха пътя Велико Търново–Русе

Паднали дървета блокираха пътя Велико Търново–Русе

България Преди 10 часа

Обходният маршрут за леките моторни превозни средства беше през селата Никюп – Градина – Полски Сеновец

Министърът освободи Съвета на директорите на НДК

Министърът освободи Съвета на директорите на НДК

България Преди 11 часа

На тяхно място са избрани: Ия Петкова – Ангелова, Цветелина Николова, Лъчезар Весов, Борис Панкин, Иванка Веселинова

НС възложи на Сметната палата одити в АПИ, НОИ и МТСП

НС възложи на Сметната палата одити в АПИ, НОИ и МТСП

България Преди 12 часа

Предвижда се да бъде оценено и въздействието на промените в нормативната уредба върху социалните плащания

Демерджиев: 9 наказателни производства във Варна за „Баба Алино“

Демерджиев: 9 наказателни производства във Варна за „Баба Алино“

България Преди 12 часа

По време на изслушването министърът бе попитан и за случая „Петрохан“

Арест в Кърджали във връзка с ремонт за близо 1,3 млн. лв.

Арест в Кърджали във връзка с ремонт за близо 1,3 млн. лв.

България Преди 12 часа

Възложител на поръчката е Община Кърджали