6

Ч атботът с изкуствен интелект, известен като ChatGPT, разработен от компанията OpenAI, привлече вниманието и въображението на обществеността. Някои приложения на технологията са наистина впечатляващи, като например способността му да обобщава сложни теми или да участва в дълги разговори.

Не е изненадващо, че други компании за изкуствен интелект побързаха да пуснат свои собствени големи езикови модели (LLM) - името на технологията, която стои в основата на чатботове като ChatGPT. Някои от тези програми ще бъдат включени в други продукти, като например в търсачките.

Имайки предвид впечатляващите му възможности, от Sciencealert решават да тестват чатбота с игра на думи - създадена от New York Times.

Играчите имат шест опита да познаят петбуквена дума. При всяко отгатване играта показва кои букви, ако има такива, са на правилните позиции в думата.

Използвайки последното поколение, наречено ChatGPT-4, става ясно, че представянето му при тези загадки е изненадващо слабо.

Може да се очаква, че игрите с думи ще бъдат лесна задача за GPT-4. Te се "обучават" върху текст, което означава, че са изложени на информация, за да могат да се усъвършенстват в това, което правят.

ChatGPT-4 e обучен на около 500 милиарда думи: цялата Wikipedia, всички книги от публичния домейн, огромни обеми научни статии и текст от много уебсайтове.

Чатботовете с изкуствен интелект могат да играят важна роля в живота ни. Разбирането на причините, поради които ChatGPT-4 се затруднява с Wordle, дава представа за начина, по който езиковият модел представя и работи с думи - заедно с ограниченията, които това носи.

Първо, анализаторът тества ChatGPT-4 върху пъзел Wordle, при който знае правилните места на две букви в една дума. Моделът е "#E#L#", където "#" представлява неизвестните букви. Отговорът беше думата "mealy".

Пет от шестте отговора на ChatGPT-4 не съвпаднат с модела. Отговорите са: "beryl", "feral", "heral", "merle", "revel" и "pearl".

При други комбинации чатботът понякога намира валидни решения. Но като цяло беше много ударен и неуспешен. В случай на дума, отговаряща на модела "##OS#", той намери пет правилни варианта. Но когато моделът беше "#R#F#", той предложи две думи без буквата F и една дума - "Traff" - която не се среща в речниците.

В основата на ChatGPT е дълбока невронна мрежа: сложна математическа функция - или правило - която съпоставя входните данни с изходните. Входовете и изходите трябва да са числа. Тъй като ChatGPT-4 работи с думи, те трябва да бъдат "преведени" в числа, за да може невронната мрежа да работи с тях.

Преводът се извършва от компютърна програма, наречена токенизатор, която поддържа огромен списък от думи и последователности от букви, наречени "токени".

Тези символи се идентифицират с номера. Дума като "friend" има идентификатор на токена 6756, така че дума като "friendship" се разделя на токените "friend" и "ship". Те се представят като идентификатори 6756 и 6729.

Когато потребителят въведе въпрос, думите се преобразуват в числа още преди ChatGPT-4 да започне да обработва заявката. Дълбоката невронна мрежа няма достъп до думите като текст, така че не може реално да разсъждава за буквите.

Задача за стихотворение

ChatGPT-4 умее да работи с първите букви на думите. Помолих я да напише стихотворение, в което началната буква на всеки ред изписва "Обичам роботи". Отговорът му беше изненадващо добър. Ето първите четири реда:

Аз съм фен на зъбните колела и стоманата

Обичам движенията им, толкова сюрреалистични,

над веригите, те бързо управляват

Състезават се със знанията, не са глупави,

Учебните данни за ChatGPT-4 включват огромен брой учебници, които често включват азбучни индекси. Това може да е било достатъчно, за да може GPT-4 да усвои асоциациите между думите и техните първи букви.

Изглежда, че токенизаторът също е бил модифициран, за да разпознава подобни заявки, и изглежда разделя фраза като "Обичам роботи" на отделни токени, когато потребителите въвеждат заявката си. ChatGPT-4 обаче не е в състояние да обработва заявки за работа с последните букви на думите.

ChatGPT-4 не се справя добре и с палиндромите - думи наобратно. Помолен да създаде палиндромна фраза за робот, той предложи "сот робот, орба", която не отговаря на определението за палиндром и разчита на неясни думи.

Езиковите модели обаче са сравнително добри в генерирането на други компютърни програми. Това е така, защото техните данни за обучение включват много уебсайтове, посветени на програмирането. Помолих ChatGPT-4 да напише програма за определяне на идентичността на липсващите букви в Wordle.

Първоначалната програма, която ChatGPT-4 създава, има грешка. Той я поправя, когато я посочим. Когато се стартира програмата, тя открива 48 валидни думи, съответстващи на модела "#E#L#", включително "tells", "cells" и "hello". Когато преди това помолим GPT-4 директно да предложи съвпадения за този модел, той намира само едно.

Бъдещи поправки

Може да изглежда изненадващо, че голям езиков модел като ChatGPT-4 трудно решава прости пъзели от думи или формулира палиндроми, тъй като данните за обучение включват почти всички налични думи.

Това обаче се дължи на факта, че всички текстови входни данни трябва да бъдат кодирани като числа, а процесът, който прави това, не улавя структурата на буквите в думите. Тъй като невронните мрежи работят единствено с числа, изискването за кодиране на думите като числа няма да се промени.

Съществуват два начина, по които бъдещите програми  могат да преодолеят това. Първо, ChatGPT-4 познава първата буква на всяка дума, така че данните за обучението му могат да бъдат увеличени, за да включват съпоставки на всяка позиция на буквите във всяка дума в речника му.

Вторият вариант е по-вълнуващо и общо решение. Бъдещите програми могат да генерират код за решаване на подобни проблеми, както показах. В неотдавнашна статия беше демонстрирана идея, наречена Toolformer, при която се използват външни инструменти, за да изпълнява задачи, при които обикновено се затруднява, например аритметични изчисления.

Коментари 6
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

6 коментара
 
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни

Последни

Руска атака с дрон е нанесла щети на хотел в украинския град Николаев

Руска атака с дрон е нанесла щети на хотел в украинския град Николаев

Свят Преди 10 минути

Там са били настанени англоговорящи наемници, воюващи в Украйна

Мощно торнадо в Китай уби най-малко петима души

Мощно торнадо в Китай уби най-малко петима души

Свят Преди 1 час

По официални данни бурята е нанесла щети на 141 производствени обекта, но няма срутени жилищни сгради

Зеленски: Русия атакува газови съоръжения, осигуряващи доставките за ЕС

Зеленски: Русия атакува газови съоръжения, осигуряващи доставките за ЕС

Свят Преди 10 часа

Русия продължава да доставя газ за ЕС през Украйна по силата на транзитно споразумение с руския Газпром

Маргарита и Кристиян на крачка от елиминацията в “Един за друг”

Маргарита и Кристиян на крачка от елиминацията в “Един за друг”

Любопитно Преди 10 часа

Те завършиха със седмичен бюджет от 0 лева за втори път този сезон

Харви Уайнстийн влезе в болница

Харви Уайнстийн влезе в болница

Свят Преди 11 часа

72-годишният Уайнстийн излежава 23 години в нюйоркски затвор за две сексуални нападения

Блинкен ще участва в преговорите за прекратяване на огъня в Газа в Саудитска Арабия

Блинкен ще участва в преговорите за прекратяване на огъня в Газа в Саудитска Арабия

Свят Преди 11 часа

Той ще се срещне с министри от блока на арабските държави от Персийския залив

Австралия ще предостави на Украйна помощ от 100 млн. долара

Австралия ще предостави на Украйна помощ от 100 млн. долара

Свят Преди 12 часа

Това заяви украинският министър-председател Денис Шмигал след среща с австралийския министър на отбраната Ричард Марлес

Арестуваха финландски депутат заради стрелба

Арестуваха финландски депутат заради стрелба

Свят Преди 12 часа

Заподозреният Тимо Ворнанен влязъл в словесен спор със свой колега

"Хамас" показа кадри на двама живи заложника (ВИДЕО)

"Хамас" показа кадри на двама живи заложника (ВИДЕО)

Свят Преди 13 часа

Те са били отвлечени от екстремисти по време на атаката на "Хамас" срещу Израел на 7 октомври

Откриха самоделни пиратки на националния стадион преди мача ЦСКА-Левски

Откриха самоделни пиратки на националния стадион преди мача ЦСКА-Левски

България Преди 14 часа

На място е изпратен сапьорски екип на Специализирания отряд за борба с тероризма, който ги е обезвредил

<p>&bdquo;Целта на Путин не е Украйна. Целта на Путин е Европа&quot;</p>

Германският финансов министър: Целта на Путин не е Украйна, а Европа

Свят Преди 15 часа

Въпреки че руският лидер нападна Украйна, „той има предвид всички нас и нашия начин на живот“, каза Линднер

Бритни Спиърс бе осъдена да плати над 2 милиона долара на баща си

Бритни Спиърс бе осъдена да плати над 2 милиона долара на баща си

Свят Преди 15 часа

Самата Спиърс е похарчила над 4 милиона долара за адвокати

Георги Георгиев: Терзиев да покаже документите от избирането на съпругата на Цеков за консултант

Георги Георгиев: Терзиев да покаже документите от избирането на съпругата на Цеков за консултант

България Преди 15 часа

Той обяви, че още в понеделник ще бъде внесен сигнал за откритите нарушенията в общинското предприятие „Гробищни паркове“

Разкриха причината за смъртта на О Джей Симпсън

Разкриха причината за смъртта на О Джей Симпсън

Свят Преди 15 часа

О Джей Симпсън почина на 76-годишна възраст в дома си в Лас Вегас на 10 април

Градушката в Сливенско уби бебе картал

Градушката в Сливенско уби бебе картал

България Преди 16 часа

Това съобщиха от природозащитната организация Фонд за дивата флора и фауна

Лувърът подготвя отделна зала за „Мона Лиза“

Лувърът подготвя отделна зала за „Мона Лиза“

Свят Преди 16 часа

Подобен ход би дал на посетителите по-добро изживяване