1

Н ауката е чудесен инструмент за иновации и подобряване на живота ни, но нека си признаем, че има някои неща, които сме усвоили до голяма степен. Не бихте очаквали, например, че можем да подобрим нещо като... като броенето.

(Във видеото може да научите повече за: Митко Христов - учител по математика от ново поколение)

Затова може да е изненада, че група учени са направили точно това: намерили са нов начин за решаване на проблем с десетилетна давност, който задава въпрос, който на пръв поглед изглежда много прост - колко различни неща има пред мен?

Това е по-труден проблем - и по-умно решение - отколкото си мислите.

Проблемът за отчетливите елементи

Компютрите могат да бъдат много интелигентни, но могат да бъдат и много, много... неинтелигентни. Доказателство за това е неотдавнашният бум на чатботовете с изкуствен интелект: те са страхотни в това да звучат интелигентно, но ако ги подложите на изпитание, може да се окажете в блато от глупости.

Понякога най-много проблеми създават нещата, които изглеждат почти смешно прости за човека. Вземете например броенето - по-конкретно броенето на отделни обекти. За нас това е лесно: гледаме колекцията от обекти и мозъкът ни просто автоматично ги подрежда в групи вместо нас. Почти не ни се налага да работим върху това.

За компютрите, от друга страна, това е фундаментален проблем с десетилетна давност. И той наистина се нуждае от отговор, тъй като приложенията му в съвременния свят обхващат всичко - от анализ на мрежовия трафик - представете си Facebook или Twitter, които следят колко хора са влезли в даден момент - до откриване на измами, биоинформатика, анализ на текст и много други.

Очевидно е, че от известно време насам можем да правим тези неща и това е така, защото този въпрос за преброяването - правилно известен като Проблемът за отчетливите елементи - наистина има отговори. Те просто не са много добри. 

"Всички по-рано известни алгоритми бяха "базирани на хеширане" и качеството на този алгоритъм зависеше от качеството на хеширащите функции, които този алгоритъм избира", обясни Винодчандран Вариям, професор в Училището по информатика към Университета Небраска-Линкълн, в изявление от миналата година. 

Заедно с колегите си Сурав Чакраборти от Индийския статистически институт и Кулдип Мил от Университета в Торонто той открива начин за значително опростяване на проблема: "Новият алгоритъм използва само стратегия за вземане на проби, а анализът на качеството може да се извърши с помощта на елементарни техники."

Как работи?

Новият метод, наречен CVM алгоритъм в чест на създателите си, драстично намалява нуждите от памет - важно предимство в съвременната ера на големите данни - и го прави с помощта на хитър трик от теорията на вероятностите. За да илюстрирате концепцията, разгледайте примера, изследван от Вариам и колегите му, както и неотдавнашната статия в Quanta Magazine: представете си, че броите броя на уникалните думи в "Хамлет" на Шекспир, но разполагате с достатъчно памет, за да съхраните само 100 думи едновременно. 

Първо, правите очевидното: записвате първите 100 уникални думи, на които сте попаднали. Сега мястото ви е изчерпано - затова вземате монета и я хвърляте за всяка дума. Орел - тя остава; опашка - забравяте я.

В края на този процес в списъка ви ще има около 50 уникални думи. Започвате отново процеса отпреди - но този път, ако попаднете на дума, която вече е в списъка, отново хвърляте монетата, за да видите дали да я изтриете. След като достигнете 100 думи, отново преминавате през списъка, като хвърляте монета за всяка дума и я изтривате или запазвате според указанията.

Във втория рунд нещата са малко по-сложни: вместо една глава, за да запазите дума в списъка, са необходими две поредни - всичко останало се изтрива. По същия начин в третия кръг ще трябва да получите три поредни глави, за да остане; в четвъртия кръг ще са необходими четири поредни глави и така нататък, докато стигнете до края на "Хамлет".

В тази лудост има метод - и то интелигентен. Като сте преминали през текста по този начин, сте се уверили, че всяка дума в списъка ви има еднаква вероятност да присъства: 1/2k, където k е броят на пътищата, които трябваше да преминете през списъка. Така че, да кажем, че са ви били необходими шест кръга, за да стигнете до края на "Хамлет", и сте останали със списък от 61 отделни думи: след това можете да умножите 61 по 26, за да получите приблизителна оценка на броя на думите.
 
Ще ви спестим отварянето на приложението ви за калкулатор: отговорът е 3 904 - а според Вариам и ко действителният отговор е 3 967 (да, те пресметнаха.) Ако имате памет, която може да съхранява повече от 100 думи, точността се повишава още повече: при възможност за съхраняване на 1 000 думи алгоритъмът оценява отговора като 3 964 - вече едва ли има грешка при закръгляването - и "разбира се", казва Вариам, "ако паметта е толкова голяма, че да побере всички думи, тогава можем да получим 100-процентова точност".

Прост подход

Той е ефективен, но това, което прави алгоритъма още по-интригуващ, е неговата простота.

"Новият алгоритъм е изумително прост и лесен за изпълнение", казва пред Quanta Андрю Макгрегър, професор в Колежа по информационни и компютърни науки в Масачузетския университет в Амхърст.

Действително, след публикуването му през януари 2023 г. - и като изключим няколко дребни забележки и грешки междувременно - алгоритъмът привлече вниманието и възхищението на много други компютърни учени.

Това означава, че макар статията, в която подробно е описан алгоритъмът, да не е била рецензирана в официалния смисъл на думата, тя определено е била рецензирана от колеги. Всъщност Доналд Кнут, автор на "Изкуството на компютърното програмиране" и така нареченият "баща на анализа на алгоритми", пише статия, в която възхвалява алгоритъма през май 2023 г.

Междувременно различни екипи - включително Чакраборти, Вариям и Мил - прекараха последната година в проучване и усъвършенстване на алгоритъма. Някои от тях, казва Вариам, вече го преподават в своите курсове по информатика.

"Смятаме, че това ще бъде основен алгоритъм, който ще се преподава в първия курс по информатика за алгоритми като цяло и вероятностен алгоритъм в частност", каза той.

Кнут е съгласен: "Той е чудесно пригоден за преподаване на ученици, които изучават основите на информатиката. Почти съм сигурен, че нещо подобно в крайна сметка ще се превърне в стандартна тема за учебник".

И така, как един толкова революционен алгоритъм е останал незабелязан толкова дълго време? Според Вариам това не е толкова невероятно, колкото звучи.

"Учудващо е, че този прост алгоритъм не е бил открит по-рано. В науката не е необичайно простотата да бъде пропусната в продължение на няколко години", казва той.

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Коментари 1
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

1 коментар
 
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
<p>&quot;Победа на Тръмп оставя Украйна на произвола&ldquo;</p>

"Гардиън“: Победа на Тръмп оставя Украйна на произвола

Свят Преди 7 часа

Камала Харис, ако спечели, вероятно ще продължи политиката на Байдън

Олимпийските игри започват без примирието на Макрон

Олимпийските игри започват без примирието на Макрон

Свят Преди 8 часа

Френските дипломати се надяваха да използват това олимпийско примирие за преговори за Украйна

Ваканцията на депутатите ще е от 17 до 31-ви август

Ваканцията на депутатите ще е от 17 до 31-ви август

България Преди 11 часа

Темата за депутатската ваканция беше обсъдена вчера на председателски съвет

Задържаха българи за оскверняване на Мемориала на Холокоста в Париж

Задържаха българи за оскверняване на Мемориала на Холокоста в Париж

България Преди 11 часа

ДАНС провежда действия по установяване на подбудителите и съучастниците

<p>&quot;Емоционалните белези ще се лекуват с години&quot;</p>

"Емоционалните белези ще се лекуват с години": Ужасът на войната в Израел

Свят Преди 12 часа

В Газа повече от един милион палестински деца са травмирани от широко разпространената смърт и разрушения

Остър конфликт между СЗО и тютюнопроизводителите в Малави

Остър конфликт между СЗО и тютюнопроизводителите в Малави

Свят Преди 12 часа

Кампанията срещу тютюнопушенето на СЗО казва, че отглеждането на тютюн представлява сериозен риск за общественото здраве

<p>&quot;Тези рестрикции нарушават човешките им права&quot;</p>

Законни ли са "виртуалните процеси" срещу политически затворници в Никарагуа (ВИДЕО)

Свят Преди 12 часа

"Тези рестрикции нарушават човешките им права"

Трите сестри, които искат да спасят планетата (ВИДЕО)

Трите сестри, които искат да спасят планетата (ВИДЕО)

Свят Преди 12 часа

Проектът за устойчива мода има икономическо, екологично и социално въздействие

Чакъров заподозря натиск, Пеевски изпрати сигнал

Чакъров заподозря натиск, Пеевски изпрати сигнал

България Преди 12 часа

От НАП категорично отхвърлиха обвиненията, отправени от Чакъров

Престъпност, убийства, трафик на наркотици: Насилието в Еквадор продължава

Престъпност, убийства, трафик на наркотици: Насилието в Еквадор продължава

Свят Преди 12 часа

Експерт посочва, че гражданите са загубили доверието си в парламентарната институция

Харви Уайнстийн е в болница с COVID-19

Харви Уайнстийн е в болница с COVID-19

Свят Преди 13 часа

През февруари 2020 г. съдебните заседатели в Манхатън го признаха за виновен по обвинения в изнасилване

Главният секретар на МВР: Няма горящ огън, има тлеене в складовете за фойерверки край Елин Пелин

Главният секретар на МВР: Няма горящ огън, има тлеене в складовете за фойерверки край Елин Пелин

България Преди 13 часа

Калганджиев посочи, че са направени няколко облитания и обливания над горящите складове

Съдът потвърди: Васил Терзиев е кмет на София

Съдът потвърди: Васил Терзиев е кмет на София

България Преди 13 часа

Решението подлежи на обжалване пред Върховен административен съд

<p>НС реши - ускоряваме приемането на еврото</p>

Народното събрание реши - ускоряваме приемането на еврото

България Преди 13 часа

Костадинов коментира, че това е национално предателство

КС отсъди за промените в Конституцията

КС отсъди за промените в Конституцията

България Преди 14 часа

Остават в сила приетите промени за съставянето на служебен кабинет

Песков за задържането на руснак в Париж: Това е куриозно

Песков за задържането на руснак в Париж: Това е куриозно

Свят Преди 14 часа

В сряда френските власти арестуваха 40-годишен руснак, за когото заявиха, че е замесен в заговор за дестабилизиране на Олимпиадата