Н ауката е чудесен инструмент за иновации и подобряване на живота ни, но нека си признаем, че има някои неща, които сме усвоили до голяма степен. Не бихте очаквали, например, че можем да подобрим нещо като... като броенето.

(Във видеото може да научите повече за: Митко Христов - учител по математика от ново поколение)

Затова може да е изненада, че група учени са направили точно това: намерили са нов начин за решаване на проблем с десетилетна давност, който задава въпрос, който на пръв поглед изглежда много прост - колко различни неща има пред мен?

Това е по-труден проблем - и по-умно решение - отколкото си мислите.

Проблемът за отчетливите елементи

Компютрите могат да бъдат много интелигентни, но могат да бъдат и много, много... неинтелигентни. Доказателство за това е неотдавнашният бум на чатботовете с изкуствен интелект: те са страхотни в това да звучат интелигентно, но ако ги подложите на изпитание, може да се окажете в блато от глупости.

Понякога най-много проблеми създават нещата, които изглеждат почти смешно прости за човека. Вземете например броенето - по-конкретно броенето на отделни обекти. За нас това е лесно: гледаме колекцията от обекти и мозъкът ни просто автоматично ги подрежда в групи вместо нас. Почти не ни се налага да работим върху това.

За компютрите, от друга страна, това е фундаментален проблем с десетилетна давност. И той наистина се нуждае от отговор, тъй като приложенията му в съвременния свят обхващат всичко - от анализ на мрежовия трафик - представете си Facebook или Twitter, които следят колко хора са влезли в даден момент - до откриване на измами, биоинформатика, анализ на текст и много други.

Очевидно е, че от известно време насам можем да правим тези неща и това е така, защото този въпрос за преброяването - правилно известен като Проблемът за отчетливите елементи - наистина има отговори. Те просто не са много добри. 

"Всички по-рано известни алгоритми бяха "базирани на хеширане" и качеството на този алгоритъм зависеше от качеството на хеширащите функции, които този алгоритъм избира", обясни Винодчандран Вариям, професор в Училището по информатика към Университета Небраска-Линкълн, в изявление от миналата година. 

Заедно с колегите си Сурав Чакраборти от Индийския статистически институт и Кулдип Мил от Университета в Торонто той открива начин за значително опростяване на проблема: "Новият алгоритъм използва само стратегия за вземане на проби, а анализът на качеството може да се извърши с помощта на елементарни техники."

Как работи?

Новият метод, наречен CVM алгоритъм в чест на създателите си, драстично намалява нуждите от памет - важно предимство в съвременната ера на големите данни - и го прави с помощта на хитър трик от теорията на вероятностите. За да илюстрирате концепцията, разгледайте примера, изследван от Вариам и колегите му, както и неотдавнашната статия в Quanta Magazine: представете си, че броите броя на уникалните думи в "Хамлет" на Шекспир, но разполагате с достатъчно памет, за да съхраните само 100 думи едновременно. 

Първо, правите очевидното: записвате първите 100 уникални думи, на които сте попаднали. Сега мястото ви е изчерпано - затова вземате монета и я хвърляте за всяка дума. Орел - тя остава; опашка - забравяте я.

В края на този процес в списъка ви ще има около 50 уникални думи. Започвате отново процеса отпреди - но този път, ако попаднете на дума, която вече е в списъка, отново хвърляте монетата, за да видите дали да я изтриете. След като достигнете 100 думи, отново преминавате през списъка, като хвърляте монета за всяка дума и я изтривате или запазвате според указанията.

Във втория рунд нещата са малко по-сложни: вместо една глава, за да запазите дума в списъка, са необходими две поредни - всичко останало се изтрива. По същия начин в третия кръг ще трябва да получите три поредни глави, за да остане; в четвъртия кръг ще са необходими четири поредни глави и така нататък, докато стигнете до края на "Хамлет".

В тази лудост има метод - и то интелигентен. Като сте преминали през текста по този начин, сте се уверили, че всяка дума в списъка ви има еднаква вероятност да присъства: 1/2k, където k е броят на пътищата, които трябваше да преминете през списъка. Така че, да кажем, че са ви били необходими шест кръга, за да стигнете до края на "Хамлет", и сте останали със списък от 61 отделни думи: след това можете да умножите 61 по 26, за да получите приблизителна оценка на броя на думите.
 
Ще ви спестим отварянето на приложението ви за калкулатор: отговорът е 3 904 - а според Вариам и ко действителният отговор е 3 967 (да, те пресметнаха.) Ако имате памет, която може да съхранява повече от 100 думи, точността се повишава още повече: при възможност за съхраняване на 1 000 думи алгоритъмът оценява отговора като 3 964 - вече едва ли има грешка при закръгляването - и "разбира се", казва Вариам, "ако паметта е толкова голяма, че да побере всички думи, тогава можем да получим 100-процентова точност".

Прост подход

Той е ефективен, но това, което прави алгоритъма още по-интригуващ, е неговата простота.

"Новият алгоритъм е изумително прост и лесен за изпълнение", казва пред Quanta Андрю Макгрегър, професор в Колежа по информационни и компютърни науки в Масачузетския университет в Амхърст.

Действително, след публикуването му през януари 2023 г. - и като изключим няколко дребни забележки и грешки междувременно - алгоритъмът привлече вниманието и възхищението на много други компютърни учени.

Това означава, че макар статията, в която подробно е описан алгоритъмът, да не е била рецензирана в официалния смисъл на думата, тя определено е била рецензирана от колеги. Всъщност Доналд Кнут, автор на "Изкуството на компютърното програмиране" и така нареченият "баща на анализа на алгоритми", пише статия, в която възхвалява алгоритъма през май 2023 г.

Междувременно различни екипи - включително Чакраборти, Вариям и Мил - прекараха последната година в проучване и усъвършенстване на алгоритъма. Някои от тях, казва Вариам, вече го преподават в своите курсове по информатика.

"Смятаме, че това ще бъде основен алгоритъм, който ще се преподава в първия курс по информатика за алгоритми като цяло и вероятностен алгоритъм в частност", каза той.

Кнут е съгласен: "Той е чудесно пригоден за преподаване на ученици, които изучават основите на информатиката. Почти съм сигурен, че нещо подобно в крайна сметка ще се превърне в стандартна тема за учебник".

И така, как един толкова революционен алгоритъм е останал незабелязан толкова дълго време? Според Вариам това не е толкова невероятно, колкото звучи.

"Учудващо е, че този прост алгоритъм не е бил открит по-рано. В науката не е необичайно простотата да бъде пропусната в продължение на няколко години", казва той.

Не пропускайте най-важните новини - последвайте ни в Google News Showcase

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Тръмп: Разочарован съм от Путин

Тръмп: Разочарован съм от Путин

Свят Преди 6 часа

Тръмп: Владимир и аз имахме много добри отношения, вероятно все още имаме

Теодор-Чикагото и Гизем изплуваха от Блатото след зрелищни победи в “Игри на волята”

Теодор-Чикагото и Гизем изплуваха от Блатото след зрелищни победи в “Игри на волята”

Любопитно Преди 6 часа

Гребецът Георги Стойчев-Шопа отпадна от надпреварата поради медицински причини

Почина легендата на соул музиката Д'Анджело

Почина легендата на соул музиката Д'Анджело

Свят Преди 9 часа

Той си отиде на 51 години

Протест във Варна в подкрепа на Благомир Коцев

Протест във Варна в подкрепа на Благомир Коцев

България Преди 10 часа

Писмо на Коцев до Европейския комитет на регионите

Министърът на правосъдието поиска наказания за четирима нотариуси

Министърът на правосъдието поиска наказания за четирима нотариуси

България Преди 10 часа

Дисциплинарните производства са в резултат от извършени проверки

Премиерът Росен Желязков отмени правителственото заседание утре

Премиерът Росен Желязков отмени правителственото заседание утре

България Преди 11 часа

Насроченото за сряда заседание трябваше да е редовно за кабинета и за него беше обявен дневен ред в 24 точки

Френският премиер ще замрази пенсионната реформа в опит да спаси правителството

Френският премиер ще замрази пенсионната реформа в опит да спаси правителството

Свят Преди 13 часа

Себастиен Лекорню подари голяма победа на Социалистическата партия

Златен медальон, свързан с Хенри VIII, се продава за 3.5 милиона паунда

Златен медальон, свързан с Хенри VIII, се продава за 3.5 милиона паунда

Любопитно Преди 13 часа

„Тюдорското сърце е може би един от най-невероятните предмети от английската история, откривани някога"

от ляво на дясно - Ива Григорова председател БАПРА, Иван Янакиев председател БДВО и Весислава Антонова - модератор на събитието

Първи по рода си доклад очертава ролята на PR комуникациите в българския бизнес

Любопитно Преди 13 часа

Той бе представен от Българското дружество за връзки с обществеността и Българската асоциация на PR агенциите, и показва стратегическата функция на PR специалистите

Министър Пешев награди световния шампион в щангите Карлос Насар

Министър Пешев награди световния шампион в щангите Карлос Насар

България Преди 13 часа

Треньорският щаб на световния шампион също ще бъде награден с парична премия

Барак Обама призна за „дефицит“ в брака си с Мишел

Барак Обама призна за „дефицит“ в брака си с Мишел

Любопитно Преди 13 часа

Барак Обама наскоро сподели, че двата му президентски мандата са поставили сериозно напрежение върху брака му

Зрителите решават кой ще бъде номиниран в Big Brother тази седмица

Зрителите решават кой ще бъде номиниран в Big Brother тази седмица

Любопитно Преди 13 часа

Те могат да подкрепят любимия си съквартирант в приложението NOVA PLAY

Жена преби учителка с тръба пред класа

Жена преби учителка с тръба пред класа

България Преди 13 часа

Жертвата е с причинена лека телесна повреда

Винопроизводител беше убит от собствената си преса за грозде

Винопроизводител беше убит от собствената си преса за грозде

Свят Преди 14 часа

Мъжът загуби живота си дни преди 45-ия си рожден ден

От утре претеглят превозните средства в движение

От утре претеглят превозните средства в движение

България Преди 14 часа

Иван Иванов отбеляза, че само в рамките на днешния ден, преди да започнат санкционирането, има 200 нарушения с претоварване.