М иналото лято търсачката на Google отмина един крайъгълен камък, добавяйки трилионния адрес от списъка с уеб страници, които познава. Но, колкото и невъзможно голям да изглежда техния брой, това представлява само една малка част от необятния океан от данни на глобалния уеб.

Зад тези трилион страници се крие още по-голямо количество скрити данни - финансова информация, каталози със стоки, разписания на полети, медицински изследвания и всякакъв друг вид материали, събрани в бази данни, които остават до голяма степен невидими за търсачките.

Трудностите, с които се сблъскват най-популярните търсачки, са свързани с проникването в така наречения "дълбок уеб" (Deep Web).

Те им пречат да не могат все още да дават отговори на въпроси като "Какъв е най-евтиният билет за полет от Ню Йорк до Лондон за утре?" А отговорите са готови, стига търсачките да знаят как да ги намерят.

Сега започва да се оформя нов вид технологии, които ще разширят обхвата на търсачките в далечните ъгли на мрежата. Когато това се случи, то не само ще подобри качеството на резултатите от търсенето, но и окончателно ще промени начина, по който компаниите ще правят онлайн бизнес.

Търсачките разчитат на програми, познати като паяци (или гъсеници), които събират информация като вървят по следите на хипервръзките, от които е образувана глобалната мрежа.

Този подход работи добре за страници, които оформят повърхността на уеб, но те проникват по-трудно в базите данни, които отговарят на написаните заявки.

Тази част на уеб е само върха на айсберга, казва Ананд Раджараман, съосновател на Kosmix - нова компания за изследване на Deep Web. Инвеститор в нея е главният изпълнителен директор на Amazon.com Джефри Бeзос.

В Kosmix са разработили софтуер, която сравнява търсения с бази данни, които най-вероятно съдържат релевантна информация, след което връща преглед на темата, извлечена от множество източници.

Повечето търсачки се опитват да ви помогнат да намерите игла в купа сено, казва г-н Раджараман, но ние се опитваме да ви помогнем да разучите цялата купа.

Тази купа сено е безкрайно голяма. В уеб има свързани милиони бази данни и безброй много възможни пермутации на термини за търсене. Просто няма начин която и да е търсачка, независимо колко мощна е тя, да претърси всяка възможна комбинация от данни в движение.

За да извлекат смислени данни от Deep Web, търсачките трябва да анализират термините за търсене на потребителите и да решат как да свържат тези заявки с конкретни бази данни.

При огромния брой варианти на формулиране на заявки за търсене и структури от бази данни тази задача представлява сериозна изчислителна трудност.

Това е възможно най-интересният проблем с интеграцията на данни, казва Алън Халеви, бивш преподавател по компютърни науки в университета на Вашингтон, който сега води екипа на Google, занимаващ се с решаване на ребуса Deep Web.

Стратегията на Google за Deep Web включва изпращането на програма, която да анализира съдържанието на всяка база данни, която открие. Ако например търсачката намери страница с форма, отнасяща се до изобразително изкуство, тя започва да налучква вероятни термини за търсене като "Рембранд", "Пикасо" и т.н., докато някои от тези термини върне съвпадение.

След това търсачката анализира резултатите и разработва прогнозен модел на съдържанието на базата данни.

Професор Джулиана Фриър от университета на Юта работи върху амбициозен проект, наречен DeepPeep, който има за крайна цел да обхване и индексира всяка база данни в глобалния уеб. Извличането на толкова много комбинации от данни изисква сложен модел на изчисления на вероятности.

Наивният начин е да се търсят всички думи в речника, казва проф. Фриър. Вместо това, DeepPeep започва с малък брой примерни заявки, които след това могат да се използват за формиране на разбиране на базите данни и избор на правилните думи за търсене.

На базата на този анализ, програмата след това генерира автоматични термини за търсене, като се опитва да обхване колко може повече данни.

Г-жа Фриър твърди, че нейният подход открива повече от 90% от съдържанието на всяка дадена база данни. Нейната работа наскоро привлече вниманието на една от големите компании, които предлагат търсене в уеб.

Извън сферата на потребителските търсения, технологиите за Deep Web могат да позволят на компаниите да използват данните по нови начини.

Например сайт за здравеопазване може да се реферира към данни от фармацевтични компании и да ги сравни и допълни с най-новите открития от медицински изследвания.

Тази степен на интеграция на данни може евентуално да посочи пътя към нещо подобно на семантичния уеб, който дава една все още нереализирана визия за мрежа от взаимосвързани данни.

Технологиите за Deep Web носят обещанието, че подобни ползи могат да се постигнат на много по-ниска цена чрез автоматизация на процеса на анализ на структурите от бази данни и многостранно рефериране на резултатите.

Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни
Трагедия в Кипър: Две деца починаха в нагорещен автомобил, твърди се, че са българчета

Трагедия в Кипър: Две деца починаха в нагорещен автомобил, твърди се, че са българчета

България Преди 2 часа

Децата на 8 и 10 години са намерени в безсъзнание пред къща в района на Ларнака с тежки изгаряния от слънцето

Дипломация на ръба: Защо преговорите между София и Скопие са в застой

Дипломация на ръба: Защо преговорите между София и Скопие са в застой

България Преди 2 часа

Доцент Наум Кайчев с анализ за студената война със Северна Македония, изтеклите ноти и натиска над българите в Скопие

Трагедия без край: Откриха мъртви жената и децата на футболист под руините във Венецуела

Трагедия без край: Откриха мъртви жената и децата на футболист под руините във Венецуела

Свят Преди 4 часа

След мъчително 74-часово издирване спасителните екипи във Венецуела откриха безжизнени телата на съпругата и двете деца на аржентинския футболист Лукас Трехо. Броят на загиналите от двойния трус в страната вече надхвърли ужасяващите 1430 души

Любомир Николов: Затягаме контрола на пътя с дронове и цивилни автомобили

Любомир Николов: Затягаме контрола на пътя с дронове и цивилни автомобили

България Преди 5 часа

И.д. главен секретар Любомир Николов с разкрития за корупционни схеми, издирването на Пепи Еврото и тежкия пропуск след трагедията на „Тракия“

„Ягодовата луна“ изгрява на 29 юни – какво трябва да знаем за „най-сладкото“ пълнолуние

„Ягодовата луна“ изгрява на 29 юни – какво трябва да знаем за „най-сладкото“ пълнолуние

Любопитно Преди 5 часа

На 29 юни нощното небе ще бъде озарено от вълшебното пълнолуние, известно като „Ягодова Луна“. Макар името да обещава розов цвят, реалността зад този феномен е съвсем различна, а през 2026 г. ни очаква и любопитно астрономическо съвпадение

СЗО: Над 1300 са жертвите на горещата вълна в Европа

СЗО: Над 1300 са жертвите на горещата вълна в Европа

Свят Преди 5 часа

Днес в Чехия беше отбелязан втори температурен рекорд за два поредни дни, след като в Доксани, северно от Прага, бяха регистрирани рекордните 41,1 градуса

Продадоха в заложна къща телефон със запаметени данни на чужда дебитна карта

Продадоха в заложна къща телефон със запаметени данни на чужда дебитна карта

България Преди 6 часа

Жена от кубратско село източи 260 евро през приложението Temu, след като се сдобила с чуждия смартфон без изтрита история

76-годишен мъж с множество травми бе транспортиран с медицински хеликоптер от Смолян до София

76-годишен мъж с множество травми бе транспортиран с медицински хеликоптер от Смолян до София

България Преди 6 часа

Пациентът е в тежко състояние с политравма и счупен гръбначен стълб след падане от височина при битов инцидент

Мазут изплува и на „Градина“, плажуващи сигнализират за замърсяване (СНИМКИ/ВИДЕО)

Мазут изплува и на „Градина“, плажуващи сигнализират за замърсяване (СНИМКИ/ВИДЕО)

България Преди 6 часа

Плажове по Южното Черноморие са осеяни с мазут, туристи алармират за замърсяването в социалните мрежи

„Славия“ потъна в скръб: Изпратиха загиналите в тежката катастрофа на „Тракия“ Мишо и баща му

„Славия“ потъна в скръб: Изпратиха загиналите в тежката катастрофа на „Тракия“ Мишо и баща му

България Преди 7 часа

Президентът Венцеслав Стефанов спря всички лагери и турнири на клуба; отборите вече ще пътуват само с лицензиран транспорт

Трагедия във Франция: 11 загинали при катастрофа на самолет с парашутисти

Трагедия във Франция: 11 загинали при катастрофа на самолет с парашутисти

Свят Преди 7 часа

Лекомоторната машина, собственост на местна школа, се разби в град Томблен; сред жертвите са петима инструктори и петима обучаеми

Професор от УМБАЛ "Александровска" обяви безсрочна гладна стачка

Професор от УМБАЛ "Александровска" обяви безсрочна гладна стачка

България Преди 7 часа

Синдикат „Защита“ алармира за дисциплинарно производство срещу нея след искане за прозрачност на заплатите в ръководството; известено е Министерството на здравеопазването

Сърбия връща задължителната военна служба от март 2027 г.

Сърбия връща задължителната военна служба от март 2027 г.

Свят Преди 7 часа

Президентът Александър Вучич обяви въвеждането на 75-дневна служба за младежи до 30 години по време на мащабна военна демонстрация в Батайница

Масирана атака с украински дронове порази петролни рафинерии в Русия

Масирана атака с украински дронове порази петролни рафинерии в Русия

Свят Преди 7 часа

Киев порази петролни обекти в Краснодарския край и Ярославска област, Москва докладва за свалени 213 безпилотни апарата на фона на засилваща се горивна криза

Огромен пожар гори край Околовръстното шосе в Пловдив (ВИДЕО)

Огромен пожар гори край Околовръстното шосе в Пловдив (ВИДЕО)

България Преди 8 часа

Четири пожарни екипа и доброволци се борят с пламъците край Околовръстното шосе, гъст черен дим покри небето над града

Германия отчете най-топлата нощ в историята си, жегата разтопи трамвайните релси в Лайпциг

Германия отчете най-топлата нощ в историята си, жегата разтопи трамвайните релси в Лайпциг

Свят Преди 8 часа

Температурите през нощта достигнаха рекордните 29,4 градуса, докато екстремните горещини блокираха градския транспорт в Саксония