Българският език заплашен от "дигитална смърт"
Българският език заплашен от "дигитална смърт"   
Източник: ЕПА/БГНЕС
51

Повечето европейски езици са заплашени от "дигитална смърт", алармира ново изследване на водещи европейски технологични експерти.

След оценка на

състоянието на езиковите технологии за 30 от близо 80-те езика,

които се говорят в Европа, експертите са заключили, че езиковите технологии за 21 езика или "са недоразвити", или са "слабо развити".

Проучването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език "Проф. Любомир Андрейчин", съобщават от БАН.

Изследването, което е обобщено в 30 "бели книги" на различните езици, използва четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

В поне една от тези категории 21 от 30-те езика (70%) получават най-ниската оценка (т.е. за тях липсват езикови технологии или съществуващите технологии са недоразвити). За българския език категорията със слаба оценка е автоматичният превод.

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.

Състоянието на наличните езикови ресурси и технологии

не е оценено като "отлично" за нито един език

Все пак ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като "средно развити".

Технологиите и ресурсите за езици като баски, български, каталунски, гръцки, унгарски и полски са категоризирани като "фрагментарно развити", което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.

За момента българският език, получил средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси, не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици.

"Резултатите от анализа са силно обезпокоителни. По-голямата част от европейските езици не разполагат с достатъчно адекватни ресурси, които да гарантират оцеляването им в епохата на развити технологии, а при някои езици дори нуждата от такива ресурси не е била осъзната. Поради тази причина и бъдещето на много от европейските езици е неясно", казва проф. Ханс Уцкорайт, координатор на инициативата META-NET, научен директор на Германския център за проучване на изкуствения интелект (DFKI) и един от авторите и редакторите на изследването.

"Пропастта между т. нар. "големи" и "малки" езици

продължава да се разширява. Трябва да положим усилия, за да осигурим адекватна технологична подкрепа за всички по-малки езици, за които липсват нужните ресурси и технологии. В противен случай те за застрашени от дигитална смърт", предупреждава друг от авторите - Георг Рем.

Под езикови технологии най-общо се разбира софтуер, който може да обработва говорима и писмена човешка реч.

Добре познати приложения на такъв софтуер са програмите за правописна и граматична корекция и за синтез на реч, интерактивните лични асистенти на смартфоните (например Siri за iPhone), диалоговите системи за обработка на въпроси по телефона, системите за автоматичен превод, уеб търсачките, както и синтезаторите на реч в навигационните системи за автомобили.

Съвременните системи, базирани на езикови технологии, разчитат предимно на статистически методи, които изискват голям обем данни от писмена и устна реч.

За езици със сравнително малък брой носители необходимият обем езикови данни се набира трудно - българският език например е в незавидна ситуация в сравнение с езици като френски, който се използва от цялата френскоговоряща общност по света.

Освен това при компютърните системи, които се базират на статистическа обработка на езика,

качеството на генерираните данни не е задоволително,

както се вижда от грешните преводи, които предлагат онлайн системите за машинен превод.

Повечето познати системи обаче са изградени около и/или са насочени към английски и поддържат превод от и на малко други езици, а и няма унификация, така че се налага потребителите да усвоят различни методи за работа с различните системи.

За разработването на езикови технологии за останалите езици не са били поемани нито политически, нито финансови ангажименти и липсва ясна изследователска и технологична визия за развитие.

Белите книги на META-NET, издавани в серията "Езиците в европейското информационно общество" (Languages in the European Information Society), предлагат анализ на достъпа до езикови технологии за 30 европейски езика и хвърлят светлина върху най-непосредствените рискове и възможности за развитие.

Книгите в серията представят всички официални езици на страните членки на ЕС, както и няколко други езика, които се говорят на територията на Европа.

Следните европейски езици имат своя "бяла книга": баски, български (вж. в PDF формат), каталунски, хърватски, чешки, датски, холандски, английски, естонски, фински, френски, галисийски, немски, гръцки, унгарски, исландски, ирландски, италиански, латвийски, литовски, малтийски, норвежки (букмол и ниноршк), полски, португалски, румънски, сръбски, словашки, словенски, испански и шведски. Бялата книга за всеки език е изготвена на съответния език и включва превод на английски.

Коментари 51
Кирилица:
Фонетична
Имате 2000 позволени символа

* Моля, коментирайте конкретната статия и използвайте кирилица! Не се толерират мнения с обидно или нецензурно съдържание, на верска или етническа основа, както и написани само с главни букви!

51 коментара
 
Обратно в сайта X

ДОСТЪП ЗА ЛОГНАТИ ПОТРЕБИТЕЛИ За да пишете, оценявате или докладвате коментари, моля логнете се в профила си.

  1. Запомни ме
забравена парола Полетата маркирани с * са задължителни
Полето Потребителско име не трябва да е празно.
Полето E-mail не трябва да е празно.
Полето Парола не трябва да е празно.
Полето Повторете паролата не трябва да е празно.
  1. Декларирам, че съм се запознал с Общите условия за ползване на услугите на Нетинфо.
Полетата маркирани с * са задължителни

Последни

Русия твърди, че е превзела украинско село в Донецка област

Русия твърди, че е превзела украинско село в Донецка област

Свят Преди 9 минути

В изявлението се посочва, че руската армия е отблъснала серия украински контраатаки в близост до Часов Яр

Теглят номерата на машините, които ще бъдат удостоверени за съответствие за вота 2 в 1

Теглят номерата на машините, които ще бъдат удостоверени за съответствие за вота 2 в 1

България Преди 30 минути

Публичното теглене ще се извърши в присъствието на служебния министър-председател и министър на външните работи Димитър Главчев

Нещата у дома, които могат да бъдат вредни за здравето

Нещата у дома, които могат да бъдат вредни за здравето

Любопитно Преди 2 часа

На кои предмети вкъщи трябва да обърнем внимание четете в следващите редове

<p>Калейн грабна бронзов медал на обръч в Ташкент</p>

Боряна Калейн взе бронзов медал във финала на обръч на Световната купа в Ташкент

Любопитно Преди 2 часа

Възпитаничката на Марияна Памукова Калейн изигра много добре композицията си

<p>Борисов: Ще работя с ПП само при тези условия</p>

Борисов: Ще работя с ПП само при доминираща роля на ГЕРБ - с наши министри и програма

България Преди 3 часа

Моят противник на тези избори са проруските партии, посочи лидерът на ГЕРБ

<p>Терзиев: В момента, в който&nbsp;си повярваш, има обстоятелства, които те приземяват</p>

Васил Терзиев: Във всеки един момент, когато си повярваш, има обстоятелства, които те приземяват

България Преди 3 часа

Един от важните за мен уроци, е че отговорността към обществото става все по-голяма с успехите, които натрупваме, заяви кметът на София

<p>Воден ад: Най-малко 70 загинали при наводнения в Кения</p>

Воден ад: Най-малко 70 загинали при наводнения в Кения, дъждовете продължават

Свят Преди 3 часа

Броят на жертвите е два пъти по-висок от обявения по-рано през седмицата

Изненадващо посещение на Мъск в Пекин

Изненадващо посещение на Мъск в Пекин

Любопитно Преди 4 часа

Визитата му не бе оповестена публично, а от Tesla все още няма коментар

<p>Контрера: Археологическите разкопки около храма &bdquo;Св. Неделя&ldquo; са зарити</p>

Карлос Контрера: Археологическите разкопки около храма „Св. Неделя“ са зарити

България Преди 4 часа

Общинският съветник от ВМРО заяви, че ще продължава да търси отговори какво се случва с археологическия обект

<p>Папа Франциск &quot;влезе&quot; в затвор във Венеция (ВИДЕО)</p>

Необичайно решение: Папа Франциск "влезе" в затвор във Венеция (ВИДЕО)

Свят Преди 5 часа

Това е първото му посещение в града от избирането му за папа през 2013 г.

Русия задържа двама журналисти по обвинения "в екстремизъм"

Русия задържа двама журналисти по обвинения "в екстремизъм"

Свят Преди 5 часа

Константин Габов и Сергей Карелин ще бъдат поставени под стража в продължение на минимум два месеца

Стълб от пепел на над 3 км височина: Изригна вулканът Ибу в Индонезия

Стълб от пепел на над 3 км височина: Изригна вулканът Ибу в Индонезия

Свят Преди 5 часа

Изригването, започнало в 00:37 ч. местно време, продължило повече от три минути

Какви са условията за туризъм в планините

Какви са условията за туризъм в планините

България Преди 5 часа

Все още има сняг на над 2200 метра надморска височина

Руска атака с дрон е нанесла щети на хотел в украинския град Николаев

Руска атака с дрон е нанесла щети на хотел в украинския град Николаев

Свят Преди 6 часа

Там са били настанени англоговорящи наемници, воюващи в Украйна

Мощно торнадо в Китай уби най-малко петима души

Мощно торнадо в Китай уби най-малко петима души

Свят Преди 7 часа

По официални данни бурята е нанесла щети на 141 производствени обекта, но няма срутени жилищни сгради