Изследвания


Проблематиката, разработвана в Секцията по компютърна лингвистика, съчетава анализирането на структурата на съвременния български език с разработването на компютърни програми както за оптимизиране на лингвистичната работа (например за създаване на различни типове електронни речници), така и за реална обработка на естествения език (например програми за правописна и граматична корекция, за търсене в Интернет и други).

Основните направления, в които е съсредоточена работата на Секцията по различни научни проекти, са:

 • теоретични проблеми на формалното описание на езика,
 • морфологичен, синтактичен и семантичен анализ,
 • компютърни речници,
 • онтологии и семантични релации,
 • корпусна лингвистика,
 • категоризация и анотация на документи,
 • търсене и извличане на информация,
 • отстраняване на граматична и семантична многозначност,
 • автоматичен превод
 • и други.

В момента нашите приоритети са ориентирани към автоматичното определяне на значението на думите в даден контекст и проблемите на машинния превод.

Резултатите от работата, получени при изпълнението на национални и международни научни проекти, са реализирани в компютърни програми с различно приложение:

 • за съставяне на електронни речници - едноезични, многоезични, тезауруси,
 • за автоматична корекция на правописа,
 • за синтезиране на реч от произволен текст,
 • за отстраняване на граматична многозначност,
 • за автоматично търсене и извличане на информация,
 • за автоматичен превод,
 • за дистанционно обучение
 • и други.

Един от приоритетите на Секцията по компютърна лингвистика е българските езикови ресурси и компютърните програми за тяхната автоматична обработка да са на равнището на останалите европейски езици, така че да могат да се интегрират лесно в различни съвременни компютърни приложения - четящи програми за незрящи, говорещи устройства, автоматично резюмиране на големи по обем документи за нуждите на администрацията, медиите и библиотеките, автоматично търсене на съответните документи в дадена област, интелигенти програми, подпомагащи преводачите и др.

Голяма част от езиковите ресурси, програмите за тяхната обработка и уеб услугите, разработвани от екипа на Секцията по компютърна лингвистика, са достъпни чрез Meta-Share, инициатива в рамките на Мрежата за върхови постижения МЕТА-НЕТ, член на която е Секцията по компютърна лингвистика.