Изследвания
Проблематиката, разработвана в Секцията по компютърна лингвистика, съчетава анализирането на структурата на съвременния български език с разработването на компютърни програми както за оптимизиране на лингвистичната работа (например за създаване на различни типове електронни речници), така и за реална обработка на естествения език (например програми за правописна и граматична корекция, за търсене в Интернет и други).
Основните направления, в които е съсредоточена работата на Секцията по различни научни проекти, са:
- теоретични проблеми на формалното описание на езика,
- морфологичен, синтактичен и семантичен анализ,
- компютърни речници,
- онтологии и семантични релации,
- корпусна лингвистика,
- категоризация и анотация на документи,
- търсене и извличане на информация,
- отстраняване на граматична и семантична многозначност,
- автоматичен превод
- и други.
В момента нашите приоритети са ориентирани към автоматичното определяне на значението на думите в даден контекст и проблемите на машинния превод.
Резултатите от работата, получени при изпълнението на национални и международни научни проекти, са реализирани в компютърни програми с различно приложение:
- за съставяне на електронни речници - едноезични, многоезични, тезауруси,
- за автоматична корекция на правописа,
- за синтезиране на реч от произволен текст,
- за отстраняване на граматична многозначност,
- за автоматично търсене и извличане на информация,
- за автоматичен превод,
- за дистанционно обучение
- и други.
Един от приоритетите на Секцията по компютърна лингвистика е българските езикови ресурси и компютърните програми за тяхната автоматична обработка да са на равнището на останалите европейски езици, така че да могат да се интегрират лесно в различни съвременни компютърни приложения - четящи програми за незрящи, говорещи устройства, автоматично резюмиране на големи по обем документи за нуждите на администрацията, медиите и библиотеките, автоматично търсене на съответните документи в дадена област, интелигенти програми, подпомагащи преводачите и др.
Голяма част от езиковите ресурси, програмите за тяхната обработка и уеб услугите, разработвани от екипа на Секцията по компютърна лингвистика, са достъпни чрез Meta-Share, инициатива в рамките на Мрежата за върхови постижения МЕТА-НЕТ, член на която е Секцията по компютърна лингвистика.