Изследвания


Проблематиката, разработвана в Секцията по компютърна лингвистика, съчетава анализирането на структурата на съвременния български език с разработването на компютърни програми както за оптимизиране на лингвистичната работа (например за създаване на различни типове електронни речници), така и за реална обработка на естествения език (например програми за правописна и граматична корекция, за търсене в Интернет и други).

Основните направления, в които е съсредоточена работата на Секцията по различни научни проекти, са:

  • теоретични проблеми на формалното описание на езика,
  • морфологичен, синтактичен и семантичен анализ,
  • компютърни речници,
  • онтологии и семантични релации,
  • корпусна лингвистика,
  • категоризация и анотация на документи,
  • търсене и извличане на информация,
  • отстраняване на граматична и семантична многозначност,
  • автоматичен превод
  • и други.

В момента нашите приоритети са ориентирани към автоматичното определяне на значението на думите в даден контекст и проблемите на машинния превод.

Резултатите от работата, получени при изпълнението на национални и международни научни проекти, са реализирани в компютърни програми с различно приложение:

  • за съставяне на електронни речници - едноезични, многоезични, тезауруси,
  • за автоматична корекция на правописа,
  • за синтезиране на реч от произволен текст,
  • за отстраняване на граматична многозначност,
  • за автоматично търсене и извличане на информация,
  • за автоматичен превод,
  • за дистанционно обучение
  • и други.

Един от приоритетите на Секцията по компютърна лингвистика е българските езикови ресурси и компютърните програми за тяхната автоматична обработка да са на равнището на останалите европейски езици, така че да могат да се интегрират лесно в различни съвременни компютърни приложения - четящи програми за незрящи, говорещи устройства, автоматично резюмиране на големи по обем документи за нуждите на администрацията, медиите и библиотеките, автоматично търсене на съответните документи в дадена област, интелигенти програми, подпомагащи преводачите и др.

Голяма част от езиковите ресурси, програмите за тяхната обработка и уеб услугите, разработвани от екипа на Секцията по компютърна лингвистика, са достъпни чрез Meta-Share, инициатива в рамките на Мрежата за върхови постижения МЕТА-НЕТ, член на която е Секцията по компютърна лингвистика.