Заглавна

 

 

Научните ми интереси са в областта на:

  • Компютърна лингвистика и обработка на езика;
  • Проблеми на формалното описание на езика;
  • Онтологии.

В момента изследванията ми са съсредоточени върху:

  • Проблеми на автоматичния превод;
  • Синтактичен анализ;
  • Семантични и синтактични алтернации.

Някои от проблемите, езиковите ресурси и програмите за тяхната обработка, върху които съм работила, са:

  • Правописна и граматична корекция на българския език: ItaEst - Taka e! за Microsoft Office, MacEst за Mac OS, WinEst и WinEst+ за Microsoft Office. Програмите за правописна корекция се базират на Граматичния речник на българския език, който съдържа над 85 000 основни форми и над 1 млн. правилни словоформи.
  • Основен изследовател и координатор при създаването на някои големи езикови ресурси за български език: Българския wordnet - лексикално-семантична мрежа, която съдържа над 33 000 синонимни множества; Българския национален корпус, състоящ се от над 450 000 000 думи; граматично и семантично анотирани български корпуси, Българския FrameNet и др.
  • Координатор при създаването на основни програми за лингвистична обработка на българския език: за предварителна обработка на текста (токънизатор, тагер, лематизатор); за създаване на различни типове граматики (на фразова структура, на граматични грашки, на именувани обекти и т.н.) тяхното приложение като карйни автомати и др.