Беше изготвен корпус с анотирани глаголни СЛЕ с обем 21 599 изречения и 480 413 думи, който включва 6721 анотирани глаголни СЛЕ. Анотацията беше извършена на две фази – фаза 1.0 (2017 г.) и фаза 1.1 (2018 г.). Количественото разпределение на типовете глаголни единици в корпуса е представено в таблица 1 по-долу.
При анотацията е използвана класификацията на глаголните СЛЕ, възприета в рамките на проекта PARSEME: (а) глаголни фразеологизми, или идиоми (verb idioms, VID), с неразложимо значение (напр. гушвам букета, обирам си крушите); (б) глаголни СЛЕ с десемантизиран глагол (light verb constructions, LVC), които се разделят на два подкласа: същински (LVC.full; напр. имам възможност) и каузативни (LVC.cause; напр. давам възможност); (в) глаголи със задължителни частици се или си (inherently reflexive verbs, IRV, напр. усмихвам се, спомням си); (г) глаголни конструкции, в които съчетанието на глагол с определен предлог носи специфично значение (inherently adpositional verbs, IAV, напр. заставам зад = подкрепям).
Тип | Брой | % от всички |
глаголни фразеологизми | 1 260 | 18,8% |
същински глаголни СЛЕ с десемантизиран глагол | 1 909 | 28,5% |
каузативни глаголни СЛЕ с десемантизиран глагол | 222 | 3,3% |
глаголни СЛЕ, задължително съдържащи частици се или си | 3 223 | 48,1% |
глаголни СЛЕ с предлози, придаващи специфично значение | 90 | 1,3% |
ОБЩО | 6 704 | 100% |
PARSEME Corpus 1.1 (2018): GitLab | LINDAT/CLARIN
PARSEME Corpus 1.0 (2017): GitLab