EN BG

PARSEME: PARSing and Multi-word Expressions

Беше изготвен корпус с анотирани глаголни СЛЕ с обем 21 599 изречения и 480 413 думи, който включва 6721 анотирани глаголни СЛЕ. Анотацията беше извършена на две фази – фаза 1.0 (2017 г.) и фаза 1.1 (2018 г.). Количественото разпределение на типовете глаголни единици в корпуса е представено в таблица 1 по-долу.

При анотацията е използвана класификацията на глаголните СЛЕ, възприета в рамките на проекта PARSEME: (а) глаголни фразеологизми, или идиоми (verb idioms, VID), с неразложимо значение (напр. гушвам букета, обирам си крушите); (б) глаголни СЛЕ с десемантизиран глагол (light verb constructions, LVC), които се разделят на два подкласа: същински (LVC.full; напр. имам възможност) и каузативни (LVC.cause; напр. давам възможност); (в) глаголи със задължителни частици се или си (inherently reflexive verbs, IRV, напр. усмихвам се, спомням си); (г) глаголни конструкции, в които съчетанието на глагол с определен предлог носи специфично значение (inherently adpositional verbs, IAV, напр. заставам зад = подкрепям).

Тип Брой % от всички
глаголни фразеологизми     1 260 18,8%
същински глаголни СЛЕ с десемантизиран глагол     1 909 28,5%
каузативни глаголни СЛЕ с десемантизиран глагол     222 3,3%
глаголни СЛЕ, задължително съдържащи частици се или си     3 223 48,1%
глаголни СЛЕ с предлози, придаващи специфично значение     90 1,3%
ОБЩО     6 704    100%

PARSEME Corpus 1.1 (2018): GitLab | LINDAT/CLARIN

PARSEME Corpus 1.0 (2017): GitLab

Annotation notes

Официални указания за анотация

Примери

Copyright © 2015-2022 Институт за български език. Всички права запазени.