Електронни езикови ресурси и програми за тяхната обработка (БулНет и ФреймНет)
Срок: 2011-2013, 2014-2016, 2017-2020 Вид на проекта: колективен Финансиране: бюджетна субсидия, БАН – ЕБР с РумАН, Програма за подпомагане на младите учени – БАН, Фонд „Научни изследвания“ Ръководител: проф. д-р Св. Коева Участници: проф. д-р Св. Коева, гл. ас. д-р Цв. Димитрова, гл. ас. д-р Св. Лесева, гл. ас. д-р М. Тодорова, д-р Ивелина Стоянова, ас. В. Стефанова, Б. Ризов,…
PARSEME: PARSing and Multi-word Expressions
Беше изготвен корпус с анотирани глаголни СЛЕ с обем 21 599 изречения и 480 413 думи, който включва 6721 анотирани глаголни СЛЕ. Анотацията беше извършена на две фази – фаза 1.0 (2017 г.) и фаза 1.1 (2018 г.). Количественото разпределение на типовете глаголни единици в корпуса е представено в таблица 1 по-долу. При анотацията е използвана класификацията на глаголните СЛЕ,…
Обогатени бази от знания за български и румънски
Срок: 2015-2017 Вид на проекта: колективен Финансиране: договор по ЕБР с Института за изкуствен интелект към Румънската академия Ръководител от българска страна: гл. ас. д-р Св. Лесева Участници от българска страна: гл. ас. д-р С. Лесева, гл. ас. д-р Цв. Димитрова, Б. Ризов, гл. ас. д-р М. Тодорова, ас. В. Стефанова. Анотация:
CESAR: Central and South-east europeAn Resources
Международен проект, финансиран по програмата на ЕС ICT PSP Проектът CESAR, в сътрудничество с META-NET, цели увеличаването, подобряването, стандартизацията и междуезиковите връзки на широк кръг от езикови ресурси и програми за обработка на езика. Проектът ще направи достъпни множество езикови ресурси и програми за български, унгарски, полски, хърватски, сръбски и словашки, които включват едно- и многоезикови корпуси, речници, лексикално-семантични мрежи…