
Автоматичният превод на Механизма за свързване на Европа за Председателството на Съвета на Европа
Институтът за български език и членове на Секцията по компютърна лингвистика вземат участие в проекта „Автоматичният превод на Механизма за свързване на Европа за Председателството на Съвета на Европа (CEF Automated Translation for the EU Council Presidency)“, финансиран от Механизма за свързване на Европа на Европейската комисия, Програма на Сектор „Телекомуникации“, номер 2016-EU-IA-0121 I. Системата „Преводач“ за Председателството на Съвета…

Обогатяване на лингвистични ресурси с деривационно свързани несвободни фрази
Срок: 2018-2020 Вид на проекта: колективен Финансиране: договор по ЕБР с Института за изкуствен интелект към Румънската академия Ръководител от българска страна: гл. ас. д-р Св. Лесева Участници от българска страна: гл. ас. д-р С. Лесева, гл. ас. д-р Цв. Димитрова, Б. Ризов, гл. ас. д-р М. Тодорова, гл. ас. д-р В. Стефанова, д-р Ив. Стоянова. Анотация: Основната цел на…

Българският национален корпус
Срок: 2017 – 2019 Вид на проекта: колективен Финансиране: бюджетна субсидия Ръководител: проф. д-р Св. Коева Участници: проф. д-р Св. Коева, гл. ас. д-р Цв. Димитрова, гл. ас. д-р Св. Лесева, гл. ас. д-р М. Тодорова, д-р И. Стоянова, Б. Ризов, Л. Джаков, М. Ялъмов. Анотация: Целите на проекта са насочени към по-нататъшно увеличаване на обема на Българския национален корпус…

Електронни езикови ресурси и програми за тяхната обработка (БулНет и ФреймНет)
Срок: 2011-2013, 2014-2016, 2017-2020 Вид на проекта: колективен Финансиране: бюджетна субсидия, БАН – ЕБР с РумАН, Програма за подпомагане на младите учени – БАН, Фонд „Научни изследвания“ Ръководител: проф. д-р Св. Коева Участници: проф. д-р Св. Коева, гл. ас. д-р Цв. Димитрова, гл. ас. д-р Св. Лесева, гл. ас. д-р М. Тодорова, д-р Ивелина Стоянова, ас. В. Стефанова, Б. Ризов,…

PARSEME: PARSing and Multi-word Expressions
Беше изготвен корпус с анотирани глаголни СЛЕ с обем 21 599 изречения и 480 413 думи, който включва 6721 анотирани глаголни СЛЕ. Анотацията беше извършена на две фази – фаза 1.0 (2017 г.) и фаза 1.1 (2018 г.). Количественото разпределение на типовете глаголни единици в корпуса е представено в таблица 1 по-долу. При анотацията е използвана класификацията на глаголните СЛЕ,…

Обогатени бази от знания за български и румънски
Срок: 2015-2017 Вид на проекта: колективен Финансиране: договор по ЕБР с Института за изкуствен интелект към Румънската академия Ръководител от българска страна: гл. ас. д-р Св. Лесева Участници от българска страна: гл. ас. д-р С. Лесева, гл. ас. д-р Цв. Димитрова, Б. Ризов, гл. ас. д-р М. Тодорова, ас. В. Стефанова. Анотация:

CESAR: Central and South-east europeAn Resources
Международен проект, финансиран по програмата на ЕС ICT PSP Проектът CESAR, в сътрудничество с META-NET, цели увеличаването, подобряването, стандартизацията и междуезиковите връзки на широк кръг от езикови ресурси и програми за обработка на езика. Проектът ще направи достъпни множество езикови ресурси и програми за български, унгарски, полски, хърватски, сръбски и словашки, които включват едно- и многоезикови корпуси, речници, лексикално-семантични мрежи…