EN BG

Електронни езикови ресурси и програми за тяхната обработка (БулНет и ФреймНет)

Българската лексикално-семантична мрежа БулНет е разновидност на семантичните мрежи, която се състои от синонимни множества и различен тип релации (род – вид, част – цяло, причина – следствие, междуезикова еквивалентност и др.). Свойствата на релациите произтичат от универсалните свойства, които съществуват между обекти, събития и техните признаци. Българският ФреймНет също може да се разглежда като тип семантична мрежа – в него се представя връзката на лексикалните единици към абстрактни семантични структури (семантични фреймове) и се описват синтактичните и лексикално-семантичните комбинаторни ограничения при тяхната употреба, илюстрирани посредством семантично и синтактично анотирани примери.

Една от основните цели на проекта е разширяването на Българската лексикално-семантична мрежа БулНет с нови синонимни множества (към момента броят им е 51 000) и техните семантични релации и разширяването на Българския ФреймНет с нови лексикални единици, на които се приписва абстрактно семантично описание и конкретни комбинаторни характеристики на семантично и синтактично равнище.

Резултатите от проекта включват както теоретични изследвания в областта на лексикалния състав и граматичната структура на българския език, така и приложение в няколко основни направления: разширено търсене и извличане на информация, съобразена с профила на потребителите; автоматично резюмиране на документи за нуждите на администрацията, медиите и библиотеките; автоматична категоризация на документи към различни тематични области и др.

Работата по проекта е интердисциплинарна и съчетава научни области като анализ на семантичната и синтактичната структура на съвременния български език и разработване на компютърни програми за оптимизиране на лингвистичната работа и за реална обработка на естествения език.Разработваните по проекта лексикално-семантични мрежи и програми за тяхната обработка се разпространяват посредством центровете META-СПОДЕЛЯНЕ, част от META-NET – мрежа за върхови постижения, в която членуват близо 70 изследователски центъра от 34 страни. Проектът се вписва в две от приоритетните за Института за български език области: Теоретични езиковедски изследвания и Електронни езикови ресурси и програми за тяхната обработка.

Срок: 2014-2016

Вид на проекта: колективен, етап от многогодишен

Финансиране: бюджетна субсидия, БАН – ЕБР с РумАН

Ръководител: проф. д-р Св. Коева

Участници: проф. д-р Св. Коева, гл. ас. д-р Цв. Димитрова, гл. ас. д-р Св. Лесева, д-р Ивелина Стоянова, гл. ас. д-р М. Тодорова, ас. В. Стефанова, Б. Ризов, Лъчезар Джаков, Мартин Ялъмов

Подтеми:

Електронни езикови ресурси и програми за тяхната обработка (БулНет и ФреймНет). Колективен проект. Участници: проф. д-р С. Коева, гл. ас. д-р Цв. Димитрова, гл. ас. д-р Св. Лесева, д-р Ив. Стоянова, Б. Ризов, гл. ас. д-р М. Тодорова, ас. В. Стефанова, Л. Джаков, М. Ялъмов. Срок: 2014 – 2016 г.

Обогатени бази от знания за български и румънски. Колективен проект, договор по ЕБР с Института за изкуствен интелект към Румънската академия. Ръководител от българска страна: гл. ас. д-р Св. Лесева. Участници от българска страна: гл. ас. д-р С. Лесева, гл. ас. д-р Цв. Димитрова, Б. Ризов, гл. ас. д-р М. Тодорова, ас. В. Стефанова. Срок: 2015 – 2017 г.

Форма на представяне на резултатите: многоезикови лексикално-семантични бази от данни, сборник с теоретични студии и статии, софтуер за компютърна обработка на езика.

начало


Copyright © 2015 Институт за български език. Всички права запазени.