EN BG

Семантична мрежа с широк спектър от семантични релации



Срок: 2017-2020

Вид на проекта: колективен

Финансиране: Фонд „Научни изследвания“, договор ДН 10/3 от 14.12.2016 г.



Ръководител: проф. д-р Св. Коева

Участници: проф. д-р Св. Коева, гл. ас. д-р Св. Лесева, гл. ас. д-р Цв. Димитрова, гл. ас. д-р М. Тодорова,гл. ас. д-р В. Стефанова, д-р Ив. Стоянова, Б. Ризов, Д. Христов, М. Ялъмов; проф. д-р Тинко Тинчев (СУ „Св. Климент Охридски“), проф. Мачей Пясецки (Вроцлавски технически университет, Полша).

Резюме:

Проектът предлага фундаментално научно изследване в областта на семантиката на естествения език. Семантичните мрежи са форма на представяне на познание във вид на граф, в който възлите са понятия или факти (имена, дати и др.), а дъгите между тях изразяват различни семантични отношения (релации). Основната цел на проекта е обогатяването на лексикално-семантичната мрежа Уърднет с гъста мрежа от семантични релации, като основният обект на изследване е Българският Уърднет. Обогатяването се постига чрез представяне на концептуални фреймове, кодиращи обобщено семантичните релации между предикат и аргументи.

За да се дефинира кои са потенциалните аргументи към конкретен предикат, се предлага детайлното онтологично представяне на семантичните класове на именните и глаголните синонимни множества в Уърднет. 82 114 синонимни множества на съществителни имена в Уърднет, групирани в 25 семантични класа, са съотнесени с 253 семантични типа в общо 171 359 съотнасяния (резултати). 13 465 глаголни синонимни множества, групирани в 15 семантични класа, са класифицирани посредством фреймове от Фреймнет и класове и суперкласове от Върбнет (резултати).

Изследването се фокусира върху определянето на множеството от потенциални семантични релации за всеки клас глаголи с оглед на това да се идентифицират синонимни множества на съществителни имена, с които влизат в определени семантични отношения. За целта са изследвани семантичните релации, които обединяват няколко по-специфични релации в Уърднет или до момента не са въведени в структурата на Уърднет. Установено е, че при многократната конюнктивна хиперонимия, единият хипероним (може да) изразява същинска хиперонимия, а вторият хипероним (и следващите) изразяват някоя от следните семантични релации: произход, форма или функция. В рамките на морфосемантичните релации (14 семантични релации между глаголно и именно синонимно множество, за които свидетелстват деривационни връзки) се показва, че морфосемантичните релации не са неразложими, а обединяват по-специфични релации като: агенс, актор, експериенцер, реципиент, причинител, пациенс, явление артифакт, локатив, съдържание, тема, цел, резултат, инструмент. Описани са семантични релации между глаголно и именно синонимно множество, съответстващи на семантичните отношения между предикат и аргументи, които до момента не са въведени в в Уърднет: агенс, пациенс, причинител, експериенцер, възприемател, реципиент, тема, средство, дестинация, източник, локатив, протагонист, познавателен субект, характеристика. Представени са семантиката и формалните свойства на новите релации.

Концептуалните фреймове се разглеждат като абстрактни структури, които се описват посредством уникално множество от семантични релации между: a) фрейм, представляван от глаголни предикати, организирани в синонимни множества на Уърднет и асоциирани с определен семантичен клас, който отразява свойствата на фрейма; б) елементи на фрейма, представяни от синонимни множества на съществителни имена, съотнесени с определен семантичен клас, който представя свойствата на елементите на фрейма; в) семантичните релации между фрейма и неговите елементи.

Компонентите от теоретичното описание на концептуалните фреймове, представящи съчетаемостта между семантични релации, глаголно синонимно множество от даден семантичен клас и множеството от именни синонимни множества, принадлежащи към даден семантичен клас или класове, включват дефиниране на йерархия от фреймови елементи, йерархия от семантични (предикатно-аргументни и предикатно-адюнктни) релации и основни семантични типове на фреймовите елементи. В рамките на приписаните фреймове към глаголните синонимни множества в Уърднет 5 025 фрейма са проверени ръчно.

Изследвани са условията, при които именни синонимни множества, между които няма семантична релация в Уърднет, могат да бъдат свързани семантично на базата на съществуващи връзки в структурата с глагол или прилагателно име. Формулирани са 21 нови семантични релации и 2 814 синонимни множества на съществителни имена са свързани от експерти с 589 релации.

Автоматично са приписани 2 904 глаголни модела на 2 593 глаголни синонимни множества в Уърднет (глаголните модели се състоят от подредени списъци с фреймове, чиито елементи се реализират като именни групи, които споделят общ семантичен компонент, представен от семантичния тип на елемента). В резултат на ръчна проверка и допълване общият брой на глаголните синонимни множества с приписаните модели в Уърднет е 3 986.

Семантичната мрежа с широк спектър от семантични релации е изключително полезна за работата на учени, редактори, преводачи и граждани с интерес към българския език и намира приложение в компютърната обработка на езика: за автоматичен превод, за автоматичен семантичен анализ (оценка на мнението на потребителите, проследяване и предсказване на събития, преобразуване и опростяване на текстове), за автоматично търсене и извличане на информация (създаване на кратки резюмета, класификация на документи, автоматично отговаряне на въпроси).

Резултатите от втория етап на проекта са представени в 19 публикации в индексирани и реферирани издания (SCOPUS, Web ISI, ERIH+) и на 5 международни конференции. Публикуван е специален рецензиран сборник със студии на английски език, който е одобрен за разпространение чрез базата данни CEEOL и базата данни РИНЦ.

Организирани са 2 публични семинара, както и Специална сесия за Уърднет и онтологии към четвъртото издание на международната конференция Компютърната лингвистика в България (2020).

Резултатите са публикувани и в сборник от студии:
➥ Koeva, S. (ed.) Towards a Semantic Network Enriched with a Variety of Semantic Relations. Prof. Marin Drinov Academic Publishing House of Bulgarian Academy of Sciences. Sofia, 2020. ISBN 978-619-245-057-1. DOI: 10.7546/TSN.2020

Copyright © 2015-2022 Институт за български език. Всички права запазени.