Програма за разрешаване на анафори
Системата за автоматично разрешаване на местоименна анафора за български език включва следните функционалности: (а) разпознаване и анотиране на антецедентите на местоименните анафори, преди всичко третоличните местоимения в именителен, винителен и дателен падеж; третоличните притежателни, възвратните лични и възвратните притежателни местоимения; относителните местоимения (който и формите му); и (б) откриване на случаите на неизразен подлог и идентифициране на антецедента на неизразения…
ClauseSplitter – програма за разпознаване на простите изречения в рамките на сложното
Програмата разпознава границите на простите изречения в състава на сложното и частично реконструира структурата на сложното изречение чрез отразяване на зависимостите (съчинителни или подчинителни отношения) между отделните прости изречения. Методът използва система от граматични и лексикални шаблони, с помощта на които се идентифицират компонентите от изречението, необходими за изпълнението на задачата, а именно: (а) сказуемите – прости и аналитични форми…
Hydra
Hydra е платформено независима програма за създаване и валидиране на лексикално-семантични мрежи. Програмата дава възможност на потребителите да редактират или търсят в произволен брой уърднети едновременно. Отделните уърднети могат да се синхронизират, което позволява едновременното визуализиране на еквивалентните синонимни множества в различните езици. Фиг. 1. Общ изглед на Hydra с Българския WordNet и Принстънския WordNet версия 3.0. …
Chooser
Общо описание Chooser е многофункционална платформено независима система за езикова анотация, която позволява дефиниране на различни анотационни схеми. Функционалностите по-долу са разгледани с оглед на семантичната анотация. Основните функции, имплементирани в програмата, са следните: бързо и интуитивно анотиране; достъп до детайлна информация за предложените значения чрез синонимните множества в уърднет и информацията, свързана с тях – синоними, тълковни…
Уеб базирани услуги на СКЛ
Общо описание Българската многокомпонентна система за първична обработка и лингвистична анотация (създадена през 2011-2012 година) на текстове включва следните видове езикова обработка: • разделяне на изречения; • токънизация; • автоматично определяне на частта на речта и на граматичните характеристики на думите; • лематизация (автоматично определяне на основната форма). Тагерът BgTagger Тагерът определя най-вероятната част на речта за…
bgMWE – програма за разпознаване на съставни лексикални единици
bgMWE е програма за обработване на корпуси, разпознаване и тагиране на съставни лексикални единици (СЛЕ), създадена през 2012 година. Разработена е на езика за програмиране Java, поради което е платформено независима. bgMWE включва няколко модула, приложими за определени задачи при обработката на езика. До голяма степен програмата е езиково независима и не се нуждае от допълнителни лексикални ресурси. Същевременно позволява…