EN BG

Програма за разрешаване на анафори

Системата за автоматично разрешаване на местоименна анафора за български език включва следните функционалности: (а) разпознаване и анотиране на антецедентите на местоименните анафори, преди всичко третоличните местоимения в именителен, винителен и дателен падеж; третоличните притежателни, възвратните лични и възвратните притежателни местоимения; относителните местоимения (който и формите му); и (б) откриване на случаите на неизразен подлог и идентифициране на антецедента на неизразения…

ClauseSplitter – програма за разпознаване на простите изречения в рамките на сложното

ClauseSplitter – програма за разпознаване на простите изречения в рамките на сложното

Програмата разпознава границите на простите изречения в състава на сложното и частично реконструира структурата на сложното изречение чрез отразяване на зависимостите (съчинителни или подчинителни отношения) между отделните прости изречения. Методът използва система от граматични и лексикални шаблони, с помощта на които се идентифицират компонентите от изречението, необходими за изпълнението на задачата, а именно: (а) сказуемите – прости и аналитични форми…

Hydra

Hydra

Hydra е платформено независима програма за създаване и валидиране на лексикално-семантични мрежи. Програмата дава възможност на потребителите да редактират или търсят в произволен брой уърднети едновременно. Отделните уърднети могат да се синхронизират, което позволява едновременното визуализиране на еквивалентните синонимни множества в различните езици.     Фиг. 1. Общ изглед на Hydra с Българския WordNet и Принстънския WordNet версия 3.0.  …

Честотни речници на българския език

Честотни речници на българския език

Общо представяне Честотните речници на българския език са извлечени от Българския национален корпус (БНК), който е най-големият систематично създаден и представителен корпус за български език. Настоящите речници отразяват честотата на употреба на лексикалните единици в Корпуса (версия на БНК: декември 2011).   Основните признаци за класификация на текстовете в БНК са стил, тематична област и жанр. Текстовете са разделени в…

Chooser

Chooser

Общо описание   Chooser е многофункционална платформено независима система за езикова анотация, която позволява дефиниране на различни анотационни схеми. Функционалностите по-долу са разгледани с оглед на семантичната анотация. Основните функции, имплементирани в програмата, са следните:   бързо и интуитивно анотиране; достъп до детайлна информация за предложените значения чрез синонимните множества в уърднет и информацията, свързана с тях – синоними, тълковни…

Уеб базирани услуги на СКЛ

Уеб базирани услуги на СКЛ

Общо описание   Българската многокомпонентна система за първична обработка и лингвистична анотация на текстове включва следните видове езикова обработка: • разделяне на изречения; • токънизация; • автоматично определяне на частта на речта и на граматичните характеристики на думите; • лематизация (автоматично определяне на основната форма).   Тагерът BgTagger   Тагерът определя най-вероятната част на речта за дадена дума в конкретен…

WinEst

WinEst

Общо описание WinEst е система за автоматична проверка на правописа, предназначена за Microsoft Office. Програмата открива и маркира в текста неправилно написаните думи и предлага най-вероятните кандидати за поправка на грешкитe, подредени според тяхната вероятност. WinEst използва експертно създаден речник от милион и половина думи, базиран на електронния граматичен речник, разработен от Секцията по компютърна лингвистика, който съдържа над 85…

MacEst

MacEst

Общо описание   Системата за автоматична проверка на правописа MacEst за Mac OS открива и маркира в текста неправилно написаните думи и предлага най-вероятните кандидати за поправка на грешките. MacEst предоставя пълните възможности за съвременна правописна корекция: експертно съставен речник; който съдържа над един милион думи, и предложения за замяна, които се подреждат според тяхната вероятност. Продуктът е достъпен за…

Copyright © 2015 Институт за български език. Всички права запазени.