EN BG

Hydra

Hydra е платформено независима програма за създаване и валидиране на лексикално-семантични мрежи. Програмата дава възможност на потребителите да редактират или търсят в произволен брой уърднети едновременно. Отделните уърднети могат да се синхронизират, което позволява едновременното визуализиране на еквивалентните синонимни множества в различните езици.     Фиг. 1. Общ изглед на Hydra с Българския WordNet и Принстънския WordNet версия 3.0.  …

WinEst

Общо описание WinEst е система за автоматична проверка на правописа, предназначена за Microsoft Office. Програмата открива и маркира в текста неправилно написаните думи и предлага най-вероятните кандидати за поправка на грешкитe, подредени според тяхната вероятност. WinEst използва експертно създаден речник от милион и половина думи, базиран на електронния граматичен речник, разработен от Секцията по компютърна лингвистика, който съдържа над 85…

bgMWE – програма за разпознаване на съставни лексикални единици

bgMWE е програма за обработване на корпуси, разпознаване и тагиране на съставни лексикални единици (СЛЕ). Разработена е на езика за програмиране Java, поради което е платформено независима. bgMWE включва няколко модула, приложими за определени задачи при обработката на езика. До голяма степен програмата е езиково независима и не се нуждае от допълнителни лексикални ресурси. Същевременно позволява интегрирането на лексикални ресурси,…

Уеб сървис за колокации

Описание   Сървисът за колокации е уеб базирана услуга за търсене и извличане на статистическа информация за асоциацията на думата от заявката и нейните колокати от Българския национален корпус, включително в паралелните корпуси. Сървисът ползва NoSketchEngine, система за обработка на корпуси, комбинираща Manatee и Bonito.   Достъп   Сървисът за колокации е REST уеб услуга, която поддържа комплексни http заявки….

Честотни речници на българския език

Общо представяне Честотните речници на българския език са извлечени от Българския национален корпус (БНК), който е най-големият систематично създаден и представителен корпус за български език. Настоящите речници отразяват честотата на употреба на лексикалните единици в Корпуса (версия на БНК: декември 2011).   Основните признаци за класификация на текстовете в БНК са стил, тематична област и жанр. Текстовете са разделени в…

Chooser

Общо описание   Chooser е многофункционална платформено независима система за езикова анотация, която позволява дефиниране на различни анотационни схеми. Функционалностите по-долу са разгледани с оглед на семантичната анотация. Основните функции, имплементирани в програмата, са следните:   бързо и интуитивно анотиране; достъп до детайлна информация за предложените значения чрез синонимните множества в уърднет и информацията, свързана с тях – синоними, тълковни…

Уеб базирани услуги на СКЛ

Общо описание   Българската многокомпонентна система за първична обработка и лингвистична анотация на текстове включва следните видове езикова обработка: • разделяне на изречения; • токънизация; • автоматично определяне на частта на речта и на граматичните характеристики на думите; • лематизация (автоматично определяне на основната форма).   Тагерът BgTagger   Тагерът определя най-вероятната част на речта за дадена дума в конкретен…

MacEst

Общо описание   Системата за автоматична проверка на правописа MacEst за Mac OS открива и маркира в текста неправилно написаните думи и предлага най-вероятните кандидати за поправка на грешките. MacEst предоставя пълните възможности за съвременна правописна корекция: експертно съставен речник; който съдържа над един милион думи, и предложения за замяна, които се подреждат според тяхната вероятност. Продуктът е достъпен за…

Copyright © 2015 Институт за български език. Всички права запазени.