EN BG
Корпусът Wiki1000+ с анотирани несвободни фрази

Корпусът Wiki1000+ с анотирани несвободни фрази

Общо описание Wiki1000+ е корпус със статии от Уикипедия, създаден за целите на изследването на съставните лексикални единици в българския език. Общата големина на Wiki1000+ е 6311 текстови единици и 13.4 милиона думи. Корпусът е включен в Българския национален корпус. Компилация Корпусът е съставен автоматично с помощта на компютърна програма (уеб кроулер), която последователно обхожда всички страници от българската част…

Българско-английски паралелен корпус със съотнесени изречения и прости изречения

Българско-английски паралелен корпус със съотнесени изречения и прости изречения

Общо описание Българско-английският паралелен корпус със съотнесени изречения и клаузи (BulEnAC) е извадка от Българско-английския паралелен корпус, част от Българския национален корпус (БНК) с обем 260,7 милиона токъна за български и 263,1 милиона токъна за английски. BulEnAC включва 176 397 токъна в българския подкорпус и 190 468 токъна в английския подкорпус (общо 366 865 токъна). Броят на изреченията в българския…

Паралелни корпуси между български и език Х

Паралелни корпуси между български и език Х

Паралелните корпуси (Bul-X-Cor) са част от Българския национален корпус (БНК). БНК е създаден като обща рамка за текстове от различна модалност (писмени – устни), период (съвременни – стари), както и на множество езици (паралелни, при които единият език е български). Паралелните корпуси включват текстове на 48 езика, между които английски, немски, френски, славянски и балкански езики, както и други европейски…

Българският национален корпус

Българският национален корпус

Българският национален корпус е създаден в Института за български език „Проф. Любомир Андрейчин” от сътрудници от Секцията по компютърна лингвистика и Секцията за българска лексикология и лексикография. В него са обединени няколко отделни електронни корпуса, разработени в периода 2001-2009 г. за целите на двете секции. Корпусът непрекъснато се обогатява с нови текстове. Българският национален корпус се състои от едноезикова българска…

Copyright © 2015-2022 Институт за български език. Всички права запазени.