Структура

Структурата на корпуса се придържа към три основни принципа: експлицитни дефиниции на категориите, ясно установена структура и гъвкавост. Структурата не е предефинирана и фиксирана. Корпусните единици са снабдени с подробни метаданни, което позволява извличането на подкорпуси със специфична структура и характеристики.

 

Езикът отразява комуникацията в следните аспекти: функция и роля на участниците (стил), тематично съдържание (тематична област) и композиционна структура (жанр). Взаимовръзките между тези характеристики са важни за изграждането на добър модел за описание и класификация на текстовите единици. Поради това дизайнът на БНК се обляга на следните три основни признака за класификация – стил, тематична област и жанр.

 

1. Стил. Стилът се дефинира като обща комплексна текстова категория, която комбинира понятията за регистър (англ. register), модалност (англ. mode) и дискурс. В системата на БНК са включени следните стилове: административен, научен, публицистичен, художествен, разговорен, художествен/разговорен (субтитри), научно-популярен и популярен.

 

2. Тематична област. Всеки стил представя набор от тематични области. По принцип тематичните области са зависими от стила, но съществуват и такива, които се появяват в различни стилове. Например текстове, свързани с икономика или политика могат да се появят в научния стил и в публицистичния стил. Позволява се и класифициране по две тематични области поради големия процент текстове с комбинирана тематика.

 

3. Жанр. За целите на БНК приемаме, че жанрът се определя от вътрешните формални характеристики на текста (писмен или устен). Използвана е общоприета класификация на жанровете, основана на стила.

 

Повече детайли за класификационната схема на БНК могат да бъдат намерени тук