EN BG

Лексикален минимум за нива А1 и А2 по Общата европейска референтна рамка за езиците

Лексикален минимум за А1 и А2 по Общата европейска референтна рамка за езиците

Извадка по ниво и част на речта

Извадка по ниво и тематична област

Местоимения и числителни


Процесът на извличане на лексикалния минимум включва анализ на съдържанието на редица източници – образователни материали, използвани за преподаването на български език като втори на деца и възрастни от 2000 година насам.

Етап 1. Събиране на всички данни

  1. Всички достъпни за използване учебници, учебни помагала и речници са обработени автоматично – прехвърлени в текстов формат, като при възможност са отстранени и грешки при разпознаването на сканираните издания. Подбрани са текстовете с добро качество, които позволяват по-нататъшна обработка. Източниците са изброени по-долу.
  2. Използваните източници за български език са разделени на: 1) учебници и помагала и 2) речници. Речниците са излечени или от самостоятелно публикувани речници, или от обособено речниково съдържание в учебниците. Всички източници са разделени в следните групи според техните заглавия:
  • Материали за ниво А1;
  • Материали за ниво А2;
  • Материали за ниво А без разграничение на поднивата А1 и А2.
  1. В учебниците и учебните помагала всяка дума е приведена автоматично към основна форма. Изчислена е общата честота на думите за А1, А2 и за тези без разграничение между двете нива. При речниците е изчислена общата честота на срещане на думите за А1 и А2, както и за А1 и А2 (когато не са разделени).
  2. На базата на честотата за всяка дума са изчислени и две отделни мерки за А1 и А2, основани на логаритмична функция, приложени върху разделените материали за двете нива:

LOG = log10 (DF^2 +1) + log10 (ACF +1)

DF – брой речници за съответното ниво, в които се среща думата, ACF – средна честота на думата в учебниците (обща честота, разделена на броя учебници за съответното ниво). (Добавянето на 1 осигурява, че стойността под логаритъма ще е положителна, в случай че някоя от честотите е 0.) 

  1. За всяка дума е посочена и част на речта, към която се отнася. 
  2. В допълнение към българските данни е извършено и съотнасяне с вече определените лексикални минимума за два чужди езика – английски (https://www.cambridgeenglish.org/) и италиански (https://www.unistrapg.it/), които следват Общата европейска референтна рамка за езиците.

За думите в чуждите минимуми са извлечени техните потенциални преводни съответствия през Българския уърднет (който е съотнесен с английски и италиански). Разглеждани са думите от базовата лексика (която е маркирана в Уърднет) от всички синсети на български, които съответстват на синсети на чуждия език, съдържащи чуждата дума, а от тях е избран преводният еквивалент, който се среща в най-много на брой синсети. Когато преводен еквивалент не е намерен, е използван автоматичен превод.

  1. От речниците сред извлечените единици има и несвободни фрази, някои от които са запазени в данните.
  2. В някои случаи са отбелязани допълнителни особености, свързани с употребата – например глаголи, които се употребяват предимно в третолични форми или съществителни имена, които имат форма за ед. ч., но се срещат предимно във форма за мн. ч. (например сандал).
  3. При извличането на думите от речници, както и от английски и италиански, в допълнение са отбелязани и тематичните области там, където такива има. На базата на всички приписани тематични области е направено автоматично съотнасяне с определените вече тематични области на лексикалния минимум. Приложени са прости евристики, при които се търси пълно или частично съвпадение между тематична област от приписаните и тематичните области на минимума и др.

Етап 2. Филтриране на данните

  1. Първоначалното филтриране включва автоматично сортиране на думите по обща честота, за да бъдат избрани думите, най-често използвани от авторите на речници и учебници за начално ниво на владеене на езика. По този начин бяха подбрани около 3000 думи общо.
  2. Втората стъпка на филтриране включва извличането на думите, които с най-голяма вероятност са за ниво А1 – това са думите с висока (лог) честота в речници за А1 и във всички учебници (тъй като думите от А1 се използват и в следващите нива). 
  3. Направена е частична ръчна проверка на думите във филтрираните данни. 

Основни източници

Алексова, Красимира, Михаела Москова, Ваня Стоева, Ника Акимова, Лилия Халембакова, Живка Колева, Кристофър Кауъл, Александър Герджев. Български език за чужденци. Ниво А1. София, 2015. 379 с.

Андонова, Маргарита, Радост Събева, Жана Загорова. Български език за бежанци. Ниво А1. София: Каритас, 2014. 112 с.

Андонова, Маргарита, Радост Събева, Жана Загорова. Български език за бежанци. Ниво А2. София: Каритас, 2014. 112 с.

Йорданова, Румяна, Цезия Механджиева. Научете бързо български език. Интензивен курс. Учебник, първа част.  Изд. „Д-р Иван Богоров“, 2006. ISBN 954-316-034-1.

Колева-Златева, Живка, Боряна Емилиянова, Валентина Седефчева. Аз говоря български: Български език за чужденци. Ниво А. Първа част [+ 2 CD]. Отг. редактор Живка Колева-Златева. Велико Търново: Фабер, 2004. 156 с. ISBN 954-775-333-9.

Колева, Женя, Людмила Иванова. Български език за чужденци: да общуваме на български. Ниво А. Втора част [+ CD]. Велико Търново: Фабер, 2009. 186 с. ISBN 978-954-400-110-0.

Куртева, Галина, Кръстинка Бумбарова, Стефка Бъчварова. Здравейте! Учебник по български език за чужденци. Нов български университет, София, 2013.

Кънчева, Павлина, Светлана Тодорова. Български език в българска езикова среда. Учебник за чуждестранни студенти в Департамента за езиково обучение и студентски спорт на Медицинския университет – София. Изд. „Артграф“. София, 2012.

Молле, Кунка. Българските думи в количествен и качествен аспект. Изд. „Сема РШ“, София, 2004. ISBN 954-8021-43-9.0

Петрова, Стефка, Правда Цанкова, Елица Куртева Кристина Томова, Иван Илиев. Учете български език. Ниво 1. Софийски университет, ИЧС. Изд. „Д-р Иван Богоров“, София, 2004.

Събева, Радост, Жана Загорова. Български език за бежанци. Работна тетрадка и тестове. Ниво А1. София: Каритас, 2014.

Хаджиева, Елена, Недка Гарибова, Адреана Ефтимова, Мирена Пацева, Анна Слуцка. Български език за чужденци. Общ курс. Университетско издателство „Св. Климент Охридски“, София. 2006. 263 с.

Ivanova, Eleonora. The Bulgarian Language in Practice. A Basic Course in Contemporary Bulgarian as a Foreign Language. Изд. „Веси“, София, 2000.

Чуждестранни източници

Cambridge English, Pre-A1 Starts, A1 Movers and A2 Flyers. Wordlists. Cambridge University Press & Assessment, 2025. CER/6137/V3/JUN25/SMF-Wordlists https://www.cambridgeenglish.org/Images/739104-starters-movers-flyers-word-list-2025.pdf 

Cambridge English Vocabulary List: A2 Key and A2 Key for Schools. August 2025. https://www.cambridgeenglish.org/images/506886-a2-key-2020-vocabulary-list.pdf

Лексикален инвентар на италиански език за ниво А1. https://www.unistrapg.it/profilo_lingua_italiana/site/liste_lessicali_a1.html

Лексикален инвентар на италиански език за ниво А2. https://www.unistrapg.it/profilo_lingua_italiana/site/liste_lessicali_a2.html

Collins Italian. 3000 words and phrases. HarperCollins Publishers. ISBN 978-0-00-832377-6. https://resources.collins.co.uk/Dictionary/CD%20Resources/Collins_Italian_3000_words_and_phrases.pdf

Copyright © 2015-2022 Институт за български език. Всички права запазени.