EN BG

Гл. ас. д-р Мария Тодорова



Главен асистент
Секция по компютърна лингвистика

Телефон: 02 9792971

Имейл: maria@dcl.bas.bg

Адрес:
Институт за български език,
ул. “Шипченски проход” 52, София 1113
Кабинет 613

Профили: ResearchGate | ORCID | Google Scholar

Интереси

  • теоретична лингвистика– морфо-синтактични явления, лексикална семантика, аргументна структура, синтаксис;
  • компютърна лингвистика и компютърна обработка на естествения език– компютърни речници, лексикално-семантични мрежи, семантични релации, корпуси, лингвистична анотация.

Постижения

Образование

25.03.2015 – придобиване на докторска степен по „Общо и сравнително езикознание и компютърна лингвистика“
2006 – 2009 – Секция по компютърна лингвистика, Институт за български език – Българска академия на науките, докторант по компютърна лингвистика.
2002 – 2003 – Факултет по славянски филологии, Софийски университет „Свети Климент Охридски“, магистър по компютърна лингвистика и интернет технологии.
1998 – 2002 – Факултет по славянски филологии, Софийски университет „Свети Климент Охридски“, бакалавър по българска филология
1993 – 1998 – Езикова гимназия „Гео Милев“, гр. Добрич, английски език, немски език.
Специализации:
2012 – 2014 г. Постдокторантска специализация по проект „Интегриране на нови практики и знания в обучението по компютърна лингвистика”, София, България.
23 – 29.08.2014. Специализация в Дъблин, Ирландия – COLING 2014.
04 – 10.08.2013. 51-ва годишна среща на Асоциацията по компютърна лингвистика. Обучение.
10 – 16.08.2013. Двадесет и пето международно лятно училище по логика и лингвистика ESSLLI 2013 в Университета Хайнрих Хайне, в Дюселдорф, Германия. Обучение.

Професионален опит

01.09. 2015 – досега – Секция по компютърна лингвистика, Институт за български език – Българска академия на науките – главен асистент
2011 – 2013 – Секция по компютърна лингвистика, Институт за български език – Българска академия на науките – асистент
2004 – 2011 – Секция по компютърна лингвистика, Институт за български език – Българска академия на науките – проучвател
2002 – 2005 – Учител по български език и литература

Преподавателска дейност

Лекции по „Увод във формално описание на естествените езици“ към Магистърската програма Компютърна лингвистика и интернет технологии към, Софийски университет „Свети Климент Охридски“ 2021 – 2022, 2022 – 2023 г.
Лекции по „Формално описание на естествените езици“ към СУ „Свети Климент Охридски“ 2020 – 2021, г.
Лекции по „Корпусна лингвистика“ към Магистърската програма Компютърна лингвистика и интернет технологии към, Софийски университет „Свети Климент Охридски“, 2016 – 2017, 2017 – 2018, 2018 – 2019 г.

Семинарни занятия по „Увод в общото езикознание“ към СУ „Свети Климент Охридски“, 2015 – 2016, 2016 – 2017, 2017- 2018 г.
2020 – досега: преподавател по „Формално описание на естествения език“ към Магистърската програма Компютърна лингвистика и интернет технологии към, Софийски университет „Свети Климент Охридски“
2016 – 2019: преподавател по „Корпусна лингвистика“ към Магистърската програма Компютърна лингвистика и интернет технологии към, Софийски университет „Свети Климент Охридски“
2016 – 2017: ментор в рамките на проекта „Студентски практики“, финансиран по Оперативна програма „Развитие на човешките ресурси“, съфинансирана от Европейския социален фонд
2015 – 2016: преподавател по „Корпусна лингвистика“ към Магистърската програма Компютърна лингвистика и интернет технологии към, Софийски университет „Свети Климент Охридски“
2015 – 2016: асистент по „Увод в общото езикознание“, Софийски университет „Свети Климент Охридски“
Проведени курсове: „Езикови ресурси и технологии в обучението по български език“ за повишаване на квалификацията на учители по български език (съвместно с Ат. Атанасова; Цв. Георгиева Цв. Димитрова) – София 2017; София 2018; Дупница 2018 г.

Доклади и лекции на научни събития у нас
Лекция на тема „Седем интересни приложения на Българския национален корпус”, изнесена на Лингвистичен семинар към Катедрата по български език на Факултета по славянски филологии на Софийския университет на 16.05.2016 г. (заедно със Светла Коева, Мария Тодорова, Цветана Димитрова)
Представяне на резултатите от научната работа на семинар на СКЛ на 22.08.2014 г. Презентация на тема “Типология и свойства на устойчиви словосъчетания в български”.

Участие в публично представяне на семинар на СКЛ на 08.09.2014 г. Презентция на тема “Разработване на речници за съставни лексикални единици за български език за целите на компютърната лингвистика”.

Лекция на тема „Унификационни граматики. Представяне на информацията в речника и правилата”, изнесена пред студенти от Софийския университет на 28.05.2014 г.

Семинар „Изследователски методи в помощ на преподаването по български език“, организиран от ИБЕ и НИ „Аз Буки“ – МОН

Участие в образователни кампании
2014 – досега: Участие в образователната инициатива на Института за български език „Написаното остава! Пиши правилно!“
2016: Участие в съвместния проект „Заедно напред“ с НИОН „Аз Буки“, насочен към образователната интеграция на децата и учениците от етническите малцинства (Договор БС – 33.14-1-061/01.10.2015)

Проекти

2018 – 2019 – участник в проекта „Обогатяване на лингвистични ресурси с деривационно свързани несвободни фрази“; Институт за български език, Българска академия на науките; проект с бюджетно финансиране;

2017 – 2019 – участник в проекта „Семантична мрежа с широк спектър от семантични релации“; финансиран от Фонд „Научни изследвания“ (Н10/39);

2017 – 2019 – участник в проекта „Семантични ресурси и програми за обработка на езика (БулНет и ФреймНет)“; Институт за български език, Българска академия на науките; проект с бюджетно финансиране;

2017 – 2019 – участник в проекта „Българският национален корпус“; Институт за български език, Българска академия на науките; проект с бюджетно финансиране; участник в проекта

2015 – 2017 – участник в проекта „Парсиране и съставни единици. Езикова прецизност и изчислителна ефективност при обработката на естествения език (PARSEME)“, проект финансиран от Европейския съюз по рамкова програма Хоризонт 2020 (COST Action IC1207), участник в проекта

2015 – 2016 – участник в проекта „Логистичен мониторинг и анализ на многоезиково съдържание в интернет (ЛАСИ)“, проект, финансиран по Седма конкурсна сесия на Национален иновационен фонд на Министерството на икономиката (7ИФ – 0243/31.7.15), участник в проекта

2016 – участник в проекта „Заедно напред“; Институт за български език; Министерство на образованието и науката, Център за образователна интеграция на децата и учениците от етническите малцинства, по програма „Осигуряване на равен достъп до качествено образование на деца и ученици от етнически малцинства“; участник в проекта

2014 – 2017 – участник в проекта „Обогатени бази от знания за български и румънски“, международен проект,
финансиран по ЕБР; участник в проекта

2014 – 2016 – участник в проекта „Българският национален корпус“; Институт за български език, Българска академия на науките; проект с бюджетно финансиране; участник в проекта

2014 – 2016 – участник в проекта „Електронни езикови ресурси и програми за тяхната обработка (БулНет и ФреймНет)“, Институт за български език, Българска академия на науките; проект с бюджетно финансиране; участник в проекта

2011 – 2014 – участник в проекта „Българският национален корпус“; Институт за български език, Българска академия на науките; проект с бюджетно финансиране; участник в проекта

2011 – 2013 – участник в проекта „Електронни езикови ресурси и програми за тяхната обработка (БулНет и ФреймНет)“; Институт за български език, Българска академия на науките; проект с бюджетно финансиране; участник в проекта

2012 – 2014 – участник в проекта „Интегриране на нови практики и знания в обучението по компютърна лингвистика“; национален проект по финансова схема Подкрепа за развитието на докторанти, постдокторанти, специализанти и млади учени по ОП Развитие на човешките ресурси на ЕСФ (Договор BG051PO001-3.3.06-0022 );

2012 – 2014 – участник в проекта „От лексикално-семантични мрежи към бази от знания: обогатяване на Българския и Румънския уърднет с морфо-семантична информация“; международен проект, финансиран по ЕБР; участник в проекта

2011 – 2012 – участник в проекта „ЦЕЗАР: Централно и южноевропейски езикови ресурси (CESAR: CEntral and South-east europeAn Resources)“, международен проект, финансиран от Европейската комисия по програма CIP-ICT-PSP.2010.6.1 (Договор 271022);

2010 – 2013 – участник в проекта „Българският национален корпус”, национален проект, финансиран по рамкови програми на ЕС и от НФНИ;

2009 – 2011 – участник в проекта „Математическа логика и компютърна лингвистика: развитие и взаимно проникване“; национален проект по финансова схема „Подкрепа за развитието на докторанти, постдокторанти, специализанти и млади учени” по ОП Развитие на човешките ресурси на ЕСФ (Договор BG051PO001 – 3.3.04/27);

2005 – 2010 – участник в проекта „БулНет – лексикално-семантична мрежа на българския език“; Институт за български език, Българска академия на науките; национален проект с бюджетно финансиране;

2006 – 2008 – участник в проекта „Компютърно разпознаване на говор на български език“, проект на CIELA и ИМИ, БАН;

2005 – 2006 – участник в проекта „Автоматично извличане на информация, базирано на семантични отношения“; международен проект, финансиран по програма RILA (Договор 2/14);

2004 – 2005 – участник в проекта „SpeechLab, синтезатор на българска реч“, проект на БАКЛ;

2001 – 2004 – участник в проекта „БалкаНет – Многоезична семантична мрежа на балканските езици”, международен проект, финансиран по Пета рамкова програма (Договор IST – 2000 – 29388);

Членство в научни организации
Изчислимостта в Европа, член (2011 – досега)
PARSEME (2015 – досега)

Участие в организационни и програмни комитети на конференции

Трета Международна научна конференция „Компютърната лингвистика в България“, 27 – 29 май 2018 г., член на организационния комитет

Юбилейна научна сесия „Съвременни тенденции в езиковедските изследвания“, посветена на 85 години от рождението на проф. д.ф.н. Йордан Пенчев, Пловдив, България, 10 – 11 ноември 2016 г., член на организационния комитет

Втора Международна научна конференция „Компютърната лингвистика в България“, 9 септември 2016 г., член на организационния комитет

Семинар на проекта „Координиране на езиковите ресурси в Европа“ (2016)

Първа Международна научна конференция „Компютърната лингвистика в България“, 4 септември 2014 г., член на организационния комитет

51-ва Годишна среща на Асоциацията за компютърна лингвистика (ACL 2013), София, България, 4 – 9 август 2013, член на местния организационен комитет

Формални подходи към южнославянските и балканските езици (FASSBL 5), София, България, 18 – 20 октомври 2006 г., член на местния организационен комитет

Студии:

Стоянова Ив., Тодорова M. Семантични релации: теоретични и приложни аспекти. В: сп. „Български език“, кн. 2, 2018 г. ISSN:0005-4283

Лесева, Св., Стоянова Ив., Кукова Хр., Тодорова, М. Интегриране на субкатегоризационна информация в релационната структура на УърдНет. Списание “Български език”, кн. 2, 2018 г. ISSN:0005-4283

Koeva, S., S. Leseva. Stoyanova, T. Dimitrova, M. Todorova. Automatic Prediction of Morphosemantic Relations. – In: Proceedings of the Eighth Global Wordnet Conference, Research Institute for Artificial Intelligence – Romanian Academy, 2016, ISBN:978-973-0-20728-6, 168-176.

Тодорова, М. А. Формализиран морфосинтактичен речник на глаголни фразеологизми в български. Известия на Института за български език „Проф. Любомир Андрейчин“, книга ХХIХ, Академично издателство “Проф. Марин Дринов”, 2016, ISSN:0323-9934, 207-243 [Formalized morphosyntactic dictionary of verbal MWEs in Bulgarian]

Лесева, Св., Ив. Стоянова, М. Тодорова, Св. Коева. Езиковите технологии и ресурси – нови перспективи в обучението по български език (Българската лексикално-семантична мрежа Булнет и Българският национален корпус). – Български език и литература, 2016, ISSN:0323–9519, 377-393.

Leseva S., I. Stoyanova, M. Todorova. Towards the Automatic Identification of Light Verb Constructions in Bulgarian. – In: ​Proceedings of the Second International Conference Computational Linguistics in Bulgaria. Sofia: Institute for Bulgarian Language, 2016, pp. 28 – 37. ISSN: 2367-5675.

Тодорова Мария, Росица Декова. Български POS анотиран корпус – особености на граматичната анотация. – В: Езикови ресурси и технологии за български език. София, Академично издателство “Проф. Марин Дринов”, 2014,с. 53-80. ISBN: 978-954-322-797-6.

Стоянова Ивелина, Мария Тодорова. Разработване на речници на съставните лексикални единици в българския език за целите на компютърната лингвистика.. – В: Езикови ресурси и технологии за български език. София,Академично издателство “Проф. Марин Дринов”, 2014, с. 185-202. ISBN: 978-954-322-797-6

Тодорова, М. Съставни единици в Българския семантичен корпус, – B: Българският семантично анотиран корпус, редактор и съставител Св. Коева, София, 2010. С. 166-186 ISBN 978-954-779-124-4.

Статии:

Svetlozara Leseva, Ivelina Stoyanova and Maria Todorova. Classifying Verbs in Word-Net by Harnessing Semantic Resources. Proceedings of the Third International Conference Computational Linguistics in Bulgaria (CLIB 2018), The Institute for Bulgarian Language, 2018, ISSN:2367-5675, 115-125

Лесева, Св., Тодорова, М. БНК – области на приложение. – В: Сборник с доклади от Международната юбилейна конференция на Института за български език „Проф. Любомир Андрейчин“ (София, 15 – 16 май 2017 година). Част 2.

Стоянова, Ив., Тодорова, М., Лесева, Св. Речник на съставните думи в българския език – развитие и перспективи. – В: Сборник с доклади от Международната юбилейна конференция на Института за български език „Проф. Любомир Андрейчин“ (София, 15 – 16 май 2017 година). Част 1. с. 311–319.

Декова, Р., Св. Лесева, М. Тодорова, Ек. Търпоманова. Структурни особености на фрази с опора прилагателно име в българския език. – Български език, 4, 2016, ISSN:0005-4283, 87-94.

Koeva S., I. Stoyanova, M. Todorova, S. Leseva, T. Dimitrova. Metadata Extraction, Representation and Management within the Bulgarian National Corpus. – In: Proceedings of the 4th Workshop on ​ Challenges in the Management of Large Corpora 2016, Portorož (LREC-2016 workshop) ELDA, pp. 33–39.
Stoyanova. I., M. Todorova. Verbal Multiword Expressions in the Bulgarian National Corpus. – В: ​Сборник с докладите от Международната научна конференция „Паисиеви четения“, ​Езикознание, Научни трудове, т. 53, кн. 1, сб. А, 2015, с. 598–609.

Svetla Koeva, Svetlozara Leseva, Ivelina Stoyanova, Tsvetana Dimitrova, Maria Todorova. Automatic
Prediction of Morphosemantic Relations. – In: Proceedings of the 15th Global WordNet Conference, 27– 30 January 2016, Bucharest, Romania.

Stoyanova I., S. Koeva, M. Todorova, S. Leseva. Semi-automatic Compilation of a Very Large Multiword Expression Dictionary for Bulgarian. – In: ​Proceedings of GLOBALEX 2016: Lexicographic Resources for Human Language Technology, Workshop at LREC-2016, Portorož, Slovenia, May 24, 2016, пп. 86 – 95.

Svetlozara Leseva, Ivelina Stoyanova, Maria Todorova, Tsvetana Dimitrova, Borislav Rizov and Svetla Koeva. Automatic Classification of WordNet Morphosemantic Relations. – In: Proceedings of the 5th Workshop on Balto-Slavic Natural Language Processing, Hissar, Bulgaria, 10–11 September 2015, pp. 59–64. //bsnlp-2015.cs.helsinki.fi/bsnlp2015-book.pdf#page=71.

Todorova, M.. On The Automatic Recognition of Bulgarian Verb Idioms. Научни трудове на Пловдивския университет „Паисий Хилендарски”, „Паисиеви четения“, Езикознание, 53, кн. 1, сб. А, 2015, Университетско издателство „Паисий Хилендарски”, 2015, ISSN:0861-0029, 587-598

Тодорова, М., Ив. Стоянова, Св. Лесева. Лингвистично описание и компютърна обработка на съставни именувани същности в българския език. – В: ​Сборник с доклади от Седмата международна конференция по лексикография и лексикология „Лексикографията в началото на XXI в.“. София: Академично издателство „Проф. Марин Дринов“, 2016, с. 687 – 694. ISBN: 978-954-322-875-1.

Тодорова, М., Цв. Димитрова. Родително-дателни конструкции в рамките на фразеологизацията. – В: ​Сборник с доклади от Юбилейната научна сесия „Морфология, синтаксис, прагматика“ в чест на 75-годишнината на проф. д.ф.н. Руселина Ницолова. (приета за печат: 2016).

Мария А. Тодорова. Типология и свойства на устойчиви словосъчетания в българския език. Глаголни фразеологизми. Дисертация за присъждане на научно-образователната степен “доктор” в професионално направление – Филология( компютърна лингвистика). 25.03.2015 (pdf)

Svetlozara Leseva, Ivelina Stoyanova, Borislav Rizov, Maria Todorova, Ekaterina Tarpomanova. Automatic Semantic Filtering of Morphosemantic Relations inWordNet. – In: Proceedings of CLIB 2014, София: ИБЕ, 2014, pp. 14 – 22. ISBN:2367-5578. //dcl.bas.bg/clib/wpcontent/uploads/2014/07/CLIB2014_Proceedings.pdf

Ekaterina Tarpomanova, Svetlozara Leseva, Maria Todorova, Tsvetana Dimitrova, Borislav Rizov. Noun-Verb Derivation in the Bulgarian and the Romanian WordNet – A Comparative Approach. – In: Proceedings of CLIB 2014, София: ИБЕ, 2014, pp. 23 -31. ISBN:2367-5578. //dcl.bas.bg/clib/wp-content/uploads/2014/07/CLIB2014_Proceedings.pdf

Тодорова Мария, Христина Кукова, Светлозара Лесева. Семантично анотирани ресурси за български език – БулСемКор. – В: Езикови ресурси и технологии за български език. Състав. и научн. ред. Св. Коева, Д. Благоева, Т. Тинчев. София: Академично издателство „Марин Дринов“, 2014.

Koeva, S., S. Leseva, B. Rizov, E. Tarpomanova, T. Dimitrova, H. Kukova, M. Todorova. Design and Development of the Bulgarian Sense-Annotated Corpus. – In: Proceedings of the Third International Corpus Linguistics Conference (CILC), 7-9 April 2011, Valencia, Spain.

Тодорова, М. Организация на лингвистичната информация в компютърен морфологичен речник на български глаголни фразеологизми, – B: Доклади от Петата конференция по лексикология и лексикография, 2010 г. с. 331-344.

Тодорова, М. Лексикализирана граматика на български глаголни фразеологизми, – B: сп. Български език, 2009 г., кн. 3, с. 70 – 83.

Maria Todorova, Nikola Obreshkov. Compilation of Inflectional Dictionaries Using WordEditor. In Tadič et al. (eds) Proceedings of the 6th International Conference on Formal Approaches to South Slavic and Balkan Languages, 25-28 September 2008, Dubrovnik, pp. 131—138. ISBN 978-953-55375-0-2. (pdf)

Todorova, M. Morpho-Syntactic Properties of Bulgarian Verbal Idiomatic Expressions, – In: Proceedings of the NooJ International Conference 2007, Publications of UAB, 2008, pp. 273 – 279. ISBN (10): 1-4438-0053-8, ISBN (13): 978-1-4438-0053-2 (pdf)

Тодорова, М. Семантико-синтактични особености на глаголни фразеологизми, – B: сп. Български език, 2007, кн. 4, стр. 78-91. ISSN 0005-4283. [Semantic and Syntactic Properties of Verbal Idioms – in Bulgarian]

Koeva Sv., Sv. Leseva, M. Todorova. Bulgarian Sense Tagged Corpus, – In: Proceedings of the 5th SALTMIL Workshop on Minority Languages: Strategies for Developing Machine Translation for Minority Languages, May 23rd 2006, Genoa, Italy, pp.79-87.(pdf)

Koeva, Sv., Sv. Leseva, I. Stoyanova, E. Tarpomanova, M. Todorova. Bulgarian Tagged Corpora, – In: Proceedings of the Fifth International Conference Formal Approaches to South Slavic and Balkan Languages, 18-20 October 2006, Sofia, Bulgaria, pp. 78-86.

Todorova, M. On The classification of Bulgarian Non-Free Phrases, – In: Proceedings of the Fifth International Conference Formal Approaches to South Slavic and Balkan Languages, 18-20 October 2006, Sofia, Bulgaria, pp. 251-256.

Andreeva, Maria. Ivaylo Marinov, Stoyan Mihov. SpeechLab 2.0 – A High-Quality Text-to-Speech System for Bulgarian, – In: Proceedings from the International Conference Recent Advances in Natural Language Processing, Borovets, Bulgaria, p. 52 – 58, 2005. ISBN 95. (pdf)

Търпоманова, Екатерина. Мария Тодорова, Христина Кукова. Структурна обусловеност и значение на глаголите в SynText, – B: Сборник доклади от Балканска конференция на младите учени в Пловдив. 2005. [The Relation of Meaning and Structure of Verbs in SynText – in Bulgarian]

Научнопопулярни статии
Тодорова, М. Втора международна конференция „Компютърната лингвистика в България“ (CLIB–2016). Български език, 4, 2016, 110-113

Тодорова М. А. Отдавам се на мисли какво ми се удава. Списание „Педагогика“, 6, 994, 2016 (препечатка)

Тодорова М. А. Кога е по-, пò, най-?.. Списание „Педагогика“, 7, 2016, 850-851 (препечатка)

Тодорова, М. А. На върба в сряда или на куково лято цъфтят налъмите. вестник “Аз Буки”, 24, 2016, 3

Тодорова, М. А.. Кой е по-, пò, най-?. вестник “Аз Буки”, Бр. 38, IX., Национално издателство за образование и наука „Аз Буки“, 2015, 17-17

Тодорова, М. А.. Отдавам се на мисли какво ми се удава. вестник “Аз Буки”, бр. 41, Национално издателство за образование и наука „Аз Буки“, 2015, 8-8

Copyright © 2015-2022 Институт за български език. Всички права запазени.