Гл. ас. д-р Цветана Димитрова « Секция по компютърна лингвистика

Информация
Образование и опит
Научна дейност
Публикации

Главен асистент
Секция по компютърна лингвистика

Телефон: 02 9792971

Имейл: cvetana@dcl.bas.bg

Адрес:
Институт за български език,
ул. “Шипченски проход” 52, София 1113
Кабинет 602

Интереси

теоретична и приложна лингвистика,
корпусна лингвистика,
диахронна лингвистика,
синтаксис,
диахронен синтаксис,
генеративна промяна, езикова промяна, езиков контакт,
старобългарски език;
компютърни лексикони,
лексикалносемантични мрежи,
лингвистична анотация

Постижения

Награда за млад учен „Професор Марин Дринов” в областта на хуманитарните науки, 2011 г.

Образование и опит

2010 – до сега: главен асистент в Секцията по компютърна лингвистика на Института за български език към Българската академия на науките

2008 – 2010: проучвател в Секцията по компютърна лингвистика на Института за български език към Българската академия на науките

2003 – 2008: Доктор по общо езикознание на Норвежкия научно-технологичен университет на (NTNU) в Трондхайм, Норвегия

2002 – 2003: Магистърска програма по компютърна лингвистика

1996 – 2001: Българска филология (втора специалност – турска филология)

Проекти

Обогатени бази от знания за български и румънски (2015 – 2017), двустранен проект на Института за български език на Българска академия на науките и Института за изкуствен интелект на Румънската академия, участник в проекта

Български национален корпус (2010 – ), Институт за български език, Българска академия на науките, участник в проекта

Българският уърднет (БулНет): Лексикално-семантична мрежа на българския език (2010 – ), Институт за български език, Българска академия на науките, участник в проекта

Автоматично разпознаване на именувани обекти в български и чешки език (2014 – 2016), двустранен проект на Института за български език на Българска академия на науките и Института за чешки език на Чешката академия на науките, ръководител на проекта

Компютърно описание на старобългарското словно богатство (с оглед на създаване на електронен словообразувателен речник), (с оглед на създаване на електронен словообразувателен речник) (2012 – 2013), Софийски университет „Св. Климент Охридски“, проект, финансиран от Фонд „Научни изследвания“ (ДМУ 0313/16.12.2011), ръководител на проекта

Parsing and multi-word expressions. Towards linguistic precision and computational efficiency in natural language processing (PARSEME) (2014 – 2017), Information and Communication Technologies COST Action IC1207, участник в проекта

От лексикално-семантични мрежи към бази от знания: обогатяване на Българския и Румънския wordnet с морфо-семантична информация (2012 – 2014), двустранен проект на Института за български език на Българска академия на науките и Института за изкуствен интелект на Румънската академия, участник в проекта

ЦЕЗАР: Централно и южноевропейски езикови ресурси (CESAR: CEntral and South-east europeAn Resources) (2011 – 2013), участник в проекта

Супрасълски сборник – старобългарски паметник от Х век: електронен корпус (2010 – 2011), проект на Института за литература на Българската академия на науките, финансиран от ЮНЕСКО, участник в проекта

Компютърни и интерактивни средства за исторически езиковедски изследвания (2009-2011), Софийския университет „Св. Климент Охридски“, участник в проекта

Прагматични ресурси за древните индоевропейски езици (PROIEL), Университет на Осло (2008 – 2012), анотатор на старославянски текстове

Български семантично-анотиран корпус (2008-2010), Институт за български език, Българска академия на науките, участник в проекта

Членство в научни организации

Международен комитет на славистите, Комисия по компютърна обработка на славянски ръкописи и старопечатни книги, члена (2010 – до момента)

Участие в организационни и програмни комитети на конференции

Годишна среща на Асоциацията по компютърна лингвистика (The Annual Meeting of the Association for Computational Linguistics 2013), София, България, 4 – 9 август 2013 г., член на организационния комитет

Първа международна конференция “Компютърната лингвистика в България” (First International Conference on Computational Linguistics in Bulgaria (2014), София, България, 4 септември 2014 г., член на организационния комитет

Семинар Computing in Humanities, София, България, 8 – 9 април 2015 г., член на организационния комитет

Глобална Уърднет конференция (Global Wordnet Conference 2016), Букурещ, Румъния, 27 – 30 януари 2016 г., член на програмния комитет

Втора международна конференция “Компютърната лингвистика в България” (Second International Conference on Computational Linguistics in Bulgaria (2016), София, България 9 септември 2016 г., член на организационния комитет

Паисиеви четения 2016: Юбилейна научна сесия „Съвременни тенденции в езиковедските изследвания“, посветена на 85 години от рождението на проф. д.ф.н. Йордан Пенчев, Пловдив, България, 10 – 11 ноември 2016 г., член на организационния комитет

Международна годишна конференция на Института за български език, София, България, 15 – 16 май 2017 г., член на организационния комитет

Монографии:

Dimitrova, T. The Old Bulgarian Noun Phrase: Towards an Annotation Specification. Doktoravhandlinger ved NTNU: 2008:99. Trondheim: Norwegian University of Science and Technology, 2008, 270 p. ISBN: 978-824-717-989-5. [С корекции: Dimitrova, T. The Old Bulgarian Noun Phrase. Saarbruecken: VDM Verlag, 2011, 316 p. ISBN: 978-363-934-362-5.]

Студии/глави в сборници:

Търпоманова, Ек., Цв. Димитрова. Анотиране на паралелни многоезикови корпуси: Българско-английският паралелел корпус със съотнесени (прости) изречения (BulEnAC). – В: Езикови ресурси и технологии за български език. София: Академично издателство „Проф. Марин Дринов“, 2014, с. 105 – 126. ISBN: 978-954-322-797-6.

Димитрова, Цв. Лингвистични конвенции при анотация на затворените класове. – В: Българският семантично анотиран корпус. София: Институт за български език „Проф. Любомир Андрейчин“, 2010, с. 141 – 156. ISBN: 978-954-779-124-4.

Студии и статии в научни списания:

Димитрова, Цв. Наблюдения върху местоименните клитики в историята на българския език. – Известия на Института за български език, XXIX, Издателство на БАН „Проф. Марин Дринов“, 2016, с. 90 – 106. ISSN: 0323-9934.

Стефанова, В., Цв. Димитрова. Прилагателното име в Българския уърднет. – Български език, кн. 4, 2016, с. 1 – 15. ISSN: 0005-4283.

Коева, Св., Д. Благоева, С. Колковска, Цв. Димитрова, Ив. Стоянова, Св. Лесева. Българският национален корпус в контекста на съвременната лингвистика. – Български език, кн. 3, 2015, с. 102 – 119. ISSN: 0005-4283.

Krapova, I., T. Dimitrova. The Genitive-Dative syncretism in the history of Bulgarian. Towards an analysis. – Studi Slavistici, XII, 2015, pp. 181 – 208. ISSN:1824-761X (print); 1824-7601 (online). SJR:0.127.

Коева, Св., Ив. Стоянова, Цв. Димитрова, Св. Лесева. Традиции и новаторство в корпусната лингвистика: Българският национален корпус. – Списание на Българската академия на науките, кн. 6, 2012, с. 34 – 39. ISSN: 0007-3989.

Dimitrova, T. Computer-Аssisted Description of the Old Bulgarian Lexica Computer-Аssisted Description of the Old Bulgarian Lexica for an e-Based Derivational Dictionary of Old Bulgarian. – Littera et Lingua, Autumn 2012, p. 1 – 10. ISSN: 1312-6172.

Koeva, S., I. Stoyanova, S. Leseva, T. Dimitrova, R. Dekova, E. Tarpomanova. The Bulgarian National Corpus: Theory and Practice in Corpus Design. – Journal of Language Modelling, 1, 2012, pp. 65 – 110. ISSN: 2299-8470, DOI://dx.doi.org/10.15398/jlm.v0i1.33.

Димитрова, Цв. Диахронните корпуси: Подготвителна фаза. – Български език, кн. 3, 2011, с. 119 – 130. ISSN:0005-4283.

Димитрова, Цв. Проблеми на лингвистичната анотация в диахронните корпуси. – Български език, кн. 1, 2010, с. 23 – 36. ISSN: 0005-4283.

Димитрова, Цв. Двуличното като. – Български език, кн. 3, 2009, с. 149 – 151. ISSN:0005-4283.

Bojadžiev, А., T. Dimitrova. Linguistic Information in the Electronic Corpus of Old Slavic Texts. – Scripta & e-Scripta, 6, 2008, pp. 105 – 151. ISSN: 1312-238X.

Статии в сборници от конференции:

Dimitrova, T., V. Stefanova. Adjectives in WordNet: Semantic Issues. – In: Proceedings of the 12th International Conference Linguistics Resources and Tools for Processing the Romanian Language (ConsILR-2016). Iași: Faculty for Computer Science, Alexandru Ioan Cuza University, 2016, pp. 131 – 141. ISSN:1843-911X.

Koeva, S., I. Stoyanova, M. Todorova, S. Leseva, T. Dimitrova. Metadata Extraction, Representation and Management within the Bulgarian National Corpus. – In: 4th Workshop on Challenges in the Management of Large Corpora Workshop Programme. ELDA, 2016, pp. 33 – 39.

Babru Mititelu, V., B. Rizov, E. Tarpomanova, S. Leseva, T. Dimitrova. Noun-Verb Derivation in the Bulgarian, Romanian and English Wordnets – a Comparative Approach. – In: Proceedings of the 11th International Conference Linguistics Resources and Tools for Processing the Romanian Language (ConsILR-2015). Iași: Faculty for Computer Science, Alexandru Ioan Cuza University, 2015, pp. 53 – 64. ISSN: 1843-911X.

Dimitrova, T., A. Bojadziev. Historical Corpora of Bulgarian Language and Second Position Markers. – In: Proceedings of the First International Conference Computational Linguistics in Bulgaria. Sofia: Institute for Bulgarian Language, 2014, pp. 55 – 63. ISSN: 2367-5578.

Dimitrova, T., E. Tarpomanova, B. Rizov. Coping with Derivation in the Bulgarian Wordnet.. – In: Proceedings of the Seventh Global WordNet Conference. Tartu: University of Tartu Press, 2014, pp. 109 – 117. ISBN: 978-994-932-492-7.

Koeva, S., B. Rizov, E. Tarpomanova, T. Dimitrova, R. Dekova, I. Stoyanova, S. Leseva, H. Kukova, A. Genov. Bulgarian-English Sentence- and Clause-Aligned Corpus. – In: Proceedings of the Second Workshop on Annotation of Corpora for Research in the Humanities (ACRH-2), Lisbon: Edicoes Colibri, 2012, ISBN:978-989-689-273-9.

Eckhoff, H. M., D. J. Birnbaum, A. Miltenova, T. Dimitrova. The Tenth- Century Cyrillic Manuscript Codex Suprasliensis: the creation of an electronic corpus UNESCO project (2010–2011). – In: Proceedings of the Workshop on Language Technologies for Digital Humanities and Cultural Heritage associated with The 8th International Conference on Recent Advances in Natural Language Processing (RANLP 2011), 2011, pp. 57 – 61. ISBN:978-954-452-019-9.

Dimitrova-Vulchanova, M., V. Vulchanov, T. Dimitrova. Issues of Pos-annotation of Old Bulgarian Texts. – In: Computer Applications in Slavic Studies. Proceedings of Azbuky.Net, International Conference and Workshop, 24-27 October 2005, Sofia, Bulgaria. Sofia: Boyan Penev Publishing Center, 2006, pp. 245 – 262. ISBN: 978-954-871-241-5.

Koeva, S., S. Leseva, B. Rizov, E. Tarpomanova, T. Dimitrova, H. Kukova, M. Todorova. Design and development of the Bulgarian Sense-Annotated Corpus. – In: Proceedings of the Third International Corpus Linguistics Conference (CILC), 7-9 April 2011, Valencia, Spain. Valencia: Universitat Politecnica de Valencia, 2011, pp. 143 – 150. ISBN: 978-846-946-225-6.

Koeva, S., S. Leseva, E. Tarpomanova, B. Rizov, T. Dimitrova, H. Kukova. Bulgarian Sense-annotated Corpus – Results and Achievements. – In: Proceedings of the 7th International Conference of Formal Approaches to South Slavic and Balkan Languages (FASSBL-7), 4-6 October 2010, Dubrovnik, Croatia 2010, pp. 41 – 48. ISBN: 978-953-553-752-6.

Koeva, S., S. Leseva, I. Stoyanova, R. Dekova, A. Genov, B. Rizov, T. Dimitrova, E. Tarpomanova, H. Kukova. Application of Clause Alignment for Statistical Machine Translation. – In: Proceedings of SSST-6: Sixth Workshop on Syntax, Semantics and Structure in Statistical Translation, ACL 2012 / SIGMT / SIGLEX Workshop, Jeju, Korea. Association of Computational Linguistics, 2012, pp. 102 – 111. ISBN: 978-193-728-438-1.

Koeva, S., S. Leseva, I. Stoyanova, T. Dimitrova, M. Todorova. Automatic Prediction of Morphosemantic Relations. – In: Proceedings of the Eighth Global Wordnet Conference. Bucharest: Research Institute for Artificial Intelligence, Romanian Academy, 2016, pp. 168 – 176. ISBN: 978-973-020-728-6.

Koeva, S., T. Dimitrova. Rule-based Person Named Entity Recognition for Bulgarian. – In: Slavic Languages in the Perspective of Formal Grammar (Proceedings of FDSL 10.5, Brno 2014), Series Linguistik International, vol. 37, Peter Lang, 2015, pp. 121 – 139. ISBN: 978-363-166-251-9.

Leseva, S., M. Todorova, T. Dimitrova, B. Rizov, I. Stoyanova, S. Koeva. Automatic Classification of Wordnet Morphosemantic Relations. – In: Proceedings of the 5th Workshop on Balto-Slavic Natural Language Processing, The International Conference Recent Advances in Natural Language Processing (RANLP) 2015, 2015, pp. 59 – 64. ISBN: 978-954-452-033-5.

Rizov, B., T. Dimitrova, V. Barbu Mititelu. Hydra for Web: A Multilingual Wordnet Viewer. – In: Proceedings of the 11th International Conference Linguistics Resources and Tools for Processing the Romanian Language (ConsILR-2015). Iași: Faculty for Computer Science, Alexandru Ioan Cuza University, 2015, pp. 19 – 30. ISSN:1843-911X.

Rizov, B., T. Dimitrova. Hydra for Web: A Browser for Easy Access to Wordnets. – In: Proceedings of the Eighth Global Wordnet Conference. Bucharest: Research Institute for Artificial Intelligence, Romanian Academy, 2016, pp. 339 – 343. ISBN: 978-973-020-728-6.

Tarpomanova, E., S. Leseva, М. Todorova, T. Dimitrova, B. Rizov, V. Barbu Mititelu, E. Irimia. Noun-Verb Derivation in the Bulgarian and the Romanian WordNet – A Comparative Approach. – In: Proceedings of the First International Conference Computational Linguistics in Bulgaria. Sofia: Institute for Bulgarian Language, 2014, pp. 23 – 31. ISSN: 2367-5578.

Димитрова, Цв., А. Бояджиев. Сегментация на диахронните корпуси. – В: Сборник доклади от заключителната конференция на проект „Компютърни и интерактивни средства за исторически езиковедски изследвания“. София: ГРАФИС – Ал. Жеков, 2011, с. 96 – 106. ISBN: 978-954-914-773-5.