EN BG

Гл. асистент д-р Цветана Димитрова



Главен асистент
Секция по компютърна лингвистика

Телефон: 02 9792971

Имейл: cvetana@dcl.bas.bg

Адрес:
Институт за български език,
ул. “Шипченски проход” 52, София 1113
Кабинет 602

Интереси

  • теоретична и приложна лингвистика,
  • корпусна лингвистика,
  • диахронна лингвистика,
  • синтаксис,
  • диахронен синтаксис,
  • генеративна промяна, езикова промяна, езиков контакт,
  • старобългарски език;
  • компютърни лексикони,
  • лексикалносемантични мрежи,
  • лингвистична анотация

Постижения

Награда за млад учен „Професор Марин Дринов” в областта на хуманитарните науки, 2011 г.

Членство в научни организации

  • Folli – the Association for Logic, Language and Information
  • Global Wordnet Association
  • Association for Computational Linguistics

Образование и опит

2010 – до сега: главен асистент в Секцията по компютърна лингвистика на Института за български език към Българската академия на науките

2008 – 2010: проучвател в Секцията по компютърна лингвистика на Института за български език към Българската академия на науките

2003 – 2008: Доктор по общо езикознание на Норвежкия научно-технологичен университет на (NTNU) в Трондхайм, Норвегия

2002 – 2003: Магистърска програма по компютърна лингвистика

1996 – 2001: Българска филология (втора специалност – турска филология)

Проекти

Обогатени бази от знания за български и румънски (2015 – ), двустранен проект на Института за български език на Българска академия на науките и Института за изкуствен интелект на Румънската академия, участник в проекта

Български национален корпус (2010 – ), Институт за български език, Българска академия на науките, участник в проекта

Българският уърднет (БулНет): Лексикално-семантична мрежа на българския език (2010 – ), Институт за български език, Българска академия на науките, участник в проекта

Автоматично разпознаване на именувани обекти в български и чешки език (2014 – ), двустранен проект на Института за български език на Българска академия на науките и Института за чешки език на Чешката академия на науките, ръководител на проекта

Компютърно описание на старобългарското словно богатство (с оглед на създаване на електронен словообразувателен речник), проект, финансиран от Фон „Научни изследвания“: ДМУ 0313/16.12.2011 (2012 – ), Софийски университет „Св. Климент Охридски“, ръководител на проекта

Parsing and multi-word expressions. Towards linguistic precision and computational efficiency in natural language processing (PARSEME), Information and Communication Technologies COST Action IC1207

От лексикално-семантични мрежи към бази от знания: обогатяване на Българския и Румънския wordnet с морфо-семантична информация (2012 – 2014), двустранен проект на Института за български език на Българска академия на науките и Института за изкуствен интелект на Румънската академия, участник в проекта

ЦЕЗАР: Централно и южноевропейски езикови ресурси (CESAR: CEntral and South-east europeAn Resources) (2011 – 2013), участник в проекта

Супрасълски сборник – старобългарски паметник от Х век: електронен корпус (2011 – 2013), проект на Института за литература на Българската академия на науките, финансиран от ЮНЕСКО, участник в проекта

Компютърни и интерактивни средства за исторически езиковедски изследвания (2009-2011), Софийския университет „Св. Климент Охридски“, участник в проекта

Прагматични ресурси за древните индоевропейски езици (PROIEL), Университет на Осло (2008 – 2012), анотатор на старославянски текстове

Български семантично-анотиран корпус (2008-2010), Институт за български език, Българска академия на науките, участник в проекта

Участия в конференции

Formal Approaches to South Slavic and Balkan Languages (FASSBL): София, България, 2006 (постер и статия); Дубровник, Хърватия, 2010 (статия в съавторство)

Workshop on Language Technologies for Digital Humanities and Cultural Heritage (8th International Conference on Recent Advances in Natural Language Processing (RANLP 2011): Хисаря, България, 2011 (статия в съавторство, презентация).

Sixth Workshop on Syntax, Semantics and Structure in Statistical Translation, the Annual Meeting of the Association for Computational Linguistics, Jeju, Korea, 2012 (статия в съавторство)

The Second Workshop on Annotation of Corpora for Research in the Humanities, Лисабон, Португалия 2012 (статия в съавторство)

Трети конгрес по българистика, София, България, 2013 (статия в съавторство, презентация)

Global Wordnet Conference, Тарту Естония, 2014 (статия в съавторство, презентация)

Първа международна конференция по компютърна лингвистика в България,София България, 2014 (две статии в съавторство; презентация)

Formal Description of Slavic Languages (FDSL 10.5), Бърно, Чешка република, 2014 (статия в съавторство, презентация)

PARSEME General Meeting, Валета, Малта, 2015 (постер – в съавторство)

The 5th Workshop on Balto-Slavic Natural Language Processing (10th International Conference on Recent Advances in Natural Language Processing (RANLP 2011), Хисаря, България (статия в съавторство, доклад)

Slavic Corpus Linguistics: The Historical Dimension, Тромсьо, Норвегия, 2015 (доклад в съавторство)

11th International Congress of South-East European Studies, София, България, 2015 (доклад в съавторство)

„Актуални проблеми на съвременната лингвистика“ – научна конференция в чест на проф. д.ф.н. Стефана Димитрова, София, България, 2015 (статия, доклад)

Организационни и програмни комитети

META-FORUM 2012 Roadshow: София, България, май 2012 г. (член на местния организационен комитет)

Годишна среща на Асоциацията по компютърна лингвистика, София, България, 04.08. – 09.08.2013 г. (член на националния организационен комитет)

Първа международна конференция по компютърна лингвистика в България, София, България, 04.09.2014 г. (член на организационния комитет)

NeDiMAH: Computing in Humanities Workshop, София, България, 08.04. – 09.04.2015 г. (член на организационния комитет)

Конференцията за глобалния уърднет (Global Wordnet Conference), Букурещ, Румъния, 27.01. – 30.01.2016 (член на програмния комитет)

Монографии

Dimitrova, Tsvetana. 2011.The Old Bulgarian Noun Phrase. VDM Verlag, Saarbruecken. 316 p. (публикация на докторската дисертация: Tsvetana Dimitrova. The Old Bulgarian Noun Phrase: Towards an Annotation Specification. Doktoravhandlinger ved NTNU: 2008:99. Trondheim: Norwegian University of Science and Technology, 2008, ISBN:978-82-471-7989-5, 270 p.)

Студии/глави в сборници

Димитрова, Цветана. Лингвистични конвенции при анотация на затворените класове.. Българският семантично анотиран корпус., Институт за български език “Проф. Любомир Андрейчин”, 2010, ISBN: 978-954-779-124-4, 141 – 165.

Търпоманова, Екатерина, Цветана Димитрова. Анотиране на паралелни многоезикови корпуси: Българско-английският паралелел корпус със съотнесени (прости) изречения (BulEnAC). Езикови ресурси и технологии за български език, София: Академично издателство, 2014, ISBN:978-954-322-797-6, 105 – 126.

Студии в списания

Bojadžiev, Аndrej, Tsvetana Dimitrova. Linguistic information in the electronic Corpus of Old Slavic texts. Scripta & e-Scripta, 6, Boyan Penev Publishing Center, 2008, ISSN:1312-238X, 105 – 151

Koeva, Svetla, Ivelina Stoyanova, Svetlozara Leseva, Tsvetana Dimitrova, Rositsa Dekova, Ekaterina Tarpomanova. The Bulgarian National Corpus: Theory and Practice in Corpus Design. Journal of Language Modelling., 1, 2012, ISSN:2299-8470, DOI:http://dx.doi.org/10.15398/jlm.v0i1.33, 65 – 110

Krapova, Iliana, Tsvetana Dimitrova. Towards an account of the genitive-dative syncretism in the history of Bulgarian and the emergence of dative clitic pronouns. Studi Slavistici, Firenze University Press, приета за печат: 2015, ISSN:1824-761X

Статии в списания

Коева, Светла, Диана Благоева, Сия Колковска, Светлозара Лесева, Ивелина Стоянова, Димитрова, Цветана. Българският национален корпус в контекста на съвременната лингвистика. Български език, ЕМАС, 2015, ISSN:0005-4283, 1 – 10. (приета за печат)

Коева, Светла, Ивелина Стоянова, Цветана Димитрова, Светлозара Лесева. Традиции и новаторство в корпусната лингвистика: Българският национален корпус. Списание на Българската академия на науките, 6, Академично издателство “Проф. Марин Дринов”, 2012, ISSN:0007-3989, 34 – 39

Dimitrova, Tsvetana. Computer-Аssisted Description of the Old Bulgarian Lexica Computer-Аssisted Description of the Old Bulgarian Lexica for an e-Based Derivational Dictionary of Old Bulgarian. Littera et Lingua, Autumn 2012, 2012, ISSN:1312-6172, 1 – 10

Димитрова, Цветана. Диахронните корпуси: Подготвителна фаза.. Български език, 58, 3, 2011, ISSN:0005-4283, 119 – 130

Димитрова, Цветана. Проблеми на лингвистичната анотация в диахронните корпуси.. Български език, 57, 1, 2010, ISSN:0005-4283, 23 – 36

Димитрова, Цветана. Двуличното като. Български език, 3, 2009, ISSN:0005-4283, 149 – 151

Статии в сборници от конференции

Koeva, Svetla, Tsvetana Dimitrova. Rule-based Person Named Entity Recognition for Bulgarian. Slavic Languages in the Perspective of Formal Grammar (Proceedings of FDSL 10.5, Brno 2014), Series Linguistik International, vol. 37, Peter Lang,, 2015, ISBN:978-363-166-251-9, 121 – 139

Leseva, Svetlozara, Maria Todorova, Tsvetana Dimitrova, Borislav Rizov, Ivelina Stoyanova, Svetla Koeva. Automatic Classification of Wordnet Morphosemantic Relations. Proceedings of the 5th Workshop on Balto-Slavic Natural Language Processing, The International Conference Recent Advances in Natural Language Processing (RANLP) 2015, 2015, ISBN:978-954-452-033-5, 59 – 64

Dimitrova, Tsvetana, Ekaterina Tarpomanova, Borislav Rizov. Coping with Derivation in the Bulgarian Wordnet.. Proceedings of the Seventh Global WordNet Conference, Tartu: University of Tartu Press, 2014, ISBN:978-9949-32-492-7, 109 – 117.

Tarpomanova, Ekaterina, Svetlozara Leseva, Maria Todorova, Tsvetana Dimitrova, Borislav Rizov, Verginica Barbu Mititelu, Elena Irimia. Noun-Verb Derivation in the Bulgarian and the Romanian WordNet – A Comparative Approach.. Proceedings of the First International Conference Computational Linguistics in Bulgaria., Sofia: Institute for Bulgarian Language, 2014, ISSN:2367-5578, 23 – 31

Tsvetana Dimitrova, Andrej Bojadziev. Historical Corpora of Bulgarian Language and Second Position Markers.. Proceedings of the First International Conference Computational Linguistics in Bulgaria., Sofia: Institute for Bulgarian Language, 2014, ISSN:2367-5578, 55 – 63.

Koeva, Svetla, Borislav Rizov, Ekaterina Tarpomanova, Tsvetana Dimitrova, Rositsa Dekova, Ivelina Stoyanova, Svetlozara Leseva, Hristina Kukova, Angel Genov. Bulgarian-English Sentence- and Clause-Aligned Corpus.. Proceedings of the Second Workshop on Annotation of Corpora for Research in the Humanities (ACRH-2), Lisbon: Edicoes Colibri, 2012, ISBN:978-989-689-273-9

Koeva, Svetla, Svetlozara Leseva, Ivelina Stoyanova, Rositsa Dekova, Angel Genov, Borislav Rizov, Tsvetana Dimitrova, Ekaterina Tarpomanova, Hristina Kukova. Application of Clause Alignment for Statistical Machine Translation.. Proceedings of SSST-6: Sixth Workshop on Syntax, Semantics and Structure in Statistical Translation, ACL 2012 / SIGMT / SIGLEX Workshop., Jeju, Korea: Association of Computational Linguistics, 2012, ISBN:978-1-937284-38-1, 102 – 111

Eckhoff, Hanne Martine, David J. Birnbaum, Anisava Miltenova, Tsvetana Dimitrova. The Tenth- Century Cyrillic Manuscript Codex Suprasliensis: the creation of an electronic corpus UNESCO project (2010–2011). Proceedings of the Workshop on Language Technologies for Digital Humanities and Cultural Heritage associated with The 8th International Conference on Recent Advances in Natural Language Processing (RANLP 2011),, 2011, ISBN:978-954-452-019-9., 57 – 61.

Koeva, Svetla, Svetlozara Leseva, Borislav Rizov, Ekaterina Tarpomanova, Tsvetana Dimitrova, Hristina Kukova, Maria Todorova. Design and development of the Bulgarian Sense-Annotated Corpus. Proceedings of the Third International Corpus Linguistics Conference (CILC), 7-9 April 2011, Valencia, Spain., Universitat Politecnica de Valencia, 2011, ISSN:978-846-946-225-6., 143 – 150.

Димитрова, Цветана, Андрей Бояджиев. Сегментация на диахронните корпуси.. Сборник доклади от заключителната конференция на проект “Компютърни и интерактивни средства за исторически езиковедски изследвания”., ГРАФИС – Ал. Жеков, 2011, ISBN:978-954-914-773-5., 96 – 106

Koeva, Svetla, Svetlozara Leseva, Ekaterina Tarpomanova, Borislav Rizov, Tsvetana Dimitrova, Hristina Kukova. Bulgarian Sense-annotated Corpus – Results and Achievements.. Proceedings of the 7th International Conference of Formal Approaches to South Slavic and Balkan Languages (FASSBL-7), 4-6 October 2010, Dubrovnik, Croatia., 2010, ISBN:978-953-55375-2-6, 41 – 48

Dimitrova-Vulchanova, Mila, Valentin Vulchanov, Tsvetana Dimitrova. Issues of Pos-annotation of Old Bulgarian Texts.. Computer Applications in Slavic Studies. Proceedings of Azbuky.Net, International Conference and Workshop, 24-27 October 2005, Sofia, Bulgaria, Boyan Penev Publishing Center, 2006, ISBN:978-954-871-241-5., 245 – 262

Copyright © 2015 Институт за български език. Всички права запазени.