Състезанието по компютърна лингвистика е съвместна инициатива на учени от Секцията по компютърна лингвистика към Института за български език „Проф. Любомир Андрейчин“ и Института по математика и информатика при Българската академия на науките, както и членове на Националната комисия за организиране и провеждане на Ученическата олимпиада и Националното състезание по лингвистика.
Състезанието по компютърна лингвистика е част от проекта „Написаното остава. Пиши правилно!“ на Института за български език и се провежда с подкрепа по програмите „Въвеждане на съвременни методи в образованието и работата с младите таланти“ (2017 – 2018) и „Образование с наука“ (2019 – 2020) на Министерството на образованието и науката и Българската академия на науките.
Състезанието по компютърна лингвистика е предназначено за ученици в прогимназиален и гимназиален етап на обучение и се провежда онлайн чрез Образователната платформа на Института за български език към БАН.
Имат ли езикознанието и математиката допирни точки? Могат ли да се решават езикови задачи?
Не пропускайте сами да отговорите на тези въпроси, като се включите в Петото състезание по компютърна лингвистика. Участието в състезанието отваря нови хоризонти, в които откривате малка част от начините, по които компютрите „разбират“ езика.
Състезанието по компютърна лингвистика е предназначено за ученици в прогимназиален или гимназиален етап на обучение и ще се проведе онлайн от 10:00 до 13:00 часа на 8 май 2023 година чрез Образователната платформа на Института за български език.
За да вземете участие в състезанието, трябва: 1) да се регистрирате и да влезете в платформата от линка Вход горе вдясно; 2) да се запишете като участник на този линк и 3) да попълните Въпросника за лични данни 2023 до 10:00 часа на 8 май 2023 г.
Задачите ще станат активни точно в 10:00 ч. на 8 май 2023 г. Всеки участник трябва да предаде решението на задачите на платформата до 13:00 на 8 май 2023 г. Резултатите ще бъдат обявени в 12:00 часа на 12 май 2023 година (петък) на тази страница и в платформата.
Награждаването на победителите в Състезанието се организира с подкрепата на ГД „Писмени преводи“ на Европейската комисия.
Предвиждат се следните награди:
- Първа награда – грамота за първо място, специална награда и тениска с надпис „Написаното остава. Пиши правилно!“.
- Втора награда – грамота за второ място и тениска с надпис „Написаното остава. Пиши правилно!“.
- Трета награда – грамота за трето място и тениска с надпис „Написаното остава. Пиши правилно!“.
- Поощрителни награди.
Победителите в състезанието се определят от комисия, която проверява решенията на задачите. Комисията включва сътрудници към Института за български език „Проф. Любомир Андрейчин“ и Института по математика и информатика при Българската академия на науките, както и членове на Националната комисия за организиране и провеждане на Ученическата олимпиада и Националното състезание по лингвистика.
Награждаването на победителите ще се проведе на 19 май 2023, петък, от 11:00 ч. в Дома на Европа (ул. „Георги С. Раковски“ №124, София 1000). Г-н Богомил Ковачев от ГД „Писмени преводи“ към Европейската комисия ще направи представяне на тема AI@DGT (Изкуственият интелект в ГД „Писмени преводи“). Допълнителна информация за награждаването ще бъде дадена след обявяването на резултатите.
Можете да се свържете с нас на имейл: teacher@ibl.bas.bg.
Състезание 2022
Състезанието по компютърна лингвистика се проведе онлайн от 10:00 до 12:30 ч. на 8 май 2022 година. В състезанието се включиха 80 ученици от 5 до 12 клас от 50 различни училища от 22 населени места.
Състезание 2021
Състезанието по компютърна лингвистика включваше две задачи и се проведе от 15:00 до 17:30 часа на 8 май 2021 година. Взеха участие 59 ученици от пети до дванадесети клас от 26 училища от 15 населени места из цялата страна. Състезанието беше изключително оспорвано с минимална разлика между класираните на челните места. Поради големия брой участници и големия брой отлични отговори решихме да обособим в класирането две възрастови групи: 5 – 8 клас и 9 – 12 клас.
Състезание 2020
Състезанието по компютърна лингвистика включваше две задачи и се проведе на 16 май 2021 година. Взеха участие 67 ученици от пети до дванадесети клас от 18 града и 25 училища. Бяха обособени две възрастови групи при награждаването: 5 – 8 клас и 9 – 12 клас.
Демонстрационно състезание 2018
В рамките на Международната конференция „Компютърната лингвистика в България“ (Computational Linguistics in Bulgaria, CLIB 2018) на 27 май 2018 се проведе Демонстрационно състезание по компютърна лингвистика.
Задачи за крайни автомати
Крайният автомат е абстрактно устройство, способно да установи дали дадена му последователност от елементи (например дума — последователност от букви или морфеми, изречение — от думи и т.н.) принадлежи на определено множество, или не. Автоматът обработва последователността елемент по елемент от начало до край. Във всеки момент той се намира в някакво състояние (състоянията са краен брой — затова говорим за краен автомат), което заедно с поредния елемент определя от кое състояние към кое може да се премине, а буквите до тях — каква буква трябва да „се прочете“, за да се осъществи преходът. Едно състояние е начално — от него започва работата на автомата. Някои състояния са заключителни — ако автоматът се окаже в едно от тях, когато свършат елементите, значи е разпознал последователността като принадлежаща на множеството.
На схемата по-долу виждате краен автомат, който разпознава всички форми на българския глагол пера в сегашно, минало несвършено и минало свършено време. Състоянията са изобразени като възли в графа (с начално състояние и заключителни състояния ); стрелките показват от кое състояние към кое може да се премине, а буквите до тях — каква буква трябва да „се прочете“, за да стане преходът.
Този автомат разпознава формите за сегашно, минало несвъшено и минало свършено време на глагола поя:
Задачи за отношения между понятия
Можете да разгледате Българския Уърднет (БулНет), който е лексикално-семантична мрежа и представя семантичните, словообразувателните и други отношения между думите в езика.
За повече информация:
Българският Уърднет на страницата на Секцията по компютърна лингвистика
Българският Уърднет в Уикипедия