EN BG

Състезание по компютърна лингвистика



Състезанието по компютърна лингвистика е съвместна инициатива на учени от Секцията по компютърна лингвистика към Института за български език „Проф. Любомир Андрейчин“ и Института по математика и информатика при Българската академия на науките, както и членове на Националната комисия за организиране и провеждане на Ученическата олимпиада и Националното състезание по лингвистика.

Състезанието по компютърна лингвистика е част от проекта „Написаното остава. Пиши правилно!“ на Института за български език и се провежда с подкрепа по програмите „Въвеждане на съвременни методи в образованието и работата с младите таланти“ (2017 – 2018) и „Образование с наука“ (2019 – 2020) на Министерството на образованието и науката и Българската академия на науките.

Състезанието по компютърна лингвистика е предназначено за ученици в прогимназиален и гимназиален етап на обучение и се провежда онлайн чрез Образователната платформа на Института за български език към БАН.


Имат ли езикознанието и математиката допирни точки? Могат ли да се решават езикови задачи?

Не пропускайте сами да отговорите на тези въпроси, като се включите в Петото състезание по компютърна лингвистика. Участието в състезанието отваря нови хоризонти, в които откривате малка част от начините, по които компютрите „разбират“ езика.

Състезанието по компютърна лингвистика е предназначено за ученици в прогимназиален или гимназиален етап на обучение и ще се проведе онлайн от 10:00 до 13:00 часа на 8 май 2023 година чрез Образователната платформа на Института за български език.

За да вземете участие в състезанието, трябва: 1) да се регистрирате и да влезете в платформата от линка Вход горе вдясно; 2) да се запишете като участник на този линк и 3) да попълните Въпросника за лични данни 2023 до 10:00 часа на 8 май 2023 г.

Задачите ще станат активни точно в 10:00 ч. на 8 май 2023 г. Всеки участник трябва да предаде решението на задачите на платформата до 13:00 на 8 май 2023 г. Резултатите ще бъдат обявени в 12:00 часа на 12 май 2023 година (петък) на тази страница и в платформата.

Награждаването на победителите в Състезанието се организира с подкрепата на ГД „Писмени преводи“ на Европейската комисия.

Предвиждат се следните награди:

  • Първа награда – грамота за първо място, специална награда и тениска с надпис „Написаното остава. Пиши правилно!“.
  • Втора награда – грамота за второ място и тениска с надпис „Написаното остава. Пиши правилно!“.
  • Трета награда – грамота за трето място и тениска с надпис „Написаното остава. Пиши правилно!“.
  • Поощрителни награди.

Победителите в състезанието се определят от комисия, която проверява решенията на задачите. Комисията включва сътрудници към Института за български език „Проф. Любомир Андрейчин“ и Института по математика и информатика при Българската академия на науките, както и членове на Националната комисия за организиране и провеждане на Ученическата олимпиада и Националното състезание по лингвистика.

Награждаването на победителите ще се проведе на 19 май 2023, петък, от 11:00 ч. в Дома на Европа (ул. „Георги С. Раковски“ №124, София 1000). Г-н Богомил Ковачев от ГД „Писмени преводи“ към Европейската комисия ще направи представяне на тема AI@DGT (Изкуственият интелект в ГД „Писмени преводи“). Допълнителна информация за награждаването ще бъде дадена след обявяването на резултатите.

Можете да се свържете с нас на имейл: teacher@ibl.bas.bg.

Условия за провеждане на състезанието

2022 | 2021 | 2020 | 2018


Състезание 2022


Състезанието по компютърна лингвистика се проведе онлайн от 10:00 до 12:30 ч. на 8 май 2022 година. В състезанието се включиха 80 ученици от 5 до 12 клас от 50 различни училища от 22 населени места.

Задачи

Резултати

Състезанието по компютърна лингвистика 2022 се провежда с подкрепата на „Мусала Софт“ – една от водещите български софтуерни компании с над 200 клиенти от цял свят и реализирани над 1000 проекта в областта на интеграция в облака, интернет на нещата, големи данни, изкуствен интелект и добавена реалност.




Състезание 2021

Състезанието по компютърна лингвистика включваше две задачи и се проведе от 15:00 до 17:30 часа на 8 май 2021 година. Взеха участие 59 ученици от пети до дванадесети клас от 26 училища от 15 населени места из цялата страна. Състезанието беше изключително оспорвано с минимална разлика между класираните на челните места. Поради големия брой участници и големия брой отлични отговори решихме да обособим в класирането две възрастови групи: 5 – 8 клас и 9 – 12 клас.

Задачи

Резултати

всички наградени


Състезание 2020

Състезанието по компютърна лингвистика включваше две задачи и се проведе на 16 май 2021 година. Взеха участие 67 ученици от пети до дванадесети клас от 18 града и 25 училища. Бяха обособени две възрастови групи при награждаването: 5 – 8 клас и 9 – 12 клас.

Задачи

Резултати


Демонстрационно състезание 2018

В рамките на Международната конференция „Компютърната лингвистика в България“ (Computational Linguistics in Bulgaria, CLIB 2018) на 27 май 2018 се проведе Демонстрационно състезание по компютърна лингвистика.

Повече информация

Задачи за крайни автомати

Крайният автомат е абстрактно устройство, способно да установи дали дадена му последователност от елементи (например дума — последователност от букви или морфеми, изречение — от думи и т.н.) принадлежи на определено множество, или не. Автоматът обработва последователността елемент по елемент от начало до край. Във всеки момент той се намира в някакво състояние (състоянията са краен брой — затова говорим за краен автомат), което заедно с поредния елемент определя от кое състояние към кое може да се премине, а буквите до тях — каква буква трябва да „се прочете“, за да се осъществи преходът. Едно състояние е начално — от него започва работата на автомата. Някои състояния са заключителни — ако автоматът се окаже в едно от тях, когато свършат елементите, значи е разпознал последователността като принадлежаща на множеството.

На схемата по-долу виждате краен автомат, който разпознава всички форми на българския глагол пера в сегашно, минало несвършено и минало свършено време. Състоянията са изобразени като възли в графа (с начално състояние и заключителни състояния ); стрелките показват от кое състояние към кое може да се премине, а буквите до тях — каква буква трябва да „се прочете“, за да стане преходът.



Този автомат разпознава формите за сегашно, минало несвъшено и минало свършено време на глагола поя:



Задачи за отношения между понятия

Можете да разгледате Българския Уърднет (БулНет), който е лексикално-семантична мрежа и представя семантичните, словообразувателните и други отношения между думите в езика.

За повече информация:

Българският Уърднет на страницата на Секцията по компютърна лингвистика

Българският Уърднет в Уикипедия



Copyright © 2015-2022 Институт за български език. Всички права запазени.