Наградата „Джон Атанасов“ на Президента на Република България се връчва от 2003 г. насам на изявили се в световен мащаб млади български изследователи в областта на компютърните науки. През 2016 г. са направени 57 номинации в четири отделни категории. Д-р Зорница Козарева получи Наградата „Джон Атанасов” на 4 октомври (рождения ден на Джон Атанасов) за своите постижения в областта на компютърната лингвистика.
Д-р Зорница Козарева има сериозни научни приноси в области като: автоматично извличане на информация; изграждане на огромни по обем бази от знания; машинно обучение за извличане на езикови данни; автоматичен анализ на мнение и отношение; компютърна обработка на езика, свързана с неговата семантика.
Д-р Зорница Козарева е ръководител на научноизследователската група по машинно самообучение в областта на компютърната обработка на езика в „Амазон”, Сънивейл, САЩ. Била е старши мениджър в „Яхо!” на група, работеща върху автоматичното разбиране на въпроси за изграждане на приложения за мобилни телефони и реклами. От 2009 г. до 2013 г. е главен асистент в Университета на Южна Калифорния в Лос Анджелис. По същото време е изследовател в Института по информационни науки (Южна Калифорния), където през 2012 г. печели финансиране от 12 милиона долара за проект на тема: „Интерпретация на метафората за анализ на културните модели”. Автор е на над 60 научни публикации в областта на компютърната лингвистика с около 1400 цитирания и на пет патента.
На 5 октомври по покана на Секцията по компютърна лингвистика към Института по български език д-р Зорница Козарева изнесе в БАН лекция на тема „Създаване на машини, които могат да придобиват знания, подобно на хората”. Д-р Козарева представи увлекателно и по достъпен начин сложните алгоритми, посредством които се извличат автоматично факти от интернет – имена на хора, места, събития и др., и думите, които назовават базови понятия (например лъв, куче и пъстърва); как извлечените данни се групират автоматично в семантични класове (например лъвът, кучето и пъстървата са животни, но само пъстървата е риба) и накрая – как семантичните класове се организират в таксономии, подобно на организацията на понятията в човешкото мислене (например: лъв е животно от семейство котки, животните от семейство котки са месоядни животни; месоядните животни са бозайници и т. н.). В дискусията се очерта изводът, че компютърната лингвистика е интересна и модерна дисциплина, която се развива много бързо и през следващите десетилетия ще придобива все по-голямо значение.