oplaTech About Teaching Archive
Oplatek's external memory

State Exam Questions

Selected Questions for Doctoral State Exam (Vybrané okruhy pro doktorskou zkoušku)

  1. Basic Methods in Natural Language Processing (Základní přístupy k počítačovému zpracování přirozeného jazyka)

  • Types of task in NLP, mathematical and linguistic basics. (Typy úloh v počítačovém zpracování přirozeného jazyka, matematické a lingvistické základy.)
  • Linguistic data collection, corpora, annotations. (Lingvistická data, korpusy, anotace.) NPFL092 Technology for NLP Prague Dependency Treebank
  • Design and evaluation of linguistic experiments, evaluation metrics. (Návrh a vyhodnocení lingvistických experimentů, evaluační metriky.)
  • Basics of graph theory. (Základy teorie grafů.) Invitation to Discrete Mathematics, Nesetril, Matousek
  • Layered description of language (TODO check translation) (Systém rovin popisu jazyka.)
  • General linguistics, language topology. (Obecná lingvistika, jazyková typologie.)
  • Morphology and syntax. (Morfologie a syntax přirozeného jazyka.)
    • [Introduction to Linguistics, Jirka Hana](http://ufal.mff.cuni.cz/courses/npfl063-2015-wi]
  • Automata and grammars, ?constituency/generative? grammar, Chomsky hierarchy. (Automaty a gramatiky, složková syntax, Chomského hierarchie.) Introduction to formal linguistics
  • Dependency syntax, properties of dependency syntax trees. (Závislostní syntax, vlastnosti závislostních stromů.) Introduction to formal linguistics Prague Dependency Treebank
  • Language modeling. (Jazykové modelování.)

General links - CS Offline Úvod do teoretické a počítačové lingvistiky. I. sv. Teoretická lingvistika. Panevová Jarmila - Sgall Petr - Hajičová Eva - CS: Wiki Matfyz - Matematická lingvistika

  1. Statistical Methods and Machine Learning in NLP (Statistické metody a strojové učení v počítačové lingvistice)

  • Probabilistic modelling of language (Pravděpodobnostní modelování jazyka.)
  • Classification and regression (Metody řízeného učení pro klasifikaci a regresi.)
  • Linear and non-linear methods (Lineární a nelineární metody.)
  • SVM and kernel functions (Support Vector Machines a kernelové funkce.)
  • Logistic regression (Logistická regrese.)
  • Decision trees (Rozhodovací stromy.)
  • Unsupervised learning (Metody neřízeného učení.)
  • ?Noisy channel and language models? (Jazykové modely a modely kanálu.)
  • LM smoothing (Vyhlazování modelů.)
  • HMM (Skryté Markovovy modely (algoritmy Baum–Welch, Forward–Backward, Viterbi).)
  • Algorithms for statistical POS tagging (Algoritmy pro statistický tagging.)
  • Algorithms for constituency and dependency parsing (Algoritmy pro složkový a závislostní statistický parsing.)
  • SMT & NN (Statistický strojový překlad. Základy neuronových sítí pro využití v počítačovém zpracování jazyka.)
  • Significance testing (Testy signifikance.)

General links - Intro to ML by Raquel Urtasun with references to Bishop

  1. Aplikace metod pro zpracování mluvené řeči

PS: As usual, suggestions and improvements are welcome by pull request.