Universität Potsdam, BSc CL, Winter 2019/2020
CLT: Computerlinguistische Techniken
Leitung | Prof. Dr. David Schlangen |
david.schlangen@uni-potsdam.de | |
Sprechstunde | Donnerstags, 13-14h |
Sitzungen | Dienstags, 14-16h; Mittwochs, 10-12h |
Raum | 2.14.2.22; 2.14.0.09 |
Website | auf github; auf moodle |
Kursbeschreibung
Basierend auf den erworbenen Grundkenntnissen macht dieses Modul die Studierenden mit der Implementierung von computerlinguistischen Algorithmen, mit Formalismen zur Spezifikation von computerlinguistischen Kernressourcen wie Grammatiken und Lexika, sowie mit dem Training von ausgewählten statistischen Modellen vertraut. Eine Auswahl der folgenden Techniken und Repräsentationsformalismen werden in der Theorie sowie konkret auf Implementierungsebene besprochen: Kontextfreie Grammatiken; Unifikationsgrammatiken; Parsingverfahren (bottom-up, top-down, chartbasiert); n-Gramm-Modelle; Hidden Markov Modelle; probabilistische kontextfreie Grammatiken; grundlegende Modelle und Algorithmen für die semantische Verarbeitung.
Kursziele
Die Studierenden besitzen ein grundlegendes Verständnis für computerlin- guistische Modellierungs- und Verarbeitungstechniken und können diese theoretisch analysieren (Korrektheit, Laufzeit) sowie implementieren und auf praktische Probleme anwenden.
Hintergrundliteratur
Vertiefend können Sie hinzuziehen:
- Dan Jurasfky & James Martin, “Speech and Language Processing”, 3. Auflage (Draft dritte Auflage online)
Formalitäten, Leistungen
Es wird 8 Übungen zur Bearbeitung geben, 4 pro Semesterhälfte. Bei jeder können maximal 100 Punkte erreicht werden. Aus jeder Semesterhälfte gehen die drei am besten bewerteten in die Gesamtwertung ein. Um die Veranstaltung abschließen zu können, müssen Sie mindestens 150 Punkte pro Semesterhälfte erreichen, sowie mindestens einmal eine Aufgabe in der Übungssitzung vorrechnen.
Zum Modulabschluß müssen Sie in der vorlesungsfreien Zeit ein Projekt erarbeiten. Die Modulnote ist die Note dieses Projektes.
Ich versuche, auf E-Mails relativ schnell zu antworten (innerhalb von 3 Geschäftstagen). Ich bitte aber darum, Fragen nach Möglichkeit in der Sitzung oder über das Forum zu stellen, so dass alle davon profitieren können.