TUD Logo

TUD Startseite » ... » Lehre » Wintersemester 2013/14 » Seminar/Proseminar Natural Language Processing

Grundlagen der Programmierung

Seminar/Proseminar Natural Language Processing im Wintersemester 2013/2014

Allgemeine Informationen

Themengebiete
Verschiedene Themen zur maschinellen Verarbeitung natürlicher Sprachen, z. B.
Zielgruppen
engagierte Studenten folgender Studiengänge
  • Bachelor Informatik: Module INF-B-510 (Proseminar), INF-B-520 (Proseminar), INF-B-610 (Proseminar)
  • Master Informatik: Modul INF-AQUA (Seminar)
  • Diplom Informatik: Module INF-D-520 (Proseminar), INF-D-940 (Seminar)
  • Diplom Informatik (Studienordnung 2004 oder älter): Hauptseminar, Fachgebiet Theorie der Programmierung
Voraussetzungen für die Teilnahme
keine; Grundlagenwissen über die Themengebiete wird empfohlen
Voraussetzungen für das Bestehen
  • fristgerecht und eigenständig Termine mit den Betreuern machen (mindestens 1 Woche im Voraus) sowie die geforderten Materialien abliefern
  • (nicht für Proseminar) Seminararbeit von 12–15 Seiten, mit Titel, Autor, Einleitung (mind. 1 Seite), vollständigen Referenzen, begrifflich und notationell in sich abgeschlossen, Inhalte mit Beispielen und Bildern anschaulich gemacht; davon eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
  • (Proseminar) Handout 1–2 Seiten (nur ein Blatt!)
  • (für alle) Vortrag von 30–35 Minuten, durch Medien geeignet unterstützt: Beamer-Folien, Tafel, physische Folien, Handout etc.; von allem eine Vorabversion: inhaltlich vollständig, aber in der Darstellung noch rudimentär
  • Anwesenheit bei allen Vorträgen, aktive Teilnahme an den Diskussionen
  • bei Einbringen in eine mündliche Prüfung: Übersichtswissen über die Seminarbeiträge (Kernthesen)

Terminplan

Datum Ereignis
42. KW, Mittwoch, 16. Oktober 2013, 13:00 Uhr erstes Treffen und Themenvergabe im Raum INF/3027
bis 45. KW, Mittwoch, 6. November 2013 Termine mit Betreuern (rechtzeitig verabreden!); Ziel: in der Lage sein, dem Betreuer das Problem und die beschriebenen Ansätze zu skizzieren und auf Nachfragen zu reagieren; Fragen an den Betreuer müssen ganz konkret formuliert werden.
bis 47. KW, Sonntag, 24. November 2013 Vorabversion der Seminararbeit abgeben, Termine zur Besprechung machen
bis 50. KW, Sonntag, 15. Dezember 2013 fertige Seminararbeit abgeben
bis 3. KW, Mittwoch, 15. Januar 2014 Vorabversion der Vortragsmaterialien abgeben, Termine zur Besprechung machen
bis 5. KW, Sonntag, 2. Februar 2014 fertige Vortragsmaterialien abgeben
6. KW, Mittwoch, 5. Februar 2014, 8:00–12:00 Uhr Vorträge in Reihenfolge der vergebenen Themen im Raum INF/3027

(KW = Kalenderwoche)

Themen

Folien zur Themenvorstellung (nur aus dem Universitätsnetz abrufbar)

Thema Literatur Student Material
Probabilistic CFG with latent annotations [1]
Learning accurate, compact, and interpretable tree annotation [2] André Vogelsang Seminararbeit, Folien
Probabilistic Context-Free Grammars Estimated from Infinite Distributions [3] Oleksiy Pitkin Handout, Folien
Improved Inference for Unlexicalized Parsing [4]
Hierarchical A* parsing with bridge outside scores [5]
Smoothing of n-gram models (Proseminar) [6, Abschnitt 4.5] Raphael Höps Handout, Folien, Zusatzfolien, Polyluxfolie
Coarse-to-Fine Syntactic Machine Translation using Language Projections [7] Christof Leonhardt Seminararbeit, Folien, Polyluxfolie
Evaluation of SMT systems (Proseminar) [8, Kapitel 8]

Literatur

Downloads teilweise nur aus dem Universitätsnetz. Literatur [6] und [8] findet man in der SLUB.

  1. Takuya Matsuzaki, Yusuke Miyao und Jun’ichi Tsujii. „Probabilistic CFG with latent annotations“. In: Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics. ACL ’05. Ann Arbor, Michigan: Association for Computational Linguistics, 2005, S. 75–82. doi: 10.3115/1219840.1219850.
  2. Slav Petrov, Leon Barrett, Romain Thibaux und Dan Klein. „Learning accurate, compact, and interpretable tree annotation“. In: Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics. ACL-44. Sydney, Australia: Association for Computational Linguistics, 2006, S. 433–440. doi: 10.3115/1220175.1220230.
  3. Anna Corazza und Giorgio Satta. „Probabilistic Context-Free Grammars Estimated from Infinite Distributions“. In: IEEE Transactions on Pattern Analysis and Machine Intelligence 29.8 (2007), S. 1379–1393. issn: 0162-8828. doi: 10.1109/TPAMI.2007.1065.
  4. Slav Petrov und Dan Klein. „Improved Inference for Unlexicalized Parsing“. In: Human Language Technologies 2007: The Conference of the North American Chapter of the Association for Computational Linguistics; Proceedings of the Main Conference. Rochester, New York: Association for Computational Linguistics, Apr. 2007, S. 404–411. url: http://www.aclweb.org/anthology/N/N07/N07-1051.
  5. Adam Pauls und Dan Klein. „Hierarchical A* parsing with bridge outside scores“. In: Proceedings of the ACL 2010 Conference Short Papers. ACLShort ’10. Uppsala, Sweden: Association for Computational Linguistics, 2010, S. 348–352. url: http://dl.acm.org/citation.cfm?id=1858842.1858906.
  6. Daniel Jurafsky und James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Second Edition. Upper Saddle River, NJ, USA: Prentice Hall, 2009. isbn: 978-0-13-504196-3.
  7. Slav Petrov, Aria Haghighi und Dan Klein. „Coarse-to-Fine Syntactic Machine Translation using Language Projections“. In: Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing. Honolulu, Hawaii: Association for Computational Linguistics, Okt. 2008, S. 108–116. url: http://www.aclweb.org/anthology/D08-1012.
  8. Philipp Koehn. Statistical Machine Translation. Cambridge University Press, 2010.

Hilfsangebote

Wir haben einige Hinweise zum Verfassen schriftlicher Arbeiten online. Ganz allgemein: Wenn Sie Fragen haben, zögern Sie nicht, sich an Ihren Betreuer zu wenden. Je eher ein Problem angesprochen wird, desto einfacher wird seine Lösung ausfallen.

Stand: 19.2.2014, 14:14 Uhr
Autor: Dipl.-Inf. Toni Dietze

Kontakt
Prof. Dr.-Ing. habil. Dr. h.c./Univ. Szeged
Heiko Vogler

Tel.: +49 (0) 351 463-38232
Fax: +49 (0) 351 463-37959
E-Mail-Kontaktformular

Bitte entschuldigen Sie – beim Einbinden der Informationen ist ein Fehler aufgetreten