TUD Logo

TUD Startseite » ... » CGV LV-archiv » WS 12/13 » Hauptseminar Computergraphik

Computergraphik

Hauptseminar Computergraphik

Feature Based Object Detection and Image Retrieval Techniques

WS 12/13, 0/2/0
HS-INF, IST
INF-BAS7 Graphische Datenverarbeitung
INF-VERT7 Vertiefungsmodul Graphische Datenverarbeitung

Bitte tragen Sie sich im jExam in die LV ein!

Dozent

Prof. Dr. S. Gumhold
Dipl.-Bioinf. Marcel Spehr
Dipl.-Medieninf. Eric Brachmann

Materialien

Einführungsfolien, Themen, Hinweise zu Vorträgen und Publikationen

Termine

Achtung: Das Hauptseminar wurde mit dem Hauptseminar Wissenschaftliche Visualisierung zusammengelegt.

Ausgewählte Termine immer Montags in der 4.DS im Raum 2101 (Ei).

Inhalt

Das Hauptseminar befasst sich mit Themen des Content Based Image Retrieval (CBIR) und der Objekterkennung. Durch ein umfangreiches Arsenal von mobilen Geräten und erschwinglichen Kameras ist unser Leben inzwischen von digitaler Fotografie geprägt. Auch in Wissenschaft und Industrie fallen große Mengen an Bilddaten an. Ohne automatische Verfahren zum Ordnen und Filtern kann diese Bilderflut kaum noch sinnvoll genutzt werden. Für die meisten Anwendungsszenarien ist der Bildinhalt - die Kenntnis was im Bild dargestellt ist - von zentraler Bedeutung. Diese Information automatisch aus einem Bild zu extrahieren, ist ein schwieriges aber auch spannendes Problem, dem sich die Forschungfelder CBIR und Objekterkennung stellen.

Wir werden uns im Hauptseminar insbesondere mit folgenden Aspekten auseinandersetzen:

  • Globale Bildmerkmale: Beschreiben das Bild als Ganzes. Dies wird beispielweise in der Szenenkategorisierung angewendet. Handelt es sich um ein Stadtpanorama oder eine Autobahn?
  • Lokale Bildmerkmale: Beschreiben markante Punkte im Bild. Bestimmte Objekterkennungsverfahren können so feststellen, ob ein gesuchter Gegenstand im Bild vorkommt oder nicht.
  • Texturdeskriptoren: Beschreiben die Eigenschaften von mehr oder weniger homogenen Bildflächen.
  • Segmentierung: Zerlegt Bilder in zusammengehörige Komponenten die dann einzeln beschrieben werden können.
  • Maschinenlernalgorithmen: Können anhand obiger Beschreibungen unbekannte Bilder klassifizieren oder Strukturen in Bildmengen erkennnen.
  • Ähnlichkeitsmaße:Geben mittels der Bildbeschreibungen an, wie stark sich 2 Bilder ähneln.
  • Semantic Gap: Beschreibt das Problem, das Bildeigenschaften wie Helligkeit, Kontrast oder Farbe nur selten darauf schließen lassen, was im Bild eigentlich zu sehen ist.
  • Evaluierung: Beschäftigt sich mit der Frage, wie gut Retrieval-Anfragen beantwortet oder Objekte erkannt werden.
  • Visualisierungstechniken: Liefern einem Nutzer sinnvolle Sichten auf große Bilddatenbanken.

Jeder Teilnehmer hält einen Vortrag mit anschließender Diskussion zu dem ihm zugeteilten Thema. Außerdem ist eine schriftliche Ausarbeitung anzufertigen. Gern nehmen wir bei der Gestaltung der Vortragsthemen Rücksicht auf eigene Vorschläge und persönliche Interessen der Teilnehmer!

Stand: 14.11.2012, 17:05 Uhr
Autor: Dr.-Ing. Wilfried Mascolus