TUD Logo

TUD Home » ... » Research Projects » Finished Reference Projects » Finished Reference Project

Computer Networks

Finished Reference Project

Project:

Effingo - Similarity Relations in Social Media

  • social media
  • internet information retrieval
  • similarity metrics
  • grouping
  • clustering
  • classification
  • information extraction
  • information retrieval

Overview:

Im Projekt Effingo untersuchen wir Ähnlichkeitsbeziehungen zwischen Beiträgen aus sozialen Medien, wobei der Schwerpunkt auf sogenannten Web-Foren oder Boards liegt. Das Projekt versucht anhand verschiedenster Merkmale solcher Beiträge Ähnlichkeitsmaße zu ermitteln. Dabei werden aber nicht nur teilweise oder komplett kopierte Inhalte betrachtet sondern speziell semantische Beinaheduplikate (Near-Duplicates). Solche entstehen häufig wenn eine schon existierende Diskussion zu einem Thema aufgrund von Unzulänglichkeiten bestehender Suchmaschinen und der zunehmenden Informationsüberlastung nicht gefunden werden kann. Nutzer sozialer Medien erstellen in solchen Fällen häufig einfach eine neue Diskussion und beschreiben das schon diskutierte Problem erneut in ihren eigenen Worten. Dadurch wird wiederrum die Informationsüberlastung erhöht was zu weiteren thematischen Beinaheduplikaten führt - ein Teufelskreis.

Schwerpunkte

  • Untersuchung von Ähnlichkeitsmetriken für Texte
  • Untersuchung semantischer Ähnlichkeitsmetriken
  • Clustering und Klassifikation von Nutzerbeiträgen sozialer Medien
  • Qualitätsauswertung und Merkmalsselektion in Nutzerbreiträgen sozialer Medien

» Projects homepage


Project leader:

Dr.-Ing. Klemens Muthmann



Resources:


Recent publications:

    1. Klemens Muthmann, Alexander Löser:
    Detecting Near-Duplicate Relations in User Generated Forum Content;
    OTM Workshops; 698-707; Kreta; 10/2010

    2. Klemens Muthmann:
    Grouping of Near Duplicates in User Generated Forum Content.;
    Tagungsband Informatiktage 2009; Gesellschaft für Informatik; Bonn; 3/2009

    3. Klemens Muthmann, Alexander Löser, Wojciech Barczynski, Falk Brauer:
    Near-duplicate detection for web-forums.;
    BytePress; 142-151; ACM; Bipin C. Desai; Cetraro; 9/2009


Student Assignments:

Show all


Last modified: 24th Jan 2018, 4.31 AM
Author: Webmaster