TUD Logo

TUD Startseite » ... » Forschungsprojekte » Archiv Forschungsprojekte » Abgeschlossenes Referenzprojekt

Rechnernetze

Abgeschlossenes Referenzprojekt

Projekt:

Effingo - Ähnlichkeitsbeziehungen in Sozialen Medien

  • social media
  • internet information retrieval
  • similarity metrics
  • grouping
  • clustering
  • classification
  • information extraction
  • information retrieval

Übersicht:

Im Projekt Effingo (lat.: duplizieren, kopieren) untersuchen wir Ähnlichkeitsbeziehungen zwischen Beiträgen aus sozialen Medien, wobei der Schwerpunkt auf sogenannten Web-Foren oder Boards liegt. Das Projekt versucht anhand verschiedenster Merkmale solcher Beiträge Ähnlichkeitsmaße zu ermitteln. Dabei werden aber nicht nur teilweise oder komplett kopierte Inhalte betrachtet sondern speziell semantische Beinaheduplikate (Near-Duplicates). Solche entstehen häufig wenn eine schon existierende Diskussion zu einem Thema aufgrund von Unzulänglichkeiten bestehender Suchmaschinen und der zunehmenden Informationsüberlastung nicht gefunden werden kann. Nutzer sozialer Medien erstellen in solchen Fällen häufig einfach eine neue Diskussion und beschreiben das schon diskutierte Problem erneut in ihren eigenen Worten. Dadurch wird wiederrum die Informationsüberlastung erhöht was zu weiteren thematischen Beinaheduplikaten führt - ein Teufelskreis.

Schwerpunkte

  • Untersuchung von Ähnlichkeitsmetriken für Texte
  • Untersuchung semantischer Ähnlichkeitsmetriken
  • Clustering und Klassifikation von Nutzerbeiträgen sozialer Medien
  • Qualitätsauswertung und Merkmalsselektion in Nutzerbreiträgen sozialer Medien

» Projekthomepage


Projektleiter:

Dr.-Ing. Klemens Muthmann



Ressourcen:


aktuelle Veröffentlichungen:

    1. Klemens Muthmann, Alexander Löser:
    Detecting Near-Duplicate Relations in User Generated Forum Content;
    OTM Workshops; 698-707; Kreta; 10/2010

    2. Klemens Muthmann:
    Grouping of Near Duplicates in User Generated Forum Content.;
    Tagungsband Informatiktage 2009; Gesellschaft für Informatik; Bonn; 3/2009

    3. Klemens Muthmann, Alexander Löser, Wojciech Barczynski, Falk Brauer:
    Near-duplicate detection for web-forums.;
    BytePress; 142-151; ACM; Bipin C. Desai; Cetraro; 9/2009


Studentische Arbeiten:

alle anzeigen


Stand: 19.6.2018, 8:33 Uhr
Autor: Webmaster