Projekt:
Intellix - Intelligente Adaptive Indexierung heterogener Dokumentenbasen
- IIR
- SaaS
- Dokumentenverwaltung
- Klassifikation
- Extraktion
Übersicht:

Im Projekt Intellix erarbeiten Mitarbeiter des Lehrstuhls Rechnernetze der Technischen Universität Dresden, gemeinsam mit der Firma DocuWare, Konzepte zur automatischen Indexierung elektronischer Dokumentensammlungen in modernen Dokumentenverwaltungssystemen (DMS).
Das Projekt konzentriert sich darauf den Aufwand für die Indexierung elektronischer Dokumentensammlungen stark zu reduzieren und diese Technologie somit auch für kleine Unternehmen und Heimwanwender interessant zu machen. Zu diesem Zweck sollen automatische Klassifikatoren und Extraktoren auf Dokumentensammlungen angewandt werden, um zum Beispiel Rechnungen von Mahnungen zu trennen und wichtige Informationen wie Absenderadressen, Rechnungsnummern und -Beträge automtisch zu extrahieren. Da solche Verfahren selten mit absoluter Sicherheit laufen wird das System durch Nutzerrückmeldungen verbessert werden die mittels eines SaaS Ansatzes für alle am System teilnehmenden Anwender zur Verfügung stehen. Die Vision ist eine automatische Klassifizierung und Extraktion der Dokumente kleiner Firmen und Heimanwender durch die großen Datenbestände die von größeren Kunden bereit gestellt werden. Andersherum sollen natürlich auch große Firmen vom Feedback profitieren, dass durch die vielen kleinen Unternehmen zur Verfügung steht. Dabei ist selbstverständlich auf die Sicherheit der Daten jedes einzelnen Anwenders zu achten.
Projektförderung:
Projektleiter:
Prof. Dr. rer. nat. habil. Dr. h. c. Alexander Schill
Projektmitarbeiter:
Dipl.-Medieninf. Klemens Muthmann
Dr.-Ing. Daniel Schuster
Dipl.-Medieninf. David Urbansky
aktuelle Veröffentlichungen:
1. Daniel Schuster, Klemens Muthmann, Daniel Esser, Alexander Schill, Michael Berger, Christoph Weidling, Kamil Aliyev, Andreas Hofmeier:
Intellix - End-User Trained Information Extraction for Document Archiving;
The 12th International Conference on Document Analysis and Recognition (ICDAR); Washington, DC, USA; 2013
2. Daniel Esser, Daniel Schuster, Klemens Muthmann, Michael Berger, Alexander Schill:
Automatic Indexing of Scanned Documents - a Layout-based Approach;
IS&T/SPIE Document Recognition and Retrieval XIX (DRR 2012); San Francisco, CA, USA; 2012
3. Marcel Hanke, Klemens Muthmann, Daniel Schuster, Alexander Schill, Kamil Aliyev, Michael Berger:
Continuous User Feedback Learning for Data Capture from Business Documents;
Workshop on Nonstationary Models of Pattern Recognition and Classifier Combinations under the framwork of HAIS2012, Salamanca, Spain; 2012
Studentische Arbeiten: