Erschließung digitaler Textarchive über Metadaten und Lemmata


Ziel des Projekts ist die Entwicklung eines Werkzeugs, das eine bessere Erschließung ausgewählter historischer Archive ermöglichen und den Weg zur Erschließung weiterer Archive ebenen soll. Das Suchwerkzeug soll eine Abfrage nach Lemmata ermöglichen und auf der Grundlage von Metadaten ein geeignetes Korpus zusammenstellen. Die dazu benötigten Sekundärdaten und Werkzeuge (Datenbanken, Lexika, morphologische Analysierer) sollen über Webservices bereitgestellt werden.
Das Projekt wird am Beispiel des Polnischen ausgeführt, ein mit seinen zahlreichen Flexionen und der starken orthographischen Variation eher schwieriges Fallbeispiel. Dadurch sollte allerdings auch die Übertragbarkeit des Werkzeugs auf andere Sprachen gut möglich sein Die Zusammenarbeit mit den CLARIN-D Zentren in Saarbrücken, Tübingen, Nijmegen, Berlin und Leipzig ist von elementarer Bedeutung für die Realisierung des Kurationsprojekts.

Projektleitung
Meyer, Roland Prof. Dr. (Details) (Westslawische Sprachen)

Laufzeit
Projektstart: 01/2013
Projektende: 08/2015

Zuletzt aktualisiert 2020-10-03 um 23:06