Eine minimale Infrastruktur für die nachhaltige Bereitstellung erweiterbarer Mehrebenensoftware für linguistische Korpora


Ziel des Projekts sind Entwurf, Implementierung, Evaluation und Dokumentation einer minimalen Infrastruktur für die nachhaltige Bereitstellung von Forschungssoftware. Hypothetisch kann eine Infrastruktur im akademischen Kontext nur dann nachhaltig betrieben werden, wenn die von der entsprechenden akademischen Institution dafür bereitzustellenden Mittel für technische Ressourcen und Personal von vornherein langfristig minimiert sind. Am Beispiel der Bereitstellung von Mehrebenenannotationssoftware für linguistische Korpora zeigt das Projekt, dass für eine solche Infrastruktur lediglich vier Komponenten essentiell sind: eine Repositorienplattform für Quellcode; ein Repositorium für die Bereitstellung von Versionen der Software für Endbenutzer*innen; ein Repositorium für die Bereitstellung von Abhängigkeiten der Software (Softwarebibliotheken); ein Maintainer, der Infrastruktur und bereitgestellte Software pflegt und veröffentlicht und die Community der Benutzer*innen und Entwickler*innen organisiert. Lediglich der Maintainer muss durch die wissenschaftliche Institution finanziert werden, für alle anderen Komponenten steht potenziell nachhaltige, kostenfreie externe Infrastruktur bereit. Weitere Voraussetzung für das nachhaltige Bestehen der im Projekt entwickelten Infrastruktur ist die technische Nachhaltigkeit der bereitgestellten Software. Im Rahmen des Projekts wird der Prototyp "GraphAnno" zur Produktionsreife weiterentwickelt. Das resultierende Produkt "Hexatomic" hat durch Erfüllung eines hohen Bedarfs seitens der wissenschaftlichen Community ein großes, nachgewiesenes Nutzungspotenzial in einer Vielzahl linguistischer Disziplinen. "Hexatomic" wird außerdem bereits frühzeitig während der Projektlaufzeit die Voraussetzung der technischen Nachhaltigkeit erfüllen durch die Umsetzung bewährter Methoden der Softwaretechnik, wie z.B. reproduzierbare Builds durch ein automatisiertes Buildsystem, umfassende Dokumentation aller Implementierungsaspekte, eine liberale Open-Source-Lizenz, Portabilität und Lauffähigkeit auf verschiedenen Betriebssystemen, umfassende Testsuiten, öffentliche Bereitstellung des Quellcodes, Erweiterbarkeit und Anpassbarkeit durch Modularität und ein generisches Datenmodell, weitreichende Kompatibilität mit anderer Software und Datenstandards sowie strukturierte Communityprozesse. Nicht nur das Entfalten des Nutzungspotenzials von "Hexatomic", auch das Potenzial für langfristige, projektunabhängige Weiterentwicklung wird im Projekt evaluiert und dokumentiert, unter anderem durch Akquise externer Kontribution von funktionalen Modulen. Ebenso wird das minimale Infrastrukturmodell nicht nur konkret implementiert. Seine Implementierung wird vielmehr dokumentiert, getestet, die Testergebnisse wiederum dokumentiert und zu Best Practices verdichtet, die ein wesentliches Projektziel ausmachen. Insgesamt stellt das Projekt einen wichtigen Beitrag zur Evaluation von Mindestvoraussetzungen nachhaltiger Infrastrukturen für wissenschaftliche Software dar.


Projektleitung
Lüdeling, Anke Prof. Dr. phil. (Details) (Sprachwissenschaft des Deutschen / Korpuslinguistik/Morphologie)

Beteiligte externe Organisationen

Mittelgeber
DFG: Sachbeihilfe

Laufzeit
Projektstart: 10/2018
Projektende: 12/2021

Forschungsbereiche
Allgemeine und Vergleichende Sprachwissenschaft, Typologie, Außereuropäische Sprachen, Angewandte Sprachwissenschaften, Experimentelle Linguistik, Computerlinguistik, Sicherheit und Verlässlichkeit, Softwaretechnik und Programmiersprachen

Zuletzt aktualisiert 2022-08-09 um 15:06