Frankfurt: Mit dem Linguistik-Portal in die Cloud

Frankfurt am Main – Die Deutsche Forschungsgemeinschaft (DFG) hat einen Förderantrag der Universitätsbibliothek Johann Christian Senckenberg bewilligt, der gemeinsam mit Prof. Christian Chiarcos vom Forschungsgebiet Angewandte Computerlinguistik (ACoLi) am Institut für Informatik der Goethe-Universität erarbeitet wurde. Die Fördermittel dienen dazu, im Verlauf von drei Jahren einen Fachinformationsdienst (FID) Linguistik aufzubauen.

In den Sprachwissenschaften gewinnen digitale Textkorpora seit Jahren an Bedeutung. Nicht nur angewandte Linguisten und Computerlinguisten, sondern alle empirisch arbeitenden Geisteswissenschaftler rekurrieren zunehmend auf große textbasierte Datenmengen, deren Analyse durch automatisierte Verfahren erleichtert wird. Das daraus erwachsene, breite Forschungsfeld der Digital Humanities bedient sich dabei linguistischer Methoden. Der FID Linguistik hat sich zum Ziel gesetzt, solche korpuslinguistischen Vorhaben durch verschiedene Maßnahmen zu fördern:

Die Sichtbarkeit von Textkorpora und von wissenschaftlichen Veröffentlichungen, die Textkorpora behandeln, soll erhöht werden. Zu diesem Zweck werden alle geeigneten Publikationen, die in der an der Bibliothek seit vier Jahrzehnten erstellten Bibliography of Linguistic Literature (BLL) verzeichnet sind, mit den jeweils behandelten Forschungsdaten (Sprachkorpora, elektronische Wörterbücher etc.) verlinkt. Ein weiterer Projektbestandteil ist, die Recherche nach forschungsrelevanten Primärdaten zu optimieren. Um dies zu erreichen, werden NLP-Werkzeuge verwendet und weiter entwickelt, mit deren Hilfe nur formal ausgezeichnete Forschungsprimärdaten automatisch durch inhaltliche Schlagwörter angereichert werden und so leichter gefunden werden können.

Ergänzend ist geplant, im Rahmen des FID Linguistik überregionale Lizenzen für kommerzielle, multilinguale Sprachkorpora abzuschließen, um Wissenschaftlern den Zugang zu solchen kostenpflichtigen Forschungsprimärdaten zu erleichtern. Die Ergebnisse dieser Maßnahmen werden in das Linguistik-Portal einfließen. Dabei handelt es sich um ein internetbasiertes Fachportal für die allgemeine Linguistik, die vergleichende Sprachwissenschaft und die Linguistiken der Einzelphilologien, das unter www.linguistik.de einen breit angelegten, einheitlichen Zugang zu fachspezifischer Literatur und anderen wissenschaftlichen Informationsquellen bietet.

Ein innovatives Merkmal des Linguistik-Portals ist die Vernetzung mit der Linked Open Data Cloud. Dadurch können heute schon Online-Ressourcen aus der Cloud über eine einfache Portalsuche gefunden werden. Und umgekehrt kann man zu einer Ressource in der Cloud über die vorhandene Verlinkung passende Sekundärliteratur im Linguistik-Portal finden.

Die Kernmodule des Linguistik-Portals, die in den Jahren 2012-2014 mit DFG-Förderung in Zusammenarbeit mit dem Institut für Deutsche Sprache (IDS) Mannheim und der Arbeitsgruppe LinseLinks an der Universität Duisburg-Essen aufgebaut wurden, werden in die Webpräsenz des Fachinformationsdienstes übernommen. Dazu zählen ein umfassendes Verzeichnis linguistisch relevanter elektronischer Zeitschriften und Online-Datenbanken sowie Verzeichnisse thematischer Webseiten, sprachwissenschaftlicher Forschungsprojekte und Online-Wörterbücher – auch zu weniger bekannten Sprachen. Der virtuelle Katalog für die gleichzeitige Recherche in mehreren Fachkatalogen, Bibliografien, Open-Access-Repositorien und den portaleigenen Modulen wird kontinuierlich erweitert.

Die Einrichtung des Linguistik-Portals geht zurück auf das Sondersammelgebiet „Allgemeine und Vergleichende Sprachwissenschaft, Allgemeine Linguistik“, das von 1950 bis 2015 im Auftrag der DFG an der Universitätsbibliothek betreut wurde und dessen Aufgabe es war, die wissenschaftliche Literatur zur allgemeinen Linguistik einschließlich ihrer Grenz- und Nachbardisziplinen so vollständig wie möglich zu sammeln. Bestandteil des Serviceangebots des FID Linguistik ist auch weiterhin der Erwerb von gedruckter oder elektronischer Literatur für die Spitzenforschung – unter besonderer Berücksichtigung des aktuellen Bedarfs der Fachcommunity.
Durch die Teilnahme der Universitätsbibliothek Johann Christian Senckenberg an dem neuen DFG-Förderprogramm „Fachinformationsdienste für die Wissenschaft“ wird die Tradition eines herausragenden Infrastrukturangebots für die linguistische Forschung aufrechterhalten.