Menü

Linked Open Research Data for Social Science Pilot Study (LORDpilot)

Projektbeginn: 01.06.2022 - Projektende: 30.09.2023

Die Nachnutzung von Forschungsdaten ist ein wichtiger Bestandteil der Forschungspraxis in den Sozial- und Wirtschaftswissenschaften. Um geeignete Daten zu finden, brauchen Forschende gut funktionierende Suchmöglichkeiten. Eine übergreifende inhaltliche Suche nach Forschungsdaten, die nicht auf einzelne Umfragen beschränkt ist, wird jedoch durch eine uneinheitliche oder fehlende semantische Erschließung der Daten erschwert. Da die einzelnen Erhebungsprogramme eine jeweils eigene Terminologie nutzen, um ihre Daten zu beschreiben, und in der Dokumentation oft eine Verbindung zwischen den gemessenen theoretischen Konzepten und den Daten fehlt, ist es für Forschende aufwendig, relevante oder vergleichbare Daten zu identifizieren. Aus Nutzendensicht behindert die Fragmentierung in der Datendokumentation die Datensuche und schränkt deshalb das Forschungspotential existierender Bestände erheblich ein. Die spezifische Herausforderung für eine Verbesserung der Datensuche ist deshalb die konzeptorientierte Erschließung von Forschungsdaten. Weil eine semantische Modellbildung für die inhaltliche Erschließung bislang fehlt, wird eine Technologie für eine einheitliche, semantische Indexierung der Forschungsdaten benötigt. Mit der LORDInfrastruktur soll diese Lücke geschlossen werden.

Die zu entwickelnde Concept Registry sozial- und wirtschaftswissenschaftlicher Konzepte wird, den FAIR Prinzipien entsprechend, der Scientific Community für die Datendokumentation bereitgestellt. Das ‚LORDpilot‘-Projekt prüft die Umsetzbarkeit einer solchen Concept Registry für die Sozial- und Wirtschaftswissenschaften, entwickelt dafür ein grundlegendes Datenmodell sowie eine nutzerfreundliche Eingabemaske. Dafür werden exemplarisch für eine Auswahl sich überschneidender Messinstrumente der zentralen Datenkollektionen der Disziplinen (ALLBUS, SOEP, Nacaps) Konzepte identifiziert, Fragen und Variablen mit den Konzepten verknüpft und Beziehungen über die Konzepte zwischen den Datenkollektionen hergestellt. Die Identifizierung der theoretischen Konzepte erfolgt über eine intellektuelle Analyse und einen Vergleich sowie durch Recherche zu Messinstrumenten und datensatzbezogenen Publikationen. Für die technische Umsetzung werden Standards des Semantic Web eingesetzt. Durch die Verknüpfung der Konzepte mit Deskriptoren aus den SKOS-konformen Thesauri „Thesaurus Sozialwissenschaften“ (TheSoz) und „Standard-Thesaurus Wirtschaft“ (STW) wird die Suche in der Konzept-Datenbank unterstützt und das Konzeptvokabular unmittelbar in die Linked Open Data (LOD)-Cloud eingebunden. Zur Erstellung des Datenmodells wird die Modellierungssprache UML (United Modeling Language) verwendet. Die Verknüpfungen werden in Form von sogenannten RDF-Triples erstellt und verwaltet.

Ansprechperson

Andreas Daniel
Dr. Andreas Daniel 0511 450670-402

Projektmitarbeit

Daniel Klein

Externe Ansprechpartner*innen

Dr. Pascal Siegers
Dr. Dagmar Kern
Dr. Jan Goebel
Antonia May
Fakhri Momeni
Dr. Benjamin Zapilko
Jana Nebelin
Claudia Saalbach
Knut Wenzig

Kooperationspartner

Deutsches Institut für Wirtschaftsforschung GESIS – Leibniz-Institut für Sozialwissenschaften

Gefördert von

Deutsche Forschungsgemeinschaft