Analysis of the Internal Coherence of Subject Categories in the Web of Science

Start of the project: 2017-Jul-01 - End of the project: 2017-Aug-31

Um fachspezifisch unterschiedliches Publikations- und Zitierverhalten für die bibliometrische Indikatorik auszugleichen, werden Publikations- und Zitationsindiaktoren in der Regel normalisiert. Für Untersuchungen im Web of Science, einer der größten und für bibliometrische Studien am meisten verwendeten Datenbanken, steht dafür das vom Datenbankhersteller bereitgestellte überlappende Klassifikationssystem der Subject Categories zur Verfügung. Zitationsindikatoren wie der mean normalized Citation Score (Waltman, van Eck, van Leeuwen, Visser, & van Raan, 2011) normalisieren die Zitationsrate eines gegebenen Publikationskorpus mit Erwartungswerten, die auf der Grundlage der Subject Categories (SCs) berechnet werden. Die beobachteten Werte werden somit in Relation gesetzt zu ihren unmittelbaren fachlichen Kontexten und erst dadurch auch fachübergreifend zu validen und vergleichbaren Kennziffern.

Die Web of Science-Subject Categories wurden innerhalb der bibliometrischen Fachcommunity oft kritisiert, u.a. weil die Klassifizierung nicht auf der Ebene der einzelnen Artikel, sondern der Journals vorgenommen wird (siehe Leydesdorff & Rafols ( 2009) für genauere Angaben) und deshalb als relativ ungenau und wenig adäquat angesichts von zeitlicher Dynamik und zunehmender Interdisziplinarität (Gómez, Bordons, Fernández, & Méndez, 1996) gilt. Jedoch bleibt diese Kritik in der Regel im Rahmen anekdotischer Evidenz, eine umfassende Untersuchung zur Kohärenz der Subject Categories ist nicht vorhanden.

Die Subject Categories des WoS sind offensichtlich in Größe und Spezifität unterschiedlich. Van Eck, Waltman, Van Raan, Klautz, & Peul (2013) zeigen Evidenzen für eine Heterogenität innerhalb der medizinischen Subject Categories entlang der Dimension klinischer und experimenteller Forschung auf. Innerhalb der graphischen Struktur als experimentell verortete Publikationen weisen dabei höhere Zitationszahlen auf – ein Befund, der Probleme aufwirft für die Normalisierung anhand von Subject Categories. Diese Analyse ist jedoch aufgrund ihres Fokus auf die Medizin in einer bestimmten zeitlichen Periode zum einen inhaltlich beschränkt und zum anderen kann keine Betrachtung einer zeitlichen Dynamik angeboten.

Für die Normalisierung – nicht nur mit dem MNCS sondern auch mit Perzentil-Methoden – ist die inhaltliche Homogenität der Subject Categories essentiell.

Erklärtes Ziel ist daher, die bestehende SC-Klassifikation analytisch zu durchleuchten und dafür Darstellungsmöglichkeiten zu entwickeln. Die Forschungsfrage ist, in welchem Ausmaß etwaige Heterogenitäten die Normalisierung mit SCs beeinträchtigen, ob sich – fachlich – problematischere oder unproblematischere Bereiche der Klassifikation angeben lassen und wie sich das Phänomen über die Zeit entwickelt. Des Weiteren werden Erklärungsansätze (wie z.B. die Zitationsautarkie) für heterogene Strukturen mit unterschiedlichen Zitationsmustern innerhalb von SCs getestet.

Contact person

Stephan Stahlschmidt
Dr. Stephan Stahlschmidt +49 30 2064177-18

Researchers

Marion Schmidt