Reading at Scale: Mixed Methods in der literaturwissenschaftlichen Korpusanalyse

bearbeitet von: Thomas Weitin, Ulrik Brandes
gefördert von der Volkswagen Stiftung
 

Das Projekt ‚Reading at Scale‘ beruht auf folgendem Ansatz: Wenn hermeneutische und statistische Methoden ihre je eigenen Stärken in der detaillierten Einzelanalyse und im Umgang mit großen Datenmengen haben, ist ein Mixed Methods-Ansatz besser für die mittlere Ebene geeignet als die beiden Methoden allein. Literarische Texte und Textkorpora ermöglichen Analysen in unterschiedlichen Auflösungsstufen von der Zeichenebene im einzelnen Werk bis hin zu ganzen Literaturen, wobei Literaturwissenschaft und Literaturgeschichte traditionell viele Forschungsfragen auf der mittleren Ebene untersuchen. Im Fokus unserer Studien steht eine historische Sammlung von 86 Novellen, die unter dem Titel „Der deutsche Novellenschatz“ (24 Bände, 1871-1876) von den Herausgebern Paul Heyse und Hermann Kurz veröffentlicht wurde. Wir haben diese realismusorientierte Anthologie bereits als TEI XML Korpus aufbereitet, weitere solche Sammlungen werden folgen. Dank ihrer mittleren Größe liegt die Novellensammlung noch in der Reichweite individueller Lektüre und hat doch schon eine für statistische Analysen vielversprechende Größe. Unser Textkorpus wird von drei Dissertationen auf unterschiedlichen Operationalisierungsstufen untersucht: (1) eine stilometrische Korpusanalyse soll das Problem des realistischen Stils erforschen; (2) eine Netzwerkanalyse beschäftigt sich mit Problemen der Distinktion innerhalb populärer Literatur; (3) eine vergleichende Studie untersucht den „Deutschen Novellenschatz“ als ein wirkungsvolles Instrument der Kanonisierung und als programmatischen Versuch einer nicht-narrativen Literaturgeschichte. Die beiden Projektleiter integrieren die Einzelstudien aus der Perspektive methodologischer Grundlagenforschung: Ein algorithmisches Subprojekt eruiert Konzepte der Position in der Netzwerkforschung, ein literaturwissenschaftliches Subprojekt konzentriert sich auf Probleme der Validierung bei digitalen Analysen.