Der Deutsche Novellenschatz als use case für Topic Modeling

bearbeitet von: Thomas Weitin

 

Erkenntnismöglichkeiten an einem mittelgroßen realistischen Gattungskorpus: Der „Deutsche Novellenschatz“ von Paul Heyse und Hermann Kurz (1871-1876).

 

Das Korpus des „Deutschen Novellenschatzes“ umfasst 86 Texte von 82 Autorinnen und Autoren, die umfangreich mit Metadaten angereichert worden sind. Die quantitativen Analysen finden vor dem Hintergrund des historischen Problems statt, auf das diese Sammlung reagiert, und beschäftigen sich mit den Auswirkungen literarischer Massenproduktion. Die Frage nach den Möglichkeiten der Distinktion unter den Bedingungen massenhafter Ähnlichkeit ist sowohl gattungspoetisch als auch für die experimentelle Methode der Literaturgeschichtsschreibung relevant, die der Novellensammlung zugrunde liegt. Topic Models sollen dabei helfen, stilometrisch und netzwerkanalytisch gewonnene Erkenntnisse über globale Ähnlichkeiten und lokale Ähnlichkeitsgruppen im Korpus weiter zu orientieren.