Pamphlet #4. Falkentopics

Thomas Weitin, Katharina Herget, November 2016

Topic Modeling gehört zu den vielversprechenden Verfahren für die quantitative Exploration semantischer Strukturen. Die Schöpfer der entsprechenden Algorithmen beschreiben die Anwendung im Hinblick auf große Textmengen, in denen versteckte thematische Zusammenhänge ermittelt werden, die das bloße Auge nicht wahrnehmen kann.
Wir haben Topic Modeling dagegen an einem mittelgroßen Korpus von Novellen erprobt, das sich wohl durch individuelle Lektüre als auch durch statistische Verfahren erschließen lässt. Angetrieben hat uns dabei eine bislang wenig beachtete Beobachtung: Diejenigen Wissenschaftler, denen es gelungen ist, statistische Verfahren bei der literarischen Korpusanalyse so angemessen einzusetzen, dass sie einschlägig werden konnten, kannten die verwendeten Korpora jeweils ausgezeichnet.
Weil wir über unser Novellenkorpus ebenfalls eine Menge wussten, war es uns möglich, die ermittelten Topics textrelevanten Themen zuzuordnen. Unter dem Stichwort ‚Falkentopics‘ beschreiben wir darüber hinaus eine andere Art von Topics, die den speziellen Plot einzelner Texte wiederzugeben scheinen.
 
 

Topic modeling is one of the more promising quantitative procedures for exploring semantic structures. The creators of the corresponding algorithms use large text sets to investigate hidden thematic connections which cannot be perceived by the eye alone.
We have, by contrast, tested a medium-sized corpus of novellas that can be explored using both individual readings and statistical procedures. We were motivated by a previously little considered observation: The scholars who have been able to implement statistical procedures for literary corpus analysis in a pertinent way were all extraordinarily familiar with their respective corpora.
Because we were also very familiar with our set, it was possible for us to order the topics being studied according to text-relevant themes. Using the keyword “falcon topics,” we describe another type of Topics, ones which seem to reflect the special character of individual texts.

 

[ Download (DE) ]

[ Download (ENG) ]