Potsdamer Zeitungskorpus - diachron
Das Potsdamer Zeitungskorpus ist eine diachrone Dependenzbaumbank, die sowohl Informationen zu den Lemmata und Wortarten als auch ausgewählte Dependenzrelationen der Universal Dependencies (UD) enthält. Der Aufbau der Baumbank erfolgte an der Universität Potsdam im Rahmen des Projekts C06 im SFB 1287 „Limits of Variability in Language: Cognitive, Computational, and Grammatical Aspects“, gefördert von der Deutschen Forschungsgemeinschaft (Projektnummer 317633480).
Das Korpus umfasst Zeitungstexte in strukturierter Auswahl, die in der Zeit von 1600 bis 1899 in unterschiedlichen Regionen Deutschlands publiziert wurden. Jedes 50-Jahres-Intervall enthält dabei Ausschnitte aus zwei unterschiedlichen Zeitungen, was zu einem Umfang von ca. 27.000 Wortformen je Zeitfenster führt. Insgesamt hat das Korpus einen Umfang von 171.375 Wortformen, die sich auf 7.594 Sätze verteilen.
Die Annotation von Lemmata und Wortarten erfolgte semi-automatisch: Nach der manuellen Segmentierung der Ganzsätze wurde mithilfe der Stanford Natural Language Processing Software zunächst automatisch das Lemma-Tagging und Part-of-Speech-Tagging vorgenommen. Anschließend wurden fehlerhafte Annotationen auf Wortebene manuell korrigiert. Die Annotation der Dependenzrelationen wurde im Double-Keying-Verfahren ebenfalls manuell erstellt. Der Zugang zum Korpus erfolgt über TüNDRA.
Zitierweise
Demske, Ulrike, Iskra Fodor, Emil Paraskevopulos, Laura Partikel & Malika Reetz. 2025. Potsdamer Zeitungskorpus - diachron. Universität Potsdam: Institut für Germanistik. DOI: https://doi.org/10.57754/FDAT.crpb9-vpr31
In der folgenden Tabelle sind die Zeitungstexte in der jeweiligen Zeitperiode aufgeführt, ebenso die Anzahl der Wortformen pro Zeitfenster sowie das Erscheinungsjahr der Zeitung. Die Abkürzungen der Zeitungstitel sind nachfolgend erläutert. Für alle Fragen das Potsdamer Zeitungskorpus betreffend wenden Sie sich bitte an Prof. Dr. Ulrike Demske, Universität Potsdam, Institut für Germanistik.
| Zeitperiode | 1600-1649 | 1650-1699 | 1700-1749 | 1750-1799 | 1800-1849 | 1850-1899 |
|---|---|---|---|---|---|---|
| Zeitungstexte | 1609_Rel | 1667_OP | 1724_BP | 1750_LZ | 1805_KukZ | 1859_AZ |
| 1628_OZ | 1667_Rel | 1743_MOP | 1766_OMZ | 1820_BN | 1881_BoZ | |
| Wortformen gesamt | 27.736 | 25.106 | 27.677 | 26.757 | 30.956 | 33.143 |
Legende
AZ = Allgemeine Zeitung. Stuttgart und Augsburg 1859. Nr. 2 und Beilage zu Nr. 2. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10504415-6.
BN = Berlinische Nachrichten von Staats- und gelehrten Sachen. Berlin 1820. Nr. 119–121. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10486266-1.
BoZ = Bonner Zeitung. Bonn 1881. Nr. 81–83. Universitäts- und Landesbibliothek Bonn, urn:nbn:de:0303-47557.
BP = Berlinische Privilegirte Zeitung. Berlin 1724. Nr. 95, 97, 98, 101, 103. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10404776-3.
KuKZ = Kaiserlich und Kurpfalzbairisch privilegierte Allgemeine Zeitung. Stuttgart 1805. Nr. 1–4. München: Bayerische Staatsbibliothek, bsb10504751_00133_u001.
LZ = Leipziger Zeitungen. Leipzig 1750. Nr. 1 (Woche 4, 15), 2 (Woche 3, 4), 3 (Woche 2, 5, 15), 4 (Woche 3, 4). Staatsbibliothek zu Berlin, urn:nbn:de:gbv:46:1-6030.
MOP = Mercurii Relation, oder wochentliche Ordinari Zeitungen von unterschiedlichen Orthen. Münchner Post=Zeitungen. München 1743. Nr. 1–16. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10505638-7.
OMZ = Ordinari=Müncher=Zeitungen, Welche Montags, Dienstags, Donnerstags, und Freytags ausgegeben werden […]. München 1766. Nr. 1–11. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10505666-2.
OP = Ordentliche Wochentliche Postzeitungen. München 1667. Nr. 2–7, 11–14. Staats- und Universitätsbibliothek Bremen, urn:nbn:de:gbv:46:1-2276.
OZ = Particular vnd rechte Ordinari Zeitungen/ auß vnderschidlichen Orten. München 1628. Nr. 16–24. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb 10505558-3.
Rel = Relation aller Fürnemmen und gedenckwürdigen Historien […]. Straßburg 1609. Nr. 1–7. Universitätsbibliothek Heidelberg, urn:nbn:de:bsz:16-diglit-27395.