Hallo, ich bin Jonas und übernehme für kurze Zeit diesen Account , um über Verlinkung und offene Daten im Mittelhochdeutschen Wörterbuch (MWB) zu sprechen.
Das MWB bearbeitet den Wortschatz der zwischen 1050 und 1350 entstandenen mhd. Quellen aller Textsorten und Schreibsprachen. Artusroman, Kochrezept, Predigt, Urkunde, Medizinliteratur, Minnesang: Alles drin, Hauptsache #Mittelhochdeutsch (jr)
Überlegungen zu einem neuen Wörterbuch der mittelhochdeutschen Sprache gibt es schon lange. Richtig los ging's 1994 gefördert von der @dfg_public. Damals entstanden die digitalen Grundlagen des Projekts. #BornDigital#DFG#90s (jr)
In dieser ersten Phase wurden Texte digitalisiert und lemmatisiert. Die Lemmaliste des MWB – also die Kandidaten für Wortartikel, die wir alphabetisch abarbeiten – wurde aus den Vorgängerwörterbüchern (Lexer, BMZ, Findebuch) gewonnen. (jr) #Lexikographie
Übrigens fand auch die Retrodigitalisierung von Lexer, BMZ & Findebuch in den 1990ern statt. Als „Mhd. Wörterbücher im Verbund“ (MWV) sind sie ein wichtiger Bezugspunkt (inhaltlich und technisch) für das MWB.
Auch das Grimmsche Deutsche Wörterbuch wurde damals retrodigitalisiert. Zusammen mit dem MWV bildete es den Kern des heuten #Woerterbuchnetz@CDHTrierwoerterbuchnetz.de (jr)
@CDHTrier Die digitale Vernetzung der älteren mhd. Wörterbücher untereinander, aber auch mit dem neuen MWB, ist also schon ein Vierteljahrhundert alt. In Zeiten kurzlebiger Forschungsförderung eine lange Zeit. (jr)
@CDHTrier Es wundert niemanden, dass Langzeitprojekte des Akademienprogramms gelegentlich als Riesenschildkröten bezeichnet werden… (jr)
@CDHTrier Kirkness, Alan: Es leben die Riesenschildkröten! Plädoyer für die wiss.-hist. Lexikographie des Deutschen. Lexicographica 32 (2016), doi.org/10.1515/lexi-2…
@CDHTrier Um die Verlinkungen zwischen MWB und MWV zu zeigen, schauen wir uns mhdwb-online.de an. Hier gibt es nicht nur die bisher erschienenen Wörterbuchartikel, sondern auch die Lemmaliste und das Belegarchiv. (jr)
@CDHTrier Anders als die Wörterbuchartikel deckt die Lemmaliste auch die noch nicht bearbeiteten Strecken des Alphabets ab. Die Stichwörter sind mit dem Mhd. Wörterbüchern im Verbund (MWV) = BMZ, Lexer, Findebuch verlinkt. (jr)
@CDHTrier Zahlen in runden Klammern verlinken auf die entsprechende Anzahl von Belegen für das Lemma im elektronischen Belegarchiv. Für das Wort „tortuke“ (Schildkröte) gibt es also 4 Belege im Archiv. (jr) mhdwb-online.de/lemmaliste.php…
@CDHTrier Von den Textstellen im Belegarchiv kann man sich übrigens zu den entsprechenden Stellen im Volltext durchklicken, aber auch die bibliographischen Infos zu den Quellensiglen aufrufen. (jr)
@CDHTrier Das digitale Textarchiv enthält 225 Texte mit etwa 12 Mio. Wortformen, von denen 1,5 Mio. durch halbautomatische Verfahren lemmatisiert, geprüft und ins Belegarchiv aufgenommen sind. (jr)
@CDHTrier Über 1000 weitere mhd. Texte liegen zwar nicht digital vor, werden aber natürlich ausgewertet und bei der Artikelredaktion verwendet. (jr)
@CDHTrier Soweit zur Ausgangslage, die auf den Vorarbeiten aus den 1990ern beruht. Wenn ihr Fragen habt, schreibt sie gern! Morgen geht es darum, wie wir versuchen, die Offenheit und Nutzbarkeit unserer Daten zu verbessern. (jr)
Einerseits: Es ist natürlich einerseits eine beneidenswerte Situation, ein Großprojekt über Jahre intensiv betreiben zu können. Andererseits ringen gerade ältere Projekte mit statischen, teils gestrigen Rahmenbedingungen in einer dynamischen Forschungsgegenwart. 🌊🚣
(jr)
Zusätzlich den Kerntätigkeiten, die teilweise vor Jahrzehnten umrissen wurden, z.B. noch Datenaufbereitung gemäß heutiger Standards zu leisten, erfordert eine gewisse Flexibilität im Projekt wie auch seitens der Trägerakademien. (jr)
Als das MWB im Jahr 2000 in das #Akademienprogramm aufgenommen wurde, war immerhin auch eine halbe IT-Stelle eingeplant. Die reicht aber leider kaum aus, um die regulär anfallenden Aufgaben zu erledigen. (jr)
Neue Entwicklungen in den #DigitalHumanities zu begleiten und Standards für unser Projekt umzusetzen, braucht zusätzliche Mittel. Das gilt auch für die Einrichtung persistent referenzierbarer Daten nach modernen Gepflogenheiten. (jr)
Auf gams.uni-graz.at/depcha (Prototyp in Entwicklung) werden digitale Editionen von historischen Rechnungsunterlagen publiziert. TEI XML ist also zentraler Bestandteil.
Waren- und Dienstleistungshierarchien, wie auch Hierachien von Konten in <taxonomy> mit Wikidata-Verknüpfung.
Es gibt auch ein eigenes Hilfsmodell im "depcha"-Namespace.
Maßeinheiten und Währungen in <unitDecl> mit Wikidata-Verknüpfung:
Wie werden Daten in DEPCHA visualisiert, damit die Arbeit der Historiker*innen unterstützt wird? Ich bin noch in der Experimentierphase. Aber dieses Beispiel hat mich sehr inspiriert:
"The Poppy Field - Visualising War Fatalities", poppyfield.org, Valentina D’Efilippo
The Poppy Field - Visualising War Fatalities ist ein Projekt, das Daten aus dem Polynational War Memorial verwendet, um eine Visualisierung militärischer Konflikte zwischen 1900 und 2010 zu erstellen, die die Dauer, die Anzahl der Opfer und die beteiligten Kontinente zeigt.
Daten explorieren und Geschichten erzählen durch visuelle Darstellung ist das Leitmotiv. Interaktion + Übersichts-, Zoom- und Filterfunktionen nutzen und bei Bedarf Detailinformationen abrufen.
Einträge in historischen Rechnungsbüchern sind historische Informationen. Hier ein Beispiel:
"Item alber ab der eken hat zinst 1 mütt Roken am mitwochn sa. urbani und 1 mütt gersten."
"Alber ab der Eken" hat also am 24.05.1402 ein Mütt Getreide als Abgabe getätigt.
In mittelalterlichen Rechnungsbüchern haben wir eben nicht nur einen solchen Eintrag, sondern 100e oder 1000e. Und man möchte z.B. sehen: wer hat was an Abgaben geleistet, wie hat sich der Wert/Preis von etwas entwickelt. Da gibt es wirklich viele spannende Forschungsfragen. 🤓