Texte einfach online prüfen

Noch Fragen?

Die Grundlage der Zahlen

Für die Statistiken, Grafiken und Tabellen in „Sprache in Zahlen“ haben die Computerlinguistinnen und -linguisten des Dudenverlags das Dudenkorpus sowie den Rechtschreibduden ausgewertet – und sind dabei auf überraschende Fakten und Details gestoßen.

Das Dudenkorpus ist eine elektronische Volltextdatenbank, die seit 1995 existiert und seitdem ständig erweitert wird. Inzwischen umfasst sie eine riesige Sammlung von Texten in deutscher Sprache: Darin enthalten sind journalistische und belletristische Texte sowie Sach-, Fach- und Gebrauchstexte in elektronischer Form mit insgesamt mehr als 6,8 Milliarden Wortformen (Stand Mai 2024). Bei der Suche nach neuen Wörtern durchkämmt die Dudenredaktion diesen einzigartigen Textschatz mithilfe von Computerprogrammen auf bislang unbekannte Wörter. Erscheinen diese dauerhaft in einer gewissen Häufung und über verschiedene Texte hinweg, werden sie zu Neuaufnahmekandidaten für die Duden-Wörterbücher (siehe dazu Duden – Die deutsche Rechtschreibung, 2024, »Wie kommen die Wörter in den Duden?«, S. 9).

Grundformen [Stichwörter] und Wortformen

Der Rechtschreibduden und das Dudenkorpus bilden die Grundlage für die in „Sprache in Zahlen“ aufgeführten Phänomene und Rekorde. Während es sich bei den Stichwörtern im Rechtschreibduden ausschließlich um Grundformen handelt, enthält das Dudenkorpus sowohl Wort- als auch Grundformen. Daher ist für die Interpretation der aufgeführten Zahlen eine genaue Unterscheidung notwendig.

Die Grundform eines Wortes ist die Form, die als fett gedrucktes Stichwort in einem Wörterbuch aufgeführt ist. Das ist bei Verben der Infinitiv, bei Adjektiven die Grundstufe und bei Substantiven normalerweise der Nominativ Singular.

  • schreiben
  • schön
  • die Autorin
  • der Text

Die Wortform ist die Form, die zum Beispiel in einem Fließtext verwendet wird. Je nach Wortart handelt es sich dabei um eine flektierte oder nicht flektierte Wortform.

  • Die Autorin schrieb den schönsten Text.
Wortform im Korpus Grundform im Korpus / Stichwort im Duden
Die die
Autorin Autorin
schrieb schreiben
den der
schönsten schön
Text Text

Diese Grundformen sind auch die Stichwörter, die in einem Wörterbuch wie dem Rechtschreibduden verzeichnet sind. Die Stichwörter sind fett gedruckt, wie »gutschreiben« im folgenden Stichwortartikel:

  • gut|schrei|ben (anrechnen); sie versprach, den Betrag gutzuschreiben

Während die Grundform als Stichwort in einem Wörterbuch normalerweise nur einmal aufgeführt wird, kann ein Wort in einem Text mehrmals und in verschiedenen Wortformen vorkommen. Will man beispielsweise die Wörter in einem Satz zählen, hängt das Ergebnis von der Zählweise ab.

Beispiel:

  • Wer täglich das tut, was täglich getan werden muss, hat viel zu tun.

a) Beim einfachen Zählen der Wörter kommt man auf 13.

b) Zählt man nur die verschiedenen Wörter, sind es 12, da täglich zweimal vorkommt.

c) Zählt man nur die Grundformen, lautet das Ergebnis 10, da das Verb tun insgesamt dreimal vorkommt (in den Wortformen tun, getan, tun).

Es macht also einen großen Unterschied, ob man von Wortformen oder von Grundformen ausgeht. In „Sprache in Zahlen“ ist deshalb die Zählweise a gemeint, wenn es um Wortformen geht. Ist von Grundformen die Rede, wird Zählweise c angewandt.

Alle Artikel in Sprache in Zahlen (13)

Der häufigste Buchstabe im Deutschen

Was glauben Sie ist der mit Abstand häufigste Buchstabe im Deutschen? Die Antwort auf diese Frage und die Erklärung, warum dies so ist, finden Sie in diesem Artikel.

Die Wörter mit den meisten auf­einander­folgenden Vokalen

Ein Artikel über die Wörter mit den meisten aufeinanderfolgenden Vokalen.

Texte einfach online prüfen

Noch Fragen?