Antwort schreiben 
Eine kleine Studie zur Häufigkeit von Kanji verschiedener Level in Texten
Verfasser Nachricht
vdrummer


Beiträge: 1.445
Beitrag #1
Eine kleine Studie zur Häufigkeit von Kanji verschiedener Level in Texten
Eins vorweg: Mir ist kein guter Titel für diesen Thread eingefallen. Falls ihr bessere Vorschläge habt: Her damit!

Motiviert durch die Zahl 1000 in diesem Beitrag bin ich mal der Frage nachgegangen, wie viel Prozent der Kanji in einem Text man mit den Kanji der jeweiligen Schuljahresstufen verstehen kann.

Dazu brauchte ich erstmal die Kanji der einzelnen Stufen. In meinem Fall sind das 小1-小6 (1. bis 6. Jahr Grundschule), 中1-中3 (1. bis 3. Jahr Mittelschule) und die 常用漢字 aus dem Jahr 2010. 中3 entspricht dabei den Pre-2010-常用漢字, da die Listen, die ich habe noch nach dem alten System sind.

Als nächstes, habe ich mir möglichst viele Texte aus 2 verschiedenen Textgattungen besorgt.
- [NHK] den Text aus 39.471 Online-NHK-News-Artikeln (insgesamt 23.294.008 Zeichen), die ich mir von Januar bis November 2020 gesammelt hatte
- [小説] den Inhalt von 20 Romanen (insgesamt 3.182.463 Zeichen) aus meiner Kindle-Bibliothek

Für jeden der Texte habe ich dann geschaut, wie viele Kanji durch die jeweiligen Stufen abgedeckt werden und das Ganze für jede der beiden Textgattungen aufsummiert.

Das Ergebnis ist in folgendem Plot zu sehen:

[Bild: plot.png?dl=1]

Die Zahlen in Klammern hinter den Stufen sind die Anzahl der Kanji in der jeweiligen Stufe (akkumuliert!).

Es zeigt sich, dass man mit ca. 1000 Kanji zwischen 83 und 90 Prozent aller Kanji eines Textes lesen kann. Das sollte reichen, um relativ bequem Texte lesen zu können.
Die größten Sprünge der Prozentwerte gibt es zwischen 小1 / 小2 und zwischen 小2 / 小3, also von ca. 100 auf 200 Kanji und von ca. 200 auf ca. 400. Ich persönlich habe im Kopf, dass ich mit einem Kanji-Inventar von ca. 300 Zeichen wesentlich angenehmer lesen konnte, was sich ja mit den Daten deckt.
Ab der 中1 steigt der Prozentsatz der Kanji, die man in Texten erkennen kann, nur noch langsam. Die letzten 1000 常用漢字 machen also nur noch ca. 10 Prozent aus. Sprich, das Kosten-Nutzen-Verhältnis für die 教育漢字 (die ersten 1006) ist wesentlich höher zwinker
Es sei noch erwähnt, dass die 1 bei den 常用漢字 in der NHK-Kategorie keine wirklichen 100%, aber immerhin 99,5% sind.

Zusammenfassend lässt sich also sagen, dass man tatsächlich mit 1000 Kanji einigermaßen gut Texte lesen kann.
01.12.21 18:38
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
adv


Beiträge: 1.039
Beitrag #2
RE: Eine kleine Studie zur Häufigkeit von Kanji verschiedener Level in Texten
Wirklich sehr interessant und aufschlussreich! Danke, dass Du das hier reinstellst.
(Dieser Beitrag wurde zuletzt bearbeitet: 01.12.21 22:36 von adv.)
01.12.21 22:35
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
yamaneko


Beiträge: 3.745
Beitrag #3
RE: Eine kleine Studie zur Häufigkeit von Kanji verschiedener Level in Texten
mich interessiert diese Statistik auch, denn ich habe in Tokio 1980 im Shop eines Hotels nicht nur das Buch Kanji und Kana von Hadamitzky entdeckt, sondern auch die drei Übungsbände dazu und ich wollte sie gerne mitnehmen, wovon aber abgeraten wurde - am Beginn einer Urlaubsreise mit viel Ortwechsel. Und in Wien habe ich sie mühelos in einer Buchhandlung bestellen können und die Fotokopien der Kanjiübersichten waren sehr wertvoll für mich, denn ich habe von den 1.900 Kanji dieser Ausgabe alle Kanji mit Farbe markiert - nach Semester, in dem ich es zum ersten Mal gelesen und gelernt hatte - da sind viele übrig geblieben, die ich zwar für die "große Kanjiprüfung" gelernt hatte, die ICH ABER NUR FÜR DIE PRÜFUNG GELERNT HATTE: (Pflicht für Dolmetschstudenten nach vier Semestern, für Japanologen nach sechs Semestern).
Diese Bögen sind mir gestern aufgefallen und ich habe die vielen "farblosen Kanji" gesehen und überlegt, ob ich sie zählen soll. Es handelt sich also um die Kanji, die ich nach sechs oder sieben Semestern nie in einem Text erlebt hatte.
Kontrolle: 1-3oo alle Kanji mehrmals verwendet.
301-900 fast keine Lücken -
901-1.900 viele nicht verwendete Kanji - bei den letzten 500 sind 90% ohne Markierung "gelernt nur für die Prüfung und derzeit fast alles vergessen" die traurige Bilanz.

(Dieser Beitrag wurde zuletzt bearbeitet: 02.12.21 03:47 von yamaneko.)
02.12.21 02:25
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
梨ノ木


Beiträge: 549
Beitrag #4
RE: Eine kleine Studie zur Häufigkeit von Kanji verschiedener Level in Texten
Vielen Dank für den wertvollen Beitrag! Eine großartige Referenz für alle Anfänger, die sich fragen, wieviele Kanji sie denn lernen müssen/sollten, bis sie einen richtigen Effekt spüren. Auch scheint sich zu bestätigen, dass es wohl kein Fehler ist, die Kanji-Lern-Reihenfolge, wie sie in Japan verwendet wird, ebenfalls zu verwenden.

Was sich für mich zeigt, ist, dass es wohl nicht unbedingt die Anzahl der Kanji war (die spielt schon eine Rolle), die es mir jetzt (im Vergleich zu vor 1.5 Jahren) ermöglicht Bücher mit Genuß zu lesen. Es war wohl hauptsächlich der Wortschatz grins
02.12.21 09:38
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Eine kleine Studie zur Häufigkeit von Kanji verschiedener Level in Texten
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
森 und andere Kanji aus drei gleichen Radikalen Haruto 28 3.968 22.08.24 17:37
Letzter Beitrag: Kikunosuke
Wilde Kanji harerod 9 2.624 27.05.24 19:58
Letzter Beitrag: harerod
das Bild meines Neffen mit Kanji, die ich nicht kenne yamaneko 4 892 23.01.24 20:53
Letzter Beitrag: Nia
Datum eines (alten?) Kanji auf Grabstein - Erledigt rantanplan 5 1.671 05.09.22 09:56
Letzter Beitrag: cat
Pitchaccent: (zusammengesetzte) Wörter mit 3 Kanji und mehr 梨ノ木 20 10.937 05.12.20 21:44
Letzter Beitrag: cat