ich würde gerne aus einem Worddokument doppelte Kanji und alle Kana herausfilter, so dass ich im besten Fall eine Liste der Kanji habe, oder im schlechtesten Fall einfach nur die Anzahl.
Um das ganze zu visualisieren:
陰鬱陰ら中々おを心 -> 陰鬱中心 / 4 Kanji
Schade; das wäre sonst ein Einzeiler geworden (wenn auch ein langer).
Sollte das Problem morgen früh noch nicht gelöst sein, mache ich mir noch mal Gedanken drüber, wie man das unter Windows am schönsten hinbekommt.
Wäre das so in deinem Sinne? Oder willst du lieber die reine Liste von Kanji haben?
Und natürlich habe ich jetzt (noch) nicht das Kanjiwiederholungszeichen 々 behandelt, wobei auch hier die Frage ist, wie du damit umgehen möchtest.
(03.03.16 11:48)vdrummer schrieb: Ich habe mal eine Kleinigkeit programmiert, die aus deinem Beispiel "陰鬱陰ら中々おを心" folgendes macht:
Code:
Anzahl verschiedener Kanji: 4
中
心
陰
鬱
Wäre das so in deinem Sinne? Oder willst du lieber die reine Liste von Kanji haben?
Und natürlich habe ich jetzt (noch) nicht das Kanjiwiederholungszeichen 々 behandelt, wobei auch hier die Frage ist, wie du damit umgehen möchtest.
Also die Häufigkeit einzelner Zeichen wäre nicht so wichtig. Ich habe mal deinen Vorschlag editiert, wie es mir reichen würde. Wenn das Wiederholungszeichen einfach zu Filtern ist, dann bräuchte ich das nicht. Aber an einem Zeichen soll das ganze jetzt nicht scheitern. Ich habe nicht vor irgendwelche Statistiken zu erstellen.
Das I-Tüpfelchen wäre wenn die Zeichen nach Häufigkeit sortiert sind. Am Rande bemerkt, würden Tabs/Leerzeichen Probleme verursachen?
Hast du dir den Link von mir angesehen? Du kannst unten auch auf Englisch oder Deutsch umschalten, geht trotzdem.
Die Tabelle, die dabei rauskommt, kann man in Excel oder ähnliches kopieren. Dann die Hiragana/Katakana Zeilen am Anfang löschen, dann kannst du auch nach Häufigkeit sortieren.
Ich habe mir mal mit vdrummer die Freiheit genommen, ein Programm zu schreiben, welches das genannte Problem besser loesen sollte, als die bisher genannten Loesungen.
Benoetigt wird die Java 8 Laufzeitumgebung (Achtung: Bei OpenJDK wird zusaetzlich OpenJFX benoetigt).
Das Programm funktioniert folgendermassen: Im oberen Texteingabefeld wird der japanische Text eingegeben.
Nach einem Klick auf "Process" erscheint das gefilterte und nach absteigender Haeufigkeit sortierte Ergebnis im unteren Textfeld.
Zusaetzlich wird neben dem "Process"-Knopf die Anzahl der paarweise verschiedenen Kanji angezeigt.
(Dieser Beitrag wurde zuletzt bearbeitet: 04.03.16 23:41 von Tommy.)