Erstmal bitte ich um Applaus für Doitsuyama. Es ist erst ein Tag um, und wir haben (soll heißen: er hat!) schon über 1% der Kanji abgearbeitet.
Du machst das schon ganz richtig mit den Übersetzungen, finde ich.
Wozu man da die Grenze ziehen sollte, weiß ich nicht. Im Zweifel bin ich für eine weite Auslegung des Begriffes "gängig". Das Lexikon soll ja keine Liste unbedingt zu lernender Vokabeln werden. Natürlich macht es keinen Sinn, lange Listen deutscher Worte zu notieren, die alle synonym sind.
Man könnte die obskuren Nebenbedeutungen ja noch abtrennen, etwa
{gängig} {gängig} {gängig} # {obskur} {obskur}
Macht Vorschläge. Wenn es zum Parsen zu aufwändig wird, dann schreie ich schon. Das Kanjidic-Format lässt solche Unterscheidungen allerdings nicht zu. Da müsste man dann am Ende überlegen, ob man es reintut oder nicht.
Ich hätte die sonstigen Jouyou zwar weiter unterteilt, um die Files nicht zu gross werden zu lassen, aber nur nach Unicode. Ich bin offen für Vorschläge, will aber nix per Hand sortieren. Nach meiner Methode erzeuge ich einen neuen Satz so (Jouyou jenseits Klasse 6, Unicode 4000-5FFFF:
*tippelditipp*
grep " G9" /usr/share/edict/kanjidic | grep " U[4-5]" | kanjidic2wiki.pl > wiki.out
*enter*
*fertisch*
Das ist an Einfachheit wohl nicht zu toppen.
Ansonsten: Ich habe doch selbst mal 'ne mail verfasst:
Zitat:Lieber Herr Bibiko,
ich bin ein Mitglied des Forums von japanisch-netzwerk.de.
Wie mir aufgefallen ist, ist Ihre deutsche Übersetzung des Kanjidic sowohl vom Monash-Archiv als auch von Ihrer Homepage verschwunden. Über den Grund scheint im Forum niemand etwas Genaueres zu wissen, obwohl es wohl naheliegt, hier Copyright-Probleme zu vermuten. Können sie mir hierzu mehr verraten? Besteht eine Chance, dass das deutsche Kanjidic in absehbarer Zeit zurückkommt?
Schaun wir mal ... Ich halte es aber für sehr, sehr, sehr unwahrscheinlich, dass sich unsere Arbeit erübrigt.