Anonymer User
Gast
|
Beitrag #1
Problem mit kanjidic bzw. kdfilt.exe
Hallo,
ich benutze auf meinem PDA das "Mini Japanese Dictionary for Pocket PC" von Mike Johnson. Wer dieses Programm kennt, weiss, dass es die Funktion bietet, Kanji aus einem Wörterbuch wie dem Wadokujiten zu suchen und diese dann auszuwählen und sich Informationen wie Strichzahl, Nelson-Nummer etc. anzeigen zu lassen. Dafür nutzt es die Datei "kanjidic" von der Monash-Seite. Dort gibt es auch das Tool "kdfilt.exe". Damit kann man angeblich Indexeinträge aus dem kanjidic löschen, was sehr praktisch wäre, da ich die Nummern eines Kanji z.B. im Morohashi nicht unbedingt brauche, und das Ganze beim Nachschlagen von Komposita auf dem PDA-Bildschirm schnell unübersichtlich wird.
Wenn ich nun kdfilt in der Kommandozeile von XP mit den entsprechenden Parametern ausführe, hat das kanjidic danach eine Größe von 0KB und ist leer.
Habe es jetzt wirklich zig-mal versucht und komme nicht weiter. Kann es sein, dass kdfilt unter XP nicht funktioniert, oder liegt das Problem auf meiner Seite und ich habe was übersehen?
Schon mal danke für Eure Mühe,
Stephan
|
|
11.02.06 04:44 |
|
frostschutz
Technik
Beiträge: 1.783
|
Beitrag #2
RE: Problem mit kanjidic bzw. kdfilt.exe
Hallo,
ich kenn das kdfilt.exe Programm leider nicht, kann dir da also nicht weiterhelfen. Aber das kanjidic ist eine stinknormale Textdatei - jedes Kanji eine Zeile, die einzelnen Einträge durch Leerzeichen getrennt. Am Anfang der Zeile steht das Kanji, gefolgt von einem Leerzeichen, danach kommen in beliebiger Reihenfolge die Zusatzeinträge (z.B. "IN393" für Hadamitzky-Nummer 393), wieder gefolgt von Leerzeichen, usw.
Du könntest die kanjidic-Datei in einem Texteditor mit einer brauchbaren Suchen&Ersetzen Funktion (Regexp-Funktion oder vergleichbares) laden und damit alle unerwünschten Einträge entfernen.
Ob durch fehlende Einträge die Anzeige dann übersichtlicher wird, hängt allerdings auch von dem anzeigenden Programm ab.
Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
(Dieser Beitrag wurde zuletzt bearbeitet: 11.02.06 09:53 von frostschutz.)
|
|
11.02.06 09:53 |
|
Anonymer User
Gast
|
Beitrag #3
RE: Problem mit kanjidic bzw. kdfilt.exe
Hallo frostschutz,
erstmal danke für die schnelle Antwort.
Ich weiß. dass das kanjidic eine EUC-Textdatei ist, die man also mit Word oder Excel öffnen kann. Wenn ich aber in einem der Programme z.B. sage :"Ersetze alle Wörter, die mit M anfangen, mit nichts" (um die Morohashi-Nummern zu entfernen), dann werden ja auch alle Wörterbucheinträge, die mit M beginnen (also z.B. "Maus", Mond", etc.), gelöscht. Das bringt mich also nicht weiter.
Und "zu Fuß" 3550 Einträge zu editieren, ist mir auch ein wenig zu mühsam.
Nachdem ich mir jetzt etwas Wissen über regexp-editoren angelesen habe, glaube ich, dass ich dafür -"informatisch" gesehen- den Allerwertesten etwas zu weit unten habe.
Wenn Du aber eine Seite mit einem Tutorial dazu kennst, das man auch verstehen kann, wenn man keiner höheren Sprache mächtig ist, nehme ich das gerne nochmal in Angriff. Vielleicht kann das Ergebnis ja auch noch jemand anderes brauchen.
Auf alle Fälle schon mal danke,
Stephan
|
|
12.02.06 01:08 |
|
frostschutz
Technik
Beiträge: 1.783
|
Beitrag #4
RE: Problem mit kanjidic bzw. kdfilt.exe
Zitat:Wenn ich aber in einem der Programme z.B. sage :"Ersetze alle Wörter, die mit M anfangen, mit nichts" (um die Morohashi-Nummern zu entfernen), dann werden ja auch alle Wörterbucheinträge, die mit M beginnen (also z.B. "Maus", Mond", etc.), gelöscht. Das bringt mich also nicht weiter.
Ja, die Bedingung musst du schon etwas genauer formulieren, z.B. alles was mit M anfängt und dann von mindestens einer bis beliebig vielen Ziffern (0-9) gefolgt wird. Bei Perl-Regexp wäre der Ausdruck dafür z.B. "M[0-9]+".
Wenn du mir sagst, welches Kanjidic du genau verwendest (direkter Download-Link?) und welche Einträge davon du rausgeschnitten haben möchtest (M, IN, usw.), kann ich dir das gerne machen. Ist für mich eine Sache von 10 Minuten (1:50 Minuten downloaden, 10 Sekunden rausschneiden, 8 Minuten mailen/hochladen).
Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
|
|
12.02.06 01:38 |
|
Mokujin
Beiträge: 6
|
Beitrag #5
RE: Problem mit kanjidic bzw. kdfilt.exe
So,
jetzt habe ich mich als ordentlicher User erstmal registriert.
Also das ursprüngliche File habe ich von folgender Adresse:
http://ftp.funet.fi/pub/culture/japan/mi...idic_de.gz
Ich habe jetzt auch schon mal ein bisschen mit "Regex Power" rumgespielt, kriege es aber nicht geregelt, wenn dann irgendwo die Indizes mit Buchstaben und Zahlen abwechselnd angegeben werden und dann an jeder Stelle beides oder ein Punkt stehen können und dann auch noch der String im gleichen Index eine unterschiedliche Länge haben kann...aua!
Ich wäre Dir wirklich extrem dankbar, wenn Du die 10 Minuten von Deiner Lebenszeit abzwacken könntest...
Laut dieser Page
http://www.csse.monash.edu.au/~jwb/kanjidic.html
hätte ich gerne raus:
U;C;G;H;F;P;K;L;Q;MN;MP;E;Y.
Oder andersrum: Ich brauche nur die Nummer im Nelson, das Radikal nach Nelson, die Strichzahl, die Nummer im Spahn/Hadamitzky und natürlich die Lesungen und Übersetzungen.
Wenn Du allerdings keine Zeit für sowas hast, setze ich mich in den ja glücklicherweise bevorstehenden Semesterferien mal ein, zwei Tage dran, dann sollte es mit etwas Handarbeit auch so hinhauen..
|
|
12.02.06 05:21 |
|
frostschutz
Technik
Beiträge: 1.783
|
Beitrag #6
RE: Problem mit kanjidic bzw. kdfilt.exe
Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
|
|
12.02.06 11:28 |
|
Mokujin
Beiträge: 6
|
Beitrag #7
RE: Problem mit kanjidic bzw. kdfilt.exe
Genau so!
Sweeeet!!!
Musste es nur noch von Unicode in EUC und Umlaute und ß umwandeln und schon hat´s gepasst. Es sind zwar immer noch ein paar kryptische Zahlen drin, aber bei weitem nicht mehr der ganze Wust.
Danke, danke, danke!
|
|
12.02.06 17:21 |
|