RE: Rikaichan's Pate fuer die Deutsche Datei
Ich komme noch einmal auf Rikaichan zurueck.
Ich hab die ganze Deutsche Datei aufgearbeitet.
Es ist jedoch sehr viel dort drin, wie der Autor schon mal schrieb:
Ein Ausdruck vom japanischen uebersetzt ins Deutsche, dass man diesen leider Gottes, in umgekehrter Form nicht verwenden kann.
Der Autor hat sehr darauf geachtet, kein Copyright von gleich welchem Buch zu brechen. Und von daher hat er eigene Uebersetzungen fuer die japanischen Worte gesucht und gefunden. Er hat auch irgendwo erklaert, dass das japanische nicht einfach waere, weil man gleich welches Wort in verschiedenen Varianten schreiben kann. Und so sehen auch seine Eintraege aus.
Ohne Kanji, also ganz in Hiragana.
Manchmal steht das Wort auch in Katakana.
Oder Hiragana + Kanji.
Oder Kanji und Hiragana.
Konfus wird, man, weil mehrere Schriften verwendet wurden.
So auch Lateinisch, Grieschich und an manchen Orten, ganz komische Zeichen.
In der deutschen Rikaichan Datei befinden sich noch 46.000 Englische Datensaetze mit mehreren Begriffen, die bislang noch nicht uebersetzt wurden.
Das Grieschiche Alphabet ist ebenfall dort drin.
Also ich hab nur die Deutsche Datei aufgearbeitet.
An manchen Begriffen waren ueberlange Erklaerungen angeheftet. Diese waren bis zu 700 Zeichen gross.
Ein Glueck dass er diese in () stehen hatte.
Verschiedene Begriffe hatten noch weitere Beispiele in Kanji und Kana mit [solcher Schreibweise]
Das machte es unmoeglich die Datei in 3 Felder zu pressen. Kanji, Hiragana Lesung, Uebersetzung.
Was nun viele an Woerterbuechern bemaengeln, dass man nicht mitgeteilt bekommt, wo man dieses oder jenes Wort verwenden kann, ist bei diesem WB ebenfalls nicht moeglich.
Die meisten Eintraege sind in der Form von Nomen verwendet worden.
Lediglich in den Wort-Ergaenzungen die unmittelbar hinter der Hiragana Form kamen, standen Ergaenzungen, wie man dieses Wort noch einsetzen konnte. Als Adjektiv, als Nomen, als Verb. (womoeglich mit する wo jedoch ein する gar nicht aufgefuehrt wird.
Da diese Datei jedoch so konfus ist. Dass soviele Schreibweisen fuer einen und den gleichen Begriff stehen, so ist es mir nicht am Ende nicht moeglich, diese Daten in die meinige Datei zu uebernehmen.
Auch gibt es keine Hinweise, wo die Partikel stehen. Eben weil das japanische alles aneinander-geknetscht ist.
(Huch, ein Begriff aus meiner Sprache). Es gibt keine Leerzeichen zwischen den einzelnen Worten.
Das aufarbeiten wuerde Jahre dauern. Das hat keinen Sinn.
Ich habe deswegen die Datensatzmenge wieder auf den Stand vor 6 Monaten zurueckgestellt. 954.000. Was ja auch einen dicken Batzen hergibt.
Fazit: Es war jedoch nicht umsonst. Ich hab doch einiges von diesem Autor lernen koennen.
(Dieser Beitrag wurde zuletzt bearbeitet: 08.10.14 20:53 von moustique.)
|