RE: Ich suche ein Prg Unicode mit Romaji,
Ja muesste, denn das を wird als wo, und auch als o gelesen.
Da habe ich aufgepasst und in meiner Datei, halt dieses mit -o- versehen.
Damit es nicht unter geht in Getuemmel der Daten.
Somit behaelt es auch als alleinstehendes "o" seinen Wert.
Welche Variante aber nun besser ist, ist mir noch ungewiss.
Bei dieser Variante muss ich die Leerzeichen einzeln loeschen. (waer auch kein Problem)
手 - O - 解 KI 去 RI NU .
手 - O - 振 TSU TA .
手 - O - 挙 GE TE .
手 - O - 上 GE TE .
手 - O - MO GA I TE .
手 - O - 休 ME TE .
手 - O - 除 KU TO .
Und in der anderen Variante, mit den nur Romaji, muss ich welche hinzu tun.
Als Erklaerung:
In den heute vertriebenen Programmen, kann man sowohl Kanji und Kana verarbeiten.
(in dem Urgetuem von anno dazumal, ging das nicht und geht immer noch nicht)
Daher hab ich aus diversen Hilfen aus dem Internet, diese Daten erst mal in Unicode umgewandelt.
In Unicode, gibt es einen einfachen Unterschied zwischen Kanji und Kana.
Kana (also Hiragana und Katakana) liegen im Bereich 30xx
Hex-Code ist ein Code basierend auf einer 15 Zaehlung und nicht wie im Dezimalen auf 10 Zahlen.
1,2,3,4,5,6,7,8,9,a,b,c,d,e,f
0001
0002
0003
0004
0005
0006
0007
0008
0009
000a
000b
000c
000d
000e
000f
0010
etc
Damit lassen sich die 65535 Zeichen den Unicode unterbringen.
Das letzte Zeichen ist also ffff.
Manche sind belegt, andere nicht. Einige haben es geschafft in dieses Unicode reinzukommen, andere wurden weggelassen.
Und heutzutage, wenn es um Buchstaben geht, die nicht im Unicode stehen, werden mit einer Grafik dargestellt.
Kanji beginnen ab 4e00 aufwaerts.
Dann gibt es auch andere Schreibsysteme.
EUC-JIS, SHIFT-JIS und JIS Code.
Beispiel von 手 Hand. Unicode 624B
Beispiel von 手 Hand. EUC-JIS bcea
Beispiel von 手 Hand. SHIFT-JIS 8ee8
Beispiel von 手 Hand. JIS-Code 3c6a
Beim grossen Hadamitzky findet man dieses Zeichen bei 3c0.1
Und so hat jedes System seine Daten, anders abgelegt.
Es galt also aus all diesen Daten, erst mal eine Liste zu erstellen, mit allen moeglichen Kana-Varianten.
Sowohl die der Hiragana als auch die der Katakana.
Dabei war zu beachten, dass in Katakana das Verlaengerungszeichen eines Buchstaben, das mit nur einem - gekennzeichnet ist, eben nicht als - zu schreiben, sondern als zB. kaa fuer ka-.
Im Hiragana gibt es die おうVariante, welche auch in anderen WB mit oo oder mit ô oder o mit der Tilde geschrieben wird.
Mir genuegt es, wenn hier das oo steht. Bei Begriffen wie 大きい、おおきい、in Romaji ookii, seht hinter diesem ein weiterer Begriff mit "o-okii
Damit geht dann hier dieses Doppel-o nicht verloren.
Und so wird auch in der Datei gesucht.
Suche nach *o-o und du wirst solche Begriffe finden.
Ueber 3000 Datensaetze sind mit dieser Variante vermerkt.
Bei den Kanji gibt es auch die Lesung mit nur einem "o"
Die kann man auch suchen. Und zwar ueber Kanji, ON-kun Lesung und dort *"o" eingeben.
Silben-Endungen koennen auch gefunden werden mit "-eru
|