Ich hatte vorhin keine weitere Zeit mehr darauf einzugehen.
Meine Datei enthaelt keine Kanji wie dieses 口 oder jenes 学 und auch keine ひらがな und カタタカ. Alle meine Zeichen entstammen dem Unicode Wert.
Meine Datensaetze haben eine feste Laenge. Felder mit fester Laenge.
Deutsch, japanisch, ein Feld fuer Bezeichnungen, ein Feld, was anzeigt dass ich diesen Datensatz bearbeitet habe (der kann spaeter auch fuer anderes herhalten). und dann 8 Felder fuer jedes Kanji eins.
Damit werden die meisten aller Woerter und auch kleinere Saetze damit fertig.
Was darueber hinaus geht, muss ich entweder aufteilen oder weglassen.
Die Kanji-Felder haben je 4 Zeichen. Das genuegt fuer den Unicode (Hex).
Im Link ABC gibt es Listen die diese Zeichen haben. So wie auch die Graphikdateien.
Jedes Feld (ausser Bezeichnungen und schon gemacht Feld) haben Indexe.
Somit kann ich alles durchsuchen. Auch Woerter suchen wo das 2 Feld das Kanji 子hat.
Aber alle anderen Kombinationen sind auch Suchbar.
So denn, wenn du aus deiner fertigen Datei nun mal spaeter, Daten dir ansiehst. und du willst diese dann zB im Internet auch suchen, muesstest du von vorne beginnen die Kanji zu suchen. Aber da man ja Dateien in Unicode hat, und dazu noch dessen richtigen Wert, kann man die ersten 4 Zeichen des Dateinamens in eine Variable einlesen. Bzw. was sag ich da, man hat diese ja bereits einer Variablen da man diese im Verzeichnis sucht.
Also dann braucht man einen Konverter um die Dateien in Unicode umzuwandeln.
Er funktioniert auch Offline.
Hier der neueste.
http://rishida.net/tools/conversion/
Da muss man irgendwo den Hex-Unicode reinkopieren und man erhaelt dann bei Character die Kanji. Andersrum funktioniert das System auch.
Wogegen die beiliegende Datei Unicode mit einem @ davor, diese in Kanji umwandelt. Andersrum geht es aber nicht. Als Vorteil hat dieses System, dass normale Buchstaben damit nicht veraendert werden.
Die gsmkonv.html laesst sich auch gut verwenden um Texte zu editieren oder Daten mit Rikaichan zu verarbeiten.
Oder aber, was fuer einen Programmierer noch ganz nuetzlich und moeglich ist, man baut die Programmzeilen aus diesen beiden .html Seiten aus und verwendet sie in seinem Programm. Dann ist sowohl ein umkonvertieren wie auch ein suchen nach Dateinamen bzw. anlegen solcher nicht mehr noetig.
Ich kann es nicht tun. MS-DOS Programm Clipper vertraegt sich nicht mit .html oder Java Code.
Kannst du denn die Schreibweise der Unicode Daten nicht in " " stellen.
oder in ' '
Spaeter kann man ja mit Teilstring diese wieder auslesen.
Dafuer gibt es allerlei Befehle. Die findest du bei den Formeln.
Ausserdem hat Excel ein Problem.
Man ist an Datensaetzen begrenzt.
Ich weiss es nicht mehr genau, aber bei 65.535 wirst du das Limit an Datenzeilen erreicht haben. Mit Sicherheit, gibt es mehr als diese Anzahl von Datensaetzen.