Ich verstehe ehrlich gesagt dein Anliegen nicht.
Du hast eine Vokabelliste. Ok.
In welcher Form ist diese vorhanden?
Excel? Word? Anki?
Sind in der Liste, die Kanji am Anfang des Wortes und/oder im innern des Datenfeldes?
Sind sie mit Hiragana und Katakana versehen?
Kannst du sie, wenn in Anki Form exportieren in eine .txt Datei?
Oder .txt Aehnliche Datei?
Aber wie auch immer, du moechtest doch alle Kanji die im japanischen angewendet sind, erfassen oder ist dem nicht so?
Wenn das der Fall ist, musst du zum einen mal eine Datei haben, wo alle Eigenschaften der Kanji aufgelistet sind. Oder willst du das Rad noch einmal erfinden und alles aus einem Kanji WB herausschreiben?
Das Rad ist bereits erfunden worden.
Also es gibt eine Datei, von Jim Breen, welche die verwendeten japanischen Kanji in einer Datei drin hat. Mit Unicode, Bruecken zu anderen Buechern, ON-kun Lesungenm englische Uebersetzung, Strichzahl und Radikal.
Das waer mal das eine.
Dann dazu mal der Link. (Hab ich so oft schon in diesem Forum vorgeschlage.).
Thread-Suche-Liste-nach-Nelson-Halpern-oder-S-H-inkl-Kanji-und-Kana-I
Enthaelt eine Diskussion um all diese Kanjiliste zu bekommen.
Der Link.
http://ftp.monash.edu.au/pub/nihongo/kanjidic.gz
Stelle den Text auf Automatisch japanisch Unicode um, dann siehst du die Kanji.
Eine Liste mit Radikalen und der zugehoerigen Kanji.
http://nuthatch.com/kanji/demo/radicals.html
Kommen wir mal zurueck zu deiner Vokabelliste.
Erst mal eins. NIEMALS an einer Original Datei rumpfuschen.
Wenn was schief laeuft, ist alles futsch.
Also kopieren und mit ainem anderen Namen abspeichern.
Dann kann man daran rumbasteln.
Mein Tip. Aus der Vokabelliste, jedes Zeichen mit einem RETURN versehen.
Dann stehen in jeder Reihe nur 1 Buchstabe oder Zeichen oder Kanji oder Kana.
Dann abspeichern. Und dann kannst du mal versuchen diese zu sortieren.
Wenn die Laenge der Seite nicht einen gewissen Wert uebersteigt, dass zB Word, dir das sortieren verweigert, kannst du es auch mit Excel versuchen.
Excel kann maximal 65535 Zeilen haben.
Ist deine Datei immer noch zu grosse, musst du diese splitten. D.h. du musst sie in kleinere Formen abspeichern.
Oder aber sie an Ort und Stelle bearbeiten.
ZB. die Buchstaben a-z durch NICHTS ersetzen.
Satzzeichen entfernen.
Leerzeichen entfernen.
Hiragana entfernen.
All diese Zeichen lassen sich ueber Word, mit der Extention Funktion, der Suchfunktion, ermitteln und auch ersetzen.
Am Ende bleiben nur noch die Kanji uebrig.
Dann sortieren.
Und voilà hast du die Kanjiliste aus deiner Datei zusammen.
Was jetzt noch vorhanden sein koennte, waeren Doppel-vorhandene Kanji.
Word hat sich mitlerweile ganz sicher verbessert.
Und da frag ich mich, ob die nicht schon eine Sortierfunktion haben, welche das Anzeigen von Doppeltverwendeten Zeichen unterdruecken kann.
Oder ueber Excel, ich weiss nicht.
Am Ende hast du eine Datei, von all den Kanji, die du bislang, in deine Vokabelliste aufgenommen hast.
Also waere damit deine Frage und das Problem geloest.
Ist nur mit Fleiss zu bewaeltigen.
Es geht dann aber weiter.
Wie nun aus den ca. 6000 Kanji, jene finden, die du noch nicht gelernt hast?
Nun hinter jedes Kanji deiner Liste, kannst du Sonderzeichen stellen.
Replace ^t mit *** ^t
Somit wird jeder Return mit *** und Return ersetzt.
Dann fuegst du deine Liste am Ende der oben angezeigten Liste hinzu.
Aufpassen dass deine Zeilen nicht umgebrochen werden.
Anschliessend sortierst du diese.
(Auch hier, niemals mit einem Original spielen).
Und dann hast du einmal eine Zeile mit zB. so und so vorhanden.
一***
一 306C U4e00 B1 G1 S1 XJ05021 F2 J4 N1 V1 H3341 DP4148 DK2105 DL2850 L1 DN1 K4 O3 DO1 MN1 MP1.0001 E1 IN2 DA2 DS1 DF1 DH1 DT1 DC1 DJ1 DB1.A DG1 DM1 P4-1-4 I0a1.1 Q1000.0 DR3072 Yyi1 Wil イチ イツ ひと- ひと.つ T1 かず い いっ いる かつ かづ てん はじめ ひ ひとつ まこと {one} {one radical (no.1)}
Den Rest wird dir dann selber einfallen, denke ich.
Mit solchen Datenmanipulationen, arbeite ich schon mein Leben lang.
Man muss nur herausfinden, wie eine Datei aufgebaut ist, und diese dann mit jenen Werkzeugen bearbeiten, die man zur Verfuegung hat.
Und es ist wie mit Bruchrechnen. Man muss fuer alles, mal den Gemeinsamen Nenner finden.
Also dann viel Erfolg.