Ach ja, noch etwas:
In Unicode sind die Kanji, die gleichzeitig auch Radikal sind doppelt codiert. Einmal eben als eigenständiges Schriftzeichen und dann nochmal als Radikal.
Hier die möglichen Unicode Ranges:
2E80 > 2EFF CJK Radicals Supplement (beinhaltet Varianten der unter "Kangxi Radicals" aufgeführten Radikale)
2F00 > 2FDF Kangxi Radicals (Standardformen der Radikale)
4E00 > 9FFF CJK Unified Ideographs (die bekannten vereinheitlichten Kanji, Hanzi bzw Hanja)
weiterhin:
3400 > 4D8F CJK Unified Ideographs Extension A (Erweiterung der Kanji)
F900 > FAFF CJK Compatibility Ideographs (noch ne Erweiterung der Kanji)
und im erweiterten Unicode (hier eher seltene oder veraltete und historische Kanji):
20000 > 2A6DF CJK Ideographs Extension B
2F800 > 2FA1F CJK Compatibility Ideographs Supplement
So, man hat sich also richtig Arbeit gemacht ...
Ja, und dann gibt es eben wie gesagt noch die berühmte Private Use Area (E000 > F8FF), wo aber eben die Zeichen nicht standardisiert sind. Wenn eine Schrift also zufällig in diesem Bereich ein Zeichen parat hält, muss eine andere das nicht tun. Also entweder muss man dann sicherstellen, dass der andere diese Schrift auch hat, oder man wählt einen durch Unicode standardisierten Bereich aus, wo dieses Zeichen evtl. auch zu finden ist.
So, fertig