Antwort schreiben 
Suche nach bestimmter Kanjilesung in Wörterbüchern
Verfasser Nachricht
harerod


Beiträge: 570
Beitrag #1
Suche nach bestimmter Kanjilesung in Wörterbüchern
Weiß jemand, wie man in einem freien Wörterbuch (z.B. joshi.org oder dictionary.goo.ne.jp/word/kanji/出/) nach Wörtern mit einer bestimmten Lesevariante suchen kann?
Konkretes Beispiel ist die Lesung [ひい] von 日出 in 日出ずる国 [ひいずるくに].
Angenommen man wollte zu Lernzwecken alle Wörter aufgelistet bekommen, in denen 出 als [い] gelesen wird - wie würde man vorgehen?
Zumindest mit den Suchoptionen von https://jisho.org/docs bin ich nicht zum Ziel gekommen.

Eine andere Idee wäre wohl mit Regex auf JMdictDB loszugehen. Allerdings habe ich keine Idee, wie der Ausdruck aufzubauen wäre.
http://www.edrdg.org/jmdictdb/cgi-bin/sr...mdict&sid=

Danke!
23.10.22 17:07
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.445
Beitrag #2
RE: Suche nach bestimmter Kanjilesung in Wörterbüchern
Vor dem gleichen Problem stand ich auch schon mal, als ich meinen "Furiganisierer" geschrieben habe. Allerdings ist mir keine Quelle bekannt, die eine eindeutig 1-zu-1-Zuordnung von Substrings der Lesung auf die verwendeten Kanji bereitstellt.
Auch Furigana auf Webseiten etc. sind meistens pro Wort und nicht pro Kanji.

Ein algorithmischer Ansatz wäre, zu versuchen, ein möglichst gutes Mapping zwischen Kanji-Lesungen der verwendeten Kanji und der Lesung des Gesamtausdrucks zu erzeugen. Dafür bräuchte man eine Auflistung der Lesungen pro Kanji, aber das sollte ja kein Problem sein. Wäre mal spannend, zu sehen, in wie viel Ambiguität man bei der ganzen Sache läuft. Vielleicht setze ich mich da nachher mal dran hoho



Die い-Lesung von 出 kommt übrigens vom Verb 出づ und findet sich u.A. in おいで (お出で). Mehr fällt mir spontan aber auch nicht ein.
23.10.22 17:39
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
harerod


Beiträge: 570
Beitrag #3
RE: Suche nach bestimmter Kanjilesung in Wörterbüchern
Danke Dir. Ich hatte gehofft, dass "ein Computerlinguist" eine Regex for JMdictDB zusammenschrauben könnte. grins
JMdictDB bietet ja Schreibweisen und Lesungen. Nun bräuchte man eine Regel, welche die Lesung in der Position des Kanji mit der Ziellösung vergleicht und filtert. Mein Beispiel ist halt elend, weil 出 so viele Lesungen hat, häufig vorkommt und meine Zielaussprache い nur ein Kana ist.

Wenn ich お出で höre, muss ich immer an einen knapp 90-jährigen Japaner denken, den ich auf Hirado oft/täglich getroffen habe, während er seinen in Hundejahren noch viel älteren 柴犬 "マリ" Gassi geführt hat. Der immer müde Hund hat sich oft einfach hingelegt, worauf Herrchen dann laut "おいで, マリ, おいで" gerufen hat. Passendes Bild von der Gassi-Runde: https://harerod.de/lbr/nihon1906/pics/1080/IMG_7077.jpg
https://harerod.de/lbr/nihon1906/nihon1906.html#190625
Ich habe auch Bilder von den beiden, nur nicht online. Das "oide" werde ich nie vergessen.
23.10.22 19:21
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.445
Beitrag #4
RE: Suche nach bestimmter Kanjilesung in Wörterbüchern
(23.10.22 19:21)harerod schrieb:  Nun bräuchte man eine Regel, welche die Lesung in der Position des Kanji mit der Ziellösung vergleicht und filtert.

Genau das ist ja das Problem. Solange das gesuchte Kanji am Wortanfang oder -ende steht, ist das ja noch einfach, aber wenn es mitten im Wort ist, wäre es (gerade bei der Lesung い) ja hilfreich zu wissen, was man außenrum "ausschließen kann". Sonst läuft es ja auf sowas wie
Lesung: .*い.*
Kanji-Schreibung: .*出.*
hinaus, was einen Haufen False-Positives generieren würde.

Und an so Ausnahmen wie 伊右衛門 (いえもん) will ich gar nicht erst denken zwinker

Ich bin gerade dabei, mir entsprechende Datenstrukturen zusammenzustellen. Mal schauen, wie weit ich heute Abend noch komme. Das ist auf jeden Fall ein interessantes Projekt, das mir schon immer im Kopf rumgeschwebt ist, insofern danke für den Motivationskick.



Kurzes Zwischenergebnis aus der Datenvorverarbeitungsphase:
Mit relativ trivialen Regexes kann man die Kandidaten schon mal von ca. 550 auf 350 runterfiltern. Sucht man z.B. nach Allem, das als Lesung mit い und als Kanji-Schreibung mit 出 anfängt, trifft man schon auf einige interessante Wörter:

Code:
いず    出づ
いずし  出石
いずしじんじゃ  出石神社
いずしやき      出石焼
いずみ  出水
いずみし        出水市
いずもおおやしろきょう  出雲大社教
いずもかぐら    出雲神楽
いずもぐつわ    出雲轡
いずもごと      出雲琴
いずもざき      出雲崎
いずもし        出雲市
いずもたいしゃ  出雲大社
いずもでら      出雲寺
いずものおくに  出雲阿国
いずものかみ    出雲の神
いずものくにふどき      出雲国風土記
いずもぶし      出雲節
いずもへいや    出雲平野
いずもやき      出雲焼
いだしあこめ    出衵
いだしうちき    出袿
いだしぎぬ      出衣
いだしぐるま    出車
いだしたつ      出だし立つ
いだしづま      出褄
いだしふづくえ  出文机
いだしふみだな  出文棚
いだす  出だす
いであう        出で逢ふ,出で会ふ
いでい  出居
いでいのざ      出居の座
いでいり        出で入り
いでいる        出で入る
いでいる        出で居る
いでかてに      出でかてに
いでぎえ        出で消え
いでく  出で来
いでしお        出で潮
いでたち        出で立ち
いでたちいそぎ  出で立ち急ぎ
いでたつ        出で立つ
いでばえ        出で栄え,出で映え
いでまし        出で座し
いでまじらう    出で交じらふ
いでます        出で座す
いでみのはま    出見浜
いでむかう      出で向かふ
いでゆ  出で湯
いでわ  出羽
いずしえいらくかん      出石永楽館
いずもしんわ    出雲神話
いずもえんむすびくうこう        出雲縁結び空港
いずもくうこう  出雲空港
いずものおくに  出雲の阿国
いずものくに    出雲国
(Datenquelle: 大辞泉)
(Dieser Beitrag wurde zuletzt bearbeitet: 23.10.22 19:57 von vdrummer.)
23.10.22 19:37
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
harerod


Beiträge: 570
Beitrag #5
RE: Suche nach bestimmter Kanjilesung in Wörterbüchern
Krass, das sind nochmal deutlich mehr Treffer, als ich erwartet hätte.

Solange die Datenbank keine Infomation enthält, wo in der Lesung des jeweiligen Kanji versteckt ist, ist das Ganze mit Regex IMHO nicht zu knacken, sondern braucht wohl einen echten Parser. Sowas auf die reine Kanafolge der Lesung loszulassen wird abenteuerlich.
Was wäre aber, wenn man einen Parser auf die Kanji/Kana-Sequenz ansetzt? Vorfilter nach Sequenzen, die das Zielkanji enthalten. Im nächsten Schritt Parser an der Position des Zielkanji ansetzen und Lesung mit Ziellesung überprüfen.

Die Frage wurde mir übrigens heute Nachmittag von meinem englischsprachigen Lernpartner gestellt. Bevor er die Frage bei Stackexchange/Japanese reinsetzt, wollte er wissen ob ich spontan eine einfache Lösung wüsste.
Ich würde mal festhalten, dass es wohl eine automatisierte Lösung geben könnte, der Ablauf aber nicht trivial ist.

夜を徹しないでください。grins
23.10.22 21:18
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Haruto


Beiträge: 408
Beitrag #6
RE: Suche nach bestimmter Kanjilesung in Wörterbüchern
(23.10.22 19:37)vdrummer schrieb:  Sucht man z.B. nach Allem, das als Lesung mit い und als Kanji-Schreibung mit 出 anfängt, trifft man schon auf einige interessante Wörter:
...
いだす 出だす

was ihr so alles findet augenrollen

Mir war die Lesung nur in einem relativ gebräuchlichen Wort bekannt:
みいだす = herausfinden
Laut Wadoku und meiner Erinnerung だす geschrieben.
IME kennt diese Schreibweise jedoch nicht und schlägt u.a. 見出す und 見い出す vor. Na wunderbar.
Hilft bei der Suche nach -Lesungen bestimmt prima weiter...
23.10.22 21:46
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
harerod


Beiträge: 570
Beitrag #7
RE: Suche nach bestimmter Kanjilesung in Wörterbüchern
vdrummer, ich darf Dir von meinem Lernpartner ausrichten, dass Deine Liste "Kurzes Zwischenergebnis aus der Datenvorverarbeitungsphase" sehr hilfreich war, um einen Überblick zu bekommen.
Ich selber bin auch gelobt worden, für meinen trivialen Vorschlag, die Links für Lesungsvorschläge in Jisho anzuschauen.

Und Danke nochmal für die Erinnerung an "おいで". (https://welovedoodles.com/japanese-dog-commands/)
30.10.22 16:32
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Suche nach bestimmter Kanjilesung in Wörterbüchern
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
[erledigt] Suche umfangreiches, aktuelles 国語辞典 für das Kindle 梨ノ木 0 1.250 26.10.21 09:31
Letzter Beitrag: 梨ノ木
Suche Grammatik Einsetzübungen mit Erklärung shingo 2 3.863 27.02.17 00:36
Letzter Beitrag: shingo
Offline Wörterbuch Datenbank anlegen mit Vokabel Suche,Kanji-Darstellung u.Abfragung Kitoai 5 5.366 13.02.14 20:57
Letzter Beitrag: Tommy
Webseite nach EPUB konvertieren, EPUB-Reader ? tc1970 1 1.985 15.01.14 19:01
Letzter Beitrag: tc1970
JLPT 2 - suche komplette Vokabelliste DomiKun 28 15.684 30.11.10 03:59
Letzter Beitrag: sd2k9