Kokujou
Beiträge: 117
|
Beitrag #1
Bestes japanisches OCR (Zeichenerkennung)
Hallo erstmal!
Ich bin leider nicht auf dem laufenden was die Forschung angeht. Ich wüsste gerne ob ihr irgendein zumindest halbwegs funktionierendes Tool kennt, optimalerweise als Smartphone-App, mit der man z.B. in der Umgebung einfach japanische Zeichen fotografieren kann und diese dann zumindest zu einem großen Teil richtig erkannt werden?
Straßenschilder, Namen von Restaurants, Speisekarten oder auch ganze Dokumente und Bücher. Ich kenne ein paar solcher Tools, auf meinem Smartphone ist so eins auch integriert, aber mit der beispiellos schrecklichen Erkennungsrate von 0,0% (ich wüsste zu gerne wie die auf diese Zeichen überhaupt kommen).
Mir ist klar dass OCR im Zusammenhang mit japanischen Kanji eine fast unlösbare Aufgabe ist bedenkt man die verschiedenen Stile, aber ich hatte gehofft in der Forschung hätte sich langsam mal etwas dazu getan.
|
|
08.12.18 11:32 |
|
Mayavulkan
Beiträge: 527
|
Beitrag #2
RE: Bestes japanisches OCR (Zeichenerkennung)
(08.12.18 11:32)Kokujou schrieb: Hallo erstmal!
Ich bin leider nicht auf dem laufenden was die Forschung angeht. Ich wüsste gerne ob ihr irgendein zumindest halbwegs funktionierendes Tool kennt, optimalerweise als Smartphone-App, mit der man z.B. in der Umgebung einfach japanische Zeichen fotografieren kann und diese dann zumindest zu einem großen Teil richtig erkannt werden?
Straßenschilder, Namen von Restaurants, Speisekarten oder auch ganze Dokumente und Bücher. Ich kenne ein paar solcher Tools, auf meinem Smartphone ist so eins auch integriert, aber mit der beispiellos schrecklichen Erkennungsrate von 0,0% (ich wüsste zu gerne wie die auf diese Zeichen überhaupt kommen).
Mir ist klar dass OCR im Zusammenhang mit japanischen Kanji eine fast unlösbare Aufgabe ist bedenkt man die verschiedenen Stile, aber ich hatte gehofft in der Forschung hätte sich langsam mal etwas dazu getan.
Mobiltelefon weiß ich jetzt nicht, aber Acrobat auf dem Desktop geht wirklich gut. Aus irgendwelchen Gründen ist 店 nicht im Zeichensatz. Wenn das im Text auftaucht, kommen die lustigsten "Übersetzungen" heraus.
Das Hauptproblem bei Acrobat sind schräg eingescannte Dokumente. Dann werden die Kanji immer noch weitestgehend richtig erkannt, aber die Satzreihenfolge stimmt nicht.
Dafür richte ich mir die Texte mit einem Matlab-Skript gerade, aber das ist dann doch schon sehr speziell.
Die ärgerlichste Sache bei Acrobat ist, dass man die Software jetzt nur noch mieten kann und zwar zu einem erheblichen Preis (fast doppelt so teuer, wie das Duo Photoshop/Lightroom). Momentan muss des deshalb immer noch die letzte Kaufversion tun.
|
|
08.12.18 13:23 |
|
Kokujou
Beiträge: 117
|
Beitrag #3
RE: Bestes japanisches OCR (Zeichenerkennung)
Adobe Acrobat Reader oder wie?
das kann ja wohl nicht sein... hab ich gerade einen Denkfehler oder meinst du was anderes? Hast du mal einen Link?
Oh und bevor ich's vergesse funktioniert das nur bei gescannten? Wie ist es wenn du Fotos einscannst? Sagen wir du bist draußen, siehst ein Ladenschild und willst wissen was da steht, Foto -> Scan -> Fertig.
(Dieser Beitrag wurde zuletzt bearbeitet: 08.12.18 13:32 von Kokujou.)
|
|
08.12.18 13:30 |
|
Mayavulkan
Beiträge: 527
|
Beitrag #4
RE: Bestes japanisches OCR (Zeichenerkennung)
(08.12.18 13:30)Kokujou schrieb: Adobe Acrobat Reader oder wie?
das kann ja wohl nicht sein... hab ich gerade einen Denkfehler oder meinst du was anderes? Hast du mal einen Link?
Oh und bevor ich's vergesse funktioniert das nur bei gescannten? Wie ist es wenn du Fotos einscannst? Sagen wir du bist draußen, siehst ein Ladenschild und willst wissen was da steht, Foto -> Scan -> Fertig.
Acrobat, ohne "Reader".
|
|
08.12.18 15:39 |
|
Yano
Beiträge: 2.920
|
Beitrag #5
RE: Bestes japanisches OCR (Zeichenerkennung)
Japanisch ist leicht zu OCRen.
Die Zeichenerkennung war schon vor der Jahrhundertwende ausreichend zuverlässig, erfordert aber eine Leserlichkeit, die man im Zeitalter des Telefax nicht oft hatte.
Heutzutage hat man es oft mit guten Scans und perfekten PDFs zu tun. Da ist die Arbeit mit einem guten OCR-Programm wie autonomes Autofahren auf Niveau 3: Es geht perfekt fast die ganze Zeit, aber ganz selten, dann paßt du womöglich gerade nicht auf, haut es dir einen Hund hinein (vor ein paar Tagen in einem Post hier ist mir das passiert).
Die besten OCR-Programme sind anscheinend ABBY (das habe ich, hieß früher Finereader) und eine Alternative von Adobe, die ich nicht kenne. Kostet jeweils mehr als 100 Euros. Auch diese high-end-Produkte haben ihre liebe Not mit der japanischen oder besser chinesischen Vorliebe für durcheinanderschreiendes Layout.
|
|
08.12.18 23:44 |
|
Kokujou
Beiträge: 117
|
Beitrag #6
RE: Bestes japanisches OCR (Zeichenerkennung)
Ich sollte aber nochmal erwähnen: Ich rede hier nicht von eingescannten Dokumenten. Sondern von Fotos die in der Umgebung geschossen worden.
Also stell dir vor du gehst in ein Restaurant, siehst ne Speisekarte irgendwo hängen und fotografierst sie ab, willst wissen was drauf steht.
Oder Straßenschilder, Hinweisschilder, Wegweisungen, alles was es eben nicht digital gibt und an Orten, an denen man nicht unbedingt einen Scanner dabei hat.
Der besondere Schwerpunkt ist ja auch Kaligraphie bzw. nonkonforme Schrift. Oder auch Hintergründe! wenn sich die Schrift nicht so gut vom Hintergrund abhebt, Bildartefakte und und und...
|
|
09.12.18 19:33 |
|
Yano
Beiträge: 2.920
|
Beitrag #7
RE: Bestes japanisches OCR (Zeichenerkennung)
(09.12.18 19:33)Kokujou schrieb: Der besondere Schwerpunkt ist ja auch Kaligraphie bzw. nonkonforme Schrift. Oder auch Hintergründe! wenn sich die Schrift nicht so gut vom Hintergrund abhebt, Bildartefakte und und und...
Das Ende der Captchas wird wohl dereinst kommen.
|
|
09.12.18 20:46 |
|
Kokujou
Beiträge: 117
|
Beitrag #8
RE: Bestes japanisches OCR (Zeichenerkennung)
XD dann denken sie sich was anderes aus. Aber Ja so etwas meine ich natürlich auch^^
Ich denk halt nur für jemanden, der nicht so gut darin ist, die Schrift zu lernen, für den wäre es gut, wenn er einfach mit dem Handy nach Japan kommen könnte und alles was er nicht lesen kann abfotografieren und durch den Übersetzer jagen könnte.
Auf eine Reform dass über jedem Kanji-Schriftzeichen, nicht nur den erweiterten, die Lesung als Hiragana drüber steht kann man wohl lange warten
|
|
10.12.18 12:13 |
|
fuyubi
Beiträge: 87
|
Beitrag #9
RE: Bestes japanisches OCR (Zeichenerkennung)
Also ich benutze manchmal Yomiwa oder so. Ich weiß grad nicht auswendig wie das heißt. Das ist noch lange nicht perfekt, aber es wird kontinuierlich verbessert. Ich vermute, dass du sowas meinst. Man schaltet die Kamera ein und wie ein QR Code Reader QR Codes scannt, scannt das eben Schriftzeichen. Oder?
Edit: Das erkennt bisher aber fast nur "schwarz auf weiß", aber das immerhin ganz gut
(Dieser Beitrag wurde zuletzt bearbeitet: 10.12.18 18:17 von fuyubi.)
|
|
10.12.18 18:16 |
|
vdrummer
Beiträge: 1.445
|
RE: Bestes japanisches OCR (Zeichenerkennung)
Ich habe mal nach japanischen OCR-Apps gesucht und bin auf die Google-Translate-App gestoßen.
Dort kann man auf das Foto-Symbol tippen und ein Foto vom Text machen. Erkannte Zeichen werden dann markiert und man kann die zu übersetzende Passage auswählen. Diese wird dann mit Google Translate übersetzt.
Meine Tests mit Büchern, Abfotografieren vom Bildschirm (PDFs) und Handschrift von Muttersprachlern verliefen ziemlich gut. Manchmal wurden einzelne Zeichen nicht erkannt, was einem dann natürlich die ganze Übersetzung versaut hat...
(Falls das relevant sein sollte: Ich beziehe mich auf die Android-Version)
|
|
10.12.18 19:23 |
|