astacus
Beiträge: 80
|
RE: OCR als Ergänzung zu Rikaichamp
Hallo Zusammen,
Wollte hier nur einmal darauf hinweisen, dass die Firma Google völlig umsonst OCR macht und nach
meiner Erfahrung fast fehlerfrei. Dazu muss man die eingescannten Seiten in "Google Bilder" hochladen (1. Schritt), dann das Bild aufrufen und auf den kleinen Punkt mit Kringel drum rechts unten klicken (2. Schritt). Danach kann man den Text entweder so übersetzen lassen (nicht machen!) oder per cut and paste herauskopieren und in eine beliebige Textverarbeitung einsetzen (3. Schritt).
Funktioniert mit senkrechten und auch waagrechtem Text.
Nachteile: Google weiss nichts von Furigana, die werden an irgendwelchen sinnfreien Stellen in den Text eingewebt. Das kann man umgehen, indem man zuerst die Furigana mit einer Bildbearbeitung wegradiert oder indem man den Text satzweise herauskopiert.
Grüße
Astacus
(Dieser Beitrag wurde zuletzt bearbeitet: 01.04.22 22:04 von astacus.)
|
|
01.04.22 21:56 |
|
astacus
Beiträge: 80
|
RE: OCR als Ergänzung zu Rikaichamp
Ach ja und noch ein Hinweis zum Flachlegen der Seiten beim Einscannen:
Man nimmt eine kleine Säge und schneidet bei dem Buch den Falz ab :-)
Dann fällt es auseinander und man kann jede Seite einzeln ganz flach hinlegen und ohne Krümmung einscannen. Da man das Buch eingescannt hat kann das Original ohnehin weggeschmissen werden....
Astacus
|
|
02.04.22 21:34 |
|
AwesomeSepp
Beiträge: 199
|
RE: OCR als Ergänzung zu Rikaichamp
(02.04.22 21:34)astacus schrieb: Man nimmt eine kleine Säge und schneidet bei dem Buch den Falz ab :-)
...
Da man das Buch eingescannt hat kann das Original ohnehin weggeschmissen werden....
Was für ein Frevel! Auf den Scheiterhaufen mit Ihm!
(MattvsJapan hat mal gezeigt wie er seine Manga-Seiten-Wand gemacht hat, er hat die Mangas in die Mikrowelle, dann löst sich der Kleber und sie fallen auseinander.)
Edith: hier das Video
「ペーター、お帰り。字は読めるようになったかい?」「ううん、まだ読めないよ。字を読むのは、すごく難しいんだ。」(-- Zitat aus アルプスの少女ハイジ --)
(Dieser Beitrag wurde zuletzt bearbeitet: 03.04.22 17:21 von AwesomeSepp.)
|
|
03.04.22 16:04 |
|
astacus
Beiträge: 80
|
RE: OCR als Ergänzung zu Rikaichamp
(03.04.22 16:04)AwesomeSepp schrieb: (02.04.22 21:34)astacus schrieb: Man nimmt eine kleine Säge und schneidet bei dem Buch den Falz ab :-)
...
Da man das Buch eingescannt hat kann das Original ohnehin weggeschmissen werden....
Was für ein Frevel! Auf den Scheiterhaufen mit Ihm!
(MattvsJapan hat mal gezeigt wie er seine Manga-Seiten-Wand gemacht hat, er hat die Mangas in die Mikrowelle, dann löst sich der Kleber und sie fallen auseinander.)
Edith: hier das Video
DEN Trick kannte ich noch nicht. Werd ich dann das nächste Mal auch probieren. Der Kleber scheint bei japanischen Büchern nicht so dolle zu sein. Im letzten Hochwasser (July 2021) sind mir eine Menge japanischer Bücher eingeweicht und der Kleber löste sich dabei völlig auf, so dass die Seiten einzeln zur Haustür herausgeschwemmt wurden. Zum Einscannen mussten sie dann wieder getrocknet und gebügelt werden... Doch leider ist trotzdem vieles verloren gegangen.
OK, wer seine Bücher lieber nach dem Einscannen behalten möchte, der mag sie auch umständlich aufklappen, im 90 Grad Winkel hinhalten und dann das Buch wenden, um die nächste Seite einzuscannen etc. Hilfreich fand ich bei diesem Verfahren eine kleine Plexiglasscheibe, die man aufs Buch legt und die die Flachheit sicher stellt. Bei der Beleuchtung ist dann darauf zu achten, dass keine Reflexionen auftreten, also zwei Lampen von links und rechts aufstellen und man erhält eine gleichmäßige Ausleuchtung. Es gibt desweiteren spezielle Buchscanner wo der Flachbettscanner auf einer Seite verkürzt ist, so dass das Buch nicht vollständig aufgeklappt sein muss, ein Teil hängt senkrecht herab. (OK, hier würde eine Zeichnung helfen).
Zur OCR: Google macht das umsonst und was für mich beeindruckend war, ist dass das auch mit altdeutschen Texten in Frakturschrift funktioniert. Ich wollte mal eine darauf spezialisierte OCR Software kaufen, bekam aber nur ein Angebot mit einem Knebelvertrag (nur so und so viele Seiten, dann nachzahlen etc.) Darauf habe ich dann verzichtet und meine Texte lieber von Hand abgeschrieben. Müsste ich jetzt auch nicht mehr machen.
Astacus
|
|
03.04.22 21:33 |
|