Antwort schreiben 
OmniPage Professional 17
Verfasser Nachricht
tc1970


Beiträge: 216
Beitrag #1
OmniPage Professional 17
Ich habe zufällig gesehen, dass die OCR-Software "OmniPage Professional 17" auch chinesische und japanische Schrift erkennt.
Preis bei ebay: 90 Euro - 99 Euro.

Hat damit schon jemand Erfahrung bei Scannen japanischer Texte gemacht ?
Wie gut ist die Erkennrate ?
Werden japanische PDFs automatisch erzeugt ?
19.11.09 13:47
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Shino
Ex-Moderator

Beiträge: 2.329
Beitrag #2
RE: OmniPage Professional 17
Ich hab´s nur einmal getestet, die Software liegt den Scannern unserer Firma bei. Ich war mit dem Ergebnis so unzufrieden, dass ich es gleich wieder heruntergekratzt hatte. Vielleicht hätte es ja auch noch Tuning-Möglichkeiten gegeben, aber ich bezweifle das.

Wenn du möchtest, kann ich ja mal schauen, ob ich dir eine Musterseite einscannen kann, aber wie gesagt, die € 100,- kannst du dir sparen, denke ich.

Selbst eine Texterkennung für lateinische Buchstaben halte ich nur für bedingt sinnvoll. Der Aufwand, den Text nachher nach Fehlern durchsuchen und anständig nachformatieren zu müssen war bei mir immer höher, als den Text gleich ordentlich einzutippen. Das mag im 2-Finger-Suchsystem möglicherweise anders sein, aber das sind meine Erfahrungen.

人生に迷うときもあるけど笑っていれば大丈夫
19.11.09 13:54
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Ex-Mitglied (bikkuri)
Gast

 
Beitrag #3
RE: OmniPage Professional 17
Hab damals mit Omnipage 11 mit lateinischer Buchstaben gearbeitet. Abhaengig von der Qualitaet des Textes, waren die Ergebnisse recht gut.
Heute arbeite ich mit Adobe Acrobat Pro 9 auf dem Mac.

Die Ergebnisse variieren von Fall zu Fall.
- Besonders gut funktioniert es bei digital printed Texten. Da diese mit den ueblichen Textverarbeitungsprogrammen formatiert sind, ist wenig Spielraum fuer Fehler beim scannen und der OCR.
- Probleme entstehen erst bei trilingualen Texten, z.B. bei wissenschaftlichen Arbeiten. Acrobat kann nur hat nur eine Primaer- und eine Sekundaersprache.
- Weiterhin gibt es Schwierigkeiten bei Sonderzeichen wie Diakritika und ausgefallenen Markierungen.

Der Fall von Buechern im Normaldruck:
- besonders bei alten Buechern kann es sein, dass der Scanner die Drucktiefe falsch interpretiert und die Zeichen verhunzt
- weiterhin sind Texte schwierig, die keine Standardfonts verwenden
- bei qalitativ minderwertigen Drucken ist die Fehlerquote hoch

Die Fehlerquote liegt meiner Erfahrung nach um die 10% bei allen Textarten, die ich aufgefuehrt habe.

Ich verwende Acrobat, um bei eingescannten Buechern eine full text search zu implentieren. D.h. ein PDF-Dokument mit [i]embedded fonts[/]. Das hat den Vorteil, dass man eine fehlerfreie Oberflaeche bei gleichzeitiger Suchfunktion hat. Kleinere Fehler fallen somit nicht auf.
Das ist m.E. auch die einzig sinnvolle Anwendung, denn die meiste Arbeit steckt nicht im Redigieren des Textes, sondern in dessen Formatierung. Denn mit Zeilenumbruechen, Zeilenabstaenden etc. gibt es noch grosse Probleme.
19.11.09 20:57
Diese Nachricht in einer Antwort zitieren
frostschutz
Technik

Beiträge: 1.783
Beitrag #4
RE: OmniPage Professional 17
Wenns nur für PDF gebraucht wird (der Text nicht bearbeitet werden muss) tuts auch als Bild (600dpi Graustufen Scan, per (Batch-)Bildverarbeitung passend auf 1bit Schwarz-Weiss reduziert, Grafiken ausgeklammert). Ist auch die einzige Möglichkeit, das Aussehen des Originaldokuments beizubehalten.

Noch besser wäre es natürlich, die (bei neueren Sachen) sowieso vorhandene digitale Fassung direkt vom Erzeuger zu beziehen, da digital (PC) -> analog (Druck) -> digital (Scan) einfach hirnrissig (aufwendig und verlustbehaftet) ist. Aber in einer Papierbuchwelt hat man halt oft keine andere Wahl.

Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
(Dieser Beitrag wurde zuletzt bearbeitet: 19.11.09 23:41 von frostschutz.)
19.11.09 23:40
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
OmniPage Professional 17
Antwort schreiben