Mayavulkan
Beiträge: 527
|
Beitrag #1
Furigana in Office vollständig löschen
Hallo,
das Ganze hängt folgendermaßen zusammen.
Ich baue mir hier schon seit einiger Zeit dreisprachige (englisch, japanisch, deutsch) Materialien (Text, Flashcards, Hörbücher fürs Autoradio) aus den ersten beiden Bänden von Harry Potter zusammen. Das ist jetzt zwar kein Originaljapanisch, dafür gibt es eben mehrere Sprachversionen und in allen Sprachen sowohl die Bücher als auch die Hörbücher.
Die Bücher übernehme ich zunächst in Word (erst scannen + OCR, dann noch mal händisch korrigieren) inklusive der zahlreichen Furigana aus den Büchern. Daraus wird für die Flashcards dann eine Exceltabelle. In dieser Tabelle erscheinen die Furigana einfach als Text in Klammern, was nicht sonderlich gut aussieht. Für die Flashcards lösche ich die Furigana folglich. Momentan einfach händisch, was aber recht mühsam ist. Gut, im Vergleich zum Gesamtaufwand ...
Dennoch sollte man das eventuell leicht automatisieren können und damit zumindest diese stupide Tätigkeit vereinfachen können. Mir ist bis jetzt allerdings nicht eingefallen, wie. Ich hab mal versucht, den Text als XML zu exportieren und darüber ein Skript laufen zu lassen, so genau habe ich aber nicht herausbekommen, wonach eigentlich zu suchen wäre.
Um es kurz zu machen: wie könnte man *alle* Furigana aus einem Word-Text loswerden?
|
|
22.08.13 19:39 |
|
frostschutz
Technik
Beiträge: 1.783
|
Beitrag #2
RE: Furigana in Office vollständig löschen
Noch jemand der mit Harry Potter lernt. Bei Englisch hats ja funktioniert, warum nicht auch Japanisch?
Aber Scannen + OCR? Händisch korrigieren?! Auf Pottermore gibts die Ebooks doch als EPUB ohne DRM. Und da kann man die Furigana recht einfach löschen (sind Ruby-Tags die sich zur Not mit Suchen & Ersetzen / Regexp erschlagen lassen).
Code:
ハリー・ポッターに<ruby>乾<rt>かん</rt></ruby><ruby>杯<rt>ぱい</rt></ruby>!
Alle <rt>.*?</rt> löschen und die Furigana sind weg. Die überflüssigen <ruby> und </ruby> kann man dann auch entfernen.
Ich behalte die Furigana allerdings, für die Antwortseite. Woran ich noch basteln muss ist das Script das die Sätze der engl. Version denen der jap. Version zuordnet. Denn das von Hand zu machen ist mir auch zuviel Arbeit...
Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
(Dieser Beitrag wurde zuletzt bearbeitet: 22.08.13 19:57 von frostschutz.)
|
|
22.08.13 19:56 |
|
tc1970
Beiträge: 216
|
Beitrag #3
RE: Furigana in Office vollständig löschen
(22.08.13 19:56)frostschutz schrieb: Auf Pottermore gibts die Ebooks doch als EPUB ohne DRM.
Kann man die japanischen Ausgaben auch mit einer deutschen Kreditkarte kaufen ?
Vor einem halben Jahr habe ich das ausprobiert und das System bestand auf japanische Kreditkarte.
|
|
22.08.13 20:16 |
|
frostschutz
Technik
Beiträge: 1.783
|
Beitrag #4
RE: Furigana in Office vollständig löschen
Ich konnte es ohne Probleme kaufen... Preis wurde auch in Euro angezeigt.
Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
|
|
22.08.13 20:26 |
|
Mayavulkan
Beiträge: 527
|
Beitrag #6
RE: Furigana in Office vollständig löschen
(22.08.13 20:26)frostschutz schrieb: Ich konnte es ohne Probleme kaufen... Preis wurde auch in Euro angezeigt.
Tschuldigung, ich dachte, das wären die irgendwo geklauten Exemplare, letztlich dann auch nur per OCR umgesetzt. Muss ich mal nachschauen, vielen Dank.
(22.08.13 19:56)frostschutz schrieb: Noch jemand der mit Harry Potter lernt. Bei Englisch hats ja funktioniert, warum nicht auch Japanisch?
Aber Scannen + OCR? Händisch korrigieren?! Auf Pottermore gibts die Ebooks doch als EPUB ohne DRM. Und da kann man die Furigana recht einfach löschen (sind Ruby-Tags die sich zur Not mit Suchen & Ersetzen / Regexp erschlagen lassen).
Code:
ハリー・ポッターに<ruby>乾<rt>かん</rt></ruby><ruby>杯<rt>ぱい</rt></ruby>!
Alle <rt>.*?</rt> löschen und die Furigana sind weg. Die überflüssigen <ruby> und </ruby> kann man dann auch entfernen.
Ich behalte die Furigana allerdings, für die Antwortseite. Woran ich noch basteln muss ist das Script das die Sätze der engl. Version denen der jap. Version zuordnet. Denn das von Hand zu machen ist mir auch zuviel Arbeit...
Nochmals vielen Dank für den Hinweis. Die Kosten aller 7 Bände sind ja in etwa die Versandkosten eines einzelnen Buches durch amazon.co.jp ...
Das mit dem Zerkrümeln der Sätze und der Audiodateien dürfte sich kaum automatisieren lassen. Die Übersetzung erfolgt nicht Satz per Satz. Und manchmal lernt man lustige Redewendung ("zwei Fliegen mit einer Klappe schlagen", "sich wie ein Ei dem anderen gleichen", "gebratene Tauben fliegen in den Mund") in der japanischen Version, was sich dann einem Automatismus auch verweigern dürfte.
Wenn es jetzt noch die Audioversion der Bände 3 ... 7 gäbe ...
(Dieser Beitrag wurde zuletzt bearbeitet: 22.08.13 21:15 von Mayavulkan.)
|
|
22.08.13 21:00 |
|
Hellstorm
Beiträge: 3.925
|
Beitrag #7
RE: Furigana in Office vollständig löschen
Ich hab mir jetzt auch Harry Potter 1 gekauft Book off sei dank, nur 105 Yen als Hardcover.
やられてなくてもやり返す!八つ当たりだ!
|
|
23.08.13 05:09 |
|
Mayavulkan
Beiträge: 527
|
Beitrag #8
RE: Furigana in Office vollständig löschen
Hallo,
nochmals vielen Dank für den Tip mit den eBooks. Das war auch insofern interessant, als es die OCR-Frage ja auch bei der deutschen und englischen Version gab, wenn auch nicht so gravierend.
Mir ist jetzt auch eingefallen, warum ich das noch nicht genutzt habe. Die Seite war mir schon aufgefallen und zwar von amazon kommend. Ihc wollte mir dann auch gleich einmal ein eBook kaufen und siehe da: "Bitte melden Sie sich an!" Hatte mich seinerzeit ziemlich geärgert, weil das amazon-Konto ansonsten weltweit prima funktionierte.
Sei's drum.
Womit liest man denn so ein japanisches eBook auf einem Windows-PC am besten? Ich habe mal das Firefox-Plugin probiert, das sieht jetzt nicht so toll aus, zudem werden Furigana einfach in den Text gebuttert, was sich dann außerordentlich schwer liest (z.B. 医い務む室しつ). Dann habe ich calibre probiert. Für deutschen und englischen Text prima, beim Japanischen erscheint zwar der Text von rechts nach links und von oben nach unten, aber alle Zeichen sind um 90 Grad gedreht. Ich habs auch mal mit PDF-Konvertierung probiert, mit calibre gings leider nicht.
Ich denke, es wird eine geeignete Software geben, muß keinesfalls Freeware sein.
|
|
23.08.13 13:14 |
|
frostschutz
Technik
Beiträge: 1.783
|
Beitrag #9
RE: Furigana in Office vollständig löschen
Hm, wenn mich meine Erinnerung nicht täuscht, hat das Calibre mal richtig angezeigt. Sigil hat allerdings das gleiche Problem.
Mit ChainLP könnte man eine PDF-Datei basteln, allerdings liest ChainLP nicht direkt EPUB Dateien, da müßte man einen Umweg über Textdateien machen. Das Programm ist mehr auf Aozora ausgerichtet.
Es sind EPUB3, so gesehen sollte jede EPUB3-fähige Software tun. Da du Amazon erwähnst, käme evtl. sonst auch ganz unkonventionell die Kindle-App in Frage.
Lernen ist wie Rudern gegen den Strom. Sobald man aufhört, treibt man zurück.
|
|
23.08.13 13:52 |
|
Mayavulkan
Beiträge: 527
|
RE: Furigana in Office vollständig löschen
Hallo,
die momentan beste Lösung besteht darin, den .epub-Container mit einem Kompressionsprogramm (zip, rar) auszupacken. Die einzelnen Kapitel erscheinen dann als .html, die zwar nicht im Firefox, aber in chrome vollständig korrekt angezeigt werden. Man kann sogar je nach Lust und Laune Furigana kopieren oder auch nicht. Beim Import in Word sind sie korrekt da, beim Import in notepad nicht.
|
|
23.08.13 15:03 |
|