Antwort schreiben 
Japanisch-Netzwerk Link A-Z
Verfasser Nachricht
Hachiko
Gast

 
Beitrag #11
RE: Japanisch-Netzwerk Link A-Z
(01.07.18 20:09)Nia schrieb:  Ich habs doch gewusst!! Ich lese hier ja im Moment sehr wenig, aber der eine oder andere Post von 'Phil.' kam mir schon vor die Nase und ich hab da noch gedacht... er klingt wie ein alter Forumshase, der sich zurückgezogen hat, bestimmt ist er es getarnt.
Willkommen zurück... grins
Wie ich sehe, bist du fleissig dabei, wieder allen zu helfen. Schön!

Nun ja, jeder hat seinen (Schreib-)Stil, durch den er sich früher oder später erkennbar macht. Nach anfänglichem Nachgrübeln war mir auch klar, dass Phil. kein Forumsneuling sein kann.
Auf jeden Fall auch meinerseits ein wiederholtes Willkommen zurückgrins

@yamaneko
... nur ein österreichischer Politiker? Was ist denn mit unserem bayrischstämmigen Innenminister, der neulich schlaftrunken seinen Rücktritt ankündigte,
um am nächsten Morgen wieder hellwach alles zu widerrufen. Alles nur Showbusiness, um zu beweisen, wie unentbehrlich man sich hält.
08.07.18 13:52
Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 799
Beitrag #12
RE: Japanisch-Netzwerk Link A-Z
An die Administratoren,
Ich versuche dem Forum zu helfen, indem ich das Internet mal
absuche und nach den gleichen Datenbanken suche, welche die Downloads sind.
Von dort hab ich ja alles. Irgendwer wird diese Daten eventuell noch haben.

Doch es gibt ein Problem. Jim Breen hatte mal all diese
oder zumindest viele dieser Dateien in seinem Repertoire.
Aber seitdem er nicht mehr arbeitet, verschwinden seine Daten und auch die vielen Universitaetsseiten, die ihm gewidmet waren.
Daher ist es sehr schade, dass all seine Arbeit fuer die Katz war

Sowas in der Form zB.
http://ftp.usf.edu/pub/ftp.monash.edu.au/pub/nihongo/
ftp ist so ein Schluesselwort, doch auch dort ist bereits vieles verschwunden.
Womoeglich ist dieses Forum, noch einer der letzten Leuchttuerme?

Beim entpacken vieler Dateien, erscheint dann eventuell eine Datei ohne Zusatz. So in der Form wie .htm oder .html oder .txt etc.
Diese Datei kann man dann umbenennen in .html. Dann werden auch die Kanji und Kana angezeigt.
(Dieser Beitrag wurde zuletzt bearbeitet: 09.07.18 22:48 von Phil..)
09.07.18 21:31
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.445
Beitrag #13
RE: Japanisch-Netzwerk Link A-Z
(09.07.18 21:31)Phil. schrieb:  Beim entpacken vieler Dateien, erscheint dann eventuell eine Datei ohne Zusatz. So in der Form wie .htm oder .html oder .txt etc.
Diese Datei kann man dann umbenennen in .html. Dann werden auch die Kanji und Kana angezeigt.

Die meisten dieser Dateien sind reine Textdateien. Allerdings sind sie nicht in UTF-8 (Der heutzutage gängigen Kodierung) kodiert, weshalb man Probleme beim Anzeigen haben wird. Gängige Alternativkodierungen sind SHIFT-JIS und EUC-JP. Letztere sieht man öfter bei Dateien von Jim Breen.
Browser sind inzwischen sehr gut darin, automatisch die richtige Kodierung zu erkennen (so gut, dass es bei manchen Browsern gar nicht mehr die Möglichkeit gibt, manuell eine Kodierung auszuwählen). Daher wird das Umbenennen der Datei in *.html das Kodierungsproblem lösen.
Allerdings "denkt" der Browser dann, dass es sich um eine HTML-Datei handelt. In dieser sind Zeilenumbrüche explizit markiert (mit <br/> o.Ä.). Deshalb steht der ganze Inhalt in einer Zeile, wenn man einfach .html an den Dateinamen hängt und das Ganze in einem Browser öffnet.

Mögliche Lösungen des Problems:
1. Eine korrekte HTML-Datei raus machen, die im Browser dann auch Zeilenumbrüche hat
2. Die Plain-Text-Datei in UTF-8 umwandeln und mit einem Texteditor öffnen

Methode 2 hätte den Vorteil, dass sich die Daten so auch leicht von anderen Programmen weiterverarbeiten lassen. Will man sich die Daten nur ansehen, reicht auch Methode 1.

Das nur mal als technischer Hintergrund zu diesen Dateien.



PS: Ich habe mir gerade mal die wordfreq-Datei angesehen. In diesem konkreten Fall war die Kodierung EUC-JP-MS.
(Dieser Beitrag wurde zuletzt bearbeitet: 10.07.18 08:35 von vdrummer.)
10.07.18 08:20
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 799
Beitrag #14
RE: Japanisch-Netzwerk Link A-Z
Grosse Dateien kann man mit dem Programm MacHacha splitten.
Dann wird aus einer Datei, etliche kleinere, gemaess einigen Werten, die man einstellen kann.

Wenn die Dateien dann angezeigt werden, fuegt man an deren Ende ein .html hinzu und die Daten sind sichtbar.
Einen Nachteil gibt es. Der Carriage Return (CR), oder genannt, Zeilenumbruch, geht dabei verloren.

Ob man Firefox noch manipulieren kann, dass der diesen CR respektiert, weiss ich auch nicht.
Hat einer eine Idee?
Oder kann jemand ein Werkzeug schreiben, der solche Daten manipulieren kann?

Danke.
13.07.18 20:30
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.445
Beitrag #15
RE: Japanisch-Netzwerk Link A-Z
(13.07.18 20:30)Phil. schrieb:  Wenn die Dateien dann angezeigt werden, fuegt man an deren Ende ein .html hinzu und die Daten sind sichtbar.
Einen Nachteil gibt es. Der Carriage Return (CR), oder genannt, Zeilenumbruch, geht dabei verloren.

Ob man Firefox noch manipulieren kann, dass der diesen CR respektiert, weiss ich auch nicht.
Hat einer eine Idee?

Wenn du an Textdateien einfach ein .html dranhängst, ignoriert der Browser die Zeilenumbrüche in der Datei (siehe auch mein letzter Post in diesem Thread). Bei HTML-Dateien musst du einen Zeilenumbruch explizit markieren:

TXT-Datei:
Code:
Zeile 1
Zeile 2

HTML-Datei:
Code:
Zeile 1<br/>
Zeile 2
-----------
oder
-----------
Zeile 1<br/>Zeile 2

Dieses "<br/>" markiert den Zeilenumbruch. Eine Quick-and-dirty-Lösung wäre also, an alle Zeilenenden ein "<br/>" anzuhängen. Das, was da rauskommt, ist zwar kein gültiges HTML, aber ein Browser kann das trotzdem interpretieren und zeigt die Zeilenumbrüche an.



Übrigens: Ein Zeilenumbruch ist nicht das Gleiche wie ein Carriage Return. Wenn man sich das mit einer Schreibmaschine vorstellt, ist ein Zeilenumbruch (genauer gesagt "Zeilenvorschub") das Hochrollen des Papiers, so dass man eine Zeile tiefer schreibt und der Carriage Return das Zurückfahren des Papiers nach rechts, so dass man wieder am Anfang der Zeile startet.
Auf Computer übertragen sieht das wie folgt aus:
Zeilenumbruch / Zeilenvorschub → \n (wie "new line")
Carriage Return → \r (wie "return")
Unter Linux / Mac sieht ein Zeilenumbruch so aus: \n
Unter Windows ist er aber immer noch mit einem CR kombiniert: \r\n
Das führt dazu, dass man Probleme bekommt, wenn man mit dem einen System erstellte Text-Dateien auf dem anderen öffnen will.

Details siehe https://de.wikipedia.org/wiki/Zeilenumbruch
(Dieser Beitrag wurde zuletzt bearbeitet: 13.07.18 21:29 von vdrummer.)
13.07.18 21:20
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 799
Beitrag #16
RE: Japanisch-Netzwerk Link A-Z
Gibt es kein Addon bei Firefox, der so etwas automatisch macht?

Das ist doch wirklich komisch.
"ftp://ftp.ottix.net/pub/packages/Nihongo/ExamplesExport.txt"
gibt nur einen Teil der Datei aus und urploetzlich aendert es die Textcodierung und man sieht unleserliche Buchstaben.
Und die folgende Datei, hat die gleichen Daten, die werden alle angezeigt.
"ftp://ftp.ottix.net/pub/packages/Nihongo/examples.utf"
Die Zeilen stehen Zeile fuer Zeile. (also kein Block). Textcodierung ist nicht erreichbar.
(Dieser Beitrag wurde zuletzt bearbeitet: 13.07.18 23:07 von Phil..)
13.07.18 22:17
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.445
Beitrag #17
RE: Japanisch-Netzwerk Link A-Z
(13.07.18 22:17)Phil. schrieb:  Gibt es kein Addon bei Firefox, der so etwas automatisch macht?

Ich hab eine viel bessere Idee! Warum ist mir das gestern nicht schon eingefallen...
Einfach ".txt" an die Datei dranhängen und das Ganze mit Firefox öffnen (Wie du mit dem Browser durch die Verzeichnisstruktur navigieren kannst, hast du ja schon rausgefunden).
Wenn Firefox die TXT-Datei öffnet, werden die Zeilenumbrüche korrekt dargestellt, ohne dass man "<br/>" hinzufügen muss. Nur die Kodierung musst du evtl. selbst einstellen.
Wenn du die Kodierung in Firefox änderst, ändert das aber nur, mit welcher Kodierung das Ganze angezeigt wird. Beim Speichern nutzt Firefox daher wieder die Ausgangskodierung.



Zitat:Das ist doch wirklich komisch.
"ftp://ftp.ottix.net/pub/packages/Nihongo/ExamplesExport.txt"
gibt nur einen Teil der Datei aus und urploetzlich aendert es die Textcodierung und man sieht unleserliche Buchstaben.

"ExamplesExport.txt" ist in EUC-JP kodiert. Wenn ich das in Firefox als Kodierung einstelle, wird mir die komplette Datei korrekt angezeigt.



"ftp://ftp.ottix.net/pub/packages/Nihongo/" scheint mir ein Mirror von Jim Breens FTP-Archiv zu sein. Es gibt auch einen von der Uni Duisburg:
Code:
ftp://ftp.uni-duisburg.de/Mirrors/ftp.monash.edu.au/pub/nihongo/
14.07.18 07:16
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 799
Beitrag #18
RE: Japanisch-Netzwerk Link A-Z
Danke vdrummer,
Ja so geht es.
Die Datei mit .txt aendern und dann
Die Datei mit gedrueckter CTRL-Taste, mit Firefox oeffnen.
Dann wird das Zeile fuer Zeile angezeigt.
Und beim abspeichern wird, egal wie man das auch abspeichert, die
originelle Datei wieder hergestellt.


Mirrors von Jim Breens FTP-Archiv gab es frueher viel mehr. Viele sind in der Zwischenzeit schon abgeschafft worden.
Jim Breen lebt ja noch. Der hat viel in der Australischen Universitaet geschaffen.
Da geht er in Pension und die Uni macht es dann wie ueberall auch, bis auf einige exotische Ausnahmen.
Sie loescht all sein Werken.

http://www.sueddeutsche.de/digital/digit...-1.4053520

Was taete die Welt, haette es Jim Breen niemals gegeben?

So denn. Weisst du vdrummer, ich lasse nicht locker, bis ich eine Loesung gefunden habe.
Und ich habe sie gefunden.
Womoeglich kann das aber nicht jeder nachvolziehen.

Ich hab einen Zwilling als Mac.
Das heisst, dass ich hier sowohl den Mac installiert habe, aber auch Windows XP.
Jeder ist aktiv.

Ich lade die Datei also mit CTRL und dem Firefox beim Mac.
Die Daten werden wie gewuenscht angezeigt.
Dann markiere ich den ganzen Text mit mac-Taste-a.
Ich kopiere alles.

Nun wechsle ich zu windows XP.
Dort oeffne ich MS-Word.
Dann lege ich das vorher kopierte mit CTRL-v in Word ab.
Es wird immer noch wie gewuenscht angezeigt.
Nun speichere ich diese Datei ab, aber anstatt .doc waehle ich htm und html aus.
Und am Namen aendere ich auf .html
.
Dann waehle ich einen USB Stick aus und speichere ab.
Gut, nun ist die Datei dort.
Ich schliesse MS-Word um Speicher zu leeren.
Wechsle zum Mac zurueck.
Schliesse dort auch Firefox.
Dann oeffne ich meinen Stick mit der dort liegenden Datei.
Klicke drauf und Firefox oeffnet sich ganz normal, ohne mit der CTRL Taste.
Und voilä, alles ist vorhanden.

-------
So nun koennt ihr das auch mit den Mac-Programmen oder mit Linux versuchen.
Bin gespannt ob das funktioniert?

Bis dann.
(Dieser Beitrag wurde zuletzt bearbeitet: 14.07.18 08:41 von Phil..)
14.07.18 07:46
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
vdrummer


Beiträge: 1.445
Beitrag #19
RE: Japanisch-Netzwerk Link A-Z
(14.07.18 07:46)Phil. schrieb:  So denn. Weisst du vdrummer, ich lasse nicht locker, bis ich eine Loesung gefunden habe.
Und ich habe sie gefunden.

Das funktioniert natürlich auch. Aber das müsste auch ohne Windows / Word funktionieren mit einer TXT-Datei als Resultat:

1. Datei in Firefox öffnen
2. Korrekte Kodierung auswählen
3. Den ganzen Text markieren, kopieren
4. Einen Text-Editor (unter MacOS "TextEdit") öffnen
5. Den Text dort einfügen
6. Das Ganze als UTF-8-Text speichern (TXT-Datei) (Wahrscheinlich macht TextEdit das automatisch)

Das Ergebnis kann man jetzt sowohl mit einem Browser als auch einem Text-Editor öffnen.
Vorteil dieser Variante: Da man keine HTML-Tags wie "<br/>" braucht, werden die Dateien nicht unnötig größer.
14.07.18 09:25
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Phil.


Beiträge: 799
Beitrag #20
RE: Japanisch-Netzwerk Link A-Z
Hab es mit dieser Datei versucht, die jedoch schon in Unicode steht.
Dialoge A mit B : -- "ftp://ftp.ottix.net/pub/packages/Nihongo/examples.utf" NEU ohne die " " Zeile fuer Zeile

Gesamtgroesse der Datei im Original: 32.6 MB. Ladbar nur mit der CTRL Taste.
Danach alles markieren und kopieren.
TextEdit laden und ablegen.
Abspeichern in html ergab eine Datei mit 139.5 MB.
Abspeichern in PDF ergab eine Datei mit 66 MB. aber mit 12787 Seiten.

Da koennen wir beide stolz drauf sein, einen Mittelweg gefunden zu haben.
Aber man soll so eine PDF nicht ausdrucken. Das Buch waere nicht mehr stemmbar.
14.07.18 09:54
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Japanisch-Netzwerk Link A-Z
Antwort schreiben 


Möglicherweise verwandte Themen...
Thema: Verfasser Antworten: Ansichten: Letzter Beitrag
Japanisch-Netzwerk Link A-Z Archiv zongoku 26 103.160 14.10.16 01:01
Letzter Beitrag: moustique
Link für Website, welche Film Untertitel beinahltet? Nephilim 13 10.254 22.02.13 08:29
Letzter Beitrag: Sanyuu
Suche bestimmten Link - In Reisegruppe nach Japan reisen xrc7581 6 6.117 19.11.10 18:00
Letzter Beitrag: Onizuka
Lustiger Link Landei 3 4.770 09.04.09 21:01
Letzter Beitrag: Kiara
Suche Link zu einem Blog kiwichan 3 4.149 21.08.06 21:51
Letzter Beitrag: kiwichan