(13.06.24 19:19)Senpai schrieb: zerschossene Smilies etc. löschen,
Was für Smilies sind das? Normale, die man über die Handytastatur eingibt? Die LINE-Sticker werden ja (bzw. wurden damals) einfach in Text konvertiert, was sie noch einigermaßen lesbar macht...
Zitat:Ich habe die LINE Sicherungsdateien unsystematisch von Zeit zu Zeit gesichert (das heißt es gibt viele zeitliche Überlappungen) und angefangen monatsweise in Word bzw. Libre Office Dateien zu kopieren.
Gut, zeitliche Überlappungen sind nicht optimal, aber das könnte man trotzdem automatisieren. Word bzw. Libre-Office macht es da schon ein bisschen aufwändiger als die reinen Textdateien, aber den Text kriegt man da auch raus (letztendlich sind das nur komprimierte XML-Dateien).
Zitat:Ich habe keine Ahnung, vermute aber das eine automatische Verarbeitung am besten mit den Rohdaten von LINE funktioniert.
Die LINE-Rohdaten haben Tab-Zeichen zwischen Abesender, Uhrzeit und Nachricht. Die sind sehr praktisch, um diese Elemente verlässlich zu erkennen (normalerweise schreibt man in LINE-Nachrichten ja keine Tabs). Wenn die fehlen würden, könnte man immer noch aufgrund des Namens und des einheitlichen Formats der Uhrzeit relativ sicher den Anfang einer neuen Nachricht erkennen. Klappt also schon, ist nur etwas aufwändiger.
Zitat:Reihenfolge der Messages nach Datum, Uhrzeit, Absender erkennen und trennen, das ganze schön und platzsparend und ohne Redundanzen formatieren, zerschossene Smileys entweder reparieren oder löschen, .....das zu automatisieren wäre ein Traum, oder vielleicht Arbeit für eine KI der Zukunft?
Das mit den Smileys müsste man sich anschauen; alles andere ist definitiv auch ohne KI machbar.
Zitat:Die Messages enthalten halt viele Namen, Adressen, persönliche, vertrauliche Informationen verschiedener Leute, die nicht zur Weitergabe an Dritte gedacht waren, wäre halt ein Vertrauensbruch gegenüber meinem Gesprächspartner, die einfach weiterzugeben. Ist nicht persönlich gemeint, vdrummer, du interessierst dich sicher nicht die Bohne für meinen LINE Klatsch und Tratsch, aber die (deutschsprachige) Japanischlernerwelt ist klein ....
Das kann ich vollkommen verstehen. Mir ginge das mit meinen LINE-Nachrichten genau so. Aber gerade deshalb würde ich die Nachrichten von jemand anderem mit Respekt behandeln.
Außerdem hätte ich gar nicht die Zeit, das alles zu lesen
(Siehe auch weiter unten bei der Antwort auf Harerods Beitrag)
Zitat:Vielleicht können wir vorher zusammen ein Bier trinken gehn ;-)
Gerne. Nenn mir eine Zeit und einen Ort
(14.06.24 12:17)harerod schrieb: PN ist nach einem Post möglich. Habe ich die Tage hier gelesen:
Thread-Moderation
Ah, danke, das muss ich gestern beim Suchen übersehen haben.
Zitat:Ich versuche mir das mal zu merken und schreib Dir das nächste Beispiel, das mir im reellen Leben auffällt.
Ich bin gespannt.
Zitat:Was vdrummer Dir angeboten hat, kann man nur mit seiner unendlichen Begeisterung für Sprachwissenschaft erklären.
Das spielt da mit rein, ja. Ich finde das einfach eine sehr reizvolle Problemstellung. Automatisierte Textverarbeitung ist einfach eine Leidenschaft von mir. Kann man nicht anders sagen
Seit dem Studium hab ich das schon immer gerne gemacht. Und ganz uneigennützig ist es ja auch nicht, da ich das Ergebnis auch für meine eigenen LINE-Daten benutzen könnte.
Zitat:Furigana in Word: wie so oft, habe ich nur eine alte Dauerlizenz, in diesem Fall Office 2013. Furigana geht mit Grafikdialogen. Ganze Texte möchte ich damit nicht bearbeiten müssen. Da würde ich lieber HTML schreiben. Oh Mann, das erinnert stark an die endlosen LaTEX / Pagemaker Debatten.
OK, ich dachte, das ginge auf ein Mal für das ganze Dokument. Dann hatte ich das falsch in Erinnerung.
Meine Lösung basiert tatsächlich auf LaTeX. Da hat man meiner Meinung nach mehr Kontrolle über das Endprodukt (gerade, wenn es gedruckt werden soll) als bei HTML.
Edit: überflüssiges quote-Tag gelöscht.