(13.08.17 14:01)DigiFox schrieb: Hast du dir jetzt alle "aktuellen" Scripte geladen und die ausgelesen? War das nich mega arbeit?
Ja, genau. Wenn man sich die einmal runtergeladen hat, ist das (nach ein bisschen Vorverarbeitung wie unnötige Zeilen / Zeichen entfernen, Half-Width-Katakana konvertieren) eigentlich nicht viel Arbeit.
Die いい加減-Häufigkeiten habe ich mit folgendem Befehl bekommen (zsh unter Linux):
Code:
grep -h "いい加減にし" **/*txt | mecab -Owakati | grep -o "いい \?加減 に し\([^ ]\| [^ ]*\)" | tr -d ' ' | sort | uniq -c | sort -nr
Ich hab mir die ganzen Untertitel irgendwann letztes Jahr mal runtergeladen, aber seitdem nicht wieder aktualisiert. Sollte ich vielleicht mal machen, um noch mehr Daten zu bekommen...