So, mein Reiwa-Distanz-Projekt ist nun endlich zum Ende gekommen. Die Distanz ist definiert als Differenz der Indizes der Zeichen 令 und 和. Ein paar Beispiele:
令和 → 1
令1和 → 2
令12345和 → 6
Nach diesem Maß beträgt die Distanz im Original-Text 10 (stimmt nicht ganz; siehe edit). Von insgesamt 6181 gefundenen 令和-Paaren haben 20 eine Distanz < 10. Diese sind nachfolgend aufgeführt (der Name hinter der Zahl ist der Dateiname der entsprechenden Datei aus der ich die Textstelle habe):
Code:
2 keiryaku_nijusen
2 sakoku
3 kokubyaku_story
3 nagasakino_insho
5 haru_7
5 inochigake
6 06mariyusu
6 izawa_ranken
6 sakoku
6 showa_yugekitai
7 kojieni_torawareta
7 kokyo_shichijunen
7 mimizuno_tawagoto
7 nobuko
7 shinsho_taikoki04
8 atarashii_ushio
8 bunmeishijono_ichi_shinkigen
8 sonjo_senryakushi
9 berurinno_kotansai
9 kushu_sosokyoku
Die beiden Fälle mit der kleinsten Distanz stelle ich hier kurz mal vor:
keiryaku_nijusen schrieb:重大な命令
昭和×年も押詰《おしつま》った十二月の或日《あるひ》[...]
Hier war ein Zeilenumbruch dazwischen, den mein Programm allerdings nicht als Zeichen gewertet hat. Dieser Fall ist also etwas fragwürdig, da dieses 重大な命令 ja qquasi nur eine Überschrift ist.
sakoku schrieb:この問題は秀吉の追放令緩和に役立つ筈でもあった。
Hier haben wir es mit einem Kompositum 津法令+緩和 zu tun.
Zum Vergleich der Original-Text:
万葉集 schrieb:初春の令月にして、気淑く風和ぎ、梅は鏡前の粉を披き、蘭は珮後の香を薫す
EDIT: Mir fällt gerade auf, dass das natürlich nicht der Original 万葉集-Text ist
Hier der Original-Orginaltext mit Distanz 6:
万葉集 schrieb:天平二年正月十三日 萃于師老之宅、申宴会成、于時、初春令月、気淑風和、梅披鏡前之粉、蘭薫珮後之香
Schaut man sich die Verteilung der Distanzen an, sieht man, dass die meisten Instanzen tatsächlich zwischen 5 und 10 liegen. Eine Instanz mit Distanz 10 zu finden war also gar nicht so unwahrscheinlich
Ich habe die Top 20 inkl. der relevanten Textstellen mal hochgeladen:
https://www.dropbox.com/s/8gr1mxa3kowoow...0.txt?dl=1
Falls Interesse besteht, lade ich auch gerne die kompletten Daten hoch.
PS: Satzgrenzen habe ich erstmal ignoriert, d.h, dem Programm ist es egal, ob die Kanji in einem Satz vorkommen oder nicht. Das erklärt auch, warum Distanzen in der Größenordnung 10.000 vorkommen.