(26.06.17 06:46)torquato schrieb: Was soll das denn für ein Korpus werden?
Ein (mit POS-Tags) annotiertes Korpus auf Basis der J-Dramas der letzten 5-6 Jahre. Damit hat man dann gesprochenes Japanisch in Schriftform und kann solche Sachen wie "A N の N" suchen.
Wenn das gut funktioniert, wären auch Zeitungsartikel spannend, denke ich. Da kommt man ja leicht dran.
Zitat:Wir können im Deutschen ja bis zu einem gewissen Grad Satzglieder umstellen. Die Bedeutung des Satzes muß sich dabei nicht zwangsläufig ändern. Manchmal verschieben sich dabei leicht Konnotationen oder die Stilebene ändert sich. Manche Sprachen sind da noch freier (z.B. Latein) oder restriktiver (Beispiel?).
Chinesisch. Das ist eine ganz klare SVO-Sprache. Wenn man die Wörter an Subjekt- und Objekt-Position vertauscht, ändert sich auch die Bedeutung des Satzes:
我认识你。
wǒ rènshi nǐ
Ich kenne dich
你认识我。
nǐ rènshi wǒ
Du kennst mich
Je mehr Information in den einzelnen Satzgliedern steckt, desto flexibler ist eine Sprache in der Wortstellung. Im Deutschen haben wir die Kasus-Informationen in den Substantiven kodiert und können daher auch "Mich kennst du" oder "Dich kenne ich" sagen ohne, dass die intendierte Bedeutung verloren geht.
Im Chinesischen, was eine sog. isolierende Sprache ist, gibt es keine Flexion wie im Deutschen und keine Partikel, die den Kasus ausdrücken wie im Japanischen. Die obigen Sätze übersetzen sich also zu "ich kennen du" und "du kennen ich". Vertauschung von S und O führt somit zwangsläufig zu einer Bedeutungsänderung.
Zitat:Mit dem Fernglas sah die Frau den Mann.
[...]
Den Mann mit dem Fernglas sah die Frau."
Komisch irgendwie. Es gibt mehrere mögliche und von der Bedeutung her eindeutige Satzstellungen, aber die mehrdeutige scheint die Normalstellung zu sein.
Ich vermute mal, dass
a) SVO-Satzstellung
und
b)
PP hinter der NP, auf die sie sich bezieht (hier bezieht sich die PP ja aber auf das Verb (Fernglas als Instrument des Sehens)...; Vllt. hinter NP oder VP?)
am natürlichsten sind.
Für den Fall, dass die Frau das Fernglas hat, wäre eine nicht-ambige Möglichkeit noch
Die Frau sah mit dem Fernglas den Mann
Zitat:Fragen:
1.) Ist so eine Umstellung im Japanischen auch möglich? Und wenn ja, welche Auswirkung hat das auf Ambiguität?
Bei den Adjektiv-Konstruktionen in Nominalphrasen mit の ist so eine Umstellung nicht möglich. Ich hatte das ja versucht.
Bei der Katze geht das aber:
猫が頭の赤い魚を食べた
頭の赤い猫が魚を食べた
Dadurch wird aus der Nominalphrase natürlich ein ganzer Satz.
Zitat:2.) vdrummer hast Du an diesen Aspekt schon gedacht? Und bringt der überhaupt etwas?
Mir ging es erstmal nur darum, auf die Ambiguitäten aufmerksam zu machen. Über Strategien zur Vermeidung habe ich mir noch nicht wirklich Gedanken gemacht...
Zitat:Besonders bei CAT natürlich ein besonderes Problem. Kleines Anektörtchen dazu:
In einem Fußballforum hat mal ein Engländer via Google Translate mit der deutschen Gegenseite versucht zu kommunizieren. Heraus kam dabei: "Unsere Ventilatoren werden eine Menge Lärm machen!"
War das Spiel vllt. im Sommer?
Das ist ein schönes Beispiel von Ambiguität in der Praxis der Sprachtechnologie
Noch ein paar Zitate aus "Computerlinguistik und Sprachtechnologie" (Carstensen et al) zum Thema:
Zitat:Die Anzahl der syntaktischen Lesarten von ganz gewöhnlichen Sätzen, die von größeren Parsing-Systemen geliefert wird, ist zumeist erheblich höher als der Ambiguitätsgrad, den selbst geschulte Syntaktiker auf den ersten Blick erkennen. Als klassisches Beispiel für diesen Effekt wird in der Literatur gerne der Satz
(3.43) Time flies like an arrow.
angeführt, dessen Lesarten wie
(3.44) Zeitfliegen mögen einen Pfeil.
(3.45) Bestimme die Geschwindigkeit von Fliegen so, wie es ein Pfeil tut!
zwar (ohne einen entsprechenden Kontext) völlig abwegig, nichtsdestotrotz aber grammatisch sind und deshalb von einem syntaktischen Parser auch erkannt werden.
Zitat:Zudem gibt es Fälle, bei denen eine Disambiguierung schlicht nicht möglich ist.
Für die Eingabekette
(3.47) Es klappte gut weil Maria die Freundin von Anna aus Osnabrück mit dem Auto von Petra aus Bielefeld abgeholt hat.
produziert der Gepard-Parser (vgl. Langer 2001) insgesamt 1732 Strukturbeschreibungen.