Jede Sprache kann als physische Form dargestellt werden, und indem man die Allgemeine Erklärung der Menschenrechte nimmt, sie in reine IPA-Phonetik übersetzt und die kontextuellen Muster dieser Laute in einen zweidimensionalen Raum abbildet, offenbart sich die physische Geometrie der menschlichen Sprache:

    (1) Schauen Sie sich die romanischen Sprachen (Spanisch, Französisch, Italienisch, Portugiesisch, Katalanisch, Rumänisch) in Purpur an. Sie gruppieren sich zu nahezu identischen Halbmondformen und teilen den exakt gleichen geometrischen Rhythmus. Sie können diesen gemeinsamen akustischen Fußabdruck in Worten wie hören "Freiheit"ob es so ist "Freiheit" auf Spanisch, "Freiheit" auf Französisch, oder "Freiheit" Auf Italienisch haben sie alle eine ähnliche phonetische Sprungkraft. (2) Deutsch, Niederländisch und Schwedisch (in Blau) sind unterschiedliche Geschichten, sie erstrecken sich in einen anderen Quadranten der Karte und bilden ihre eigenen, unterschiedlichen Strukturregeln aus. Sie setzen auf schärfere, konsonantenlastigere Cluster. Für den gleichen Freiheitsbegriff gibt uns das Deutsche "Freiheit"Niederländische Verwendungen "Freiheit"und Schwedisch sagt "Freiheit." Wir sehen diese ähnlichen strukturellen Klänge zusammen. (3) Und natürlich mein Favorit, der Ausreißer: Ungarisch (lila). Da Ungarisch eine uralische Sprache ist und nicht wie die anderen 11 indoeuropäisch, ist sein Fußabdruck völlig verschwunden. Es bildet weit links eine dichte, isolierte Ansammlung, die seine einzigartige Herkunft visuell beweist. Während die romanischen und germanischen Sprachen Variationen davon widerspiegeln "Freiheit" oder "Freiheit"das ungarische Wort ist "Freiheit" eine völlig andere phonetische Realität, und die Geometrie zeigt es perfekt.

    Der graue Hintergrund stellt den universellen Korpus aller Klänge zusammen dar. Keine einzige Sprache deckt das gesamte Gebiet ab, da jede Sprache spezifische Regeln dafür hat, welche Laute zusammenpassen können, wodurch sie auf ihre eigenen spezifischen Inseln beschränkt werden.

    Wie wurde das abgebildet? Ich habe ein event2vector-Paket verwendet, das es ermöglicht, die Sequenzen zu verarbeiten und ihre kontextuellen Einbettungen ohne vorheriges Sprachtraining zu zeichnen.

    Von sulcantonin

    Share.

    13 Kommentare

    1. FiglarAndNoot on

      This sounds so tantalisingly cool, but it’s hard to get anything from a graph with no axis labels, and thus no clarity on what the subtle differences in shapes (to a lay person) might mean. Would love to share in the coolness, but right now I’ve mostly got cloudy blobs.

    2. To the untrained eye these all look incredibly similar with the exception of the arbitrary colors assigned. I honestly don’t see crescents for the Romance languages. All the axes are the same…but no real differences apparent. Somehow you need to highlight some other dimension(s) to give this more meaning.

    3. Elziad_Ikkerat on

      Its interesting, but if they weren’t colour coded I don’t think I could have grouped them… I’m not sure I’m seeing the differences.

    4. Needs axis labels/explanations. Also, given that most of us on this site speak English, English would be nice to have as a comparison.

    5. poison_camellia on

      Interesting concept! It would be even cooler to have more linguistic diversity. How about including some Asian and African languages?

    6. Interesting!! I’d love to see a similar charts for Danish, Norwegian, and English.

    7. forgetwhattheysay on

      This data makes more sense as a PCA of all the data combined. It doesn’t really give intel on much with two dimensions and with each language separated out. Plot it all on a UMAP or something.

    8. pheromone_fandango on

      I cant understand why you wouldn’t understand English since its a reference point to everyone here on reddit

    9. As a linguist, I was momentarily excited. But I don’t see much use to this. The axes are unlabeled, though if I understand correctly, they don’t make much intuitive sense because they are 2D compressions of a PCA? So how is it even meant to be interpreted?

    Leave A Reply