Terra Prosodia. In: KUNSTMUSIK#16, 2014, ed. by Marc Sabat. Köln, world-edition, 2014

Antje Vowinckel

TERRA PROSODIA – Klangkompositionen mit Dialektmelodien

Sprechmelodien: Zuhause sind sie unsichtbar oder grau, in fremden Ländern aber flirren sie auf den Wegen herum wie bunte Schmetterlinge. Und sind genauso schwierig einzufangen. Nähert man sich ihnen mit dem Mikrofon wie mit einem Kescher, dann verflüchtigen sie sich schnell. Nicht die Menschen, aber die Melodien. Wenn man eine erwischt, scheint sich der Kescher sogar in eine Walze zu verwandeln, mit der man die Melodien platt macht. – Der Anblick eines Mikrofons lässt die Menschen meistens sofort flacher sprechen.

 

Mein Interesse an Dialektmelodien[1] bezieht sich nicht so sehr auf Regionen und Traditionen sondern auf die unbeabsichtigte, flüchtige Musik darin. Solche unbeabsichtigten Melodien fand ich zuerst in internationalen Sprachkursen – also gerade da, wo es gilt, regionale Sprachunterschiede zu überwinden. Für mein Stück Call me yesterday hatte ich Audiosprachkurse gesammelt und bin dabei überall auf ausgeprägten Modulationen gestoßen, die wie artifizielle Melodien klingen, aber nie als Musik gedacht waren. Die Melodien waren allein durch den Willen zur perfekten Aussprache entstanden und ergaben sich nur als „Nebenwirkung“ der didaktischen Arbeit. Es sind sozusagen objéts trouvés, die erst in einem anderen Kontext musikalisch wirken können. Um sie zu finden, muß man allerdings um viel Bedeutung herum und durch viele Konsonanten hindurch hören. Damit bestätigt sich die These von Tom Johnson, „dass es oft viel länger dauert, ein gutes Stück zu finden, als eines zu komponieren.“

Erst diese Suche nach solchen unbeabsichtigten Melodien hat mich später zu den Dialekten gebracht. Für das Komponieren mit Sprachmelodien gibt es aber auch viele andere Vorläufer.

 

 

Vorläufer

 

Bereits in der Antike trennten sich die Wege von Melodie und Prosodie, wobei die Melodie der Harmonie, Metrik und Instrumentation zugerechnet wurde, die Prosodie dem Sprechen. Sie umfasste nicht nur Sprechmelodie sondern auch Tempo, Rhythmus, Lautstärke, Akzent und Pausen. Die Melodie wurde als etwas Figürliches klar Erkennbares gesehen, das zur Sprache hinzukommt. Die Sprachmelodie dagegen war seit dieser definitorischen Abgrenzung „versteckt“ in der Prosodie, einem Bündel von Parametern. Diese kontrollieren zu können, diente in erster Linie dem eindringlichen Verständlich-Machen des Wort-Inhalts. [2]

Als in der europäischen Tradition ca. 1600 im Rezitativ Sprechmelodien auftauchten, geschah dies folglich vor allem, um mehr Inhalt zu transportieren und die Handlung voranzutreiben. Es wurde auf ziemlich künstliche Weise „natürlich“ gesprochen; Melodien wurden erfunden, und die Musik eher im Rhythmus der Sprache angeglichen. Erst in Schönbergs Pierrot Lunaire (1912), worin der Komponist eine Melodie in Noten notiert, welche der Interpret weder singen noch sprechen soll, geht es deutlich mehr um den musikalischen Ausdruck des Sprechens als um den Inhalt. Dieser musikalische Ausdruck des Sprechens inspirierte auch Partch zu seinen Kompositionen mit Sprechgesang. In seinen Seventeen Lyrics for Li Po (1931-33) übertrug er die mikrotonale Modulation des Sprechens in die begleitenden Instrumentalstimmen. Während er einen enormen Aufwand unternahm und spezielle Instrumente entwickelte, um diese Intonation, – die er den Leuten auf der Strasse abgelauscht hatte-, in den Instrumentalstimmen abzubilden, veränderte er genau diese Intonation in der Sprechstimme und ließ sie – zwar rhythmisch frei und changierend zwischen Sprech- und Singstimme- die Texte künstlich deklamieren. Damit wir die impulsive Modulation (oder B-Prosodie nach Tillmann) wieder von einer kontrollierten Deklamation (oder A-Prosodie) überlagert. In manchen kurzen Passagen der Bitter music (1935) scheint die Instrumentalstimme ganz der zufälligen Sprechintonation zu folgen, was damit zu tun hat, dass der Sprecher lange Zeit unbegleitet spricht, allerdings ist auch hier die Sprechstimme ausnotiert, und der Sprecher liest den Text ab. Es bleibt,- wenn auch schon abgeschwächt- bei einer deklamatorischen Modulation. Sie wird vom Klavier aufgegriffen, welches sie dann häufig in Liedmelodien überführt.

 

Die Möglichkeit der Audioaufzeichnung einerseits und die Öffnung der Künste hin zum Vorgefundenen haben die Wahrnehmung von spontaner, natürlicher Sprache als Musik ab den dreißiger Jahren des letzten Jahrhunderts beschleunigt. Walter Ruttmann verwendet 1930 als erster aufgenommene Sprachfragmente in seiner auf Film produzierten Komposition Weekend. In den 50ern sind es John Cage (Williams mix) so wie Pierre Schaeffer und Pierre Henry (Symphonie pour un homme seul), die mit Tonbandaufnahmen komponieren. Sie zerschneiden, montieren und repetieren Sprachfragmente, die sie in verschiedene musikalische Strukturen fügen. Diese Sprachaufnahmen haben fast durchgehend noch eine deklamatorische, artifizielle Modulation. (Wie auch die vielen Stücke mit komponierter Sprache z.B. von Raoul Hausmann, Kurt Schwitters oder Ernst Toch). Olivier Messiaens Kompositionen nach Vogelstimmen beziehen sich zwar nicht auf menschliches Sprechen, gehen aber von gefundenen Melodien aus. Versuche mit Original-Ton, also freiem, spontanem Sprechen gibt es dann im Neuen Hörspiel seit Ender der 60er Jahre in Deutschland, z.B. in Kagels Hörspiel – ein Aufnahmezustand. Hier spielen konkrete Sprechmelodien zwar weniger eine Rolle, allerdings kann man erkennen, dass die Sprachimprovisation schon viel weniger von fremden musikalischen Formen überlagert wird. Natürliches Sprechen wird zum künstlerischen Ausgangsmaterial. Das gilt auch für Robert Ashleys „Automatic writing“ (1979), der hierin spontane Sprachäußerungen verwendet, die er seinem eigenen Tourette-Syndrom verdankt (während er sonst eher versucht, natürliche Modulation in eine deklamatorische Sprache zu übertragen). Der Fokus liegt hier eher auf dem Klang der Stimme als auf der Melodie. Steve Reich verwendet dann in Different Trains (1988) kurze Fragmente aus Zugdurchsagen, die ebenfalls die Hinwendung zur ungeformten Alltagssprache erkennen lassen. Allerdings sind auch diese Ansagen nicht vollkommen spontane Äußerungen. Die in diesen kleinen Fragmenten enthaltenen Melodien lässt Reich von Instrumenten imitieren und in der darüber liegenden musikalischen Struktur aufgehen.

 

1989 schließlich verwendet der kanadische Komponist René Lussier längere Passsagen mit spontanen Sprechmelodien in seinem Werk Le Tresor de la Langue. Hier dominieren tatsächlich die natürlichen Sprechmelodien, die von Instrumenten imitiert werden. Sie kehren in dem vielteiligen Werk immer wieder und gehen nur bedingt in größeren musikalischen Formen auf. Oft beginnen die Instrumentalmelodien vorher und legen sich dann wie zufällig auf die Sprache. Allerdings vertraut auch Lussier kaum auf die Wahrnehmung der Melodie in der gesprochenen Sprache, ohne diese doppelnde Begleitung. Das Stück hat eine größere instrumentale Besetzung, es hat eine starke inhaltlichen Dimension (es geht um die Provinz Quebec), geht streckenweise auch ins Szenische, und sein (zumindest erstes) Publikum, kann die Sprache verstehen. Es liegt daher auf der Hand, dass das Sprechen ohne imitierende Melodie sofort wieder als Klang oder als Inhalt wahrgenommen würde, nicht als Melodie. Diese Wahrnehmung von Sprache ist für uns so normal, dass die Wahrnehmung jederzeit wieder umkippen kann. Umgekehrt ist es leicht möglich, solistische Instrumentalpassagen als „Gerede“ wahrzunehmen, wenn sie die Intervallfolgen des Sprechens imitieren. Weder Klang noch Inhalt können ablenken. Es ist alles eine Frage des Fokus.

Ausgehend von der griechischen Definition der Antike, könnte man sagen, dass die Sprechmelodie in der Musik – wie die Künste insgesamt – einen langsamen Paradigmenwechsel erfährt. Schritt für Schritt verändert sich ihr Sagen (Diegesis) zum Zeigen (Mimesis).

 

Terra Prosodia

 

In meinem Stück Terra Prosodia (2011) wollte ich eine Wahrnehmungsweise etablieren, die es nach und nach erlaubt, die gesprochene Stimme als eigenständige Melodiestimme zu hören, ohne dass ein Instrument permanent die Melodie unterstreicht. Das erfordert eine starke Fokussierung auf die innere lineare Bewegung. Denn sobald viele verschiedene Instrumente, Klänge, räumliche Tiefe hinzukommen, hört man die Sprache wieder von außen. Man nimmt den gesamten Klang mit Rhythmus und Konsonanten wahr; man visualisiert die Person, die spricht, mit ihrem Alter, ihrem Geschlecht, ihrem Milieu und ihrer Region.

In Dialekten gibt es ausgeprägte Sprechmelodien, die niemand als Musik entworfen hat. Sie entstehen in einer einzigartigen Verbindung aus spontanem Impuls und jahrtausendealter Tradition. Die Melodien sind eng mit der geografischen Region, mit der Landschaft verknüpft, so dass man den Eindruck bekommen kann, Täler und Berge setzten sich im Sprechen fort. Diese Melodien scheinen ihren Sprechern unauffällig, für den Besucher aus anderen Regionen aber entfalten sie einen charakteristischen musikalischen Reiz. Die Tatsache, dass nur eine kleine Gemeinde von Menschen den Dialekt spricht, hat in meiner Arbeit den Vorteil, dass die große Mehrheit ihn nicht versteht.

 

Vorhandene Aufnahmen

 

Die unbeabsichtigte, als Nebenprodukt entstandene Musik der Sprachen und Dialekte ist ein immenser weltweiter Reichtum. Sprachwissenschaftler allerdings interessieren sich kaum dafür. Nur wenn Modulation bedeutungstragend ist, wie vor allem in den vielen tonierenden Sprachen Asiens oder zuweilen in der Unterscheidung von Aussage und Frage, spielen sie in der Linguistik eine Rolle. Das zeigt sich auch in den meisten historischen Aufnahmen, die von Sprachwissenschaftlern gemacht wurden, seit es Aufnahmegeräte gibt. In diesen Aufnahmen ist die Sprache fast immer schon seziert, bevor sie zum Klingen kommt. Da werden Texte abgelesen, Vokabellisten gesprochen oder einzelne Wörter abgefragt. Es hat mich immer wieder aufs Neue erstaunt, dass es praktisch keine Aufnahmen gibt, die den natürlichen Sprechfluss abbilden. Und wenn es doch mal vorkam, hat der Wissenschaftler das Mikrofon weit weg gehalten, oder im Hintergrund läuft Musik, oder die Klimaanlage rauscht, Kinder spielen, Telefone klingeln, Uhren ticken, Kühlschränke seufzen.

Immer wieder habe ich mich kurz vor dem Ziel gesehen, weil die Beschreibung so vielversprechend klang. Auch auf Youtube gibt es neuerdings viele Dialektaufnahmen. Es handelt sich aber immer um Lernende, nicht um Native Speaker. Die echten Dialektsprecher haben kaum Interesse ihre Sprechweise auf Youtube zu präsentieren. Nach einer Weile hat sich dann der Eindruck eingestellt, dass es sich mit Dialektaufnahmen so verhält wie mit Müsli-Riegeln. Es ist selten das drin, was drauf steht.

Auch den Versuch, Dialektsprecher in Berlin aufzunehmen habe ich bald aufgegeben. Wer erst mal für eine Weile in einer Metropole gelebt hat, dessen Modulation verflacht. Das impulsive, spontane Sprechen verflüchtigt sich. Man fängt an, sich zu kontrollieren, zu reflektieren und spricht gemäßigter. Natürlich kann man eine ausgeprägte Modulation auch üben. Schauspieler lernen dies in der Ausbildung. Aber es gibt einen großen Unterschied zwischen artifizieller Modulation, die darauf ausgelegt ist, denn Sinn und/oder die Emotion des Satzes zu unterstützen, und einer impulsiven Modulation, die in der Region verwurzelt ist. (siehe Tillmann). Letztlich sind diese Unterscheidungen natürlich theoretisch. Jeder Mensch ist auch Schauspieler, und man kann die persönliche, möglicherweise gespielte Modulation von der regionalen Färbung am Ende nicht sauber trennen. Man kann aber zumindest einiges dafür tun, um eine möglichst natürliche Sprechhaltung zu bekommen.

 

Die eigene Aufnahme

 

Da weder die vorhandenen Aufnahmen noch in Berlin lebende Dialektsprecher mich überzeugen konnten, habe ich mich entschlossen, die Menschen dort aufzunehmen, wo sie leben. Das scheinbar einfache Anliegen, „Erzählen Sie eine Geschichte aus ihrem Leben“ stellt sich dabei schnell als ziemlich schwierig heraus. Es ist den meisten Sprechern, die in abgelegenen Gegenden wohnen, vollkommen unverständlich, dass ich so weit reise, nur um „irgendeine“ Geschichte zu hören. Dass der Klang ihrer Sprache der Grund sein soll, bezweifeln sie und suchen daher den Grund woanders, nämlich in ihrer Region und Geschichte. Statt „irgendwas“ persönliches zu erzählen, kommen viele Menschen mit Büchern, Liedern, Gedichten. Dann möchten sie die Geschichte des Dorfes deklamieren. Im nächsten Anlauf erzählen sie ihre eigene Lebensgeschichte mit Jahreszahlen. In allen solchen Berichten ist die Stimme flacher, weil die Personen nicht emotional involviert sind. Ich muss lange darauf insistieren, dass ich nur die Geschichte eines einzelnen Ereignisses hören will, etwas, das mit „Eines Tages….“ anfangen könnten, eine Geschichte mit allen Details und nur etwas, das sie selbst erlebt haben. Man braucht viel Geduld und eine möglichst gute Vermittlerperson, um an diesen Punkt zu kommen.

Manchmal gerät man an Personen, die eine gewisse Routine im Erzählen entwickelt haben und im Dorf als gute Erzähler bekannt sind. Das kann positiv sein, kann aber auch dazu führen, dass die ganz natürliche Modulation durch einen Erzählergestus überdeckt wird, wie man ihn manchmal für Kinder einsetzt, die man mit einem Märchenton einlullen will. Statt der regionalen Färbung hört man dann einen Rollensingsang. Solche zu routinierten oder auswendig gelernten Geschichten verwende ich daher nicht. – Von der Zwischenperson lasse ich mir später nur den groben Inhalt der Geschichte erklären und frage nach der Bedeutung der häufigsten narrativen Floskeln wie „und dann“, „später“, „weißt Du“, „so war das“ usw., die immer ein bisschen variieren, aber in jeder Erzählung vorkommen. Diese kann ich dann als Bausteine verwenden und auch wiederholen oder verschieben. Ansonsten bleibt die Reihenfolge der Geschichte unangetastet.

 

 

Kompositionsverfahren

 

Für den Kompositionsprozess extrahiere ich aus den Audiodateien eine Midi-Datei, die den Klang auf die reine Melodie reduziert. Dabei bleibe ich bewusst bei einer temperierten chromatischen Skala, was regelmäßig auf Protest stößt, denn das Sprechen folgt ja nicht den chromatischen Stufen, wie schon Partch wußte. Und es wäre doch heute so viel mehr möglich. Doch bereits dieses chromatische Ergebnis hört sich so überkomplex an, das man darin verloren ist, wie das Auge in der Tropfsteinhöhle. Diese Abbildung hat nichts mit den kleinen Ohrwurmsätzen zu tun, die man im Kopf behält, wenn man die Dialekte hört.

Meine Schlussfolgerung war daher, dass es müßig ist, die Natur der Melodien so realistisch wie möglich abzubilden. Vielmehr kann es nur darum gehen, statt der Natur unsere Wahrnehmung abzubilden, und die ist von Schablonen beeinflusst, und seien es nur die Schablonen der temperierten Stimmung und der chromatischen Tonleiter. Wir hören in der Erinnerung bei weitem nicht die Nuancen, welche die Midi-Datei oder eine mikrotonale Skala abbilden, im Gegenteil, wir vereinfachen noch weiter. Und nur in diesem vereinfachten Erinnerungsmodus drückt sich auch das Typische der Dialekte aus. In eine Midi-Datei akkurat übertragen (auch bei noch so differenzierter Skala), kann man die unterschiedlichen Charakteristiken nicht mehr erkennen. Es piepst – platt gesagt –wie auf einer Morsestation.

Ich habe mich daher entschlossen, genau den entgegengesetzten Weg zu gehen und die Midi-Dateien weiter zu vereinfachen. Dabei folge ich meiner eigenen Erinnerung und Wahrnehmung. Welches ist die Hauptlinie, was bleibt hängen? Verschleifungen der Sprache habe ich mittels Pitch-Bending in der Midi-Skala mit hineingenommen, aber auch hier zeigt sich, dass zu viel Genauigkeit kontraproduktiv ist. Die Glissandi können dadurch so stark in den Vordergrund rücken, dass das wiederum nicht unserem Eindruck von Sprache entspricht. Wir überhören das in Wirklichkeit. (Sicher gibt es Experten, die mikrotonale Intervalle auch in der Erinnerung abspeichern können, und natürlich ist diese Wahrnehmung auch von dem tonalen System abhängig mit dem man aufwächst; andere Kulturen haben andere Schablonen, aber das ließe sich dann auch nur in der jeweiligen Kultur abbilden). Ich habe das Bending also flexibel, mal mehr, mal weniger, ebenfalls meiner Wahrnehmung folgend, eingesetzt. Die so entstandenen Melodien habe ich dann entweder mit Stimme, mit akustischen oder mit virtuellen Instrumenten eingespielt.

Zu Beginn eines Stückes imitiert die Instrumental- oder Gesangstimme die Sprechstimme. Auf diese Weise wird der Fokus der Wahrnehmung auf die Melodie gelegt, und die Tatsache, dass es sich um fremde Sprache handelt, hilft dabei. Ab diesem Punkt vertraue ich auf die Wahrnehmung des Hörers, dem es nun überantwortet ist, seine Wahrnehmung von der Diegesis auf die Mimesis umzustellen. Nach einer Weile – wenn man auch die Sprechstimme als Melodiestimme hört- weicht die Instrumentalstimme ab und geht eigene Wege, wobei sie die charakteristischen Intervalle des jeweiligen Dialekts beibehält. Auf diese Weise wird der lineare Charakter der Komposition etwas gelockert, man folgt weniger der Erzählung als vielmehr einer allgemeinen Intervallcharakteristik.

Noch weiter entfernen konnte ich mich von dieser Linearität allerdings nicht. Jede Erweiterung in eine größere räumliche Tiefe, das Hinzunehmen von weiteren Klangfarben oder das Fokussieren auf die klangliche Färbung der Sprechstimme mit ihren Konsonanten – all das lenkt schnell von der linearen Sprechmelodie ab. Man hört dann die Sprache gleich wieder von außen, die anderen prosodischen Parameter drängen sich auf, man nimmt die Stimme als Klangfarbe oder sogar als Person war; die Instrumentalstimme erscheint wiederum als Fremdkörper nicht als zweite Stimme.

 

Ausblick

Im Moment existieren noch ca. 6000 Sprachen auf der Welt, es gibt also noch viel zu tun, und ich möchte noch weitere Sprach- und Dialektmelodien zu Gehör bringen.

Mein Ziel ist es jedoch nicht, diese Sprachen und Dialekte zu retten. Das können ohnehin nur ihre Sprecher- wenn sie mögen, und ihre Staaten es erlauben. Was ich zeigen möchte, ist ein Eindruck von der engen Verquickung von Landschaft und Sprechen und dem starken melodischen Potential, das darin zu hören ist. Es ist eine menschliche Ausdruckskraft, die im traditionellen und gleichzeitig spontanen impulsiven Sprechen liegt. Daran, dass wir diese Melodien irgendwann nirgends mehr hören, können wir auch spüren, dass uns diese Fähigkeit abhanden kommt (weil wir zunehmend in Metropolen und im Internet wohnen und vieles bedenken, bevor wir es sagen). Dieser unmittelbare Ausdruck ist – neben dem Wunsch nach Identität- ein wichtiger Grund dafür, dass Dialekte wieder beliebt werden. Und es ist kein Wunder, dass dies ausgerechnet im Flugzeug, dem Nicht-Ort der Globalisierung par excellence, passiert, z.B. wenn Air Berlin sein Flugpersonal ermuntert, Durchsagen auch in Dialekten zu sprechen. So z.B. eine schwäbische Stewardess, die auf YouTube bekannt wurde, weil sie in ihrer Durchsage einfach mal drauf los gebabbelt hat. Ohne die Stimmbänder anzuschnallen…

[1] Ich unterscheide nicht wissenschaftlich zwischen Dialekt und Minderheitensprache. Für meine Aufnahmen suche ich nach möglichst ausgeprägten Sprechmelodien. Meistens findet man sie in Dialekten abgelegener Gegenden, aber auch das Englisch in Glasgow hat charakteristische Melodien.

[2] Hans Günther Tillmann unterscheidet hilfreich zwischen A- B- und C- Prosodie, wobei die A-Prosodie kontrolliert werden kann, die B-Prosodie impulsiv erfolgt. Hans Günther Tillmann, Phil Mansell: Phonetik. Lautsprachliche Zeichen, Sprachsignale und lautsprachlicher Kommunikationsprozess. Klett-Cotta, Stuttgart 1980