|
|||||||
HINWEIS: Wenn Sie per Weiterleitung auf diese Seite gelangt sind, aktualisieren Sie bitte jetzt von dieser Seite aus Ihre Daten (Favorit bzw. Lesezeichen / Notiz der Seiten-Adresse (URL) etc.). Diese Seite wird demnächst nicht mehr unter der alten Adresse (URL) erreichbar sein. |
|||||||
Darstellung - Hintergründe zum Begriff der Frequenz und mehr
Heinz Stolze, Institut für Stimme und Kommunikation, Bremen in www.forum-stimme.de Neufassung einer älteren Webseite aus forum-stimme.de überarbeitet am 30.3.2005, letzte Änderung am 15.10.2012 Ganz unabhängig von der Stimme und vom Hören, ist die Beschäftigung mit Darstellungen von allgemeinem Interesse. Das grundlegende Konzept ist nicht schwer zu verstehen, besondere mathematische Fähigkeiten sind nicht erforderlich. Wer sich darauf einlässt, wird auf jeden Fall seine Vorstellungen über die Welt und ihre Wahrnehmung vertiefen, vielleicht auch ändern. Zudem wird er eine wesentliche Grundlage moderner Wissenschaft und Technik näher kennenlernen. Auch einige eher philosophische Fragestellungen werden unter dem Aspekt der Darstellung neu beleuchtet. Der Text und die Abbildungen erhalten einige Hinweise zur Mathematik. Diese sind für mathematisch Interessierte gedacht. Zum Verständnis des Prinzips sind sie nicht erforderlich. Die Erfassung der Realität in Darstellungen Die Darstellungen in Auge und Ohr In der Abbildung 1 sind die Vorgänge im Auge skizziert > Abbildung 1 zeigen . Die Netzhaut ist das Sensororgan, in ihm erfolgt die Umsetzung des optischen Bildes in eine neuronale Darstellung. Das Lichtmuster auf der Netzhaut ist uns vertraut, wir können uns ohne weiteres vorstellen, wie die optische Realität aussieht, die es erzeugt hat. Bei den vergleichbaren Prozessen im Ohr ist dies jedoch nicht so. Der Schall gelangt durch den Gehörgang auf das Trommelfell, das er in Schwingungen versetzt (Abb.1, rechte Seite). Diese werden durch die Gehörknöchelchen in die Schnecke übertragen. In ihr sitzt das Sensororgan des Hörens, das Cortiorgan. Anatomie und Physiologie sind in medizinischen Fachbüchern näher beschriebenen. Hier geht es uns nur um die Art der Darstellung des Schalles auf diesem Sensororgan. In der Abbildung ist die typische Verteilung der Schwingungsamplituden für den Vokal "A" schematisch dargestellt. Diese Verteilung sagt allenfalls den Experten etwas, mit den normalen menschlichen Erfahrungen läßt sich nicht direkt einsehen, welcher Laut dargestellt ist. Im Anregungsmuster auf dem Sensororgan des Sehens kann man leicht die Elemente (Striche) erkennen, die die Wahrnehmung eines "A" auslösen. Das Anregungsmuster auf dem Sensorelement des Hörens können wir aber kaum einem "A" zuordnen. Das Bild auf der Netzhaut können wir verstehen, weil wir gut in räumlichen Dimensionen, hier in zweidimensionalen, denken können. Aber das Muster auf dem Cortiorgan ist unserer natürlicherweise erworbenen Denkkategorie für variierende Größen, nämlich dem Denken im Zeitlichen, fremd. Hier wird statt der Darstellung in der Zeit eine Alternative benutzt: eine Darstellung in Frequenzen. Bevor wir dies näher ausführen, wollen wir den Begriff der Darstellungen noch grundsätzlich erläutern. Wir beginnen dazu mit einem einfachen Beispiel aus der Geometrie, weil es direkt "einsichtig" ist und übertragen das Konzept dann auf die Darstellung von Schall.
Wir wollen noch eine Betrachtung anstellen, die wohl etwas elementar wirken mag, für das Verständnis des Frequenzbegriffes aber wichtig ist. Das zuvor beschriebene, in Schulbüchern übliche, Darstellungssystem besteht im Grunde genommen aus zwei Basiseinheiten: zwei Pfeilen von der Länge einer Einheit (z.B. 1 cm), die senkrecht aufeinander stehen. Wir nennen sie x1 und x2 , siehe Abb. 2 >Abbildung 2 zeigen. Solche Basiselemente sind die Grundlage einer Darstellung. Der dargestellte Punkt läßt sich aus diesen Basiselementen wie folgt finden: Man multipliziert das erste Element mit dem Zahlenwert der ersten Koordinate und legt daran das zweite Basiselement, multipliziert mit dem Wert der zweiten Koordinate an. Mathematisch gesehen ist das eine Addition -hier Vektoraddition- der mit dem zugehörigen Koordinatenwert multiplizierten Basiselemente. So kommt man genau zu dem Punkt, der in diesem System dargestellt wurde. Schall läßt sich an einer festen Stelle im Raum als ein zeitlicher Verlauf des Luftdruckes registrieren. Um einen solchen Verlauf über eine bestimmte Zeit hinweg in einer endlichen Menge an Information darzustellen, bedient man sich im allgemeinen eines Zeitrasters, wie es in Abb.3 gezeigt ist (Zeitdarstellung) >Abbildung 3 zeigen. Auch dieses ist im wesentlichen eine Darstellung, wie sie oben beschrieben wurde. Die Basiselemente sind hier Zeitverläufe oder Funktionen, die zu einem bestimmten Zeitmoment den Wert 1 haben, ansonsten sind sie Null. Die Darstellung besteht in einer Reihe von Zahlen, entsprechend den Koordinaten im vorherigen Beispiel, je eine für jedes Basiselement. Der Wert der Zahl ist der Schalldruck zum Zeitpunkt der "Spitze". Am Rande sei bemerkt, daß auch diese Ermittlung des "Koordinatenwertes" im Sinne der mathematischen Funktionentheorie als Projektion der vorgegebenen Funktion auf die Basisfunktion beschrieben werden kann. Die Rekonstruktion des Schallverlaufes aus der Darstellung geschieht hier nach dem gleichen Prinzip wie im geometrischen Beispiel: die Basiselemente mit den Koordinatenwerten multiplizieren und die Ergebnisse aufaddieren. Der rekonstruierte Verlauf entspricht insofern nicht der Realität, als die Werte zwischen den Rasterpunkten fehlen, die Darstellung ist nicht vollständig. Mathematisch gesehen ist eine vollständige Darstellung in der Zeit möglich, man müsste eine Kontinuum von Zeitpunkten benutzen, und würde dazu "unendlich viele" Punkte benötigen. Die Darstellung wäre im Gegensatz zu unserem zweidimensionalen Beispiel aus der Geometrie unendlich-dimensional. In einer real ausführbaren Darstellung muß man das Raster so eng machen, daß die unvollkommene zeitliche Auflösung nicht stört, andererseits aber so weit, daß die anfallende Datenmenge auch verarbeitet werden kann. Für die elektronische Speicherung und Rekonstruktion von Audiodaten hat sich ein Raster von 44100 Punkten pro Sekunde als Standard, etwa für CD´s etabliert. Bei der Wiedergabe werden die Lücken zwischen den Punkten glatt aufgefüllt. Vor allem für mehr oder weniger periodische Signalverläufe, wie sie bei stimmhaften Lauten vorliegen, hat eine andere Darstellung viele Vorteile, nämlich die Frequenzdarstellung. Sie ist auch als Fourierdarstellung bekannt, so benannt nach dem französischen Mathematiker, der ihre theoretischen Grundlagen erforscht hat. Auf den vorangehenden Beispielen aufbauend ist es leicht zu verstehen, wie sie funktioniert. Die Basis ist folgendes: ein vorgegebener Abschnitt eines zeitlichen Verlaufes, etwa des Schalldruckes, läßt sich als eine Summe von sinusförmigen Verläufen verstehen. Das heißt konkret: indem man mehrere sinusförmige Funktionen mit verschiedener Frequenz jeweils mit der richtigen Amplitude (siehe Abb. 4 und die dort gegebenen Erklärungen) zusammenaddiert, läßt sich der Verlauf der Kurve darstellen. > Abbildung 4 zeigen Anmerkung zum Text unten in der Abbildung "die ausfallenden Frequenzen kommen eh nicht vor": siehe dazu unter Frequenzreihe. Bezugnehmend auf die oben beschriebenen Darstellungen sind die benutzten sinusförmigen Funktionen die Basiselemente, die zu ihnen gehörigen Amplituden die Koordinaten. Eine "Koordinate" ist also hier eine Amplitude. Der Einfachheit halber haben wir für unser Beispiel eine Kurve gewählt, die sich nur durch sinusförmige Anteile darstellen läßt, die zum Zeitpunkt Null den Wert Null haben. Wie in der Abbildung angemerkt, ist im allgemeinen für jede Frequenz eine Projektion auf Sinus- und Cosinusverlauf nötig. Es gibt also zwei "Koordinaten" für jede Frequenz. Statt der Prokjetionen auf Sinus und Cosinus werden oft auch die Werte Betrag und Phasenlage benutzt. Die Frequenzdarstellung eines Signalabschnittes wird oft als Spektrum oder spektrale Darstellung bezeichnet. Dies bezieht sich auf eine Analogie zum Licht. Weißes Licht enthält viele Frequenzen. Wird die Lichtstrahlung in einzelne Frequenzen zerlegt, sieht man die Spektralfarben, die vom Regenbogen her bekannt sind. Von Rot über Orange, Gelb, Grün, Blau zu Violett hin ist die Frequenz ansteigend.
Die Frequenzdarstellung ermöglicht zusammen mit der modernen Informationstechnologie Anwendungen, deren Realisierbarkeit vor wenigen Jahrzehnten nicht vorstellbar war. Im technischen Bereich etwa: Text in Sprache verwandeln und umgekehrt Gesprochenes in Text, oder Sprecher zu identifizieren. Die Auswirkung auf die Stimmkunst und die Musik sind derzeit gar nicht absehbar. Man könnte sie mit denen vergleichen, die aus der Erfindung der Notation von Melodien folgten: komplexeres Komponieren und mehrstimmiges Musizieren wurden ermöglicht und eine zuvor undenkbare Verbreitung von Musik konnte sich über die Noten entwickeln. Allerdings sind auch die Gefahren einer "synthetischen Armut" , der Aufhebung der Authetizität von Schallaufzeichnungen und die vielen unleidlichen Facetten hemmungsloser Kommerzialisierung zu sehen. Gerade im Hinblick auf die mögliche künstlerische Bedeutung ist eine kurze Betrachtung der Hintergründe von Darstellungen angemessen. Wenn eine sich ändernde Größe wie der Schalldruck in Frequenzen dargestellt wird, so ist dies im Prinzip einer Zeitdarstellung, wie wir sie gewöhnt sind, gleichberechtigt. Beide können zumindest theoretisch vollständige Darstellungen der Realität sein. Dazu müsste das Darstellungsraster, also die Zeitpunkte oder die Frequenzen kontinuierlich gedacht werden - kein Problem für den Mathematiker. Mit folgendem Aspekt muß man sich erst vertraut machen: wird die Frequenzdarstellung gewählt, so gibt es im Bereich dieser Darstellung keine Zeit mehr. Die Vorstellungen von vorher und nachher sind nicht anwendbar. Somit wird auch die gewohnte kausale Interpretation der Realität in Form von Ereignisketten hinfällig. Die Zeit ist also zur Darstellung eines vorgegebenen Ausschnittes der Realität nicht unbedingt nötig. Sie ist so gesehen also keine Eigenschaft einer abgeschlossen vorliegenden Realität selbst sondern eine Art ihrer Beschreibung. Letztendlich ist auch der Klang, den wir hören keine physikalische Realität. Die Klangstrukturen hängen von der Art und Weise der Darstellung des Schalles im Ohr ab. Trotz der Verschiedenheit des Wesens von gehörtem Klang und physikalisch vorliegendem Schall oder auch gerade deswegen ist die Beschäftigung mit den physikalischen Strukturen, die den Klang hervorrufen, und mit ihrer Beziehung zu Kommunikation und Ästhetik eines der interessantesten Themen des beginnenden 21. Jahrhunderts. Die obige Aussage, daß bei der Frequenzdarstellung die Zeit bedeutungslos wird, muß für das Hören genauer hinterfragt werden, da wir ja zeitlich hören können. Die Erklärung ist: es liegt eine gemischte Art der Darstellung vor. Sozusagen im Feinen, bei Ereignissen, die sich ganz schnell abspielen, wird die Frequenzdarstellung benutzt. Solche schnellen Abläufe sind klangbildend. Im "Gröberen" wird die Zeitdarstellung benutzt. Wie das genauer zu verstehen ist, und welche Vorteile das hat, ist ein Thema für sich, das hier nicht weiter behandelt wird. Zu den Betrachtungen über Darstellungen gehört auf jeden Fall die Frage: wie sieht es denn nun aus, wenn die Darstellungen nicht vollständig sind. Auch hier ist zwecks leichter Einsicht ein Blick in die bildliche Darstellung ganz hilfreich. Auch zur Darstellung von Bildern kann man die Frequenzdarstellung -nun in sinusförmigen räumlichen Schwärzungs- oder Farbverläufen- wählen. Das so entstehende "Dia" nennt man Hologramm. Wenn man ein Hologramm zerbricht und mit einer Hälfte das Bild reproduziert, erscheint wieder das gesamte Bild. Allerdings hat es sich verändert. Wenn die abgebrochene Seite beispielsweise vor allem hohe Frequenzen enthalten hat, wird die Auflösung schlechter. Allgemein gesagt: in der Frequenzdarstellung erhält man auch mit nur einer oder wenigen Frequenzen das gesamte Bild, aber die Zeichnungsqualität leidet. Beim konventionellen Dia mit der üblichen Darstellung im Raum, kann mit einem abgebrochenen Teil eben nur ein Teil des Bildes rekonstruiert werden, aber die Zeichnungsqualität bleibt im wesentlichen bestehen. Im Bereich des Schalles: eine Frequenzdarstellung, die nur einen Ausschnitt von Frequenzen enthält, liefert eine Reproduktion über die gesamte Dauer, aber mit mehr oder weniger "verfärbtem Klang", eine Zeitdarstellung, die auf einen Ausschnitt beschränkt ist, nur diesen, aber im wesentlichen mit voller Abbildungsqualität. Wird im Frequenzbereich ein Raster mit gleichgroßen Abständen von Frequenz zu Frequenz benutzt, so können damit alle periodischen Signale mit der Grundfrequenz der tiefsten Frequenz des Rasters vollständig dargestellt werden. Berücksichtigt man noch, daß für das Hören nur Frequenzen eine Rolle spielen, die im hörbaren Bereich von ca 20 Hz bis ca 16000 Hz liegen, so ist nur eine bestimmte Anzahl von Frequenzen nötig, um das Signal komplett darzustellen. Beispiel: ein periodischer Ton hat die Grundfrequenz 400 Hz. Der hörbare Anteil liegt auf den Frequenzen 400/800/1200/1600/2000 etc bis 20000 Hz. Das sind 50 Frequenzen. Indem man für jede Frequenz Amplitude und Phasenlage ermittelt -insgesamt 100 Zahlenwerte- kann man den hörbaren Anteil exakt darstellen. In der Zeitdarstellung ist es unmöglich, einen periodischen Druckverlauf (Ton) mit einer endlichen Zahl von Stürtzpunkten exakt darzustellen. Dies zeigt, daß die Frequenzdarstellung für periodische Signale -entsprechend den stimmhaften Lauten- sehr vorteilhaft ist. Ein Aspekt sei noch erwähnt, der zum Nachdenken anregt: Wie sieht es aus, wenn man sich zu sehr konzentriert, eben auf nur ein Element, statt auf das Ganze, wenn man sozusagen Spezialist und nicht Generalist ist. Wenn man nur einen Zeitpunkt herausgreift (ein Signal erzeugt, daß nur in einem Moment an, sonst immer aus ist), so stellt sich diese "Konzentration im Zeitlichen" im Frequenzlichen so dar, daß alle Frequenzen -ein Kontinuum von Frequenzen- zu diesem einen Zeitpunkt gehören (das Spektrum des Signales ist für alle Frequenzen ungleich Null). Greift man sich umgekehrt nur eine Frequenz heraus, so entspricht dies im Zeitlichen einer Sinusfunktion, die geht per Definitionen von minus Unendlich bis plus Unendlich, die gesamte "zeitliche Unendlichkeit" ist beteiligt. Statt spezialisiert zu denken, soll man ganzheitlich denken - wird oft gesagt. Aber wenn die Spezialisierung unter einem andereren Blickwinkel -sprich in anderer Darstellung- ein Allgemeinbezug ist, und ein Allgemeinbezug wiederum in einer anderen Darstellung als Spezialisierung erscheint, dann ist eine solche Aussage als allgemeinverbindliche Forderung wertlos! Was wirklich hilft, ist die Fähigkeit, die Darstellung wechseln zu können und die Ergebnisse aufeinander beziehen zu können. Diese Fähigkeit, Erscheinungen und Prozesse in verschiedenen Darstellungen zu verstehen, ist erforderlich, um eine klare Vorstellung von der Stimmproduktion zu erreichen. Auch wenn man sich ernsthaft mit der Frage beschäftigen möchte, was den Stimmklang ausmacht, den wir hören, ist diese Fähigkeit unumgänglich. |
|||||||