forum-stimme, animiert Zur Startseite von forum-stimme.de
Übersicht über eine Vielfalt von
Themen im Bereich der menschlichen Stimme

Zu den Themenlisten
Wissen / Journal / Praxis

Liste von Stimm- und Sprechtrainern sowie Gesangslehrern
in Deutschland
mit Kurzportraits

HINWEIS: Wenn Sie per Weiterleitung auf diese Seite gelangt sind, aktualisieren Sie bitte jetzt von dieser Seite aus Ihre Daten (Favorit bzw. Lesezeichen / Notiz der Seiten-Adresse (URL) etc.).
Diese Seite wird demnächst nicht mehr unter der alten Adresse (URL) erreichbar sein.

ERRATA VOCOLOGICA

10 Fehler und 7 Fazits

Heinz Stolze, Juni 2005, letzte Ändeung am 25.10.2012

in www.forum-stimme.de


ERRATUM 9: FORMANTEN


Dieses Konzept wurde wesentlich durch H. v. Helmholtz ausgearbeitet. Er hat es 1896 in seinem grundlegenden Werk "Die Lehre von den Tonempfindungen als physiologische Grundlage für die Theorie der Musik" publiziert. Nach L. Hermann wird die Charakterisierung der Vokale durch bestimmte im Tonsystem feststehende Töne hergestellt, denen er den Namen "Formanten" gegeben hat ( in Pflügers Arch. f. d. ges. Physiol. 36, 1894). Man darf wohl davon ausgehen, daß dies so zu verstehen sei, daß diese "Töne" zur Formung -daher Formant- der Vokalwahrnehmung beitragen. Zudem darf man annehmen, daß Hermann natürlich nicht exakt festgelegte Einzeltöne (etwa c´´) sondern Tonregionen (etwa h´bis d´´) meint.


Anmerkung: Besonders bei Instrumentalklängen spielen auch der zeitliche Pegelverlauf (Ein-, Ausschwingen) und Begleitgeräusche eine Rolle bei der Klangprägung und der Erkennung von Instrumenten, wie C. Stumpf auch bereits zum Ende des 19. Jahrhunderts feststellte. Dies ändert jedoch nichts daran, daß die spektrale Zusammensetzung (Stärkeverteilung der Teiltöne) eine wesentliche Rolle bei der Klangwahrnehmung spielt. Oft wird in diesem Zusammenhang auch schlicht übersehen, dass ja gerade auch die Klangstruktur beim Toneinsatz eine wesentich andere ist als im eingeschwungenen Ton. Allein von daher ist es nicht erstaunlich, dass sich z.B. ein Klavierton rückwärts abgespielt ganz anders anhört als vorwärts.


Anmerkung: Heute sagt man, ein Ton bestehe aus Teiltönen. Zu H. v. Helmholz´ Zeiten nannte man die Teiltöne "(einfachen) Ton", den Gesamtton "Klang".

9.1 Die Aussage

Für manche ist ein Formant ein einzelner Teilton, mitunter wird die Grundfrequenz als Hauptformant (F0) bezeichnet (in phonetischen Publikationen). Experten aus der naturwissenschaftlich orientierten Stimmforschung wollen den Begriff endlich exakt und numerisch ausdrückbar festgelegt sehen. Ihre Definition ist allerdings grundlegend neu und differiert erheblich von der ursprünglichen Intention und Bedeutung. Haben auch Musikinstrumente Formanten oder nur die Stimme? Sind Formanten überhaupt als Eigenschaften eines einzelnen Tones zu verstehen, oder sind sie Eigenschaften einer Gruppe von Tönen? Etwa der Töne eines bestimmten Instrumentes oder der Realisierungen eines Sprachlautes durch verschiedene Sprecher. Oder sind sie primär Charakterisierungen der Hörwahrnehmung? Oder ist das im Grunde genommen alles dasselbe? Neben der Verbreitung eindeutig falscher Vorstellungen besteht auch unter Fachleuten verschiedener Disziplinen weitgehende Uneinigkeit, was ein "Formant" genau genommen ist.

Neben einigen schlichtweg falschen Vorstellungen geht es hier vor allem um Unklarheiten des Begriffes, die nicht kurz und schnell erklärbar sind.


9.2 Zum Sachverhalt

9.2.1 Grundkonzept und Historisches
Historisch gesehen baut das Formant-Konzept auf der Idee auf, daß die Stärkeverteilung der in einem Ton enthaltenen Teiltöne den gehörten Klang weitgehend prägt, und daß dabei vor allem die besonders starken Teiltöne die wesentliche Rolle spielen. Für die Stimme heißt das, daß solche starke Teiltöne die Wahrnehmung des gehörten Sprachlautes (U oder A etc.) auslösen. Bei Instrumenten prägen sie das typische Timbre.


9.2.2 Formant_Perzeption: Formanten als Konzept der Wahrnehmungsforschung
H. v. Helmholtz experimentierte mit Stimmgabeln und mit Resonatoren, die er in das Ohr steckte. Sie filterten Teiltöne aus einem angebotenen Ton heraus. Seine Arbeit und die anderer Forscher dieser Periode stand unter der Fragestellung, durch welche Bereiche auf der Tonskala bestimmte Klangeigenschaften hervorgerufen werden. Später wurde diese Fragestellung mit synthetischen Tönen untersucht, bei denen in einzelnen Regionen der Tonskala (Frequenzbereichen) Teiltöne mit besonders hohem Schallpegel eingebaut wurden.

Das Ergebnis sind bestimmte Tonhöhen- oder Frequenzbereiche, die zu bestimmten Klangeigenschaften führen. Diese Bereiche nennt man Formanten. Damit wären Formanten ein Konzept der Wahrnehmungsforschung. Im Verfahren eines kurzen Schlusses deshalb nun akustische Eigenschaften eines einzelnen Tones als Formanten zu bezeichnen ist zumindest unpräzise.

Die Untersuchungen der Stimmlaute zeigen, daß bestimmte phonetisch definierte Laute, wie etwa das geschlossene U (wie in "Brut"), das geschlossene O (wie in "Boot"), im wesentlichen durch zwei Formanten geprägt werden. Ihre Lage ist in der Abbildung Formantenschema angegeben. Es ist unschwer zu erkennen, daß solche Bereichsangaben nicht als präzise Festlegungen zu verstehen sind. In vielen Publikationen, mit Karten wie in der Abbildung Formantenkarte wird man vergeblich nach genauen Angaben dazu suchen, wie stark bei den Experimenten die Teiltöne in den Formantregionen angehoben wurden, wie breit diese Regionen waren und mit welchen Methoden der gehörte Laut festgestellt wurde. Es darf nicht verwundern, daß die Regionen in veschiedenen Publikationen recht verschieden ausfallen. Oft übersehen Autoren, die solche Abbildungen aufgreifen, die Notwendigkeit darauf hinzuweisen, ob die Daten überhaupt aus Hörversuchen ermittelt wurden, oder ob an faktisch gesprochenen Lauten gemessen wurde. Letzteres würde genau genommen einer anderen Formantvorstellung ( siehe unten) entsprechen.

Das Formantenschema zeigt jeweils zwei Regionen (Formanten), in denen "starke Teiltöne" die entsprechende Klangwahrnehmung auslösen. Auch für Instrumente gibt es solche Regionen.

Die Formantkarte zeigt die Formantregionen als Gebiete in einer zweidimensionalen Karte aufgetragen (Frequenz von Formant 2 nach oben, von Formant 1 nach rechts) .


9.2.3 Formant_Phänomen: Formanten als Strukturen eines einzelnen Tones
Schaut man auf das Spektrum eines Momentes eines stimmhaft gesprochenen Lautes, so erkennt man i.a. schnell Regionen besonders starker Teiltöne. Wobei die "besondere Stärke" nicht am absoluten Wert, sondern am relativen Wert verglichen mit der näheren Umgebung erkennbar ist. Viele sagen dann: "Da ist ein Formant.". Aber kann denn da wirklich ein Formant sein, wo das Spektrum nur einzelne Teiltöne und deren Pegel (oder Amplitude) darstellt?

Offenbar ist klar, daß ein Formant in einem einzelnen Ton nicht so klar und eindeutig existiert, wie ein Teilton, dessen Frequenz und Pegel genau definierbar und messbar sind. Eher ist es so, daß man sich zu einem Spektrum eine Hüllkurve mit Erhebung vorstellt, wie einen Berg in einer Landschaft, und davon ausgeht, daß diese Erhebung (Formantierung) deutlich klangprägend ist.

Es ist heute üblich, zu sagen, ein einzelner Ton habe einen oder mehrere Formanten, in dem Sinne, daß man im Spektrum Zonen besonders starker Teiltöne findet. Von einigen Autoren werden solche Zonen auch als spektrale Energiekonzentration bezeichnet. Wir nennen diese an der Struktur des Spektrums orientiere Definition spektral-phänomenologisch.

Die Ausführungen zu den Abbildungen unten zeigen allerdings, daß man die zunächst vielleicht naiv geglaubte Idee, ein Formant lasse sich als Eigenschaft eines einzelnen Tones definieren, in Frage stellen muss.

Anmerkung: Beim Vibrato der Sängerstimme variiert die Grundfrequenz kontinuierlich. Dadurch wird dem Ohr in kurzer Zeit eine kontinuierliche Folge von Stützstellen (im Sinne des Textes zu Abb. c) oben) angeboten, und die Konstruktion der Hüllkurve wird viel genauer möglich als bei einem Ton konstanter Grundfrequenz. Dementsprechend prägnater wird die Klangwahrnehmung des Lautes. Auch die beim Sprechen übliche gleitende Grundfrequenz wirkt in diesem Sinne. Parallel dazu gleiten dabei auch die Formantlagen, so daß ein sehr lebendiger Klang entsteht, jedenfalls beim Reden mit guter Sprechmelodie.

9.2.4 Formant_Produktion: Formanten als Resonanzen
Nachdem die Stimme insbesondere unter Aspekten der Telekommunikation im 20. Jahrhundert immer besser erforscht wurde, wurde deutlich, daß vor allem die akustischen Eigenschaften der Luft im Vokaltrakt den Stimmklang prägen. In den Frequenzbereichen um die Resonanzstellen dieser "Luftsäule" werden besonders starke Teiltöne ausgebildet. Sie führen im Spektrum zu Formanten im Sinne des vorangehenden Abschnittes. Vor allem die beiden am tiefsten gelegenen Formanten (F1 und F2) prägen die Lautwahrnehmung, bestimmen also, ob wir ein O (wie in "Boot"), A (wie in "Jahr") etc. hören.

Anmerkung: Es ist allerdings nicht davon auszugehen, daß jede Struktur des Spektrums, die wie ein Formant aussieht, unbedingt auf eine Resonanz im Vokaltrakt zurückzuführen ist. Ebenso muss eine Resonanz des Vokaltraktes im Spektrum nicht unbedingt als Formant erkennbar sein, da nicht immer ein Teilton in den Resonanzbereich fallen muss.

Dieses Konzept von "Formanten" ist natürlich ideal für die elektronische Synthese von Lauten. Man erzeugt zuerst ein "Primärsignal" (Abbildung: Primäres Spektrum) und filtert dies dann so, daß sich die gewünschten "Formanten" ergeben (Abbildung: Filterkurve, Ergebnisspektrum). In der klassischen Elektrotechnik verwendet man Filter aus elektronischen Resonatoren. Ihre Resonanzen sind gut beschreibbar durch die Parameter Mittenfrequenz, Bandbreite und Stärke. Heutzutage wird dies im wesentlichen nach denselben Algorithmen digital modelliert. So ist es nicht verwunderlich, daß für Forscher aus diesem Bereich ein Stimmlaut Formanten hat, die Resonanzen sind und sehr präzise beschrieben werden können. Von daher ist der Vorschlag verständlich, den Begriff doch nun endlich genau und präzise, nämlich in diesem Sinne zu definieren.

Zitat Sundberg: "This is the most appropriate way of defining the term formant. As a consequence, formants can occur, strictly speaking, only in sounds generated by the human voice organ. However, in some books and articles the reader may meet formant definitions associated with spectrum envelope peaks, which are mostly unaffected by a change of fundamental frequency." (The Science of Musical Sounds, 1991, S. 121)

Abgesehen davon, daß der Formantbegriff ursprünglich ganz anders aufgefasst worden war, hat der Vorschlag noch einen kleinen Haken. Wenn ein Ton nicht elektronisch synthetisiert ist, kann man allein an seiner Schallwelle die Resonanz gar nicht genau erkennen, da sie nur einzelne Frequenzen enthält, die mehr oder weniger weit auseinander liegen. Daher hat man mathematische Modelle erfunden, die auch aus solcher unvollständiger Information unter bestimmten Voraussetzungen eine mehr oder weniger genaue Berechnung der Resonanzdaten (Mittenfrequenz, Bandbreite, Stärke) erlauben, etwa die LPC-Analyse (Linear Prediction Coding). Ihre Ergebnisse hängen allerdings von der Wahl eines Parameters ab, die geschickt getroffen werden muss. Die Klärung der Brauchbarkeit solcher Daten für bestimmte Zwecke ist eine Expertenangelegenheit. Durch die leichte Verfügbarkeit in Computerprogrammen ist damit zu rechen, daß viele Fehlinterpretationen stattfinden. Insbesondere bei hohen Tönen erhält man als "Formanten" eher die Position von Teiltönen als von Resonanzstellen.

Die genannten Methoden zur Beschreibung eines Tones durch Resonanzstellen sind sehr hilfreich bei der Erforschung von Stimmlauten und zur Bearbeitung vieler Fragestellungen der Wahrnehmungsforschung. Ihr Verdienst: Sie präzisieren die oben unter c) beschriebene Betrachtungsweise und bieten dabei mathematische Algotithmen an, die zu eindeutigen Ergebnissen führen. Allerdings muss man sich klar machen, daß sie aus einem einzelnen Spektrum unter der Annahme eines bestimmten Modells der Tonproduktion mehr herausholen, als die Daten per se allein hergeben. Ob es nun geschickt ist, diesen Formantbegriff für alle Disziplinen der Stimmforschung vorzuschlagen, sei dahingestellt.

Das Konzept der elektronischen oder digitalen Synthese eines stimmhaften gesprochenen Tones ist in der Abbildung unten skizziert (siehe dazu auch Text links).

Dieses Verfahren wird gerne auf die Funktion der menschlichen Stimme projiziert. In einer recht stark vereinfachenden Annäherung könnte man es wie folgt auf die Stimmproduktion übertragen: Die Schallwelle, die vom Kehlkopf ausgehen würde, wenn der Vokaltrakt nicht vorhanden wäre - der Kehlkopf also direkt ins Freie abstrahlen würde- hat ein Spektrum wie ganz oben dargestellt. Im Zusammenwirken von akustischer Kehlkopffunktion, Vokaltrakt und Abstrahlcharakteristik des Mundes ergibt sich für das abgestrahlte Spektrum eine Modifikation gemäß der im mittleren Bild gezeigten Filterkurve. Das abgestrahlte Spektrum entspricht somit der unten dargestellten Kurve. Problem: Es ist damit zu rechnen, dass durch die Präsenz des Vokaltraktes die Strümungsprozesse über der Glottis so stark beeinflußt werden, dass die Schallwelle, die vom Kehlkopf ausgehen würde, wenn der Vokaltrakt nicht vorhanden wäre , kein geeigneter Ausgangspunkt für das Verhalten des gekoppelten Systems ist. Allein schon die Annahme, dass es in beiden Fällen zu exakt derselben Periodenfrequenz kommt, ist nicht überzeugend. Trotzdem hat das Modell als Ideal-Vorstellung eine Berechtigung.

Man beachte, daß sich die Beschreibung dieses Modells in wesentlichen Punkten von dem in Erratum 2 kritisierten, gängigen Beschreibungen des "Primärklang-Filter-Modells" unterscheidet. Insbesondere ist nicht von einer "Verstärkung" durch den Vokaltrakt die Rede (Erratum 1) und auch nicht davon, daß die Schallemission vom Kehlkopf aus in den Vokaltrakt durch eine (primäre) Schallwelle mit dem Spektrum der obersten Abbildung beschrieben wird (sondern als hypotetische Schallwelle in den freien Raum).



9.3 Diskussion

Wir beschränken die Diskussion auf eine kurze Zusammenstellung eindeutig falscher Anwendungen und der allgemeinen Problematik:

9.3.1 Formant ist ein Teilton
Eine verbreitete Vorstellung ist, daß ein Formant ein einzelner Teilton sei. Zum Beispiel wurde in Kreisen, in denen bewusst am Sängerformanten bei 3000 Hz gearbeitet wird, von vielen erwartet, daß ein Teilton mit der Frequenz von 3000 Hz in jedem guten Gesangston enthalten sein müsse. Dies ist schon deshalb nicht möglich, weil ein solcher Teilton nur bei einigen wenigen Tonhöhen auftreten kann (-> Erratum 7 unter 7.2.3).

9.3.2 Grundfrequenz als Hauptformant
Im Bereich phonetischer Publikationen findet man gelegentlich die Aussage, die Grundfrequenz f0 sei ein Hauptformant. Dazu kann man eigentlich nur lapidar feststellen, daß eine Grundfrequenz aus heutiger Sicht jedenfalls eine Größe vollständig anderer Art ist als ein Formant (siehe dazu auch Erratum 7). Es ist zwar denkbar, daß der Teilton auf der Grundfrequenz in bestimmten Situationen (wenn er in oder über die tiefste Resonanzstelle fällt - eher beim Singen in hoher Lage als beim Sprechen bedeutsam) für die Klangwahrnehmung prägend wirkt, das dürfte aber keinesfalls den Begriff "Hauptformant" rechtfertigen.

9.3.3 Formantnomenklatur nach Stärke
In einigen Schriften (speziell im Bereich der Musikalischen Akustik von Instrumenten) findet man die Nomenklatur-Definition: die Formanten werden ihrer Stärke nach benannt als F1, F2, F3 etc..

Sie werden aber üblicher- und sinnvollerweise nach ihrer (Mitten-)Frequenz klassifiziert, so daß der tiefstgelegene Formant F1, der nächsthöhere F2 ist etc.. Denn es ist die Frequenzlage, die die klangprägende Wirkung hat und somit einen Formanten charakterisiert.

9.3.4 Schwachpunkt der derzeitigen Begriffsverwendung
Die wesentliche Unklarheit ist, daß man offenbar nicht deutlich unterscheidet zwischen den oben beschriebenen Optionen:

Formant_Perzeption: Man geht von einem Sprachlaut (Phonem) aus und fragt danach, welche Frequenzbereiche müssen starke Teiltöne aufweisen, damit man diesen Laut hört. Dies Bereiche nennt man dann Formanten.

Formant_Phänomen: Man benutzt den Begriff, um die spektrale Struktur eines faktisch vorliegenden Tones zu beschreiben. (Je präziser man den "Formant" dabei beschreiben möchte, umso mehr wird man sich allerdings an Modellvorstellungen ausrichten, die über die Fakten des gegebenen Tones allein hinausgehen.)

Formant_Produktion: Man schränkt den Begriff ein als Resonanzstelle des Vokaltraktes. Damit werden Formanten quantitativ präzise beschreibbar. Die Definition funktioniert nur im Rahmen eines Modells der Tonproduktion. Für die Stimme ist dies ein Vokaltraktresonanzmodell.


9.4 Zusammenfassung

Der Formantbegriff im historisch gewachsenen Sinne meint keine Eigenschaft eines einzelnen Tones. Eher eine vorgestellte Region, die eine bestimmte Wahrnehmung auslöst. Also wäre es in diesem Sinne nicht zulässig zu sagen, dieser Ton, den ich da höre hat einen Formanten. Richtiger wäre: er bedient einen Formanten. Etwa den, der den Oboenklang ausmacht. Bzw. im Bereich der Stimme: er bedient mehrere Formanten, die beiden tiefstgelegenen sind beispielsweise die, die den Sprachlaut " geschlossenes A" ausmachen.

Im täglichen Sprachgebrauch wird man wohl dennoch sagen, er habe diesen Formanten. Bzw.: "Schauen Sie sich dies Spektrum einmal an, dann sehen Sie hier einen Formanten". Und dazu ggf. anmerken, man wisse schon, wie das gemeint sei. Ebenso wie dies derzeit bezweifelt werden darf, muss wohl festgestellt werden, daß die meisten Hörer und Leser das mit Sicherheit nicht wissen.

Man könnte vorschlagen, den Begriff "Formant" so zu verwenden wie historisch üblich, die Ausprägung starker Teiltöne, die ihn bedienen, dagegen als "Formantierung" zu bezeichnen. Auch wenn das keine Aussicht hat, allgemein realisiert zu werden, so ist doch die gelegentliche persönliche Anwendung einer solchen Unterscheidung allemal gut, das eigene Denken in präziseren Bahnen zu halten.

Die neuere Formantdefinition als Resonanzstelle wird im technisch-naturwissenschaftlichen Bereich benutzt und mitunter als allgemein verwendbar vorgeschlagen, u.a. von J. Sundberg (siehe obiges Zitat). Auch D.E. Hall benutzt im Glossar zu seinem Buch "Musikalische Akustik - Ein Handbuch" eine Definition in dieser Richtung:
"Formant oder Formantbereich: Eine breite Resonanz (vor allem im menschlichen Vokalapparat), die die darin liegenden Fourier-Komponenten (Teiltöne) verstärkt."
Der Kürze wegen sei auf die durchaus interessante Hinterfragung des in diesem Zusammenhang hilfreichen Adjektives "breite" verzichtet. Allerdings muss die "Verstärkung" von Teiltönen im Vokaltrakt als falsch oder zumindest missverständlich kommentiert werden (->Erratum 1).

Es ist unbestreitbar, daß die von Sundberg vorgeschlagene Definition die präzise Angabe der Parameter einer resonanzbedingten Formantierung erlaubt. Dennoch ist sie in der überdisziplinären Beschreibung der Stimme nicht etabliert, zumal sie den gewachsenen Begriff zu stark spezialisiert. Zudem ist die "Resonanzstelle" als solche ja ein klarer und eindeutiger Begriff, der bezüglich des Stimmspektrums keiner anderen Namensgebung bedarf. Seitens der Phonetik wird mitunter ähnlich argumentiert:
"The tract resonances themselves are sometimes referred to as formants, but this is technically imprecise. Formants are a consequence of resonance, not resonance itself." (J. Clark und C.Yallop: An Introduction to Phonetics and Phonology, 2nd ed.,1995, S.246)
Die Autoren benutzen offenbar die oben als "spektral-phänomenologisch" beschriebene Definition. Darüberhinaus ist nicht davon auszugehen, daß jede im Stimmspektrum ausgemachte Formantierung (auffallend starke Teiltöne, die vermutlich klangprägend sind) auf eine Resonanzstelle des Vokaltraktes zurückgehen muss.

In Anbetracht des Dilemmas muss man "Formant" in die Reihe der Begriffe einordnen, die nicht allgemein eindeutig definiert sind. Jeder, der ihn außerhalb enger Fachdisziplinen benutzt, täte gut daran, jeweils "vor Ort" zu definieren wie er gemeint ist.

Schlußidee: Die Begriffsproblematik wird dadurch verstärkt, daß nur wenige Leute praktische Erfahrungen mit Formanten haben. Sie lassen sich in der Tat sehr konkret erleben. Im "Klangkontakttraining" lernt man, Formanten der Stimme zu hören und zu gestalten. (-> Klangkontakttraining)




HINWEIS: Die Diskussion über Formanten setzt Grundkenntnisse des Frequenzbegriffes voraus. Dieser wird in Erratum 7 ausführlich diskutiert und erklärt.(-> Erratum 7)

weitere ERRATA VOCOLOGICA