|
(Published Internet-Name DT01011 / Copyright Manfred Baier omtec hifi components, Giessen 2005) Digital Audio MemorandumEntwicklung eines Theorems zur Abtastung Vorbemerkung In den zurückliegenden Jahren in denen ich mich mit der Theorie digitaler Signalverarbeitung beschäftigt habe kam der Wunsch nach der Herleitung eines Abtasttheorems auf, das eine Richtlinie zur Verwendung der Digitaltechnik und ihrer Vorzüge nach audiophilen Gesichtspunkten darstellt. Ermutigt wurde ich in diesem Entschluß durch die Arbeit von Claude E. Shannon, dem Vater der Informationstheorie. In seiner Arbeit "A Mathematical Theory of Communication" (1948) spricht Shannon klar aus, das die Verlässlichkeit der Rekonstruktion des analogen Signals aus den digitalen Daten ("fidelity of recovery") wesentlich von der Abtastrate in Bezug auf die genutzte Übertragungsbandbreite abhängig ist.Shannon führt dazu aus:
"The question is, can we assign a definite rate to a continuous source when we require only a certain fidelity of recovery, measured in a suitable way. Of course, as the fidelity requirements are increased, the rate will increase." MTC S. 48
Die Erfahrung mit Digital Audio in Form der CD und Vergleiche mit der Wiedergabe von Schallplatte erbrachten schon früh einige Schwächen des digitalen Formats hinsichtlich Einschwingverhalten, Impulstreue, Fehlen hochfrequenter Harmonischer - die allesamt natürlich miteinander in Beziehung stehen. Insofern war die Forderung nach höherer Abtastrate von jeher legitim. In der Studiotechnik ging man relativ schnell zur Abtastrate von 96 kHz über. Obwohl alle darin einig sind, das diese Abtastrate eine bessere Qualität der Musikwiedergabe erlaubt, wird sie nicht als neuer Consumer-Standard eingeführt. Es kamen andere Verfahren. Das Hörvermögen ist lediglich die physiologische Seite der Übertragungsstrecke. Einiges ist noch ungeklärt, eher Modell als Gewißheit. Tatsache ist, das ein Schallereignis gleich welcher Beschaffenheit auf die Ohren eines jeden Zuhörers in gleicher Weise trifft. Daher halte ich es für notwendig, dieses Ereignis in allen technischen Facetten so linear wie möglich zu übertragen, völlig unabhängig davon ob der Einzelne 'Unterschiede' bewußt hört oder nicht. Menschliche Wahrnehmung unterliegt nun einmal physiologisch interpersonalen Schwankungen. Wenn wir Kultur ernst nehmen, ist eine Bildreproduktion vom Typ Tageszeitung oder eine Musikaufzeichnung vom Typ Grammophon eben nicht mehr angemessen, sobald die technische Entwicklung einen höheren Grad an Perfektion ermöglicht. Gewöhnlich wird sie dann auch angestrebt. Wenn aber bereits in dem unbestrittenen Übertragungsbereich von 20-20000 Hz Fehler auftreten, dann ist die Suche nach einer Abtastrate welche diese Fehler minimiert ein Versuch, zumindest auf der technischen Seite der Entwicklung mehr Raum und Gewißheit zu geben. Zu viele Aussagen der Vergangenheit stellen sich in der Rückschau als reines Marketing dar. Die vorliegende Studie ist der Versuch, auch dem technischen Laien die Betrachtung der zeitdiskreten Abtastung zu ermöglichen. Wir kommen dabei ohne mathematische Transformationen aus. Hiermit stelle ich die Ergebnisse unserer Arbeit zur Diskussion. Manfred Baier Giessen, im Oktober 1994 uf.
Die klassische Idee der zeitdiskreten Abtastung wurde 1924 von H. Nyquist formuliert: Zur Rekonstruktion einer Sinusschwingung genügt ihre Abtastung mit zwei Stützwerten, den Samples. Wie bereits gezeigt, ist diese Definition allerdings mehrdeutig in Bezug auf abzutastende Signale gleicher Frequenz, aber anderer Amplitude (Höhe der Schwingung) und Phase (Zeitpunkt der Abtastung), welche die gleichen Ordinaten (Samples) bei der AD-Wandlung ergeben. Daraus ist zu schließen, das die sogenannte Nyquistfrequenz (halbe Abtastfrequenz Fs/2) nicht die obere Grenze der Übertragungsbandbreite darstellt, sondern den Beginn des Aliasbereichs, in dem Mehrdeutigkeit mit entsprechenden Aliasfrequenzen herrscht. Bei FS/2 hat der Alias die Frequenz 0 Hz. Später wurde die als Abtasttheorem bezeichnete Mindestforderung der zeitdiskreten Abtastung kontinuierlicher Schwingungen so formuliert: Fs > 2 Fa.
Ist die höchste im analogen Signal vorkommende Frequenz kleiner als Fs/2, läßt sich innerhalb dieser Bandbreite das analoge Signal wieder aus den Werten der Samples rekonstruieren. Verwendung von Methoden der Analogtechnik Wir stützen uns auf die Arbeit von C. Shannon und anderen, die den mathematischen Beweis für die spektrale Tauglichkeit des LPCM-Verfahrens längst erbracht haben. Da es uns um die Entwicklung einer Abtastrate für Musikanwendungen für den Frequenzbereich bis 20 kHz geht, fügen wir einige neue Betrachtungen zum Abtasttheorem hinzu. Dabei beschränken wir uns konsequent auf die klassischen Mittel der Geometrie und der Analogtechnik. Abschnitt 1: Anstiegszeit und Zeitkonstante Beginnen wir versuchsweise mit der Abtastrate der CompactDisc von 44.1 kHz. Zur Beschreibung der Aussteuerung benötigen wir keine Quantisierung, sondern verwenden eine Skala von -100% bis +100%, wobei Null bedeutet das kein Signal anliegt. Jeder Ton entsteht aus der Stille, d.h. von der Nulllinie aus. Aus diesem Grund verwenden wir zunächst einen Spannungssprung von 0 auf 100%. Den Zeitpunkt für das Auftreten des Spannungssprungs legen wir irgendwo zwischen 0*Ts und 1*Ts. Somit wird der Abtastwert zum Zeitpunkt 0*Ts die Amplitude 0, und der Abtastwert zum Zeitpunkt 1*Ts die Amplitude 100 haben. Ts ist die Abtastzeit von 22,67µs (CD).
In Grafik 1 sind diese Abtastwerte mittels einer Geraden miteinander verbunden. Bei Tiefpässen gilt als Kenngröße zur Charakterisierung die Anstiegszeit. Sie gibt an, in welcher Zeit die Abtastwerte von 10% auf 90% des Endwerts ansteigen. Für den vorliegenden Fall ermitteln wir 0,1*Ts und 0,9*Ts. Einfache Rechnung ergibt:
Aus der Zeitkonstante tau1 erhalten wir zugleich die Grenzfrequenz des Tiefpasses fg1. Da alle Informationen zur Berechnung der Sprungantwort eines einfachen analogen Tiefpasses vorliegen, geben wir dessen Verlauf der Ausgangsspannung ebenfalls an (gestrichelte Kurve). Im digitalen System ist gefordert, das die höchste Frequenz mehr als zwei Abtastpunkte besitzt. Als nächsten Fall legen wir den eingangsseitigen Spannungsverlauf daher so, das dessen Amplitude bei 0*Ts den Wert 0 und erst bei 2*Ts den vollen Wert von 100 erreicht. Die Abtastpunkte werden wieder mit einer Geraden verbunden.
Die zur Berechnung von tau benötigten Zeiten für die Amplituden bei 10% und 90% ermitteln wir mit 0,2*Ts und 1,8*Ts. Die gestrichelte Kurve stellt wieder die Sprungantwort eines analogen Tiefpasses dar mit dieser Charakteristik dar. Wie nicht anders zu erwarten, erhalten wir:
Den letzten Fall den wir untersuchen betrifft Nyquists Konstruktion der Abtastung eines Sinusförmigen Signals mit der Nyquistfrequenz FS/2 in ihren Scheitelpunkten. Für 0*Ts nehmen wir den Abtastpunkt im Scheitelpunkt der negativen Halbwelle, in 1*Ts liegt der Scheitelpunkt der positiven Halbwelle. Wiederum werden die Zeitpunkte für 10 bzw. 90% der Amplitude ermittelt mit 0,1*Ts und 0,9*Ts. Die Sprungantwort des analogen Tiefpass ist der Vollständigkeit wegen auch hier als gestrichelte Kurve gegeben.
Im digitalen System stellt diese Änderungsrate der Amplitude von -100 zu +100 bei zwei aufeinanderfolgenden Samples gleichzeitig die höchstmögliche Änderungsrate von Abtastwerten dar. Die Rechnung bringt erwartungsgemäß:
Mit diesen Betrachtungen sind alle Möglichkeiten der Änderungsrate von Samplingwerten die zwei und drei Abtastungen betreffen erfaßt. An dieser Stelle wollen wir die Ergebnisse noch nicht bewerten. Allerdings erlauben die Daten die Angabe einer weiteren Signalgröße, und zwar der Anstiegsgeschwindigkeit (Slewrate) die wir nachstehend für jede der Zeitkonstanten berechnen. Als Amplitude der Wechselspannung veranschlagen wir einen Spitzenwert von Vp = 1 Volt (peak) für den bisherigen Skalenwert 100% der Aussteuerung.
 Abschnitt 2: Modellierung der Abtastung Mit den Ergebnissen aus dem vorhergehenden Abschnitt läßt sich noch keine Übertragungsfunktion für eine zeitdiskrete Abtastung herstellen. In der analogen Filtertechnik gibt die Übertragungsfunktion das Verhältnis der Laplacetransformierten von Ausgangs- und Eingangsspannung für beliebig von der Zeit abhängige Signale an. Daraus ergibt sich dann der Frequenzgang für sinusförmige Signale. Bei der zeitdiskreten Abtastung eines sinusförmigen Signals erhalten wir jedoch kein sinusförmiges Signal zurück, sondern lediglich die Ordinaten des Eingangssignals als Abtastwerte (Samples) zu den Zeitpunkten der Abtastung mit der Abtastrate Fs. Wie lassen sich zeitdiskrete Abtastwerte beschreiben?Um die Frage zu beantworten erinnern wir an die Definition des Sinus aus dem sogenannten Einheitskreis: "Ein Punkt der sich mit konstanter Winkelgeschwindigkeit auf einem Kreisumfang bewegt, beschreibt mit einem Zeitpfeil eine sinusförmige Bahn." In dieser Definition wird "Zeit" als kontinuierlich fortschreitende Größe verwendet. Allerdings können wir auch dafür sorgen, das der Zeitpfeil sich sprunghaft von Abtastwert zu Abtastwert bewegt.
 Oben stehendes Diagramm verdeutlicht den Vorgang. Links der Einheitskreis, der das sinusförmige Eingangssignal erzeugt. Darin einbeschrieben ein auf einer Spitze stehendes Quadrat und ein flach stehendes Quadrat. Beide Quadrate geben Abtastungen wieder, allerdings zu unterschiedlichen Phasen des Eingangssignals: Bei dem auf der Spitze stehenden Quadrat beginnt die Abtastung im Nulldurchgang des Eingangssignals (Pos.0). Bei dem flach stehenden Quadrat beginnt die Abtastung bei 45° des Eingangssignals (Pos.1). Der Zeitpfeil bewegt sich in gleichen Winkelabständen durch den Kreis und bildet zu jedem Abtastzeitpunkt die Ordinate ab. Nach vier Abtastvorgängen befindet er sich wieder am jeweiligen Ausgangspunkt und der Vorgang beginnt erneut. Mit der Abtastrate von 44.1 kHz ergibt sich die Frequenz des Eingangssignals im Beispiel zu Fs/4 = 11025 Hz. Im Einheitskreis läßt sich die Winkelgeschwindigkeit gegenüber dem Eingangssignal einfach ändern. Auf diese Weise läßt sich leicht jede gewünschte Frequenz des Eingangssignals 'digitalisieren'. Das Ergebnis ist stets eine regelmäßige Figur im Einheitskreis mit n=Fs/Fa Ecken: ein Vieleck oder n-Eck.
Um von hier aus zum Frequenzgang zu kommen, bilden wir das Verhältnis von Ausgangsspannung "n-Eck" zur Eingangsspannung "Kreis". Die Kreisfläche ist bekannt. Weniger bekannt hingegen ist, das eine allgemeine Formel zur Berechnung der Fläche eines beliebigen Vielecks mit n Ecken existiert. Der Kehrwert des Abtastprodukts Fa*Ts liefert sofort den Wert für n. In beiden Flächenformeln setzen wir den Kreisradius 1. Vereinfachen der Formel erbringt dann eine sinx/x-Funktion (im englischen Sprachraum sinc-Funktion):
Aus der Literatur entnehmen wir die Definition der sinc-Funktion als eine "Rücktransformierte aus dem Fourierraum". Das verwundert kaum. Nun sind Rücktransformationen stets etwas unglücklich deswegen, weil es keinen plausiblen direkten vorwärtsgerichteten (Eingang -> Ausgang) Weg zu geben scheint, ähnlich dem Umstand als gäbe es für eine physikalische Wirkung nur eine aus der Wirkung zu schließende Ursache die selbst unerklärt bleibt. Wir nennen die gefundene sinc-Funktion Asin(Fa). Sie ist die Übertragungsfunktion des von uns benannten Sinus-Samples aus der Grafik mit dem Einheitskreis. Da die Abtastung höherer Frequenzen zunehmend kritischer wird hinsichtlich der absoluten Phasenlage des Eingangssignals zur Abtastung, beschreibt Asin(Fa) den Frequenzgang mit einer Nullstelle bei Fs/2, entspechend dem Start der Abtastung im Nulldurchgang bei Fs/2 mit dem Ergebnis 0 aller Abtastwerte. Mit anderen Worten: sie beschreibt einen Grenzfall der Abtastung. Die Grafik zum Einheitskreis sieht den zweiten Grenzfall - benannt Cosinus-Sample - vor, der bei Fs/2 durch Verschiebung der Phasenlage der Abtastung in den Scheitelpunkt des Eingangssignals zustande kommt. Offensichtlich handelt es sich hier um Nyquists Konstruktion der Abtastung bei Fs/2 die eingangs bereits erwähnt wurde. Natürlich entspricht die Änderung der Phasenlage von Abtastungen einer Drehung des Abtast-Vielecks im Einheitskreis. An dieser Stelle scheint es geboten zu untersuchen, wie sich n-Ecke verhalten wenn sie gedreht werden. Wir bieten hier nur das Ergebnis, für den Rechenweg verweisen wir auf den Anhang:  Variation aufeinanderfolgender Abtastwerte: Amplitudenvariation durch Drehen der n-Ecke von Abtastung N zu N+1 mit Phasendrehung dp = 0 ... p. Dieses Muster findet sich später im Frequenzgang wieder. Im Augenblick interessiert insbesondere die obere Grenzlinie, die der Abtastung der Nyquistfrequenz in den Scheitelpunkten entspricht. Die maximale Amplitude bei Fs/2 beträgt 2, oder eben die Summe des Betrags von -1 und +1, entsprechend den Quadranten der Abtastwerte. Weil zum Peripheriewinkel 0 Grad die Strecke a=d=2*r gehört, erbringt sin(p/n) nur die halbe Amplitude -> daher ersetzen wir mit 2*sin( o/n). Zum gleichen Ergebnis führt die Ersetzung von n mit 2n.Aus dem Drehungsverhalten der n-Ecke ist die mit Erhöhung der Eingangsfrequenz größer werdende Phasenabhängigkeit der Abtastung erkennbar, bis Fs/2* o ist die phasenabhängige Variabilität recht klein und wächst ab Fs/4 bis Fs sowohl an der Ober- wie auch der Untergrenze stark an. Für einen ersten Eindruck genügt der Wert Fs/4, welcher auch der Abtastung im Einheitskreis (siehe Grafik) zugrunde liegt. Zur Vervollständigung sei erwähnt, das die innere Kurve mit Maximum bei Quadratwurzel(2) das geometrische Mittel von Amax(N) und Amin(N) darstellt.Kommen wir zurück zur Übertragungsfunktion des Cosinus-Samples. Wir erhalten es, indem wir n durch 2*n ersetzen und die Prozedur der Vereinfachung wiederholen.
Statt einer Übertragungsfunktion haben wir nun derer zwei. Das macht Sinn, wenn man sich die phasenabhängigen Extrema der Abtastung bei Fs/2 ansieht. Betrachten wir die beiden sinc-Funktionen. Die untere Kurve (rot) stellt die Funktion Asin(Fa), die obere Kurve (blau) die Funktion Acos(Fa) dar. Abszissenwerte sind die Eingangsfrequenzen ab 1 kHz. Für niedrigere Frequenzen des Eingangssignals sind beide Funktionswerte gleich, daher sind sie nicht dargestellt, gehören natürlich dennoch zur Bandbreite W des digitalen Systems. Bei Fs/2 sind für Asin(Fa) alle Abtastwerte 0, demnach auch die Fläche der Abtastung 0. Für die Abtastung bei Fs/2 mit Acos(Fa) sind alle Abtastwerte zwar |1|, die Fläche beträgt aber nur 64% des Eingangssignals. Beide Abtastungen besitzen eine Wahrscheinlichkeit nahe 0 für ihr reales Auftreten, das gleiche gilt jedoch für jede beliebige momentane Phasenlage während der Abtastung. Bei Fs/2 als Eingangsfrequenz spielt die Dauer des abgetasteten Tons keine Rolle, die Abtastwerte verändern sich in keiner Weise, gleichgültig wie lange abgetastet wird. Dieses Charakteristikum gehört neben der Mehrdeutigkeit der Abtastwerte selbst zu dem Argument, das Fs/2 eben nicht mehr zur digitalen Bandbreite gehört.Alle Eingangsfrequenzen unterhalb Fs/2 bieten -sich ständig verändernde- Abtastwerte die "durch das Signal phasen". Für die Eingangsfrequenz 20 kHz haben wir den Wahrscheinlichkeitsraum für die aufeinanderfolgenden Abtastwerte je nach Phasenlage der Abtastung eingezeichnet (siehe FuE Artikel hierzu). Obwohl das Aussehen der Abtastwerte für 20 kHz Eingangsfrequenz im Zeitbereich an Amplitudenmodulation oder Schwebung erinnert, ist sie tatsächlich keines von beiden. Dies läßt sich leicht anhand der Darstellung der Abtastung im Einheitskreis klarmachen: im Kreis ist von Schwebung nichts zu sehen. In der nachstehenden Grafik sind im Kreis mehrere Perioden des Eingangssignals von 20 kHz abgetastet. Erkennbar ist hingegen die konstante Verschiebung der Abtastzeitpunkte (zur Phase des Eingangssignals) um die sich das 'Sternmuster der Abtastung dreht'.
Zurück zur Grafik der Übertragungsfunktionen Asin(Fa) und Acos(Fa).Oberhalb Fs/2 liefert die - mit der von Shannon identische - Übertragungsfunktion Acos(Fa) keinen Hinweis auf Abtastprodukte (=spektraler Inhalt der zeitdiskreten Abtastwerte) innerhalb des Frequenzbands Fs/2 bis Fs. Hingegen scheint die Abtastung bis zu Eingangsfrequenzen hinauf zu Fs zu funktionieren. Wir wissen natürlich, das in diesem Band Abtastprodukte entstehen, sie sind wesentlicher Grund für die Filterung oberhalb Fs/2. Die sinc-Funktion Asin(Fa) zeigt jedoch das Abtastprodukte in diesem Frequenzband vorhanden sein werden. Wegen der Betragsbildung für Acos und Asin erscheinen die Amplituden nur oberhalb der Nulllinie. Tatsächlich bleibt ihr Verlauf sinusartig. Für unsere Betrachtung spielt dieser Umstand allerdings keine Rolle. Abtastprodukte können in Abhängigkeit vom Eingangssignal und seiner Abtastung prinzipiell bei jeder Frequenz oberhalb Fs/2 auftreten, gerechnet sind sie in der Grafik nur bis 1 MHz, wo ihr Pegel noch durchaus nennenswert ist, auch wenn die lineare Skala für die Amplitude das zunächst nicht vermuten läßt. Ein Beleg dafür, das an die Filterung wie bekannt hohe Ansprüche zu stellen sind. Abschnitt 3: Mehrdeutigkeit und Einschwingverhalten Nach Nyquist und Shannon genügen zwei Abtastwerte zur Beschreibung des sinusförmigen Eingangssignals mit der Frequenz Fs/2, der sogenannten Nyquistfrequenz. Für diese Frequenz haben wir bereits bewiesen, das diese Definition Nyquists nicht stimmen kann, weil sich durch zwei Abtastwerte mit anderer als der von Nyquist konstruierten Phasenlage stets eine weitere Sinusschwingung mit abweichender Amplitude und Phase legen läßt. Dieses Faktum heißt, die Abtastwerte sind nicht eindeutig in Bezug auf das Eingangssignal.Betrachten wir daher die ersten zwei Abtastwerte einer niedrigeren Frequenz des Eingangssignals, z.B. 20 kHz. Auch bei dieser Frequenz treten immer wieder aufeinanderfolgende Abtastwerte auf, die als Mehrdeutig gelten müssen. Vom Abtastzeitpunkt 0 bis zum ersten Sample (0-1) läßt sich mindestens eine weitere sinusförmige Schwingung niedrigerer Frequenz und anderer Phasenlage legen, das Gleiche gilt für das Abtastpaar (1-2) usw. Es ist dabei völlig gleichgültig, in welcher absoluten Phasenlage wir mit der Abtastung beginnen, stets werden Abtastpaare auftreten, die ihre Abtastwerte mit anderen sinusförmigen Schwingungen gemein haben. Genau diese Mehrdeutigkeit von Abtastpaaren ist dafür verantwortlich, daß das digitale System bei höheren Frequenzen des Eingangssignals erst 'einschwingen' muß. Im Gegensatz zum analogen System stellt schon das simple Einschalten eines sinusförmigen Eingangssignals der Frequenz 20 kHz keinen kontinuierlichen Vorgang im Sinne des Shannon'schen Abtastheorems dar. Tatsächlich sind an derartigen Signalen (Tonbursts) für den Moment ihres Einschaltens höhere Frequenzen im Spektrum vorhanden als die der eigentlichen Signalfrequenz von 20 kHz. Wir erwarten demnach durch das Zuschneiden der analogen Bandbreite auf die digitale Bandbreite (Antialias-Filterung vor dem Sampling) die eigentliche nicht rekonstruierbare Veränderung des Signalverlaufs wenn die digitale Bandbreite -gegeben durch die Abtastfrequenz- zu klein ist. Bei Musik treten ständig neue Töne auf mit ganz willkürlicher Phasenlage zum Zeitpunkt der Abtastung. Dem Einschalten eines Tons entspricht z.B. das Anschlagen einer Taste auf dem Klavier. Während der Grundton (der die Tonhöhe selbst ausmacht) in einem Frequenzbereich liegt in dem ausschließlich im Sinne unserer Betrachtung eindeutige Abtastwerte vorkommen (deren Abtastpaare mit Schwingungen anderer Frequenz und Phasenlage nicht dupliziert werden können), gilt diese Aussage eben nicht notwendig auch für die höheren Harmonischen eines Klaviertons, die den charakteristischen Klang des Instruments ausmachen. Höhere Harmonische werden im Gegensatz zum Grundton längere Einschwingzeit in Gestalt einer Hüllkurve besitzen. Dadurch wird allerdings ihr Energiegehalt zu gering bewertet. Tatsächlich handelt es sich hier um eine Eigentümlichkeit der zeitdiskreten Abtastung, die mit der Betrachtung des Spektrums eingeschwungener Dauertöne nichts zu tun hat und die der Analogtechnik so völlig fremd ist. Zur Illustration zeigt das nebenstehende Bild die Abtastung eines sinusförmigen Eingangssignals der Frequenz FS/2-50 Hz. Bei einer Samplingfrequenz von 44.1 kHz entspricht das einer Eingangsfrequenz von 22 kHz. Zwar sie höher als die Spezifikation der CD, liegt jedoch innerhalb des vom Abtasttheorem ausdrücklich erlaubten Bereichs.
Selbst nach 40 Abtastungen (fast 1 ms) haben die Abtastwerte noch nicht 50% der Amplitude erreicht. Wir können auch nach der Rekonstruktion nicht nach zwei anfänglichen Abtastungen bereits die volle Amplitude des Eingangssignals erwarten. Die Einschwingzeit ist deutlich länger. Auch bei 20 kHz ist das noch so. Viele Harmonische haben zudem nur eine kurze Lebenszeit weil sich der Klang eines Instruments ständig ändert. Abschnitt 4: Abtasttheorem äquivalenter Slewrate In den vorangegangenen Abschnitten haben wir einiges über Signalqualität in Verbindung mit der zeitdiskreten Abtastung erfahren. Wichtige Punkte sind zusammengefaßt:Ein Ton entsteht aus der Stille. Signale die mit einer anderen Amplitude als 0 beginnen existieren in der Natur nicht. Ein einfaches Beispiel dafür ist die Funktion cos(x). Deshalb betrachten wir konsequent sin(x) und ändern die Phase wenn notwendig. Zwei Abtastpunkte die mehrdeutig sind stellen keine Repräsentation des Eingangssignals dar. Zeitdiskrete Abtastung erfordert die Ein-Eindeutigkeit (math.) zweier aufeinander folgender Samples. Wenn das klassische Abtasttheorem die Definition eines sinusförmigen Eingangssignals anhand zweier Abtastwerte verspricht, so erwarten wir logisch Gewißheit über den Signalverlauf. Da eine 20-kHz-Schwingung ihre zweite Abtastung erst spät hinter ihrem ersten Scheitelpunkt des Eingangssignals erhält, können wir prinzipiell erst nach Ansicht weiterer Abtastpunkte eine Aussage über den bereits vergangenen Signalverlauf machen. Würde dieser Sachverhalt einzig auf eine zeitliche Verschiebung zwischen Eingangs- und Ausgangssignal hinauslaufen wäre das nicht als problematisch anzusehen. Verzerrungen der Hüllkurve eines Signals sind zu vermeiden. Daher vergleichen wir die Anstiegsgeschwindigkeit im analogen System mit der des digitalen Systems. Ausgehend von der eingangs zitierten Fragestellung Shannon's nach der Zuordnung einer Abtastrate zu einer konkreten Anwendung zeitdiskreter Abtastung haben wir genügend Fakten für die Entwicklung einer Antwort. Die Anstiegsgeschwindigkeit (Slewrate) bildet den Schlüssel. Slewrate ist definert als delta Signal / delta Zeit, normiert auf 1µs. Im analogen System erhalten wir die Slewrate eines sinusförmigen Signals aus seiner Frequenz und Amplitude mit SR A = 2*o*upA*Fa.Im digitalen System gilt nach unseren Betrachtungen aus Abschnitt 1 für die Slewrate SR D = upD*Fs.Die aus dem digitalen System resultierende Ausgangsspannung soll den gleichen Betrag wie das Eingangssignal haben, d.h. die Verstärkung sei 1. Daraus folgt: u p = upA = upD Nun können wir beide Ausdrücke für die Slewrate gleichsetzen. SRA = SRD erbringt2* o*up*Fa = up*FsDie Signalspannung u p auf beiden Seiten der Gleichung läßt sich kürzen. Das bedeutet, Quantisierung ist (genau wie bei Shannon) eine gänzlich andere Fragestellung. Wir erhalten sofort das Abtasttheorem äquivalenter Slewrate: Fs >= 2* o*FaSetzen wir als obere Grenzfrequenz Fa = 20 kHz ein, erhalten wir für die Frequenz der Abtastung 125,7 kHz. Abschnitt 5: Eigenschaften der Übertragungsfunktionen Beginnen wir mit der Abtastrate der CompactDisc, die wir bei unseren Überlegungen zugrunde gelegt hatten. In der Grafik sind alle Ergebnisse aus den vorangegangenen Abschnitten eingetragen.
Durchgezogene Kurven sind die Übertragungsfunktionen Asin und Acos, punktierte Kurven sind Anstiegsgeschwindigkeiten (Slewrate). Zunächst die Slewrate einer analogen Sinusschwingung im hier betrachteten Frequenzbereich zwischen 1 kHz und 1 MHz. Sie steigt proportional der Frequenz an. Wie üblich ist für alle Signale die Frequenzachse logarithmisch geteilt, die Ordinate der Amplitude ist linear dargestellt, d.h. der Zuwachs der Slewrate des Analogsignals erscheint nicht linear. Für das analoge Eingangssignal bei 20 kHz beträgt die Slewrate 0,126 V/µs. In Abschnitt 1 hatten wir für zwei aufeinander folgende Abtastungen die maximale Änderungsrate des Abtastwerts einmal mit 0,88 V/µs und mit 0,44 V/µs ermittelt. Dann folgte die Ableitung der Übertragungsfunktionen Asin und Acos jeweils aus dem Flächenverhältnis von Abtastung und Kreis im Einheitskreis, welche hier ebenfalls eingezeichnet sind. Für die Übertragungsfunktionen ist in der Grafik 0,707 V als -3 dB-Grenze angegeben. Die Kurve Asin schneidet die Grenze bei 9,7 kHz, die Kurve Acos schneidet die Grenze bei 19,6 kHz. Der Fehler zu den in Abschnitt 1 über die Zeitkonstanten ermittelten Grenzfrequenzen fg1 und fg2 beträgt nur 0,1 dB. Asin und Acos sind hier anders als in Abschnitt 4 mit ihrem tatsächlichen Vorzeichenverlauf gezeigt. Wie bereits erwähnt, gibt nur die Funktion Asin einen Hinweis für das Auftreten spektraler Abtast-Komponenten im Bereich Fs/2...Fs. Aus dem Dämpfungsverlauf von Asin und Acos wurden die jeweils zugehörigen Anstiegsgeschwindigkeiten (Slewrate) berechnet und sind als punktierte Kurven gezeichnet. Deutlich erkennbar, das deren Maxima mit den erwarteten Maxima aus Abschnitt 1 übereinstimmen. Interessant ist jedenfalls, das die Maxima der Slewrates auch im Frequenzbereich der Abtastkomponenten oberhalb Fs nie überschritten werden, während die Pegel der dazugehörigen Übertragungsfunktionen für die Abtastkomponenten oberhalb Fs kontinuierlich kleiner werden. Nach geltender Physik ist das logisch. Ab etwa 7 kHz (Fs/6) werden die Abweichungen sowohl zwischen den Übertragungsfunktionen Asin und Acos als auch deren Slewrates >1 dB. In Abschnitt 2 hatten wir dies auf die Abhängigkeit der Phasenlage der Abtastung in Bezug auf das Eingangssignal zurückgeführt. Wenden wir nun das Abtasttheorem äquivalenter Slewrate an.
Die dazugehörige Grafik zeigt wiederum den Verlauf der Übertragungsfunktionen und deren Slewrates. Asin schneidet die Nulllinie bei Fs/2, Acos bei Fs (125,66 kHz). Wie erwartet haben sich die Maxima der Slewrate beider Funktionen vergrößert. Für die Funktion Asin entspricht das Maximum der Slewrate nun der eines sinusförmigen Eingangssignals der Frequenz 20 kHz, wie gefordert (0,126 V/µs). Das Maximum der Slewrate für die Funktion Acos liegt entsprechend höher bei 0,251 V/µs. Damit sind Verzerrungen der Hüllkurve (Einschwingfehler) für die analoge Bandbreite von 20 kHz weitestgehend vermieden. Im Anhang zeigen wir die Ergebnisse auch für eine Abtastrate von 96 kHz, dem derzeitigen Studiostandard für Aufzeichnungen im Format LPCM. Schlußendlich vergleichen wir das Abtastergebnis eines Eingangssignals der Frequenz 20 kHz im Zeitbereich, einmal mit der auf CD gespeicherten Abtastrate von 44,1 kHz und andererseits der Abtastrate des von uns entwickelten Abtasttheorems für äquivalente Slewrate von 125,66 kHz.
Die Abtastung mit Fs=44.1 kHz erlaubt keinen Rückschluß auf den Verlauf des Eingangssignals von 20 kHz zwischen aufeinander folgende Paare von Samples, z.B. Sample 0 und Sample 1. Hingegen bildet die Abtastung des gleichen Eingangssignals mit 125,66 kHz sowohl den Verlauf als auch die Steilheit des Signals deutlich ab. Damit ist auch der Forderung Genüge getan, das zwei Abtastwerte den zeitlichen Verlauf eines Eingangssignals beschreiben. Aufgrund der zufälligen Phasenlage der Abtastung in Bezug auf das Eingangssignal beträgt der Fehler noch etwa 1 dB gegenüber 17 dB bei Abtastung mit 44,1 kHz. Die Beschäftigung mit dem Abtasttheorem hat uns die Analogtechnik einmal lieber gemacht. Immerhin ist mit dem Standard der DVD-A mittlerweile ein zweikanaliges Audioformat auf dem Markt, das unseren Ansprüchen auf eine gute - der analogen Musikwiedergabe vergleichbare - Signalqualität sehr nahe kommt. Software Alle vollständigen Berechnungen können vom Autor gegen eine Gebühr von 10 Briefmarken a 1,44 (EUR 14,40) als Datei im Format MathCad 5 auf 3,5"-Diskette bezogen werden. Anhang
Übertragungsfunktion und Slewrate bei einer Abtastrate von 96 kHz, dem derzeitigen Studiostandard für die Aufzeichnung von Musik:
Vergleich der Abtastung von 20 kHz bei Abtastraten von 96 kHz und 192 kHz (DVD-A):
|
|