|
(Published Internet Name ON01-09.rtf / Copyright Manfred Baier, omtec hifi components, Giessen 1992) Digital Spezial Interessante Ergebnisse aus dem omtec-Labor Die Compact Disc (CD) begann ihren Siegeszug vor etwa 10 Jahren. Seither hat sie die Schallplatte zum Leidwesen vieler Musikfreunde fast völlig vom Globus verdrängt. Mittlerweile haben nahezu alle Entwickler von High End-Elektronik das digitale Medium akzeptiert und selbst CD-Player und/oder DA-Wandler herausgebracht. Das auch die digitale Schallspeicherung viele Verfahren zur Rückgewinnung der analogen Information aus dem Zahlenberg der CD zuläßt, beweist die Anzahl der bereits vorgestellten Geräte vom 'puristischen' CD-Player ohne jede Digital- und Analogfilterung bis hin zum 'Luxus' der x-bit/y-Oversampling-Klasse. Der CD-Standard Ausgehend vom menschlichen Hörvermögen wurden in einer Normenkommission das Format und die technischen Einzelheiten der CD festgelegt. Dabei wurde der Übertragungsbereich bis 20 kHz gewählt, weil höhere Frequenzen vom Ohr wahrscheinlich nicht wahrgenommen werden. Nachdem die Einigung auf eine Bandbreite von 20 kHz erfolgt war, mußten sich die Mitglieder der Kommission noch auf zwei Details einigen, die Besonderheiten digitaler Systeme darstellen. Die Geschwindigkeit, mit der die analogen Musik-Signale erfaßt werden und die Auflösung der Amplitude in Zahlenwerte. Dabei wurde sowohl wegen der damaligen technischen Möglichkeiten und dem erforderlichen Kostenaufwand das bis heute bestehende Format der CD gewählt. Die Geschwindigkeit, mit der das analoge Signal in Zahlen gewandelt wird, beträgt 22,7 us und entspricht einer Frequenz von 44,1 kHz. Der Zahlenbereich, in den das analoge Signal übersetzt werden könnte, entspricht 20 bit. Von diesen über eine Million Möglichkeiten, die Amplitude eines Signals als Zahl zu speichern werden beim CD-Verfahren bis heute jedoch nur 16 bit praktisch genutzt. Immerhin ist 16 bit noch ein Zahlenbereich von 0 bis 65535. Im nebenstehenden Diagramm ist ein sinusförmiges Signal mit einer Frequenz von 1 kHz gezeigt, das in Abständen von 22.7 Mikrosekunden entsprechend 44.1 kHz abgetastet wird und eine Gesamt-Amplitude von 2 Volt (-1..+1 Volt) besitzt. Der A/D-Wandler erzeugt von dieser Schwingung Abtastwerte in Zahlen, wobei die kleinste Änderung der Amplitude, die mit 16 bit erfaßt wird, ca. 30 MikroVolt beträgt. Das Abtast-Theorem Für die Festlegung der Abtastfrequenz mußten sich die Väter der CD an die im Abtast-Theorem beschriebenen minimalen Anforderungen halten, wenn die Abtastwerte das Original-Signal gut repräsentieren sollten. Dieses Abtast-Theorem wurde von Nyquist formuliert und besagt, das die Abtastung eines kontinuierlichen Signals mindestens mit der doppelten Frequenz des Signals erfolgen muß. Will man im digitalen System als höchste Frequenz 20 kHz übertragen, bedeutet diese Forderung eine Abtastfrequenz von mindestens 40 kHz und man muß dafür sorgen, daß der Analog-Digital-Wandler wirklich keine Frequenzen über 20 kHz mehr angeboten bekommt. Ansonsten wäre das Abtast-Theorem verletzt.Streng genommen ist das Abtast-Theorem von Nyquist in seiner minimalen Form wie bei der CD nur für stationäre Signale geeignet. Die Darstellung einer kontinuierlichen Schwingung geschieht bei der A/D-Wandlung durch eine Folge sog. Dirac-Impulse. Entgegen der Theorie können diese Impulse nicht mit verschwindender Dauer erzeugt werden. Es tritt eine Benachteiligung höherer Frequenzen auf, die als 'Gewichtung' berücksichtigt werden muß. Außerdem werden alle Transformationen vom Frequenz- in den Zeitbereich in der dazugehörigen Mathematik durch Summenformeln dargestellt, die ausnahmslos die Betrachtung einer großen Anzahl von Abtastvorgängen voraussetzen. Musik bedingt eine höhere Abtastfrequenz, weil die Dynamik in den übertragenen Frequenzbereich eingerechnet werden muß. Der Schlag auf eine Trommel besitzt in seiner Anfangsphase unendlich viele Harmonische. Um einen solchen Impuls annähernd exakt wiederzugeben ist eine wesentlich höhere Abtastfrequenz notwendig.
In Diagramm 6 ist dargestellt, wieviele Abtastwerte (Samples) zu einer Frequenz gehören. Bei 20 Hz sind es stolze 2205, bei 200 Hz nur noch 220 und bei 20 kHz gar nur noch 2.
Man muß bereits bei der Wandlung des kontinuierlichen analogen Originals in eine digital darstellbare Zahlenfolge dafür sorgen, das alle Frequenzen oberhalb 20 kHz ausgefiltert sind. Üblicherweise verwendet man hierzu Tiepassfilter, die meist in analoger Technik arbeiten. An das Tiefpassfilter werden sehr hohe Anforderungen gestellt. Idealerweise sollte es alle Frequenzen unterhalb 20 kHz voll durchlassen und oberhalb 20 kHz voll sperren. Diese Forderung ist so nicht realisierbar. Immerhin lassen sich Filter mit einer Filtersteilheit von über 100 dB/Oktave aufbauen, aber dann ist die Dämpfung des Filters oberhalb von 20 kHz eben nicht vollständig. Es sind immer noch Reste solcher Frequenzen vorhanden, die das Abtasttheorem verletzen. Um die Situation ein wenig zu entspannen, einigte man sich auf die Abtastfrequenz von 44.1 kHz. Theoretisch könnte man mit dieser Abtastfrequenz ein Sinussignal von knapp 22.05 kHz abtasten und es rekonstruieren. Aber wegen der Unmöglichkeit, das ideale Tiefpass-Filter zu bauen, nutzt man den Abstand zwischen 20 kHz und 22.05 kHz um die Tiefpassfilterung hier vorzunehmen. In der Praxis bedeutet das, ein Filter zu bauen, das alle Frequenzen unterhalb von 20 kHz ungehindert passieren läßt, und im Bereich von 20 kHz bis 22.05 kHz eine Dämpfung von wenigstens 90 dB erreicht. Dafür ist die Konstruktion eines extremen Analog-Filters notwendig. Musik als Schwingung Jedes Geräusch ist die Summe von sinusförmigen Einzelschwingungen. Interessant ist die Tatsache, daß jede beliebige Kurvenform aus sinusförmigen Einzelschwingungen besteht und daher herstellbar ist. Grundsätzlich kann jede in der Musik nur kurzzeitig bestehende
Abtastwerte darstellen. In beiden Beispielen werden die Maxima der Schwingung kaum abgetastet. Ein anderer Verlauf der Originalschwingung hätte faktisch beliebig ähnlich aussehen können und dennoch die gleichen Abtastwerte ergeben. An manchen Stellen wird der originale Verlauf sogar gänzlich ignoriert.In den Diagrammen 4 und 5 haben wir zwei Beispiele ausgearbeitet, aus denen die fortschreitende Summierung der Grundschwingung mit Schwingungen 2-, 3- usw. bis 10-facher Frequenz einen guten Eindruck vermittelt. In Diagramm 4 ergibt sich eine sogenannte
Sägezahn-Schwingung, in Diagramm 5 eine der musikalischen Realität schon recht nahe kommende Schwingungsform. Wie gesagt, erhält man diese Schwingungsformen dadurch, das die Harmonischen der Grundfrequenz von 2 kHz bis zum 10-fachen (20 kHz) übertragen werden. Gegenüber einem 'richtigen' Sägezahn erkennt man leicht die mangelnde Anstiegsgeschwindigkeit, die Verrundung der Umkehrpunkte und das die Flanken nicht wie mit dem Lineal gezogen sondern wellig sind. Welligkeit ist immer ein Indiz für fehlende Obertonfrequenzen. Diese Dinge sind wichtig für das Verständnis dessen, was bei der analogen und digitalen Weiterverarbeitung geschieht. Läßt man nämlich nur eine der hier verwendeten Einzelschwingungen bei der Summenbildung weg, ergibt sich eine andere Kurvenform.
Akustisch ist dies gleichbedeutend mit einer Änderung der Klangfarbe. In den Beispielen wird auch deutlich, wie klein die notwendige Amplitude jeweils der höchsten Frequenz wird. Da jedoch auch diese kleinen Schwingungen das ihrige zur endgültigen Kurvenform, und damit der Klangfarbe, beitragen, dürfen sie nicht ignoriert werden. Man hat sich bei omtec die Mathematik dazu überlegt. Einfach ausgedrückt bedeutet es folgendes: Laut Definition ist der Effektivwert einer Sinusschwingung diejenige Spannung, welche die gleiche Leistung vollbringt wie eine Gleichspannung desselben Werts. Der Effektivwert wird aus dem Spitzenwert der Spannung berechnet. Wird eine Sinusschwingung in gleichen Zeit-Intervallen abgetastet wie bei der A/D-Wandlung, wird ihr Effektivwert zu höheren Frequenzen hin stets kleiner abgebildet als es der Wirklichkeit entspricht. Damit haben wir das Paradoxon eines linear darstellbaren Frequenzgangs bei gleichzeitig zu höheren Frequenzen hin abnehmender Power. Anders ausgedrückt: Je weniger Abtastpunkte die Spannungsmaxima einer Schwingung ermitteln, umso größer der Power-Fehler. Dabei handelt es sich um echte dynamische Fehler und nicht etwa um eine mathematische Spielerei. Während zu höheren Frequenzen die spektrale Dichte größer wird, nimmt die Anzahl der Abtastwerte ab. Ein weiteres Problem stellt die Notwendigkeit dar, das analoge Musik-Signal bereits vor der A/D-Wandlung in seiner Bandbreite auf 20 kHz zu begrenzen. Obwohl es zu weit führt, hier den Beweis dafür anzugehen, liegt die Vermutung nahe, daß durch diese Begrenzung ein weiterer Amplitudenfehler auftritt. Einfach deshalb, weil die maximale Anstiegsgeschwindigkeit des Musik-Signals auf einen Wert innerhalb des digitalen Übertragungsbereichs begrenzt wird. Es sind jedoch beliebig viele Schwingungsformen mit der unterschiedlichsten Beteiligung der oben erwähnten Einzelschwingungen denkbar, welche die Anstiegsgeschwindigkeit einer 20 kHz-Schwingung bei Vollaussteuerung im digitalen System erreichen können. Ihre aktuelle Amplitude spielt dabei keine Rolle mehr. Im digitalen System gibt es keine Kleinsignalbandbreite. Als Beispiel sei angeführt ein A/D-Wandler, dem eine Frequenz von 20 kHz mit Vollaussteuerung zugeführt wird. Nehmen wir als maximale Eingangsspannung für den A/D-Wandler einmal großzügig 10 Volt an, dann beträgt die größte Anstiegsgeschwindigkeit des Signals 0,6 Volt/Mikrosekunde, ein Wert den man analog leicht zu Fuß erreicht, im digitalen System jedoch die absolute Obergrenze darstellt, soll das Abtast-Theorem nicht verletzt werden. Ein weiteres Indiz ist das Spektrum der zu einem Ton gehörenden Obertöne selbst. Es handelt sich letztlich um ein Leistungsspektrum. Werden Spektralanteile durch Filterung entfernt, wird gleichsam deren Leistungsanteil mit entfernt. Mit steigender Frequenz wächst dieser Fehler an. Interpolieren Mathematik ist eine Wissenschaft für sich. Alle Berechnungen in der Digitaltechnik sind aufwendig und, was noch schlimmer ist, unansehnlich. Die notwendigen Transformationen vom Frequenz- in den Zeitbereich mittels Laplace gehören nicht gerade zum kleinen Einmaleins dieser Disziplin.Geradezu erleichternd ist da die lineare Interpolation, die beim Oversampling die Lücken zwischen zwei Abtastwerten durch eine zusätzliche Anzahl von Punkten miteinander verbindet. In den Broschüren der CD-Industrie geht die bildliche Darstellung des Oversampling immer haarscharf an der Linearität vorbei. Will heißen, die durch Oversampling entstehenden Punkte werden gerade so zwischen zwei Abtastwerte gezeichnet, das man den Eindruck einer Rundung oder Näherung an das Original-Signal haben muß. Dem ist aber nicht so. Die zwischen zwei Abtastwerten liegende Information ist keine Information unter der Bedingung des Abtasttheorems und unwiederbringlich verloren. Demgemäß kann Oversampling nicht dazu dienen, 'näher' an das Original-Signal zu kommen. Informationstheoretisch muß man sagen, die durch 'Oversampling gewonnenen Abtastpunkte' sind redundant, haben keinen Informationsgehalt. Man kann diese Abtastpunkte getrost mit irgendwelchen Pseudo-Abtastpunkten füllen ohne einen statistischen Fehler zu begehen. Die meisten D/A-Wandler arbeiten mit linearer Interpolation. Es gibt jedoch D/A-Wandler mit anschließender Spline-Interpolation. Sie versuchen die Abtastpunkte nach einer mathematischen Funktion miteinander zu verbinden. Auch hierdurch kann der Informationsgehalt nicht vergrößert werden, noch kann man sich so an das 'Original' heranschleichen. Die Abweichungen von der Abweichung sind viel zu unterschiedlich, als das sie durch eine einfache lineare oder Spline-Interpolation rückgängig gemacht werden könnten. Der Grund hierfür ist in den Diagrammen 2 und 3 nachzusehen. Im Beispiel sind es kleine sinusförmige Halbwellen, die im Signal enthalten sind und durch die Abtastung fallen. Tatsächlich könnte der wirkliche Verlauf auch die direkte Verbindung der Abtastpunkte gewesen sein. Eine Spline-Interpolation würde immer eine Schwingungsform ergänzen, auch wenn im Original keine war. Der Algorithmus ist zu primitiv, als das er die Realität erfassen könnte. Es ist bemerkenswert, daß jedwede Interpolation durch gegebene Abtastpunkte immer ein und die selbe Ausgangsschwingung ergibt , obwohl das Originalsignal, aus dem die Abtastpunkte gewonnen wurden, unendlich viele verschiedene Formen gehabt haben kann. Der Sinn des Oversampling besteht einzig darin, den Abstand des gesampelten Datenstroms zum Übertragungsbereich zu vergrößern. Beim vierfachen Oversampling wird aus den ursprünglich 44.1 kHz die neue Datenfrequenz von 176.4 kHz. Das 16-fache Oversampling führt zu 705.6 kHz Datenfrequenz. Dadurch werden die Anforderungen an das anschließende Analog-Filter zum Ausfiltern der Quantisierungsreste geringer. Digital-Filter Im Zeitbereich machen Digitalfilter mit den Zahlenwerten der digitalisierten und gefilterten Original-Signale das gleiche wie ein Analogfilter im Frequenzbereich. Die Eigenschaften sind hier wie dort durch Koeffizienten bestimmt. Es ist falsch, anzunehmen, Digitalfilter seien irgendwie besser. Ihr einziger Vorteil ist der Aufbau ohne diskrete Bauteile. Im Digitalfilter werden wieder die Frequenzen oberhalb 20 kHz gedämpft, diesmal bei der Wiedergabe. Keineswegs kann darauf verzichtet werden, denn durch Lesefehler der Laseroptik, mangelnde Qualität der CD, Schmutz oder Spiegelungen könnten Daten ins System gelangen, deren Werte das Abtasttheorem verletzen weil sie Frequenzanteile oberhalb 20 kHz repräsentieren. Das Abtasttheorem besitzt jedoch für die Wiedergabeseite die gleiche Relevanz wie für die Aufnahmeseite. Frequenzen oberhalb 20 kHz würden im Digitalfilter/Oversamplingbereich zu unerwünschten Alias-(Spiegel-)frequenzen führen, die das Klangbild erheblich beeinträchtigen. Fehlerkorrektur Während bei der Schallplatte Kratzer und in der Rille eingeschlossene Partikel für Knackser bei der Wiedergabe sorgen und ständig daran erinnern, sorgfältig mit der Platte umzugehen, bleiben die gleichen Störungen bei der CD bis zu einer gewissen Länge unhörbar, weil die Lücken durch Interpolation gefüllt werden. Der Begriff Fehlerkorrektur ist richtig und falsch zugleich. Richtig ist er deshalb, weil das Korrektursystem bei verloren gegangener Synchronisation durch Lesefehler diese Synchronisation wieder herstellt. Falsch ist dagegen, anzunehmen, die Fehlerkorrektur könne Lesefehler der Daten korrigieren. Hier ist der Begriff äußerst irreführend und suggeriert eine Zuverlässigkeit, die nicht vorhanden ist. Klirrfaktor Der CD-Standard krankt an zwei Stellen. Einmal werden durch die steilflankige Filterung aller Frequenzen oberhalb 20 kHz zum Musiksignal gehörende Obertöne nicht übertragen. Eine Verringerung des Obertongehalts ist gleichbedeutend mit einer Änderung der Klangfarbe und der Verkleinerung des Leistungsspektrums oder Power, wie es bei omtec kurz genannt wird. Zweitens wird die Auflösung in Amplitudenwerte bei kleinen Amplituden recht grob. Der Punkt, an dem nur noch ein bis zwanzig Amplitudenwerte die ursprüngliche Signalform repräsentieren sollen ist schnell erreicht.Nimmt man diese beiden Eigenschaften digitaler Systeme zusammen, ergeben sich wiederum zwei bemerkenswerte Auswirkungen auf reale Musik. Das zu einem rechteckförmigen Signal gehörende Obertonspektrum setzt sich nur aus Cosinus-Schwingungen ungerader Vielfacher des Grundtons zusammen, welche mit höherer Ordnung in ihrer Amplitude abnehmen. Nehmen wir als Beispiel eine Rechteckschwingung mit einer Frequenz von 100 Hz. Diese Frequenz ist musikalisch ein Basston, der digital durch 441 Abtastpunkte zeitlich beschrieben wird. Zu ihm gehören im Frequenzbereich bis 20 kHz einhundert Obertöne. Abgesehen davon, daß eine solche Schwingung keine ideale Rechteckform besitzt, führt die Abnahme der zu den Obertönen gehörenden Amplituden dazu, daß wegen der begrenzten 16-bit-Auflösung bei höheren Obertönen keine Amplitudenwerte mehr ermittelt werden. Krass wird dieser zusätzliche Fehler, wenn man den für Musik typischen Aussteuerbereich von -50 bis -6 dB betrachtet. Hier wird die Grenze für die analogen Abtastwerte bereits sehr früh erreicht. Wenn wir einmal so tun, als wäre die Abtastfrequenz 50mal höher bei gleicher Frequenz-Obergrenze von 20 kHz, und zählen die Anzahl der Amplituden von Obertönen, die durch das Abtastwerte-Sieb fallen, so ist ihre Anzahl in diesem Zeitbereich weit größer als die Anzahl der durch die reale Abtastung übertragenen Amplituden. Dieser Vorgang ist typisch nur für digitale Systeme. Werden die Ergebnisse vom Computer grafisch dargestellt, kann auch der Laie sofort die Problematik erkennen. Ein solches Verhalten digitaler Systeme bei Musiksignalen bedeutet nichts anderes, als das sich der Klirrfaktor des Systems in jedem Augenblick ändert. Der Klirrfaktor ist bei großen Lautstärken durchschnittlich klein, vergrößert sich aber zusehends bei geringen Lautstärken. Um dem teilweise akustisch entgegenzuwirken, ist es wiederum notwendig, den digitalen Musik-Daten zusätzliches digitales Rauschen hinzuzufügen, um den Effekt zu kaschieren. Zweitens wird hieran deutlich, daß der nutzbare Dynamikbereich der CD nicht größer sein wird als bei der Schallplatte, will man Obertöne einigermaßen 'originalgetreu' übertragen und den Klirrfaktor nicht auf Werte anwachsen lassen, die nicht mehr überhörbar sind. Übrigens ist es interessant, daß bei hohen Sinus-Tönen ab 5 kHz der Klirrfaktor wieder geringer wird, weil einfach die den Klirrgrad ausmachenden Harmonischen ab 20 kHz ausgefiltert sind. Dadurch werden alle Kurvenformen oberhalb 5 kHz faktisch zur eindimensionalen, langweiligen Sinusform degradiert. Die ist auch der Grund, weshalb alle Glöckchen, Triangeln und Becken ewig gleich klingen: Klang-farblos. Wasser im System Neben der 'originalgetreuen' Wiedergabe sollen die großen Vorzüge digitaler Musikspeicherung im geringen Rauschen und einer enormen Dynamik liegen. Betrachten wir zunächst das Rauschen.Wichtigste Kenngröße im analogen und digitalen System ist das Signal/Rauschverhältnis (S/N, Signal/Noise-Ratio). Man bezeichnet damit das Verhältnis der größtmöglichen Ausgangsspannung zur Rauschspannung ohne Eingangssignal. Das Rauschen bildet sozusagen die Grenze, unterhalb derer Musik-Signale unhörbar werden. Die Messung von S/N im analogen System ist einfach, weil der Begriff des Rauschens seit langem bekannt und gut definiert ist. Anders im digitalen System. Hier reklamieren die Hersteller der CD ein S/N von 96 dB und machen folgende Rechnung auf: Die größtmögliche Amplitude bei 16 bit entspricht 65536 Abtastwerten. Die kleinstmögliche Informationseinheit ist 1. Berechnet man aus diesen Zahlen das S/N und drückt es in dB aus, entsteht der Ausdruck S/N (dB) = 20 * log (65536/1) = 96.3 dB. Diese Rechnung ist absolut korrekt. Allerdings werden hier die tatsächlichen Verhältnisse nicht berücksichtigt. In der Analogtechnik wird nämlich nie wie hier mit den Spitze-Spitze-Werten für die ins Verhältnis zu setzenden Spannungen gerechnet, sondern mit Effektivwerten. Der Effektivwert einer sinusförmigen Spannung ist der Wert, der an einen Verbraucher die gleiche Leistung abgeben würde wie eine Gleichsspannung gleicher Voltzahl. Sofort sieht die Rechnung völlig anders aus. Der Effektivwert eines aus 16 bit gebildeten Sinus-Signals wird lediglich durch 23170 Abtastwerte repräsentiert. Hinzu kommt, das aus der kleinsten Informationseinheit von 1 kein Effektivwert gebildet werden kann. Die kleinste Informationseinheit wäre nicht die Kleinste, wäre sie leistungsgerecht teilbar. Berechnet man großzügig die notwendige Anzahl von Abtastwerten die einen Effektivwert von Samples erahnen lassen, erhält man mindestens 3 (2 mal Wurzel 2 = 2.82). Werden die neuen Zahlen in die Formel eingesetzt, ergibt sich S/N (dB) = 20 * log (23170/3) = 77.7 dB für den effektiven Signal/Rauschabstand eines 16 bit-Systems, wenn man den frequenzabhängigen Klirrfaktor von etlichen Prozent einmal übersieht. Dies stimmt auch besser mit der dynamischen Wirklichkeit überein. Wenn der Meßwert im Test wirklich einen höheren S/N ergibt, so liegt es daran, das beim Digitalverfahren das Rauschen zu hohen Frequenzen verschoben, gefiltert und vom Meßgerät nicht erfaßt wird. Hier kommt das Quantisierungsrauschen ins Spiel. Alle Definitionen der Schnittstellen AD und DA beinhalten eine Unsicherheit der Entscheidung, ob der tatsächliche Zahlenwert der Amplitude 1 oder vielleicht 2 beträgt. Wie weiter oben ausgeführt wurde, betrug im Beispiel die kleinste Spannung, die zu einer Änderung des Abtastwerts führt, 30 Mikrovolt oder +/- 15 Mikrovolt. Liegt der wirkliche Augenblickswert des Signals zum Zeitpunkt der Abtastung nämlich diese +/- 15 Mikrovolt zwischen zwei gültigen Abtastwerten, dann entscheidet der A/D- oder D/A-Wandler ad libitum. Genau dieser Tatsache verdanken wir die 18 bit-Wandlersysteme in dem Bemühen um höhere Genauigkeit. Die kleinste Informationseinheit der Abtastwerte (ein einzelner Quantisierungsschritt) besitzt also überhaupt keinen Wert, weil aus ihr allein keine Schwingung oder Kurvenform rekonstruiert werden kann. Es gibt einen weiteren Anhaltspunkt für die Richtigkeit dieser Sichtweise, der im folgenden Abschnitt behandelt wird. Musik ist Dynamik Normalerweise wird das S/N-Verhältnis gleichgesetzt mit der Dynamik des gesamten Systems. Das stimmt schon bei Analog nicht immer, ist bei der digitalen Musikübertragung jedoch völlig falsch. Es berücksichtigt nämlich nicht die schon oben beschriebene Tatsache, das sich Musik aus Einzelschwingungen zusammensetzt. Da bei realer Musik viele Instrumente zum Klanggeschehen beitragen summieren sich faktisch unendlich viele sinusförmige Schwingungen letztendlich zum Klang.Dabei stellt die Ausfilterung oberhalb 20 kHz und der bei der A/D-Wandlung entstehende Power-Fehler für Einschwingvorgänge eine unüberwindliche Hürde dar, solange die Abtastfrequenz geringfügig über der Bandbreite des Systems liegt. Damit noch nicht genug. Wie in den Diagrammen zu sehen ist, nimmt die Amplitude jeder Einzelschwingung die zu einer Gesamtschwingung gehört zu höheren Frequenzen stark ab. Ein definiertes Signal, welches eine der Musik am nächsten kommende repräsentative Verteilung von Frequenzen darstellt, ist das rosa Rauschen. Beim rosa Rauschen ist die Leistung in jedem eine Oktave breiten Band konstant. Dies entspricht einem Abfall der Amplitude der beteiligten Frequenzen von -10 dB/Dekade. Betrachtet man das gesamte Übertragungsspektrum zwischen 20 Hertz und 20 kHz (3 Dekaden), so ist die Amplitude der im rosa Rauschen enthaltenen 20 kHz-Anteile um -30 dB gegenüber 20 Hz gefallen. Was das bedeutet erkennen wir in Diagramm 7 und der zugehörigen Tabelle. Man sieht, wie die Amplituden bei jeder Aussteuerung durch eine geringer werdende Anzahl von Amplitudenwerten repräsentiert werden. Zwischen 0 dB und -6 dB sind es bei 20 kHz 1036 Abtastwerte, zwischen -50 und -56,8 dB, Differenz ebenfalls -6 dB, sind es nur 14 Amplitudenwerte.
Pegel 20 Hz 20 kHz Tabelle 0,0 dB 65535 2072 Anzahl der maximal -6,0 dB 32767 1037 verfügbaren Stufen -20,0 dB 6553 207 für die Quantisierung -40,0 dB 655 21 abhängig vom Pegel -50,0 dB 207 6 der Aussteuerung -56,8 dB 95 3 Amplitudencharakter- -60,0 dB 65 2 istik “Rosa Rauschen” -70,0 dB 21 0 mit -10 dB/Dekade -77,7 dB 9 0 20 Hz 0 dB -80,0 dB 6 0 20 kHz -30 dB
Ein rosa Rauschsignal würde bei 20 Hertz und Vollaussteuerung von 65535 Amplitudenwerten repräsentiert. Bei 20 kHz sinkt die Amplitude um -30 dB wie erwähnt und dazu gehören 2072 Amplitudenwerte. Nun bleibt Musik eben wegen ihrer dynamischen Struktur nicht ständig bei Vollaussteuerung, diese wird vielmehr nur in kurzen Momenten bei Spitzen erreicht. Die Hauptinformation der Musik spielt sich in einem Bereich von -50 bis --6 dB der Aussteuerung ab (ppp bis fff). In der Tabelle ist die Anzahl der Amplitudenwerte für 20 Hz und 20 kHz bei diversen Aussteuerungen eingetragen. Die Dynamik-Einschränkung beginnt dort, wo nur noch kleine Amplitudenwerte bei 20 kHz erreicht werden und das ist schon bei -50 dB Aussteuerung der Fall. Darunter kann aus den Amplitudenwerten nicht mehr annähernd die ursprüngliche Kurvenform des Musik-Signals hergestellt werden!In der Tabelle fallen zwei krumme Werte auf. Die -77.7 dB aus dem Abschnitt über die Dynamik im digitalen System wurde von omtec neu bestimmt. Man sieht, daß bei 20 kHz keine Amplitudenwerte mehr exisistieren und der vom A/D-Wandler bei 20 Hertz ermittelte Zahlenwert läge zwischen 8 und 9. Interessant ist die Frequenz, bei der für die Aussteuerung von -77.7 dB noch immerhin die in unserer S/N-Rechnung angeführten drei Amplitudenwerte zur Ermittlung eines Effektivwerts der Ausgangsspannung liegen. Sie beträgt 162 Hertz, mitten im musikalischen Grundtonbereich. Da in der Tabelle die Anzahl der Amplitudenwerte Spitze-Spitze-Werte der zugehörigen analogen Schwingung repräsentieren, haben wir eigentlich sämtliche Berechnungen so ausgeführt, als wäre das objektive S/N-Verhältnis tatsächlich 96 dB. Daher wurde zusätzlich ermittelt, bei welcher Aussteuerung die Anzahl der Amplitudenwerte bei 20 kHz exakt drei Amplitudenwerte liefert um daraus in etwa den Effektivwert zu bekommen: es sind genau -56.8 dB. Hier wird ein zweites Paradoxon der Digitaltechnik deutlich: Der Dynamikbereich ist deutlich kleiner als das Signal/Rausch-Verhältnis, gleichgültig, ob man der 'offiziellen' oder unserer Art der Berechnung folgt. Das Zahlenmaterial spricht für sich.
D/A-Wandler Die in diskreten Zahlen vorliegende Information muß an irgendeiner Stelle wieder in die analoge Form gebracht werden. In der Regel geschieht dies heute noch entweder direkt im CD-Spieler oder in einem nachgeschalteten D/A-Wandler. Die Wandlung kann auch im Vorverstärker oder der Endstufe erfolgen, allerdings sind die Verhältnisse dort sehr viel schwieriger zu handhaben. Jeder kennt die Problematik verschieden klingender Kabel im Analog-Hifi. Die DD-Schnittstellen digitaler CD-Player, Vorverstärker und Endverstärker sind genau denselben analogen Gesetzen unterworfen. Auch hier werden unterschiedliche Kabel gänzlich unterschiedlich klingen. Die 'Objektivität der Zahlendarstellung' von Musik wird hier zur Farce. Optische Verfahren zu Konsumer-Preisen bieten keine gute Langzeitstabilität.Zur D/A-Wandlung gibt es verschiedene Verfahren. Ob 18 bit oder 1 bit, jedenfalls müßten die 65536 möglichen Abtastwerte linear in Spannungsschritte umgesetzt werden. Der Fehler beträgt wieder +/- 1/2 bit Unsicherheit. Die größere Schwierigkeit besteht in der Linearität der Umsetzung. Für die Multi-Bit Verfahren werden technologisch aufwendige Prozeduren benötigt um die Linearität individuell bei jedem Wandler-Chip abzugleichen. Sogenannte Flash-Wandler besitzen die kürzeste Einschwingzeit gegenüber allen anderen Verfahren. Vom Prinzip her arbeitet der 1-Bit-Wandler völlig anders. Dieses Prinzip stellt die analoge Ausgangsspannung nicht direkt her, sonder setzt sie wieder aus einer Anzahl von diskreten Impulsen zusammen. Der Vorteil ist die hohe Frequenz von etwa 11 MHz, mit der die analoge Größe hergestellt wird.
In Diagramm 8 wird das 16-Bit-System der CD mit 44.1 kHz Abtastfrequenz in andere Bit-Systeme grafisch transformiert. Man erkennt, das bei einem 1-Bit-System eigentlich eine Abtastfrequenz von mehr als 1.4 Gigahertz (10 hoch 9) erforderlich wäre. Zugrundegelegt ist dabei ein Zweier-Komplement-Verfahren beim D/A-Wandler. Würde man einen Ein-Komplement-Wandlersystem verwenden, käme sogar eine Taktfrequenz von 2.8 Gigahertz in Anwendung (Diagramm 8). Das sind phantastische Frequenzen, an die bei heutiger Digital-Technik nicht zu denken ist. Das Beispiel zeigt aber auch deutlich, das es sich beim gegenwärtigen 1-Bit-Wandler nicht um ein echtes 1-Bit-System handeln kann. Auch hier ist leider ein irreführender Begriff eingeführt worden. Bemerkenswert ist jedoch, daß der Graph in dem Diagramm 8 bei 11.3 MHz genau die 8-Bit Linie schneidet. Sobald hierzu eigene Untersuchungen vorliegen, wird darüber zu berichten sein. Gleichgültig, welches Verfahren bei der D/A-Wandlung verwendet wird, die 'Originaltreue' bezieht sich immer auf die durch Filterung und Abtastung eingeschränkten musikalischen Daten. Analog-Filter Durch die Taktung des Signalflusses im Digitalteil und die diskreten Spannungsschritte bei der D/A-Wandlung treten Störsignale auf, die man als Rauschen und Quantisierungsrauschen bezeichnet. Die Frequenzen, aus denen sich das digitale Rauschen zusammensetzt sind allerdings nicht wie beim analogen rosa Rauschen schön gleichmäßig verteilt oder auch nur vertreten. Quantisierungsrauschen besteht aus Frequenzanteilen mit ekligem Verlauf des Spektrums. Genau so hört es sich auch an. Daher ist man relativ früh schon dazu übergegangen, dem Digitalsystem ein breitbandiges Rauschsignal hinzuzufügen, das in seiner Zusammensetzung dem rosa Rauschen beim analogen Hifi ähnlich ist und das Quantisierungsgeräusch überdeckt (Dither). Dabei muß das S/N-Verhältnis nicht notwendigerweise schlechter werden, da man das Quantisierungsgeräusch im Dither-Signal unterbringen kann und alles innerhalb des Digital-Filters wieder mit den Abtastwerten verrechnet wird. Dies ist ein kompliziert beschreibbarer Vorgang. Auch an dieser Stelle wird deutlich, wie sehr man immer wieder auf 'analoge' Verhältnisse zurückkehrt, um im Digitalsystem bessere Wiedergabe zu erreichen.Je höher die durch Oversampling gewonnene Datenrate, desto leichter fällt die anschließende analoge Filterung der Störsignale. Der Effekt, der beim Oversampling auftritt ist nämlich derart, daß das Rauschen zu hohen und höchsten Frequenzen hin verschoben wird. Gleichzeitig tritt dabei ein weiteres Paradoxon der Digitaltechnik auf: Normalerweise sinkt die Rausch-Amplitude in analogen Systemen mit steigender Frequenz. Als Beispiel hatten wir rosa Rauschen erwähnt, bei dem die beteiligten Rauschspannungen mit -10 dB/Dekade kleiner werden. Im Digitalsystem jedoch steigt die Rauschamplitude mit der Frequenz an. Die Steilheit dieses Anstiegs ist abhängig vom Verfahren und stellt jedenfalls eine unschöne Eigenart dar, der konstruktiv begegnet werden muß. Zum Schluß haben wir die Rechteckwiedergabe eines CD-Spielers bei diversen Frequenzen simuliert. In den Diagrammen 9 bis 13 sind sie abgebildet. Man erkennt die deutlich gröbere Welligkeit und Kurvenform mit steigender Frequenz. Das 5 kHz-Rechteck ist in manchen Tests abgebildet und kann mit der Realität verglichen werden. Bei 6,70 kHz wird bereits kein Oberton mehr übertragen wird und daher ein Sinussignal ausgegeben.
Zusammenfassung Die digitale Musikübertragung im CD-Format stellt ein Verfahren dar, das mit gewissen Stärken und Schwächen verbunden ist. Die Stärken sind sicherlich ein kleineres Format der CD, die Fernbedienbarkeit und, mit Einschränkungen, die Störfreiheit.Was die Musikalität digitaler Systeme angeht, muß man starke Einschränkungen machen, weil bestimmte dynamische Fehler schon bei der Aufnahme entstehen, sich im System mit neuen Fehlern überlagern und letztlich nicht korrigierbar sind. Dabei stellt das digitale Datenformat der CD die absolute Untergrenze tolerierbarer Musikübertragung dar. Eine Verbesserung des Standards ist notwendig. - Der nutzbare Frequenzbereich der CD ist kleiner als bei der Schallplatte. - Der nutzbare Dynamikbereich der CD ist nicht besser als bei der Schallplatte. - Impuls- und Rechteckwiedergabe sind deutlich schlechter als bei der Schallplatte. - Der Einfluß 'analoger' Größen wie Zeit, Wandler-Unsicherheit, Rauschen, Dynamik, Kurvenform, Schnittstellen, Abtastung usw. stellt vor schwere Probleme. Es gibt keine Lösung, welche die ursprüngliche Information wieder zurückbringt. - Der technische Aufwand ist gegenüber der Analog-Technik riesig und kennzeichnet ein schlechtes Aufwand/Nutzen-Verhältnis. Daran ändert auch der hohe Grad der Integration aller Funktionen auf einem Chip nichts. Er dient lediglich der preiswerten Massenfertigung. Für die Realisierung ist mehr Ingenieur-Power notwendig ohne klanglichen Fortschritt. Die Zuverlässigkeit des CD-Verfahrens ist weder bei der Aufnahme noch bei der Wiedergabe höher als bei Analog. Es sind jedoch mehr Verfahren zur Kaschierung von Fehlern möglich. - Der Aufwand wird dadurch vergrößert, daß man die vielen kleinen analogen Schwächen digitaler Bausteine von der Signalübergabe und -verarbeitung bis hin zur Stromversorgung durch weitere analoge Techniken maskieren muß. Die Digitaltechnik ist ein durchaus spannendes und interessantes Gebiet, zu dem sich noch eine Menge beitragen ließe. Die hier vorgestellten Ergebnisse stellen einen Ausschnitt aus unserer Arbeit über das CD-Verfahren dar. Obwohl omtec noch kein Digital-Audio-Gerät gebaut hat, haben diese Ergebnisse und deren wirklichkeitsnahe Simulation eine wichtige Funktion bei Planung und Entwurf eines solchen Geräts im Bereich Grundlagen-Erforschung. Den meisten Entwicklern von Digital-Audio dürften sie, zumindest großenteils, neu sein, weil entsprechende Informationen weder aus der Literatur bekannt sind noch von der Industrie preisgegeben werden und in den meisten Firmen für solche aufwendigen Arbeiten keine Zeit vorhanden ist. Um wirklich zu einer originalnäheren Musikwiedergabe zu kommen, scheint eine Erhöhung der Abtastfrequenz um das Vierfache unbedingt notwendig, wobei ein 20-Bit-Format wünschenswert bleibt. |