|
(Published Internet-Name DT01001 / Copyright Manfred Baier omtec hifi components, Giessen 2005)
“Grundsätzlich kann ... Mathematik nichts anderes bieten als gewöhnliches Denken auch, und wo letzteres genügt - was sehr oft der Fall ist - ist der >mathematische Beweis< überflüssige Rechenübung.” (Lenard, 1936/37)
Nyquist und Shannon: Die Theorie digitaler Kodierung Historisch ist die Geschichte der Entwicklung des Abtasttheorems durchaus spannend. Nach der Erfindung von Telegrafie und Telefonie wurden besonders in den beiden Weltkriegen Anstrengungen zur Abhörsicherheit militärischer Kommunikation gemacht. Kodierung und Dekodierung wurden zum Gegenstand der Forschung. Zwischen den Kriegen bestand die Motivation in einer effizienteren Nutzung von Telefonleitungen und ihrer Bandbreite. Bei der Entwicklung des Abtasttheorems ging es zunächst nicht um die Digitalisierung, Speicherung und Wiedergabe von Musik. Das hätte die damaligen technischen Möglichkeiten auch bei weitem überschritten. Vielmehr ging es um Anwendungen in der Telefonie und Informationsübermittlung.
Grundlegende Überlegungen stellte Karl Küpfmüller an. In seiner Arbeit "Über Einschwingvorgänge in Wellenfiltern" [1928] stellte er erstmals eine Beziehung zwischen Einschwingzeit und verfügbarer Bandbreite her, die später als "Küpfmüllers Zeitgesetz" bekannt wurde. Darin stellt er die auf Beobachtung beruhende Forderung auf, die Bandbreite eines (analogen) Systems müsse etwa das 6-fache des Nutzbandes sein um Fehler bei Einschwingvorgängen zu vermeiden. Mit dieser Betrachtung stellte sich Küpfmüller gegen Nyquist’s Idee von der doppelten Abtastrate. Als Konsequenz des daraufhin folgenden internationalen Streits verließ er Deutschland um erst Jahre später nach Leipzig zurückzukehren.
Im Jahre 1928 veröffentlichte auch der Mathematiker Harry Nyquist seine Arbeit "Certain Topics in Telegraph Transmission Theory", in der er eine vage Vorstellung vom Zusammenhang zwischen der Übermittlungsgeschwindigkeit von "Zeichen" und der verfügbaren Bandbreite entwickelt. Er gab an, zwei Abtastpunkte einer Sinusschwingung reichten um diese wieder zu rekonstruieren und formulierte die berühmt gewordene Formel Fa >= 2 * Fs, allerdings - ohne einen Beweis zu führen.
In Rußland war es 1933 der Mathematiker Wladimir A. Kotelnikow, der eigenständig die Herleitung eines Theorems der zeit- und amplituden-diskreten Abtastung kontinuierlicher Schwingungen präsentierte. Weder in seinem Heimatland noch in der westlichen Welt wurde seine Arbeit zur Kenntnis genommen. Kotelnikov war dennoch der erste, der das Abtasttheorem mathematisch schlüssig und vollständig formulierte. Leider scheint sein Aufsatz verlorengegangen. Die Aufmerksamkeit der technischen Welt erregte Claude E. Shannon mit seiner "Mathematical Theory of Communication" [1948]. Shannon überzeugte insbesondere durch die Berücksichtigung "gestörter Kanäle" -z.B. durch Rauschen- und die Prinzipien der "signal entropy" und "channel capacity". Teils konkurrierende Diskussionsansätze brachten Wiener, Hartley und andere ein, die jedoch rasch an Einfluß verloren. Shannon machte in seiner Arbeit bereits deutlich, das die Qualität der digitalen Kodierung analoger Schwingungen von der Abtastrate direkt abhängig ist: “Ist eine höhere Qualität der digitalen Reproduktion gefordert, muß eine entsprechend höhere Abtastrate für die Analogsignale angewendet werden.”
Die Idee der diskreten Abtastung (PCM) Harry Nyquist fand 1928, die Erfassung zweier Punkte einer Sinusschwingung müsse ausreichen, diese wieder zu rekonstruieren. Die Abbildung illustriert diese Vorstellung.
Eine erste Formulierung des Abtasttheorems war gefunden. Die halbe Abtastfrequenz (Nyquistfrequenz) stellt somit die höchste rekonstruierbare Signalfrequenz dar.An dieser Stelle ergeben sich für unsere Untersuchung wichtige Aspekte. Nyquist's Darstellung der Abtastung von Scheitelpunkten erinnert an eine erste ideale Prinzipzeichnung. Verschiebt man in Gedanken die Zeitpunkte der Abtastung in Richtung Nulldurchgang bleibt zwar die Information über die Frequenz erhalten, aber die Information über die tatsächliche Amplitude geht verloren. Finden die Zeitpunkte der Abtastung mit ebensolcher Genauigkeit im Nulldurchgang der Sinusschwingung statt wie zuvor bei deren Scheitelwerten, gehen sämtliche Informationen über Frequenz und Amplitude verloren . Lange Zeit glaubte man, die halbe Abtastfrequenz sei tatsächlich die höchste Signalfrequenz die sich auf diese Weise digital kodieren läßt. Selbst heute findet man diese Ansicht noch in vielen Büchern und Websites, die sich mit den Grundlagen der Digitaltechnik befassen. Wir können jedoch leicht ein Beispiel konstruieren um die Unmöglichkeit dieser Sichtweise zu zeigen. Voraussetzung für die Rekonstruktion des analogen Signals aus den digitalen Daten ist die Eindeutigkeit der Daten in Bezug auf den analogen Signalverlauf. Im nachfolgenden Beispiel führt die Abtastung zweier zueinander in der Phase verschobenen Analogsignale zu exakt den gleichen Digitaldaten, die Zuordnung digitaler Abtastwerte zum Analogsignal ist demnach bei FS/2 (der halben Abtastfrequenz) nicht mehr Eineindeutig, wie der Mathematiker sagt.
Dieses Umstands war sich Shannon 1948 offenbar anders als Nyquist bewußt. Er wählte Weisses Rauschen als repräsentativ für die zu übertragende Bandbreite und bemerkt in seiner berühmten Schrift 'Mathematical Theory of Commuincation' in einer Fußnote:
Ein Vorteil der 'certain advantages' ist die ideale Vorstellung von Weissem Rauschen als unendlich dicht bei frequenzunabhängiger Amplitude (Höhe der Schwingung) zu deren mathematischer Beschreibung Shannon eine diskrete sinx/x-Funktion gefunden hat. Über die erforderliche Abtastrate schreibt Shannon dann:
"This means that to transmit the output of a continuous source with exact recovery at the receiving point requires, in general, a channel of infinite capacity (in bits per second). Since, ordinarily, channels have a certain amount of noise, and therefore a finite capacity, exact transmission is impossible." (MTC S. 47)
Shannons Formulierung bedeutet, das für die genaue Rekonstruktion des Analogsignals eine “unendlich”:hohe Abtastrate benötigt würde. Weiter führt Shannon aus:
"This, however, invades the real issue. Practically we are not interested in exact transmission when we have a continuous source, but only in transmission to within a certain tolerance. The question is, can we assign a definite rate to a continuous source when we require only a certain fidelity of recovery, measured in a suitable way. Of course, as the fidelity requirements are increased the rate will increase." (MTC S. 48)
Das ist der springende Punkt. Welcher Grad von ‘fidelity’, also Wiedergabetreue, ist für hifi-Anwendungen notwendig und welche Abtastrate ist zur Erreichung der für hifi notwendigen Qualität erforderlich. Shannon wirft die Frage auf, überläßt ihre Beantwortung allerdings dem Entwickler eines solchen Systems. Die Geschichte zeigt, das die Entwickler der CD sich offenbar an der Minimalforderung orientiert haben ohne die mit der Abtastrate der CD festgelegte Qualität der Wiedergabe technisch genauer zu untersuchen. Bei der CompactDisc beträgt die Abtastrate 44.1 kHz, demnach ist die Nyquistfrequenz 22.05 kHz. Die Bandbreite von 20 kHz (Übertragungsbereich) liegt sehr dicht an der Nyquistfrequenz. Im logarithmischen Dezibel-Maß beträgt der Unterschied lediglich 20*log(22.05 kHz / 20 kHz)= 0.85 dB. Zunächst werden wir daher auf die Konsequenzen dieser Bedingungen eingehen, und wenden uns dann der interessantesten aller Fragen zu: Welche Abtastrate wird für eine der Schallplatte adäquate 'fidelity of recovery' benötigt.
|
|