Macht es Sinn immer die Hi-Res Vari­ante eines Albums bei Qobuz, HD-Tracks & Co her­unter zu laden? Nach den Download-Anfängen mit daten­re­du­zierter Musik ist es begrüs­sens­wert, wenn das Angebot an her­vor­ra­gender Qua­lität zunimmt. Aber leider gibt es auch da Stolpersteine.

Zuerst einmal was heisst eigent­lich Hi-Res Audio? Wenn wir von unserer Audio-CD aus­gehen kennen wir die Para­meter 16Bit/44.1 kHz als Defi­ni­tion. Was bedeuten diese? Wir haben es hier mit einer digi­talen Wort­länge von 16 Bit und einer Abtast­fre­quenz von 44.1 kHz zu tun. Mit den 16 Bit können wir auf einer CD eine Dynamik von 96dB und mit den 44.1 kHz einen Fre­quenz­um­fang bis 22.05 kHz abbilden (Nyquist Theorem). Wei­ter­ge­hende Infor­ma­tionen dazu in unserem Blog Digital Basics: ver­gessen Sie Treppen und Löcher zwi­schen den Sam­ples.

Das mensch­liche Hör­ver­mögen und der Fre­quenz­um­fang der Instru­mente sind der Massstab

Was heisst das bezogen auf den mensch­li­chen Hör­be­reich? Der Mensch kann in jungen Jahren Fre­quenzen bis 20 kHz wahr­nehmen. Mit zuneh­mendem Alter ver­lieren wir all­mäh­lich die Fähig­keit solch hohe Fre­quenzen hören zu können. Das nimmt kon­ti­nu­ier­lich ab bis auf 10 bis 12 kHz, was aber nur einem 10%igen Hör­ver­lust ent­spricht.  Der Dyna­mik­um­fang wird vom Genre der Musik bestimmt. Im Pop-Bereich ist der Dyna­mik­um­fang der Musik nicht sehr gross und bewegt sich so im Rahmen von 20 bis 30dB. Mehr dazu in unserem Blog Ver­stüm­melte Musik: wie Dyna­mik­kom­pres­sion und Daten­re­duk­tion die Musik ver­än­dern. Im Ver­gleich zur Klassik wo man locker mit einem grossen Sin­fo­nie­or­chester einen Dyna­mik­um­fang von 90dB und mehr errei­chen kann.

Als gän­gige Regel wird alles ober­halb von 16Bit/44.1kHz als Hi-Res bezeichnet. Hoch­auf­lö­sende For­mate sind 24Bit/88.2kHz, 96kHz oder 192kHz. Mit 24 Bit lässt sich  eine Dynamik von 144dB abbilden und mit den genannten Abtast­fre­quenzen können Fre­quenz­be­reiche bis 44.1, 48, oder 96kHz dar­ge­stellt werden. Also weitaus mehr als dass wir fähig sind zu hören. Auch die Instru­mente pro­du­zieren die meiste Energie unter­halb von 10kHz, ihre Ober­töne können bis 30kHz rei­chen aller­dings mit nur noch sehr geringen Pegeln.

Wel­ches von diesen For­maten macht nun am meisten Sinn? Ideal ist 24Bit/96kHz. Mit dieser Auf­lö­sung sind wir für alle Bereiche auf der sicheren Seite, da wir damit genü­gend Dyna­mik­um­fang und auch einen genü­gend grossen Fre­quenz­be­reich abde­cken können. Aus dieser Betrach­tungs­weise ist es auch klar, dass eine höhere Fre­quenz­auf­lö­sung wenig Sinn macht, da im Fre­quenz­spek­trum von 48 – 96 kHz keine irgendwie ver­wert­baren Töne mehr vor­handen sein können.

Wird heut­zu­tage eine neue Ton­auf­zeich­nung gemacht, so geschieht dies selbst­ver­ständ­lich auf dem digi­talen Weg. Es ist mög­lich, dass im Studio für die Auf­zeich­nung und das Mas­te­ring eine noch grös­sere Auf­lö­sung ver­wendet wird. Dadurch werden der Spiel­raum und die Sicher­heits­marge grösser. Denn im digi­talen Bereich führt eine all­fäl­lige Über­steue­rung sofort zu extremen Ver­zer­rungen und dies muss unter allen Umständen ver­mieden werden. Hier ist es selbst­ver­ständ­lich ange­bracht diese gute Qua­lität auch in Hi-Res anzu­bieten und dann z.B. mit Classé Elek­tronik und den neuen 800 Series Dia­mond Laut­spre­cher von Bowers & Wil­kins voll­um­fäng­lich geniessen zu können.

Anders ver­hält es sich mit his­to­ri­schen Auf­nahmen aus den 50er bis 80er Jahren. Damals arbei­tete man mit den guten alten Ton­band­ma­schinen. Dies waren natür­lich spe­zi­elle Stu­dio­ma­schinen welche mit bis zu 76cm/s Geschwin­dig­keit arbei­teten und damit Fre­quenzen bis zu 22kHz (Studer A807; +/-2dB) auf­zeichnen konnten. Die Top­ma­schinen konnten einen Dyna­mik­um­fang bis maximal 75dB, mit Dolby A bis 85dB errei­chen, danach war end­gültig Schluss.

Es ist durchaus lobens­wert, wenn all die her­vor­ra­gende Musik von den alten Legenden sowohl im Jazz- wie auch im Klas­sik­be­reich wieder in einer guten Qua­lität auf den Markt gebracht wird. Und dass die Fehler und Eigen­heiten der dama­ligen Technik in den Auf­zeich­nungen in der digi­talen Domäne teil­weise aus­ge­bü­gelt werden können ohne wieder neue Mängel hinzu zu fügen.

Werden heute solche Auf­nahmen in den Stu­dios digi­ta­li­siert und dann remas­tered macht es natür­lich Sinn in diesem Pro­zess auch die heu­tigen digi­talen Stan­dards wie zum Bei­spiel 24Bit/96kHz zu ver­wenden. Damit hat man in der Bear­bei­tung genü­gend Reserven. Aber wenn wir, wie vorher beschrieben, die damals mög­li­chen Para­meter der alten ana­logen Mas­ter­bänder anschauen, macht es kaum Sinn diese Remas­ter­ver­sionen in einem Hi-Res Format anzubieten.

Als Bei­spiel soll uns das  Album „In the wee small hours“ von Frank Sinatra aus dem Jahre 1955 dienen. Es gilt als das erste Kon­zept­album bei dem die Titel des Albums unter­ein­ander Bezug nehmen und als Gesamt­kunst­werk ver­standen werden kann. Arran­giert und diri­giert wurde das Bal­laden Album von Nelson Riddle. Das Album ist das jazz-lastigste Werk von Frank Sinatra. Die Auf­nahmen wurden im Februar und März 1955 mit einem aus­ge­wählten Publikum gemacht um die gewünschte „Nacht­klub Atmo­sphäre“ zu erreichen.

Diese Ein­spie­lung wird nun als Hi-Res Ver­sion mit 24Bit/96kHz oder sogar als 24Bit/192kHz ange­boten zu einem wesent­lich höheren Preis als die nor­male 16Bit/44,1kHz CD-Version, dann muss man sich schon die Frage stellen wofür man denn den Mehr­preis bezahlt.

Frank Sina­tras Album „In the wee small hours“ aus dem Jahre 1955:

Angebot bei Qobuz.com:

16Bit/44.1kHz    € 12.99
24Bit/192kHz     € 17.48

Angebot bei HD Tracks:

24Bit/96kHz       $ 17.98
24Bit/192kHz     $ 24.98

Die Fre­quenz­ana­lyse bringt es an den Tag

Da die tech­ni­schen Werte einer Band­ma­schine in Bezug auf Fre­quenz­um­fang, Dynamik, Kanal­tren­nung, Linea­rität und Gleich­lauf die des 16Bit/44.1kHz For­mats nicht über­steigen, stellt sich die Frage, ob ein Release in einem Con­tai­ner­format von 24/96 oder 24/192 über­haupt Sinn macht.

Ana­ly­sieren wir das Stück „What Is This Thing Called Love“ aus dem erwähnten Sinatra Album. Die Mono-Aufnahme aus dem Jahre 1955 ent­stand also noch vor der Markt­ein­füh­rung der Stereophonie.

Hier das Spek­trum der 16Bit/44.1kHz Version:

Das Fre­quenz­spek­trum reicht knapp über 16kHz hinaus. Die Spitzen bei 18kHz tau­chen bereits in den Rausch­tep­pich ein, typisch für Band­ma­schinen der 50er Jahre. Der Dyna­mik­um­fang des eher ruhigen, getra­genen Stü­ckes liegt bei rund 45dB, die Neu­auf­lage des Albums zeigt einen erfreu­li­chen Dyna­mikrange Wert von 12.

Das Spek­trum der 24Bit/96kHz Version:

Das Spek­trum der 24Bit/96kHz Vari­ante bietet mehr Rau­schen fürs Geld, aber keine klang­li­chen Mehr­in­for­ma­tionen. Der poten­tiell auf 48kHz erwei­terte Fre­quenz­um­fang bleibt unge­nutzt. Die höhere Abtast­rate von 96kHz bringt auch nicht mehr Infor­ma­tionen weil die Sam­ples näher bei­ein­ander liegen – wie Sie im Blog „Digital Basic“ nach­lesen können.

Hier der Ver­gleich der Hüll­kurven von 44.1kHz und 96kHz Variante:

Beide Kurven zeigen den glei­chen Ver­lauf, da in beiden Con­tai­nern das gleiche Fre­quenz­spek­trum vor­handen ist.

Wie sieht es nun mit der 192kHz Vari­ante aus, welche wir eigent­lich ausser Acht lassen könnten, da 96kHz schon keinen Mehr­nutzen gebracht hat. Schauen wir trotzdem rein:

 

Der Rausch­tep­pich bricht bei rund 40kHz ab, dann kommt nichts, absolut nichts, ausser zwei Stör­fre­quenzen bei unge­fähr 72kHz und 78kHz. Die Stör­pegel rei­chen bis auf ‑60dB hinauf.

Hier ein Ver­gleich der 96kHz und 192kHz Varianten:

96kHz Sam­pling­fre­quenz

192kHz Sam­pling­fre­quenz
Die Hüll­kurve zeigt bei genauer Betrach­tung auch Unsau­ber­keiten im Signalverlauf.

Fazit: Dieses Album bietet in der preis­werten 16Bit/44.1kHz Vari­ante (CD) vollen Genuss. Der Mehr­preis für die Hi-Res-Versionen ist nicht gerecht­fer­tigt. Bei der teuren 192kHz Vari­ante kriegt man noch Stör­ge­räu­sche als Zugabe. Diese Stör­ge­räu­sche sind nicht hörbar und kein Laut­spre­cher könnte sie repro­du­zieren. Aller­dings können diese Stör­fre­quenzen in den Elek­tronik­kom­po­nenten Effekte her­vor­rufen, die in den Hör­be­reich gelangen (Inter­mo­du­la­tionen, Inter­fe­renzen). Ebenso lässt sich nicht völlig aus­schliessen, dass der Rausch­tep­pich gewisse Effekte her­vor­rufen kann. Gehör­mässig klingen alle drei Vari­anten über die hoch­wer­tige Abhör­an­lage des Autors (Classé/Bowers & Wilkins/Sonata Server) absolut gleich.

Nicht immer ist Hi-Res drin, wenn Hi-Res drauf steht. Ein Kilo Mehl in einem 2 Kilo Sack wiegt trotzdem nur 1 Kilogramm.