Jump to content

Finns det några fördelar med DSD jämfört med PCM?


Guest dicdac

Recommended Posts

Vad betyder "transient-stabilare"? Sen har ljudformaten i sig varken före- eller efter-ringningar och analog teknik hanterar inte transienter annorlunda än digital.

Det där är en gravt missvisande bild som antagligen är medvetet konstruerad för att vilseleda folk utan grundläggande kunskaper i signallära.

Pulsen som kallas "analog" på bilden har inget med analoga ljudformat eller musiksignaler att göra utan är förmodligen genererad av en pulsgenerator.

Bilden kommer från Merging Technologies som förser många av världen främsta studios med DAW mjuk & hårdvara både för PCM och DSD. Varför vi gillar bilden för att den illustrerar det vi hör när vi jobbar med DSD, om än extremt förstorat och därav lite missvisande. Men att det skulle vara felaktig har jag mycket svårt och tro.

PCM är ett mycket bra ljudformat som är extremt flexibelt med massvis med möjligheter till redigering, limitering, dithering, komprimering, efterklangmodifiering m.m. DSD är mer begränsat till arkivering av master taper eller inspelningar där allt är "rätt" redan då mikrofonen fångar upp det. Iaf än så länge. Korg har sen en tid tillbaka tagit staffetpinnen i utveckling av DSD formatet. Gentlemannen bakom DSD och Korg's VD är goda vänner och förmodligen ser han nu möjligheten att utveckla DSD efter den släppts ur Sony's järngrepp.

Men var ser du att pulsen skulle vara "analog"? När jag tittar på bilden står det bara "impulse response of an analog, a 48KHz, a 96KHz...." precis som bilden visar eller har jag missat något?

Måste säga att jag blir rätt imponerad av kunskapen hos vissa! Och det vore kul att höra hur ni lärt er allt. Och framför allt om ni använt kunskaperna till något praktiskt t.ex konstruerat egna produkter eller liknade?

Edited by Absolute Audio
Link to comment
Share on other sites

  • Replies 92
  • Created
  • Last Reply

Top Posters In This Topic

Måste säga att jag blir rätt imponerad av kunskapen hos vissa! Och det vore kul att höra hur ni lärt er allt. Och framför allt om ni använt kunskaperna till något praktiskt t.ex konstruerat egna produkter eller liknade?

Det är intressant med elektroniska och mekaniska system såsom flera andra också tycker på detta forum. Jag antar att vi hugger på sånt som kan tolkas som missvisande av de flesta och vill gärna korrigera det hela. En pusselbit till i denna diskussion är i vilken kontext bilden hämtats. Här är länken till sidan.

När jag läser om produkten vill Merging Technologies visa vad deras mjukvara/hårdvara Pyramix är kapabel till och jämför några olika inläsningar av signalmaterial (dirac med 3us). De kör internt i mjukvaran med 32-bit flyttal vid 352.8kHz. Det är alltså (i teorin) inga problem att sampla en sådan diracpuls och få bra resultat. Samplingstiden är 2.83us och de borde alltså få minst ett sampel på pulsen, men det förutsätter att pulsens flanker är mycket branta, annars blir det problem. Men det går också att lösa mättekniskt om man vill, fast då börjar man gå ifrån idén med en diracpuls - att visa på impulssvaret från en enda puls.

Link to comment
Share on other sites

Guest dicdac
Intressant...

Men vad är det då jag hör? I boxen jag relaterar till finns musiken på 16/44,1 plus en DVD-platta med samtliga spår med 24/48. Skillnad är det hur som helst. Inspelningarna är gjorda analogt 1975.

Om man använder en bitrate på 24 så behöver man väl inte utnyttja dynamikpotentialen fullt ut. I min enkla betendebaserade värld så jämför jag med bilmotorer. Min bil levereras med motorer från ca 125 hk (4 cyl) upp till ca 350 hk (6 cyl). Om jag kör i 100 km med samtliga motorer så går det lika fort, men det låter inte samma i kupén.

Är den liknelsen användbar, tro :?::Thinking:

Jämförelsen med bilmotorn fungerar inte så bra i det här fallet. Lite förenklat kan man säga att en stor bilmotor har större vridmoment än en liten motor (man kan "pumpa upp" en liten bilmotor med en turbo men men det hamnar utanför den här diskussionen). Det gör att en stor motor kan driva en bil på ett lägre varvtal än en liten motor, som måste ha ett högt varvtal för att leverera samma kraft som en stor motor.

Jag har sett att i vissa beskrivningar av hur digitalt ljud fungerar så skriver man att ett större bitdjup skulle öka upplösningen. Jag har till och med sett sådana påståenden i beskrivningar som är gjorda av framgångsrika företag i hifi-branschen. Om det var så att man hade samma "max och min" värde för amplituden för både för 16 och 24 bitars bitdjup så hade man fått en högre upplösning med 24 bitar i och med att "stegen" i skalan i så fall hade blivit mindre med 24 bitarsupplösning och det är precis det som vissa bolag i hifi-branschen vill få oss att tro. Upp till en nivå på 16 bitars bitdjup så har både 16 och 24 bitars bitdjup precis samma "skala" vilket gör att dom blir exakt lika på den nivån. Det är först när man behöver mer än 16 bitar som det blir någon skillnad, d.v.s. först när dynamikomfånget på den musik man vill spela in eller återge blir större än 96 dB (jag bortser ifrån dither och nois sharping) som det blir skillnad mellan 16 och 24 bitar.

Jag har sysslat med hifi och musik i snart 50 år. Eftersom jag inte bygger min elektronik så behöver jag inte förstå varför saker låter som de gör men skillnader kan jag fortfarande höra mellan olika anläggningar och sammanhang. Men varför, är en annan fråga. Dock inte om.

En elektronikprofessor (kompis till Eliot) uttryckte det ungefär så här: "Professionellt vet jag att det är mycket som inte skall inverka på ljudet, men ändå påverkar det - men varför och hur förstår jag inte. Ju mer jag vet desto mindre känner jag till".

Din elektronikprofessor till kompis är nog inte bara elektronikprofessor utan också filosof :). Det är definitivt inte enkelt att förstå varför det blir skillnad mellan två olika audio-prylar eller mellan två olika tekniker så jag kan hålla med honom. Jag tror att det du hör att verkliga skillnader och jag har ingen riktigt bra förklaring till vad skillnaderna beror på, men jag ger mej in på några gissningar som kanske kan föra diskussionen framåt.

En skillnad kan naturligtvis vara att cd-versionen och dvd-versioner är mastrade på olika sätt. Det kan ge tydliga skillnader, lite beroende på vad som skiljer i matringen. (Det har nämnts tidigare i tråden.)

Det kan också bero på det som "Conan" är inne på i sitt inlägg, dvs. att det kan ha att göra med hur signalen är filtrerad. "Conan" skriver dock om filtering som görs av producenten vid mastring. Vad jag förstår så görs också så att denna typ av filtering i da-omvandlaren och olika da-omvandlare fungerar på olika sätt. Filterteknik är ett komplicerat område och mina kunskaper inom detta område är inte tillräckliga för att beskriva alla "vinklar och vrår" av ämnet men jag kan även i detta fall ge mej in på att spekulera lite kring vilka effekter olika filertekniker kan ha på en musiksignal. Andra personer får gärna fylla på med information och kunskap inom området.

Med en samplingsfrekvens om 44.1 kHz så ligger "Nyqvist frekvens" väldigt nära det hörbara området, mer exakt, 22.05 kHz i den analoga värden. Med en 44.1 kHz signal måste man använda ett "anti-alias filter" som är av s.k. "brick-wall" typ, dvs. lutnigen på kurvan som filterat skapar måste vara väldigt brant eftersom man vill (måste?) filtrera bort hela signalen innan man kommer över "Nyqvist frekvens" annars får man problem med s.k. "aliases" av riktiga signaler.

Ett s.k. "brick-wall" filter kan skapa en s.k. ”pre-ringing effekt”. Med en högre samplingsfrekvens, t.ex. 96 kHz så hamnar ”Nyqvist frekvens” på 48 kHz i den analoga domänen, d.v.s. långt ovanför det hörbara området. Det gör att tillverkaren har mycket utrymme ovanför den hörbara nivån att filtrera signalen vilket i sin tur gör att han får flera olika filteringstekniker att välja mellan. Han kan välja att använda ett filter med en ”flackare” frekvenskurva än om samplingsfrekvensen var 44.1 kHz vilket kan ge flera fördelar men det kan också skapa nya problem i form av bl.a. fas-vridningar.

Dom flesta moderna da-omvandlare uppsamlar signalen till en samplingsfrekvens om 196 kHz eller liknande (ofta en heltalsmultipel av vad ursprungliga signalen dvs. 44.1 x 4 = 176.4 och 48 x 4 = 196). Det borde innebära att tillverkaren efter uppsampling skulle kunna använda samma filter oberoende om signalen från början var 48 eller 192 kHz.

Har man däremot en da-omvandlare som inte samplar upp signalen (s.k. Nos-dac) så borde resonemanget om olika filter hålla.

Link to comment
Share on other sites

Vet att det är många som inte har möjlighet att spela DSD ännu men här är lite spridda röster från nätet om det vi släppt hittils:

Tacksamt med info men de inslag som är direktreklam hänvisas till Nyhetsforum.

Link to comment
Share on other sites

Guest dicdac
Det där är inte en mätning på DSD i sig utan någon specifik implementation av DSD.

Sen kan man inte jämföra spektrum på det sättet som görs i grafen eftersom brusgolvets nivå i grafen beror på vilken FFT-längd/fönster man väljer.

De ritade linjerna för PCM är alltså inte representativa för hur de skulle ut under samma förutsättningar som DSD-signalen.

Jag har inte så goda kunskaper om ”Fast Fourier transform” så jag är inte säker på hur du menar. PCM-signalerna i bilden ser lite konstgjord ut. Menar du att PCM signalerna är ”fasförskjutna” i förhållande till DSD-signalen?

(Förskjutna på så sätt att DSD kurvan inte ligger rätt i frekvens i förhållande till PCM-kurvorna)

Och i verkligheten har du ingen utrustning som låter dig komma i närheten av prestanda motsvarande 24 bitar, så det är av mindre intresse.

Nä, jag känner till det. Jag har i och för sig tänkt att det skulle finnas vissa fördelar med 24 bitar då man vid mastring har mer utrymme och skulle kunna lägga signalen 5 dB under nollan. Då skulle det vara lättare att vid uppspelning manipulera signalen med en EQ eller rumskalibreringssystem som t.ex. Dirac eftersom man skulle kunna höja nivån några decibel utan att riskera att slå igenom det ”digitala taket” men det är naivt att tro att musikproducenter/mastringstekniker skulle lägga signalen på -5 dB. Dom skulle naturligtvis lägga signalen så nära noll som möjligt i alla fall för att få så högt ljud som möjligt.

Filtren i spelarna brukar ligga vid 50 eller 100kHz. Problemet är att man måste använda ett analogt filter för den filtreringen (om man inte frångår DSD-formatet, vilket många D/A-omvandlare gör).

Både du och Wikipedia har rätt! DSD är från början av 90-talet medan SACD är från 1999.

DSD var egentligen aldrig tänkt som ett format för distribution och uppspelning utan enbart för arkivering av gamla masterband.

Tack, nu kommer jag ihåg hur historien hänger ihop.

Sen skulle jag gissa på att den största individuella orsaken till att man valde att lansera SACD-formatet var att Sony/Philips äganderätt till CD-formatet höll på att löpa ut.

Det har du nog helt rätt i. Om jag förstått det rätt så har licensen/patenten för DSD gått ut nu. Det är väl därför som så många tillverkare plötsligt blivit intresserade av formatet.

Det där är en gravt missvisande bild som antagligen är medvetet konstruerad för att vilseleda folk utan grundläggande kunskaper i signallära.

Pulsen som kallas "analog" på bilden har inget med analoga ljudformat eller musiksignaler att göra utan är förmodligen genererad av en pulsgenerator.

Det enda bilden egentligen visar är vid vilken frekvens som signalerna är filtrerade och där stämmer inte DSD-grafen eftersom DSD brukar filtreras vid 50 eller 100kHz (och det användbara frekvensomfånget är ännu mindre).

Och det kan vara värt att notera att alla skillnader mellan signalerna på bilden ligger över 20kHz.

Jag blev lite förvirrad av bilden. Som jag uppfattar den så har man på ”x-axeln” tid som enhet och på ”Y-axeln” har man frekvens men på sådan här impulsmätningar brukar man väl ha amplituden på ”y-axeln”? I det här fallet har man alltså använt ett frekvenssvep för att kontrollera impulsvaret. Blir inte det konstigt?

(Nu har du redan skrivit att bilden är vilseledande men det är principen för hur den här typen av mätningar görs som jag funderar över.)

Även om bilden är felaktig så är väl ändå ”pre-ringing” ett problem vid da-omvandling. Åtminstone om man använder sig av ett ”brick-wall filter” precis vid audiobandets slut (20-22 kHz)? Idag uppsamplar nästan alla da-omvandlare signalen till 174.4 kHz eller 192 kHz och då borde det gå att använda ett filter med längre ”roll-off”. Kan det lösa problemet med ”pre-ringing”?

Edited by dicdac
Link to comment
Share on other sites

Även om bilden är felaktig så är väl ändå ”pre-ringing” ett problem vid da-omvandling. Åtminstone om man använder sig av ett ”brick-wall filter” precis vid audiobandets slut (20-22 kHz)? Idag uppsamplar nästan alla da-omvandlare signalen till 174.4 kHz eller 192 kHz och då borde det gå att använda ett filter med längre ”roll-off”. Kan det lösa problemet med ”pre-ringing”?

Uppsampling kan vara aningens missvisande då man kopplar det till att lägga till "korrekta" sampel mellan de ursprungliga. Vissa applikationer kan fungera med det men det brukar bli för mycket distortion i denna metod. Nu ska vi ju inte anmärka så mycket på orden ... men jag vill komma till min poäng.

Det man gör i en digital kedja, i synnerhet i de flesta CD-spelare, är att öka samplingsfrekvensen innan D/A. Det gör man för att slippa skapa detta "brick-wall" filter i den analoga domänen. Men det är lätt att glömma att det inte finns några genvägar ens i den digitala domänen, man måste ändå filtrera signalen, fast digitalt då.

Ifall man vill öka från 44,1kHz till 176,4kHz så sätter man in tre nollor mellan varje par av ursprungliga sampel, dvs sampel med amplituden noll. Det som händer då är att signalens frekvensinnehåll (20-20kHz) upprepas som en vikt kopia efter 22,05kHz och vidare uppåt i frekvens. Det vill man inte ha.

Det viktiga är att få ett rent spektrum ända upp till 88,2kHz redan i den digitala domänen, dvs upp till halva den nya samplingsfrekvensen. Ett "brick-wall" filter måste läggas till i den digitala domänen. Fördelen i den digital domänen är att det handlar om processorkraft och minne för hur bra detta filter kan göras. Riktigt bra CD-spelare har mycket minne och kanske en DSP som gör jobbet, medan en billig CD-spelare har ett enklare digitalt filter.

Hur som helst är det enklare att få till filtret i den digitala domänen.

Därefter går den interpolerade signalen till en D/A och därefter ett analogt filter som inte alls har så hårda krav på sig längre. Filtret ska ju undertrycka spektrum från 88,2kHz och uppåt men behålla audiospektrat upp till 20kHz.

Link to comment
Share on other sites

Det här med ringning går inte att undvika ens teoretiskt. Är en signal bandbreddsbegränsad (fyrkantvåg, triangelvåg mfl) så blir det ringningar. Det säger egentligen bara att det saknas högre frekvenskomponenter.

Frågan är om det gör nåt att det t ex saknas en 30kHz sinus ...

Man får inte stirra sig blind på kurvformer bara för att de inte ser "optimala" ut.

Link to comment
Share on other sites

Jag blev lite förvirrad av bilden. Som jag uppfattar den så har man på ”x-axeln” tid som enhet och på ”Y-axeln” har man frekvens

Nej, det är amplitud som funktion av tiden.

Även om bilden är felaktig så är väl ändå ”pre-ringing” ett problem vid da-omvandling.

Vad tänker du dig att problemet skulle vara?

Link to comment
Share on other sites

Bilden kommer från Merging Technologies som förser många av världen främsta studios med DAW mjuk & hårdvara både för PCM och DSD. Varför vi gillar bilden för att den illustrerar det vi hör när vi jobbar med DSD, om än extremt förstorat och därav lite missvisande. Men att det skulle vara felaktig har jag mycket svårt och tro.
Men bilden illustrerar enbart vad som händer när man bandbegränsar en signal, och eftersom skillnaderna i det här fallet ligger utanför människoörats frekvensomfång så säger det inget om hörbara skillnader.

Bilden säger alltså ingenting om vad du hör när du jobbar med DSD (som i verkligheten ofta är filtrerad vid 50kHz och alltså skulle se ut ungefär som 96kHz-pulsen på bilden).

PCM är ett mycket bra ljudformat som är extremt flexibelt med massvis med möjligheter till redigering, limitering, dithering, komprimering, efterklangmodifiering m.m. DSD är mer begränsat till arkivering av master taper eller inspelningar där allt är "rätt" redan då mikrofonen fångar upp det. Iaf än så länge.

Men vad är poängen med att använda DSD då?

PCM gör allt som DSD (som faktiskt är en form av PCM) gör men är mer flexibelt, mer kompatibelt, erbjuder högre prestanda och integrerar bättre med modern hård-/mjukvara.

Men var ser du att pulsen skulle vara "analog"? När jag tittar på bilden står det bara "impulse response of an analog, a 48KHz, a 96KHz...." precis som bilden visar eller har jag missat något?

Alla impulserna är givetvis analoga, men det står "analog" under den första impulsen som jag antar är originalet (förmodligen en pulsgenerator kopplad till ett oscilloskop).

Jag anmärkte på det för att inte någon skulle tolka det som att den "analoga" impulsen skulle representera impulsresponsen från exempelvis analoga masterband eller vinyl, vilket den givetvis inte gör.

Edited by FalloutBoy
Link to comment
Share on other sites

När jag läser om produkten vill Merging Technologies visa vad deras mjukvara/hårdvara Pyramix är kapabel till och jämför några olika inläsningar av signalmaterial (dirac med 3us). De kör internt i mjukvaran med 32-bit flyttal vid 352.8kHz. Det är alltså (i teorin) inga problem att sampla en sådan diracpuls och få bra resultat.

Det beror på vad man menar med bra resultat. ;)

Om man enbart är intresserad av de delar av impulsen som ligger under 20kHz så räcker det att sampla den med 44.1kS/s.

Samplingstiden är 2.83us och de borde alltså få minst ett sampel på pulsen, men det förutsätter att pulsens flanker är mycket branta, annars blir det problem.

Du måste sampla snabbare än dubbla den högsta frekvensen signalen innehåller för att kunna representera den.

För att representera en ~333kHz (3us) signal med 352,8kS/s måste du alltså först bandbegränsa impulsen till mindre än halva samplingsfrekvensen (176,4kHz) innan du samplar den, vilket kommer bredda impulsen.

Link to comment
Share on other sites

Med en samplingsfrekvens om 44.1 kHz så ligger "Nyqvist frekvens" väldigt nära det hörbara området, mer exakt, 22.05 kHz i den analoga värden. Med en 44.1 kHz signal måste man använda ett "anti-alias filter" som är av s.k. "brick-wall" typ, dvs. lutnigen på kurvan som filterat skapar måste vara väldigt brant eftersom man vill (måste?) filtrera bort hela signalen innan man kommer över "Nyqvist frekvens" annars får man problem med s.k. "aliases" av riktiga signaler.
Det är när du samplar (A/D-omvandling) eller omsamplar signalen som du använder anti-aliasfilter. När du spelar upp signalen (D/A-omvandling) så brukar det kallas det rekonstruktions- eller anti-imagefilter.

Moderna A/D-omvandlare brukar faktiskt inte använda särskilt branta anti-aliasfilter utan de är s.k. halvbandsfilter vilka endast dämpar signalen med ett par dB vid Nyquistfrekvensen.

Det gör faktiskt inte så mycket eftersom vikningsdistorsionen du får kommer ligga över 20kHz och dessutom vara extremt svag.

Ett s.k. "brick-wall" filter kan skapa en s.k. ”pre-ringing effekt”.

Det är faktiskt inte filtret som skapar ringningen utan det är en naturlig konsekvens av bandbegränsningen.

Du kan alltså köra en signal genom samma filter hur många gånger du vill utan att det kommer öka mängden ringning.

Med en högre samplingsfrekvens, t.ex. 96 kHz så hamnar ”Nyqvist frekvens” på 48 kHz i den analoga domänen, d.v.s. långt ovanför det hörbara området. Det gör att tillverkaren har mycket utrymme ovanför den hörbara nivån att filtrera signalen vilket i sin tur gör att han får flera olika filteringstekniker att välja mellan. Han kan välja att använda ett filter med en ”flackare” frekvenskurva än om samplingsfrekvensen var 44.1 kHz vilket kan ge flera fördelar men det kan också skapa nya problem i form av bl.a. fas-vridningar.

Du får inte fas-vridningar av att använda ett flackare filter, däremot kan du få det om du inte använder ett FIR-filter.

Du kan t.ex. använda ett filter som är "intermediate phase" vilket har mindre pre-ringning men istället ger lite fasdistorsion.

I modern hård-/mjukvara är dock varken ringning eller fasdistorsion några större problem (inte ens vid 44.1kHz).

Jag har inte så goda kunskaper om ”Fast Fourier transform” så jag är inte säker på hur du menar. PCM-signalerna i bilden ser lite konstgjord ut.

Det är inte så konstigt eftersom de är ditritade. ;)

Menar du att PCM signalerna är ”fasförskjutna” i förhållande till DSD-signalen? (Förskjutna på så sätt att DSD kurvan inte ligger rätt i frekvens i förhållande till PCM-kurvorna)

Nej, men brusgolvets amplitud på bilden är missvisande eftersom den beror på FFT-upplösningen medan de ditritade PCM-signalerna är baserade på formatens verkliga begränsningar.

Sen kan brusformningen för DSD se lite olika ut beroende på implementation.

Jag blev lite förvirrad av bilden. Som jag uppfattar den så har man på ”x-axeln” tid som enhet och på ”Y-axeln” har man frekvens men på sådan här impulsmätningar brukar man väl ha amplituden på ”y-axeln”? I det här fallet har man alltså använt ett frekvenssvep för att kontrollera impulsvaret. Blir inte det konstigt?

Nej, det är (som Almen också skrev) amplitud/tid som visas. Frekvens/tid är inte så meningsfullt att visa (eftersom de är aspekter av samma sak), men däremot kan man göra ett 3D-diagram över frekvens/amplitud och ha tid på z-axeln.

Link to comment
Share on other sites

Tacksamt med info men de inslag som är direktreklam hänvisas till Nyhetsforum.

Ooops! :o Tyckte tråden helt saknade lyssnings-intryck, vilket i sammanhanget inte är helt oviktigt?! Ville inte ge mina egna. Men jag köper helt att det räknades som reklam! Vill du att jag ska droppa ur tråden skicka ett PM eller nått!

FalloutBoy:

Men vad är poängen med att använda DSD då?

För vi tycker det låter "nog" mycket bättre än PCM för att det ska vara värt det! Annars är det bara nackdelar. Om man inte gillar "purismen" i att inte ha all världens ljudprocessningsverktyg.

Du skrev ju att de flesta DACar jobbar med delta sigma tekniken och egentligen konverterar all PCM till DSD innan DA-omvandling?! Kan det inte finnas en viss fördel i att "mata" DACen med det språk den jobbar i?

Link to comment
Share on other sites

Guest dicdac
Ifall man vill öka från 44,1kHz till 176,4kHz så sätter man in tre nollor mellan varje par av ursprungliga sampel, dvs sampel med amplituden noll. Det som händer då är att signalens frekvensinnehåll (20-20kHz) upprepas som en vikt kopia efter 22,05kHz och vidare uppåt i frekvens. Det vill man inte ha.

Det viktiga är att få ett rent spektrum ända upp till 88,2kHz redan i den digitala domänen, dvs upp till halva den nya samplingsfrekvensen. Ett "brick-wall" filter måste läggas till i den digitala domänen. Fördelen i den digital domänen är att det handlar om processorkraft och minne för hur bra detta filter kan göras. Riktigt bra CD-spelare har mycket minne och kanske en DSP som gör jobbet, medan en billig CD-spelare har ett enklare digitalt filter.

Hm, jag trodde att man räknade ut amplituden på sampeln innan/när man infogade den vid uppsampling.

Frågan är om det gör nåt att det t ex saknas en 30kHz sinus ...

Ja, det var ungerfär så jag tänkte. Om man uppsamplar signalen och gör filtreringen långt ovanför det hörbara området så borde problemet med "pre-ringing" vara betydelselöst.

Link to comment
Share on other sites

Hm, jag trodde att man räknade ut amplituden på sampeln innan/när man infogade den vid uppsampling.

Det är lätt att tro att man räknar ut samplen mellan och sedan filtrerar, men det är bättre att inte anta något annat än noll och sedan låta ett lågpassfilter räkna fram samplen direkt.

Link to comment
Share on other sites

Guest dicdac

Tack för klargörandet.

Nej, det är (som Almen också skrev) amplitud/tid som visas. Frekvens/tid är inte så meningsfullt att visa (eftersom de är aspekter av samma sak), men däremot kan man göra ett 3D-diagram över frekvens/amplitud och ha tid på z-axeln.

Då stämmer det lite bättre. Jag blev lite konfunderad över att signalerna med samplingsfrekvenserna 48, 96, 196 kHz inte nåde samma höjd. Jag tyckte att dom borde ha det om det var amplituden som visades, förutsatt att dom hade samma bitdjup.

Men har jag tolkat det rätt, så är det inte "pre-ringing" som visas som vågor bredvid staplarna utan det det som visas är "sinX/X funktioner"?

Vad jag förstått så görs FFT i början av da-omvandlingen. "Pre-ringing" uppstår däremot i slutat av processen när signalen ska filtreras med rekonstruktionsfiltret.

Edited by dicdac
Link to comment
Share on other sites

Guest dicdac
Det är lätt att tro att man räknar ut samplen mellan och sedan filtrerar, men det är bättre att inte anta något annat än noll och sedan låta ett lågpassfilter räkna fram samplen direkt.

Ah, då hänger jag med lite bättre.

Link to comment
Share on other sites

För vi tycker det låter "nog" mycket bättre än PCM för att det ska vara värt det!
Men varken PCM eller DSD (som ju också är PCM) har något eget "ljud" (förutom bakgrundsbrus då).

Däremot kan skillnader i upplevelse orsakas av saker som inte är direkt relaterade till formaten, t.ex. olika mastrat material (vanligaste orsaken), suggestionseffekter eller skillnader i hårdvara/implementation.

Annars är det bara nackdelar. Om man inte gillar "purismen" i att inte ha all världens ljudprocessningsverktyg.
Med tanke på att nästan allt som givits ut kommersiellt i DSD-format (som SACD eller annat) har processats som PCM så verkar inte ens DSD-förespråkarna gilla den "purismen". ;)

Du skrev ju att de flesta DACar jobbar med delta sigma tekniken och egentligen konverterar all PCM till DSD innan DA-omvandling?! Kan det inte finnas en viss fördel i att "mata" DACen med det språk den jobbar i?
För 20+ år sedan (när DSD introducerades) så var det kanske ett vettigt argument, men utvecklingen har gått framåt sedan dess och moderna delta/sigma-omvandlare jobbar inte med 1bit/64xFs (DSD) utan med fler bitar och högre frekvens.

De flesta moderna D/A-kretsarna tar inte ens emot DSD-signaler och de som gör det måste implementera speciallösningar, t.ex. konvertera signalen till PCM, för att kunna dra nytta av fördelarna med dagens omvandlare.

Link to comment
Share on other sites

Men varken PCM eller DSD (som ju också är PCM) har något eget "ljud" (förutom bakgrundsbrus då).

Däremot kan skillnader i upplevelse orsakas av saker som inte är direkt relaterade till formaten, t.ex. olika mastrat material (vanligaste orsaken), suggestionseffekter eller skillnader i hårdvara/implementation.

Den (vanligaste orsaken) kan vi avskriva direkt! Suggestionseffekter är ju populära i vissa kretsar och en möjlighet. Skillnader i hårdvara/implementation låter dock mer spännande och intressant. Som det skrevs tidigare i tråden så var DSD framtaget för arkivering. Stämmer mycket bra! Men inte för uppspelning? Den får jag inte ihop och låter extremt långsökt. Varför skulle man vilja arkivera i något annat än formatet det ska spelas upp i? Vad blir vinsten? Bakgrunden var att arkiveringstekniker var missnöjda med PCM eftersom det inte fångade ljudet från taperna som skulle arkiveras. Därav utvecklades DSD. Ska dock tilläggas att detta är 80-90-tal och mycket hänt med PCM sen dess.

Med tanke på att nästan allt som givits ut kommersiellt i DSD-format (som SACD eller annat) har processats som PCM så verkar inte ens DSD-förespråkarna gilla den "purismen". ;)

Jodå! Men möjligheterna har inte funnits.. Får tänka på att när SACD utvecklades var musikindustrin en blomstrande "megabuck" bransch. System som Sonoma som är mest DSD av alla kostade mycket pengar. För mycket för många audiofilbolag. Artister som Beyonces advokater krävde dubbla royaltys när hon fick veta att det fanns ett SACD lager på skivan. Samtidigt börjar försäljningen dala i takt med att nedladdningar ökar. Så att SACD inte tog fart är en stor politik och ekonomisk sörja som egentligen inte har något med DSD att göra.

För 20+ år sedan (när DSD introducerades) så var det kanske ett vettigt argument, men utvecklingen har gått framåt sedan dess och moderna delta/sigma-omvandlare jobbar inte med 1bit/64xFs (DSD) utan med fler bitar och högre frekvens.

Hur många bitar då och hur höga frekvenser?

De flesta moderna D/A-kretsarna tar inte ens emot DSD-signaler och de som gör det måste implementera speciallösningar, t.ex. konvertera signalen till PCM, för att kunna dra nytta av fördelarna med dagens omvandlare.

Njaa stämmer inte, det blir fler DACar hela tiden som tar emot DSD64 och DSD128: dCS var dom som fick loss rättigheterna till DSD från Sony, tror inte patentet riktigt gått ut, men jag är inte säker. Har för mig att det var vissa förhandlingar. EmmLabs, Mytek kan räknas till dom tidiga(förra året, typ) Nu finns DSD stöd i nya Benchmark, Lynx, Accuphase, Marantz, Teac, Wadia bara för att nämna några. Även Oppo ska få, eller har fått, firmware uppgradeing för att klara spela DSD.

Link to comment
Share on other sites

Men har jag tolkat det rätt, så är det inte "pre-ringing" som visas som vågor bredvid staplarna utan det det som visas är "sinX/X funktioner"?

I sammanhanget är det samma sak. En ideal diracpuls blir efter brickwallfilter en sinc med fina för- och efterringningar, precis som det skall vara.

Link to comment
Share on other sites

jag inte ihop och låter extremt långsökt. Varför skulle man vilja arkivera i något annat än formatet det ska spelas upp i? Vad blir vinsten? Bakgrunden var att arkiveringstekniker var missnöjda med PCM eftersom det inte fångade ljudet från taperna som skulle arkiveras. Därav utvecklades DSD. Ska dock tilläggas att detta är 80-90-tal och mycket hänt med PCM sen dess.

Jag läser från Wikipedia - rätt eller fel - men det handlar inte om arkivering, utan snarare att undvika decimering som krävs när man samplar i PCM. För min del låter det otroligt att det skulle handla om decimering på grund av att man faktiskt samplar och digitaliserar signalen till en bit. Hur som helst så skriver Wiki följande:

DSD is a method of storing a Delta-Sigma signal before applying a "decimation" process that converts the signal to a PCM signal. When Delta-Sigma conversion was originally described in patent 2,927,962 filed by C. C. Cutler in 1954 (But not named as such until a 1962 paper by H. Inose, Y. Yasuda, and J. Murakami), decimation did not exist and the intention was to have oversampled data sent as-is. Indeed, the first proposal to decimate oversampled delta-sigma data to convert it in to PCM audio did not appear until 1969, in D. J. Goodman's paper "The Application of Delta Modulation of Analog-to-PCM encoding".

Men följande länk från Stereophile gör gällande att det handlar om arkivering:

As described in Stereophile some years back (footnote 1), Direct Stream Digital is a new way of digital-encoding an analog signal, and was developed by Sony's engineers in order to archive Sony Music's priceless catalog of recordings. While DSD is fundamentally different from the conventional Linear PCM encoding used on CD and DVD-Audio, there is a connection at the A/D level, in that both involve oversampling delta-sigma converters (footnote 2).

Vidare skriver Wikipedia följande:

When comparing a DSD and PCM recording of the same origin, the same number of channels and similar bandwidth/SNR, some still think that there are differences. A study conducted at the Erik-Thienhaus Institute in Detmold, Germany, seems to contradict this, concluding that "hardly any of the subjects could make a reproducible distinction between the two encoding systems. Hence it may be concluded that no significant differences are audible."

Länk till Wiki.

Edited by conan
Link to comment
Share on other sites

Den (vanligaste orsaken) kan vi avskriva direkt!

Utveckla gärna. Hur ofta är DSD/SACD- och PCM-utgåvor helt identiskt mastrade?

Suggestionseffekter är ju populära i vissa kretsar och en möjlighet.

"Populära"? Snarare en felkälla som alla bör vara medvetna om i fall där lyssning görs öppet.

Som det skrevs tidigare i tråden så var DSD framtaget för arkivering. Stämmer mycket bra! Men inte för uppspelning? Den får jag inte ihop och låter extremt långsökt. Varför skulle man vilja arkivera i något annat än formatet det ska spelas upp i? Vad blir vinsten? Bakgrunden var att arkiveringstekniker var missnöjda med PCM eftersom det inte fångade ljudet från taperna som skulle arkiveras. Därav utvecklades DSD. Ska dock tilläggas att detta är 80-90-tal och mycket hänt med PCM sen dess.

Det var inte PCM man var missnöjd med och inget har hänt med PCM sedan dess. Däremot har implementationerna ändrats lite.

Vad man var missnöjd med på den tiden var A/D-omvandlarna, och specifikt då med filtren som användes nära det hörbara området (digitala i delta/sigma-omvandlare och analoga i SAR-omvandlare).

Det man gjorde var att plocka ut modulatorsignalen (alltså före det digitala filtret) från en 1bit/64xFS A/D-omvandlare och det är det som kallas DSD.

Vinsten var att man då hade en "rå" modulerad signal med så lite påverkan från dåtidens hårdvara som möjligt som kunde arkiveras och senare konverteras till vanlig PCM för vidare behandling/utgivning.

Att spela upp den modulerade signalen fanns inte med i planerna på den tiden eftersom signalen inte kunde behandlas på något vettigt sätt utan att konverteras till vanlig PCM.

Och för att spela upp signalen skulle du antingen behöva implementera ett analogt filter nära det hörbara området (och då förstöra hela poängen med DSD) eller chansa på att den extremt höga ultraljudsdistorsionen

inte orsakade hörbara artefakter (intermodulation, etc.) i uppspelningshårdvaran.

Fördelarna med DSD som arkiveringsformat försvann i takt med att A/D-omvandlarna blev bättre och när hela industrin gick över till multi-bits delta/sigma i slutet av 90-talet var formatet i stort sett meningslöst.

Hur många bitar då och hur höga frekvenser?

Mellan 3 och 7 bitar är väl det vanligaste och modulationshastigher från 128x och uppåt.

Njaa stämmer inte, det blir fler DACar hela tiden som tar emot DSD64 och DSD128

Jag refererade till själva A/D och D/A-kretsarna.

DSD har mycket riktigt fått en liten "hype" den senaste tiden, vilket har lett till att många tillverkare (iaf de riktade till "audiofiler") vill stödja formatet.

Hur länge det varar får tiden utvisa, men man kan inte räkna med något större genomslagskraft så länge inte de stora elektronikjättarna, skivbolagsjättarna och framförallt konsumenterna är

med på tåget.

Link to comment
Share on other sites

Utveckla gärna. Hur ofta är DSD/SACD- och PCM-utgåvor helt identiskt mastrade?

Har tillgång till hela Opus3 arkiv av Master Taper, dvs identisk källa. Och det har ju varit nästintill omöjligt att göra en ren DSD kopia tills Korg MR2000S kom för ett tag sedan. Så nu för första gången kan vi gå direkt från mastertape till DSD utan något PCM mellansteg. Resultatet är fantastiskt och det mest identiska mastertapen jag & Jan Eric hört. Jag har personligen inte varit speciellt intresserad av SACD. Men DSD filer är en annan sak, speciellt dubbel DSD. Och det finns massor kvar att utveckla! Därav mitt engagemang för formatet! :) Som jag tror kan bli audiofilformatet för framtiden. Massorna har ju Itunes & Spotify och det lär inte ändras.

F.ö så fick jag reda på att Oppo's uppgradering kom i lördags. Även Weiss är nu med på tåget.

Link to comment
Share on other sites

Suggestionseffekter är ju populära i vissa kretsar och en möjlighet.

Men om du inte kan utesluta det så är ju era tester inte värda något.

Varför gör ni inte ordentliga tester? Det vore väl något, att komma med ett resultat som emotsäger alla hittills gjorda seriösa tester?

Link to comment
Share on other sites

Apropå tester, här är en länk till en ABX test där man jämför DSD med PCM 176.4 kHz. Testen är gjord 2004.

http://old.hfm-detmold.de/eti/projekte/dip..._paper_6086.pdf

Ja, fast de hade missljud vid omkopplingen som var olika för DSD och PCM, så de få detekteringarna kan man inte dra alltför stora växlar på. Dock var det ju omöjligt för de allra flesta att skilja dem åt.

Link to comment
Share on other sites

Guest dicdac
Ja, fast de hade missljud vid omkopplingen som var olika för DSD och PCM, så de få detekteringarna kan man inte dra alltför stora växlar på. Dock var det ju omöjligt för de allra flesta att skilja dem åt.

Man väl inte "dra några växla" överhuvudtaget av det resultatet? Det blev ju ett nollresultat.

Link to comment
Share on other sites

Man väl inte "dra några växla" överhuvudtaget av det resultatet? Det blev ju ett nollresultat.

Nja... Det var ett fåtal personer (fyra av 145) som fick statistiskt signifikanta serier (en hade 100% rätt). Dock upptäckte man då att start/stop-kommandot gav ett missljud som skiljde sig mellan DSD och PCM som gör att man inte kan utesluta Typ I-fel.

Because of its principle of operation, when a “stop” or

“play” command was issued directly or indirectly, the

DSD encoding in conjunction with the “non-audio

format” which was used for file storage on the multichannel audio workstation caused a very brief, low-level

crackling sound. A similar sound also occurred in PCM

mode at similar moments, but was subtly different

sounding. It could probably have been avoided only by

fading in and out in the digital domain—but any such

fades would have required converting the DSD

internally to multi-bit format at the most crucial stage,

thus contradicting the fundamental design approach of

the experiment, and in any event would have been

extremely difficult given the non-audio data storage

format. Despite intensive work on this problem, a

restructuring of the originally planned computer

arrangement and consultation with some of the firms

which supported the listening tests, a solution by means

of additional hardware or software was not obtainable at

the time. Evaluation of the test subjects’ questionnaires

showed that this noise was not consciously perceived by

any of them, and that the test does not lose any validity

on account of it.

Jag tycker att det är tråkigt att man inte gick vidare med detta och arrangerade ytterligare test för att utröna om de skillnader som "de fyra" hörde härrörde sig från musiken eller från switchningen.

Edited by Almen
Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...