Jump to content

Recommended Posts

 

Digital audio

 

Digital audio är ett omfattande ämne. Syftet med denna tråd är inte att gå igenom hela ämnet, utan snarare dyka ner i vissa avsnitt som har mer intresse för vad de flesta på Euphonia kommer i kontakt med, dvs att lyssna på inspelad musik i hemmiljö. Det behövs ingen utförlig artikel för att lägga en cd i släden och trycka på play, men många av oss är noga med högkvalitativ återgivning och i strävan efter bra ljud hamnar man stundtals i kvasivetenskapliga resonemang som kan låta mer som voodoo än bondförnuft för en glad amatör. Därför kan det väl vara bra att gå igenom några grundläggande tekniker och begrepp inom digital audioteknik.

 

Jag börjar med en översiktsbild över inspelnings- och uppspelningskedjan.

Utan inspelning - ingen uppspelning :1952293183_slightlysmilingface:

 

image.png

 

Hyfsat begripligt, men hur fungerar de olika stegen i dessa kedjor mer i detalj, och vad är det för faktorer som påverkar dem :question:

 

Link to post
Share on other sites

Digitala och analoga signaler


Det som karakteriserar en analog signal är att den är kontinuerlig och avbildar något med en analogi. Variationen i det som avbildas har i varje ögonblick en avbild i proportion till det som avbildas. Analogin mellan avbildningen och det som avbildas åstadkoms med någon sorts transducer, dvs en apparat som omvandlar ett energislag till ett annat. En transducer kan omvandla mekanisk, magnetisk, elektrisk, termisk, kemisk eller akustisk energi. Analogin blir då att tex en kraft eller rörelse motsvarar en viss mängd magnetism, spänning, temperatur, ljusmängd, ljudtryck eller godtyckliga varianter av dessa. Dessa fysiska analogier fungerar när (eller eftersom) systemen har samma matematiska modeller.


En digital signal är diskret, dvs den avbildar genom att kvantisera med en sekvens punkter där varje punkt ges ett värde i proportion till det som avbildas.
För att skapa en digital signal utförs en process av sampling och kvantisering. Sampling och kvantisering är motsvarigheten till en transducer för analog signalbehandling. Sampling innebär att skapa en kontinuerlig sekvens värden vid diskreta tidpunkter. Man använder då en sample & hold-krets, vilket innebär en krets som läser av värden (samplar) från en analog signal och fryser respektive värde i en bestämd tidsperiod. Kvantisering innebär att byta ut varje värde med en approximation som väljs från en given serie diskreta tal, dvs en sorts avrundning.

 


Digitalt ljud
 

Som beskrivits i denna artikel kan ljud sägas utgöra vågformer som har en viss nivå och en viss tonhöjd. Det allra mesta ljud vi hör, inkl musik, är en salig blandning av olika toner (frekvenser) med olika nivåer (ljudstyrka).
Sedan i slutet av 1800-talet har man kunnat spela in dessa ljudvågor, och därefter spela upp dem igen.
Den in- och uppspelningsutrustning man använt i form av mikrofoner, grammofoner eller magnetband lagrar vad man kallar en analog signal. Det innebär att graveringen i en LP respektive magnetiseringen på ett magnetband följer ljudvågens form kontinuerligt i "realtid":

 

image.png

 

Digitalt ljud lagras på ett i grunden annorlunda sätt. Den analoga signalen diskretiseras eller samplas, dvs den delas upp med jämna tidsintervall, där varje intervall får ett värde från vågformen:

 

image.png

 

Detta kallas för pulskodmodulering och förkortas pcm. Tidsintervallets storlek (avståndet mellan pulserna) kallas för samplingsfrekvens, och precisionen i det valda värdet definieras av bitdjup.

Ju högre samplingsfrekvens, desto tätare är det mellan de värden som samplas. Det innebär att avbildningen blir mindre känslig för hastiga ändringar i signalen:

 

image.png

 

Och ju högre bitdjup, desto närmre det exakta värdet på den analoga grundformen. Även om man har hög samplingsfrekvens så kan värdet bara väljas i diskreta steg:

 

image.png


Kvantiseringen (avrundningen) kan göras med linjära nivåer, dvs avrundningen och därmed felet blir lika stort oavsett om signalen är svag eller stark. Det finns andra algoritmer där kvantiseringen tex är en funktion av signalens amplitud, men linjär pcm (LPCM) är det som normalt avses och standarden för tex cd (Red Book) baseras på LPCM. 

Den digitaliserade signalen lagras som en bitström, dvs en binär sekvens av bitar där varje bit kan vara en etta eller en nolla. (Anm: Många spelare med digital utgång anger om signalen är pcm eller bitstream. PCM är också en bitstream, men här avser man om utsignalen ska skickas ograverad så som den lagrats på mediat eller om den först ska avkodas till pcm. Mer om detta senare.)

 

 

 

Historik


Grundtekniken med pcm har egentligen använts sedan mitten av 1800-talet inom telegrafi mm, och senare inom telefoni, radio och fax redan före 2:a världskriget.
Den första pcm-inspelningen gjordes i Japan av NHK 1967. Fem år senare släppte Denon en 8-kanals pcm-inspelningsmaskin med 13-bitars 47kHz upplösning.

 

R-10551375-1499736448-5925.jpeg.jpg....image.png....R-10263609-1494325819-9271.jpeg.jpg....R-10502289-1499038581-5444.jpeg.jpg

 

Den första prototypen till CD visades för några entusiaster 1979 i Europa och Japan. Året därefter bildade Sony och Philips ett team för att ta fram CD för konsumentmarknaden. De bestämde sig för en tunn, skinande lagringsdisk som kunde innefatta ca 80 min musik och som kunde sättas i en cd-spelare. Digital Audio Disc Committee godkänner den standard som Sony-Philips föreslår och formatet definieras i Red Book.

Både Sony och Philips lanserar cd-spelare för det nya systemet 1982, Philips med CD100 och Sony med CDP-101. CD-skivor blev tillgängliga för allmänheten samma år och de blev snabbt det mest effektiva sättet att lagra musik.
 

image.png....image.png

Philips CD100 och Sony CDP-101, de första kommersiella cd-spelarna. Bild: Catawiki och Alamy

 

Den första kommersiella musik-CDn var albumet "The Visitors" av ABBA. Den CD som sålt mest genom tiderna är Eagles Greatest Hits, som sålt i över 38 miljoner ex. Den första helt digitala inspelningen gjordes med en 3M-bandspelare för Ry Cooders album "Bop Till You Drop". Donald Fagens "The Nightfly" är en mycket tidig digital inspelning som visar att man behärskade tekniken redan från kommersiell start.

 

CD-skivans marknadsandelar steg markant år från år, men tekniken fortsatte utvecklas.

Sony hade ett gigantiskt arkiv av masterband, och man ville hitta ett digitalt arkivformat som inte skulle bli förlegat inom snar framtid. Det vore en kommersiell katastrof om det format man använde inte höll måttet i framtiden. Det Sony kom på var att i den process man hade för AD-omvandling så fanns det ett steg i digitaliseringen innan man förband sig till ett specifikt digitalt format. Så, det var detta man spelade in. En ΣΔ-modulerad 1-bits digitalström skapades rakt av helt utan editering och med så hög samplingsfrekvens att man garanterat skulle få med alla nyanser från masterbanden. Filstorleken (det var många band) motsvarade ungefär pcm 24/96, och pcm 24/96 betraktades som ett mer riskabelt format ur marknadssynpunkt. De där 24 bitarna är bara ineffektiva. Varför ska man spara det exakta värdet för varje sampel när det räcker att man vet om värdet är större eller mindre än föregående värde? Bättre då att sampla tätare. Det beslutet innebar att man inte kunde editera. Man kunde inte plocka ut ett stycke musik från dsd-strömmen och bearbeta den, eftersom det inte finns nån referens. Men det var inte heller syftet. Dsd skulle absolut inte editeras, tvärtom. Tanken var att när något arkivmaterial skulle användas, så kunde man konvertera det till vilken analog eller digital signal man än önskade. Därefter kom Philips in i bilden, och efter deras samarbete med lanseringen av cd började man snegla på dsd och därifrån kom lanseringen av sacd, för ca 20 år sedan. Sony och Philips gav specifikationen för formatet namnet "Scarlet Book".

 

image.png

 

 

I början på 90-talet lanserades också en codec för audio som drastiskt minskade filstorlekar men bibehöll acceptabel ljudkvalitet, MPEG-1 Audio Layer III, eller mp3 i kortform. Det var främst Karlheinz Brandenburg vid Fraunhofer IIS som utvecklade algoritmer för ljudkompression utifrån perception. Det sägs vara mest hans egen perception av Susanne Vegas "Tom's Diner" som låg till grund för utvecklingen. Formatet standardiserades 1993 i ISO/IEC 11172-3.

 

Parallellt med illegal rippning och fildelning via tjänster som Napster, mp3.com m.fl utvecklades bärbara och billiga mp3-spelare. Formatet fick snabbt världsomspännande spridning, och ungdomar hade enorma musikbibliotek på sina hemdatorer.

Jag tror att den ursprungliga tanken med Napster var god, man ville utveckla en tjänst för spridning av obskyr musik som ingen av de lokala skivhandlarna tog hem på varken LP eller cd. Konsekvensen blev att man sänkte hela musikindustrin. Men borde inte musikindustrin själv varit mer kreativ och proaktiv under alla dessa år?

 

image.png

 

 

 

Grundaren till Napster, Shawn Fanning, hade en Metallica T-shirt på sig på en MTV-gala, och när värden kommenterade “nice shirt” svarade han "A friend of mine shared it with me, but I’m thinking of getting my own”. Lars Ulrich satt i publiken, men låtsades sova.

 

 

 

Lawrence Lessig representerade Napster i stämningen från RIAA:

Quote

Lawrence Lessig claimed that the decision to prevent Napster trading of copyrighted music made little sense from the perspective of copyright protection: "When Napster told the district court that it had developed a technology to block the transfer of 99.4% of identified infringing material, the district court told counsel for Napster 99.4% was not good enough. Napster had to push the infringements 'down to zero.' If 99.4% is not good enough," Lessig concluded, "then this is a war on file-sharing technologies, not a war on copyright infringement."

 

Winamp släpptes som freeware 1997, och Nullsoft tjänade 10 MSEK/år när de ändrade licensen till shareware utan att ändra innehållet. Entusiastiska användare skickade $10 checkar i mängder till den lilla firman.

 

I takt med att hårddisk blev billigt, processorer och minnen blev snabbare, och utbyggnaden av bredband tog fart så minskade kraven på små filstorlekar. Nya codecs som aac, ac3, wma och flac utvecklades. De flesta innefattar komprimering i kodningen, men en del av dem utan förluster i ljudkvalitet vid avkodning.

 

Det var främst inom gaming som utvecklingen skedde kring strömning av media. SimpleDevices, TurtleBeach och senare Sony Playstation och Microsoft XBOX implementerade lösningar för strömning av både audio, video och annan data. Uppkoppling mot databaser och så småningom online gaming var de stora pådrivarna.

 

Från början av millenieskiftet gick utvecklingen snabbt inom alla områden kopplat till digital audio. Computer audio blev hushållsvara, digitala inspelningar blev standard, digital hårdvara boomar inom alla prissegment från en hundring till mångmiljonklassen. Musikdistributionstjänster som Spotify, Tidal och Qobus etableras. Communities som Roon och iTunes har miljoner medlemmar, där både hård- och mjukvara tillhandahålls av it- eller elektronikföretag. Helt nätbaserade bolag nischar sig med försäljning av spår eller album, Bandcamp för små artister, eClassical för klassisk musik eller HDTracks för högupplöst pcm och dsd. Konserthus och spelställen strömmar konserter live till medlemmar eller pay-per-view.

 

 


Brus, dynamik och överstyrning


Inom analog signallagring är det det fysiska mediat som bestämmer max- och min-nivåer på signalen, inklusive brus. Hur mycket man kan magnetisera ett band och hur djupt man kan gravera en LP bestämmer dynamik- och frekvensomfång för en given speltid. Kraftfaktorn i transducern (tonhuvud/pickup) avgör vilken nivå utsignalen får i volt.


Inom digital signallagring har man i stället en skala 0 till 100%, och hela inspelningen måste hålla sig inom dessa 100%. Som vanligt uttrycks detta i dB, och 100% signal definieras som 0dBFS, noll decibel full scale. Förstärkningen i analogdelen i da-omvandlaren avgör vilken utnivå detta kommer motsvara. Om tex en cd-spelare förstärker utsignalen till 2 V så motsvarar 0dBFS 2V.

 

Inom analog signalbehandling har man alltid brus från inspelningsrummet, mickar, elektronik, filter mm, och vid varje kopiering ökar detta brus. Inom digital signalbehandling har man också brus från inspelningsrum, mickar och elektronik, men när väl signalen är digitaliserad kan den hanteras utan att detta brus ökar. Dock har man så kallat kvantiseringsbrus. Processen som beskrivs ovan ger ett lägsta brusgolv som definierar hur mycket dynamik det teoretiskt går att skapa för 0dBFS. Kvantiseringsbruset beror av bitdjupet, och det finns alltid ett fel så länge bitdjupet inte är oändligt. Storleken på detta fel definierar den undre gränsen på signalnivå. Man kan säga att för väldigt låga ljudnivåer kan en signal med lågt bitdjup inte bestämmas till ett precist värde. Varje extra bit sänker brusgolvet med 6dB. För 8-bitars ljud ligger brusgolvet på -48dB, och för 32-bitars ljud ligger det på osannolika -192dB.

 

Hela inspelningen måste hålla sig under 0dBFS. Varje transient eller tillfällig instrumentmix som överstiger den nivån gör att kvantiseringen klipper:

 

image.png

 

 

Nyquists samplingsteorem

 

Samplingsteorem får en egen rubrik eftersom det är helt grundläggande för vilken standard man kan erhålla för digitalt ljud.

Vi ska dock inte fördjupa oss i det utan bara konstatera att när man samplar en analog signal, så måste man göra detta så tätt som motsvarar signalens frekvensomfång gånger två. Med andra ord, man kan inte återskapa en signal till mer än hälften av samplingsfrekvensen.

 

image.png

 

Om man ska mäta och dokumentera en signal (vilken som helst) som har en bandbredd på säg 100Hz, så måste man ha mätpunkter var 0.005:e sekund för att exakt kunna återskapa alla förekommande signaler som innehåller 0 till 100 Hz.

Bandbredden inom audio är som bekant 20kHz, varför man behöver sampla med som mest 25µs tidsintervall (motsvarar 40kHz) för att undvika fel i samplingen.

 

Detta krav var allmän kunskap sedan länge inom kommunikation före förra sekelskiftet, men det var Harry Nyquist och Claude Shannon som först beskrev teoremet i samband med deras arbete med telefoni på 1910- och 20-talet.

 

harry-nyquist.jpg The Nyquist Limit: Tips & Help: Equipment: Electron Microscopy Center:  Indiana University

Harry Nyquist och Claude Shannon. Bild: Indiana University

 

 

AD-omvandling

 

Ovanstående figurer är schematiska för att ge en övergripande beskrivning. För att praktiskt kunna skapa den digitala signalen behöver man beskriva några ytterligare trix i AD-omvandling.

 

Vid mastring av en analog inspelning till pcm inleder man med en lågpassfiltrering av den analoga signalen. Det finns flera skäl till detta. Dels vill man ta bort högfrekvent brus och störningar för att inte kontaminera signalen med vikningsbrus. Detta filter rensar såklart också bort överstyrning utanför bandbredden, men kan även användas att begränsa ström och nivåanpassa spänningen till efterföljande AD-omvandlingskrets.

Ju högre samplingsfrekvens man avser använda i kommande steg, desto flackare filter kan man använda utan att riskera påverka magnitud och fas inom audiobandet.

 

image.png

 

 

Sample & Hold är en krets för att sätta det värde man får i varje sampel att gälla konstant under hela tiden fram till nästa sampel. På så vis har man en sammanhängande signal som inte är noll mellan varje sampel. För att kunna ta ett sampel används en analog switch (tex en JFET eller MOSFET) och för att hålla detta värde konstant till nästa sampel behövs en kondensator.

 

image.png

 

Signalen är fortfarande analog (om än diskret), och det är först när kvantiseringen är gjord som signalen kan lagras digitalt. Kvantiseringen innefattar att tilldela sampelvärdena något av de närmevärden som är möjliga utifrån aktuellt bitdjup. Ju högre bitdjup desto bättre approximation. För 8-bitars ljud finns det 28=256 tal att välja mellan, för 24-bitars ljud finns det 224=16 miljoner tal.

Därefter kan dessa värden skrivas om i binär form.

Exempel: antag att vi har ett analogt sampel som är 1.32V och att detta ska kvantiseras till 4-bitars ljud. Antag vidare att max amplitud från inspelningen sätts till ±2.00 V. Då måste vi välja ett värde i 0.27V-steg:

 

image.png  

 

image.png

 

Det finns en rad olika metoder för att så precist och snabbt som möjligt bestämma approximationen för aktuellt antal bitar. En vanlig metod är så kallad successiv approximation, här exemplifierad för en 4-bitars kvantisering:

 

 

successiv-approximering-001.gif

 

Felen i approximationerna i kvantiseringen visar sig som kvantiseringsbrus. För 8-bitars ljud är felet ±2, för 24-bitars ljud är felet ±0.00003.

Dynamikomfång så som det anges för digitala format är alltså bara en matematisk konsekvens, det har väldigt lite med verkliga förhållanden att göra.

 

All inspelning är analog i något led, eftersom man måste ha en transducer i mikrofonen för att omvandla ljudtrycket till en elektrisk signal innan digitalisering. Nästkommande led kan dock utföras med analog eller digital inspelning, mixning och/eller mastring. Den 3-siffriga SPARS-koden på cd-skivor anger detta. Så koden AAD innebär analog inspelning och mixning, medan mastring är digital (självklart ett krav för cd). DDD anger att både inspelning, mixning och mastring utförts digitalt.

 

image.png

 

 

Link to post
Share on other sites

 

CD-spelare och andra digitala musikspelare

 

Många spelare har en diskläsare eller så kallad transport och digital till analog omvandlare (DAC) samt klocka integrerat i samma låda.

Men det förekommer mängder av varianter med separat transport och dac, separat klocka och framför allt är det snart vanligare med strömmad musik där transporten ersätts med en dator och mjukvara eller strömmare. En del spelar enbart cd eller sacd, medan andra spelar allt från brända filer till hdcd, bluray, dvd audio och andra highres-format samt surround. Utöver detta finns det en rad olika standarder för att transportera den digitala audioströmmen mellan enheter.

De olika huvudfunktionerna beskrivs därför var för sig i följande avsnitt.

 

p1x_front.jpg

Dual mono sacd transport med separat nätdel från Esoteric. Bild: esoteric.jp

 

 

Transport

 

En transport består normalt av en släde för skivor, en motor, en laser för avläsning, ett servo som styr motorhastigheten, ett kretskort med digitalutgång och en nätdel för spänningsmatning till dessa komponenter.

 

Motorn roterar skivan med ca 500 rpm och en laser riktad mot en fotocell skannar skivan inifrån och ut. Motorn saktar ner kontinuerligt under skanningen, så att fotocellens avläsningshastighet är konstant. 

En cd-skiva har binärkoden lagrad fysiskt som en enda lång spiral med präglade gropar och plana delar:

 

image.png

 

 

Lasern strålar mot skivans undersida och ljuset reflekteras mot aluminiumskiktet i skivan. För plana delar reflekteras ljuset rakt tillbaka, medan groparna diffuserar ljuset. Varje tidsenhet kommer det således antingen en ljusreflektion eller ingen ljusreflektion.
När ljuset reflekteras tillbaka detekteras det av fotocellen som skickar en elektrisk puls till en elkrets som då genererar en etta. När det inte reflekteras ett ljus till fotocellen, genererar elkretsen en nolla.

 

 

image.png

 

 

 

image.png

 

 

 

Optiska pickuper (OPU) eller i dagligt tal "laser" till cd-, sacd-, dvd- och bluray-spelare använder ett astigmatiskt detektionssystem.

 

OPU-01.jpg (klicka för större bild)

 

 

Bilden visar en 3-stråles optisk pickup, där laserdioden lyser med tre strålar mot ett diffraktionsgaller som delar upp varje stråle i ett knippe ljus som träffar ett polarisationsfilter och därefter en spegel. Det utgående ljuset speglas mot en kollimeringslins för att parallellrikta ljuset och därefter en kvartvågsplatta som konverterar ljusets vågutbredning. Innan ljuset träffar cd-skivan passerar det en objektivlins som fokuserar strålarna mot plana och gropiga delar i spåret.
Det reflekterade ljuset passerar tillbaka genom objektivlinsen, mot spegeln och polarisationsfiltret, för att slutligen träffa en yta på fotosensorn.

 

Konstruktionen ser onödigt krånglig ut, men är helt avgörande för att sensorn ska kunna fokusera med så högfrekvent ljus och kontinuerligt ha kännedom om spåravvikelse och fokuseringsfel.

 

Fotosensorn omvandlar ljusintensitet till en elektrisk spänning för olika ytor på sensorn, här indelade i A, B, C, D. Objektivlinsens placering styrs av fotosensorn som ger en spänning till en moving coil för att flytta linsen till bästa möjliga fokus.

 

image.png

 

Att man läser av rätt spår styrs på liknande sätt av ljusfläckar från strålarna E och F.

 

 

 

Hur mycket data man kan trycka in på en skiva beror på hur tätt man kan prägla aluminiumskiktet med gropar och vilken typ av ljus man kan använda i lasern.
På en cd-skiva är en grop 0,8µm och det röda ljusets våglängd från dioden är 780nm. Ljuset i en dvd-laser har 650nm våglängd och groparna är 0,4µm. Det gör att en dvd kan lagra 4,7 GB (8,5 GB för dual layer) medan en cd endast kan lagra 680 MB.
Blu-ray använder blå-violett laser med 405nm våglängd och kan lagra 50 GB. Det finns som bekant en hel rad olika varianter, men här är ett par exempel illustrerade för att ge en känsla för principerna:

 

image.png


Jämförelse av geometrier för laser och prägling mellan cd och blu-ray.

 

 

För Hybrid SACD spelas skivan med två lasrar, 780nm för cd och 680nm för sacd, och objektivet har olika bländaröppning, så att för det halvtransparenta sacd-lagret fokuserar linsen på 0,6mm från ytan och för cd på standard 1,1mm:

 

 

image.png

Hybrid sacd.

 

 

Utvecklingen fortskrider och det är inte långt bort med multilager holografiska skivor som kan lagra uppåt 1,6 TB.

 

Discos ópticos : Discos ÓpticosHolographic Versatile Disc – Wikipedia

HVD (Holographic Versatile Disc). Bild: discosopticoslosazulejos

 

 

 

Streamers, digitala mediaspelare, nätverkstransporter mm

 

Musik blir mer och mer tillgängligt som filer, antingen direkt från musiktjänster som Spotify, Tidal, Qobus m.fl, eller för musikfiler som säljs för nedladdning från nätbutiker. Musiken spelas då med en mjukvaruspelare och strömmas med ethernet eller wifi, lokalt eller med Internet.

Enbart denna typ av strömmare, kringutrustning, format och tekniker är så omfattande att det kräver en separat artikel. Dessutom är det inte mitt område :1952293183_slightlysmilingface:

Jag nöjer mig därför med denna korta notis om strömmare, och konstaterar bara att dessa digitala mediaspelare är transporter för digital audio där gränssnittet till transporten är UPnP med ethernet, wifi eller anslutna hårddiskar, och output mot en dac är de sedvanliga s/pdif, aes3 eller usb.

Esoteric N-03T finns hos Ultimate.se | Sounds Perfect

Esoteric Network Audio Transport N-03T. Bild: esoteric.jp
 

 


DA-omvandlare

 

Output från transporten ska nu rekonstrueras och omvandlas till en analog signal i linjenivå, och det görs i en DAC. De fysiska huvudkomponenterna i en dac är (oftast) ett dac-chip, klocka eller klockgränssnitt, filter, nätdel, ingångsgränssnitt och utgångsgränsnitt.  

 

 

ESS Technology will integrate MQA rendering into its SABRE DACs -  HardwareZone.com.sg

Dac-chip från ESS Technology. Bild: Apogee Digital

 

Dac-chippet är normalt en ic-krets som innefattar någon form av transkodning för att anpassa den digitala signalen till nästa steg, samt en dekoder, exvis en delta-sigma-modulator med översampling. Därefter behövs filter för rekonstruktion till en analog signal och biasering till linjenivå. Både filter för eliminering av vikningsbrus (anti-aliasing) och rekonstruktionsfilter är lågpassfilter vars syfte är att ta bort oönskat högfrekvent brus. Anti-aliasing bandbreddsbegränsar till aktuellt format, och rekonstruktionsfilter tar bort oönskat brus från samplingen.

 

Det första som görs i DA-omvandlingen är att läsa de paket av binärkod som skickas i bitströmmen. Varje paket innehåller ett sampel där binärkoden omvandlas till ett flyttal:

 

image.png

 

 

Nästa steg är att rekonstruera en kontinuerlig analog signal som kan skickas till en förstärkare. Man behöver ett rekonstruktionsfilter. För att göra det bör man i DA-omvandlingen (på samma sätt som i AD-omvandling) definiera en bandbredd så att man kan filtrera bort speglingsprodukter pga vikning. Det perfekta filtret är sådant att under delningsfrekvensen är responsen 1.0, och över delningsfrekvensen är responsen 0.0.
Rent tekniskt innebär det att responsen är en rektangelfunktion i frekvensdomänen:
 

image.png

 

 

En sådan rektangelfunktion i frekvensdomänen (dvs ett idealt lågpassfilter) innebär att impulssvaret är en sinc-funktion i tidsdomänen:
 

image.png

 

 

Matematiskt betyder det att FFT av en sinc-funktion (sinx/x) är en rektangelfunktion (image.png).

Den perfekta sincen eliminerar alla frekvenser över den valda bandbredden, utan att påverka lägre frekvenser varken i amplitud eller fas.

Output från dekvantiseringen är ett värde i volt för varje sampel. Om man lägger en sinc över varje sampel och adderar bidragen från de då överlagrade sincarna så erhålls en mycket bra approximation för ett godtyckligt antal punkter som ligger mellan varje sampel.

 

image.png

 

På så vis får man en mycket bra approximation för punkterna mellan varje sampel:

 

image.png

 

Vi har i vårt exempel valt en pcm-ström med både låg samplingsfrekvens och lågt bitdjup för att kunna illustrera vad som ger vad. Trots detta ser vi att rekonstruktionsfilter med sincen ger en väldigt bra approximation och återskapande av den analoga signalen. Med hög samplingsfrekvens och högt bitdjup blir återskapandet mycket exakt.

 

Det är inte helt intuitivt hur sincen samtidigt fungerar som ett lågpassfilter. Men om man tittar på ett mer extremt exempel med kraftigare diskontinuiteter så ser man det tydligt. Exvis en sågtandsignal som filtreras med sincen:

 

image.png

 

 

 

Diskret DAC, NOSDAC

 

Det förekommer även diskreta dacar, där ic-kretsen ersätts med passiva och aktiva komponenter, typiskt en R/2R-stege och mosfetar eller bipolära transistorer, där varje R/2R+mosfet motsvarar en bit.  Kretsen utgör en summerande förstärkare som normalt beräknar spänningen direkt från bitströmmen utan översampling, varvid den kallas NOSDAC (non-oversampling dac). Filtrering i en sådan dac utförs normalt i den analoga domänen.

Här är ett exempel som motsvarar en 4-bitars dac, där D1-D4 tar emot inkommande bitar som var för sig kan anta värdet 0 eller 1. En 1:a ger då en spänning på den ingången, medan en 0:a lämnar den ingången jordad:

 

 

image.png

 

 

Principen att omvandla binär kod till spänning har funnits sedan början på 60-talet och TTL (Transistor-Transistor-Logic) är exempel på en digital integrerad krets med 5V spänningskälla som omvandlar 0-0.8V till en logisk 0:a och 2-5V till en logisk 1:a.

 

Exempel på elektroniktillverkare som använder diskreta dacar i en del modeller är Esoteric, MSB, Sonic Illusions och Audionote. Här ser vi DAC-kretsen till en sådan 32-bitars diskret dac. R-2R-stegen är uppdelad i 4st halvcirklar per kanal för att få samma avstånd för signalöverföring i varje delkrets:

 

image.png

Esoteric Mastersound Discrete DAC. Bild: esoteric.jp

 

 

Klocka

 

All AD- och DA-omvandling styrs av en klocka som antingen sitter i ADC/DAC eller externt. Den används för att synkronisera olika delar av kretsen, och bestämmer takten för all digital transport av data. En klocksignal skapas av en oscillator (klockgenerator) som består av en piezoelektrisk kristall som vibrerar och på så vis skapar en elektrisk signal med mycket exakt frekvens. Om datatransport inte sker med perfekt periodicitet skapas jitter.

Klocksignalen i en DAC brukar benämnas WORD CLOCK eftersom den klockar sampel, och det finns ett sampel i varje WORD.

Kommunikationen mellan digitala kretsar kan ske synkront eller asynkront. I synkron kommunikation skickas WORD i klockans takt mellan kommunicerande kretsar och kretsarna taktar med varandra som ett roddarlag. I asynkron kommunikation interagerar också delkretsarna, men de kan arbeta var och en i sin egen takt oberoende av varandra.

 

Sida 2 – Äldre foton från Sollerö socken

Roddarlag. Bild: solfoto.se

 

 

Kablar och kontakter

 

De mest förekommande gränssnitten för överföring av digitalt ljud är s/pdif, aes3, usb, hdmi.

För s/pdif använder man då en 75 ohms koaxialkabel som termineras med rca-kontakter alternativt en optisk fiberkabel med toslink-kontakter.

För aes3 använder man antingen en balanserad 110 ohms tp-kabel med xlr-kontakter, eller en obalanserad 75 ohms kabel med bnc-kontakter.

Usb-kablar baseras på ett twisted pair för signal och 5V + jord för spänningsmatning.

Hdmi-kablar (utan ethernet) har fyra skärmade 110 ohms tp-kablar och sju separata ledare för kommunikation. 

 

Som kuriosa kan nämnas att många kontakttyper är förenade med licenskonstnader för tillverkarna. En hdmi-kontakt kostar tillverkaren 1.50 kr per apparat i licensavgift utöver en årlig administrationskostnad på 5-10 k$. Om tillverkaren implementerar kopieringsskyddet HDCP (bra namn!) och sätter HDMI-loggan på apparaten kostar kontakten bara 40 öre i licens.

 

Vi ska inte gå igenom kablar mer i detalj för det skenar iväg och blir dessutom snabbt inaktuellt. Enbart olika typer av usb-kontakter förekommer i en uppsjö varianter från typ A, B, C, mini och micro-varianter med olika specar;

 

image.png


Det finns redan idag ett dussin olika typer av USB-kontakter

 

Kablarna i sig är sällan det som avgör typ eller standard för signalöverföring utan det är snarare gränssnitten och bakomliggande protokoll. Men kablarna är ett pedagogiskt sätt att definiera vilken typ av digital audio som stöds av en dac med sådana kontakter. Eller rättare sagt kan stödjas, om da-omvandlaren har konstruerats med stöd för det. I nästa avsnitt ska vi titta på vilka digitala format som kan användas för olika gränssnitt.

 

Link to post
Share on other sites
2 hours ago, calle_jr said:

Enbart denna typ av strömmare, kringutrustning, format och tekniker är så omfattande att det kräver en separat artikel. Dessutom är det inte mitt område :1952293183_slightlysmilingface:

Finns det någon lika pedagogiks och kunnig herre, eller dam, som kan fylla i detta område åt calle_jr? 

Jag tror det finns ett stort intresse "där ute" att få en "komplett" digital-audio-förståelse-bibel :1952293183_slightlysmilingface:

Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...