소리이야기

디지털 음원

다재헌 2019. 11. 30. 21:55

 

 소리를 처음으로 기록하는데 성공한 사람은 에디슨이다. 원통 표면에 밀랍을 바르고 소리의 진동에 따라 진동하는 스틸러스로 홈을 만들고 다시 그 홈을 따라 스틸러스가 움직이도록 하여 진동을 재생함으로써 소리를 재생시킬 수 있었다. 그러다가 소리의 진동에따라 진동하는 거울을 통한 빛을 영화 필름에 투사하여 소리를 기록하고 다시 재생하는데 성공함으로써 무성영화 시대의 종언을 맞게 되었다. 그 후에는 마그네틱, 즉 자석 가루를 고르게 바른 테이프에 소리 진동에따라 변화하는 자기장을 이용하여 자석가루가 뭉치고 흩어지게 함으로써 소리를 기록하게 되었고, 또 LP판에 홈을 파는 방식으로 소리를 기록하고 다시 재생할 수 있게 되었다. 이 때 소리는 시간에따라 변화하는 음압 변화로써 종파지만 횡파적인 표현을 할 수 있다. 마이크로 소리를 전기신호로 바꾸어 오실로스코프(oscilloscope)로 볼 수 있는데 이 신호가 아날로그(Analog) 신호이다. 이는 [그림1]의 파란선이다.

[그림1] ADC 설명도( https://www.planetanalog.com/adcs-analog-to-digital-converters-basics/)

  그러나 현대에는 아날로그 신호를 0과 1의 이진코드로 구성된 디지털(Digital) 신호로 변환하여 신호를 가공, 수리, 보완하기 쉽게, 즉 알고리즘 처리하여 기록하고 재생하는 세상이 되었다. 이 때 아날로그 신호를 디지털 신호로 변환하는 기능을 갖는 집적회로가 ADC(Analog to Digital convertor)이다. 

 

 ADC는 세부분으로 나뉘어 일을 수행한다. 첫째는 표본화(Sampling)이고, 둘째는 양자화(Quantized)이고, 셋째는 부호화(coding)이다. 표본화는 [그림1]의 시간축의 눈금을 매기는 작업이라고 할 수도 있다. 즉 아날로그 신호의 값을 읽을 시간 간격을 결정하는 것으로 1초에 몇 번의 그래프값을 읽을 것인가를 나타내는 값이다. 이를 샘플링 레이트 또는 샘플링 주파수라고 부른다. 예를 들어 샘플링 주파수가 44.1kHz라면 1초를 44100등분한 시간 즉, Ts=2.26×10^(-5) 초 마다 신호값을 읽는다는 의미이다. 단, 샘플링 레이트를 크게하지 않으면 기록 및 재생하고자하는 소리의 최고 주파수가 낮아져서 음질이 열화될 수 있다. 보통은 샘플링 주파수의 1/2되는 주파수를 최고 높이로 갖는 소리성분까지만 디지털 신호로 변환되고 기록된다.  만일 샘플링 주파수를 20kHz로 설정하면 디지털 신호로 변환가능한 소리 최고주파수는 10kHz가 된다. 이 때 10kHz 이상의 소리 성분에 대하여는 엘리어싱(aliasing) 잡음이 발생하게 된다. 실제로 MP3음원을 스펙트럼 분석해 보면 재생음의 최고 주파수가 11kHz인 경우와 [그림2]와 같이 16kHz인 것을 확인할 수 있다. 이런 음원의 경우 스피커가 아무리 고음역을 재생할 수 있는 능력이 있을 지라도 음원에 16kHz 이상의 소리 성분이 없기 때문에 의미가 없다.  

[그림2] 20Hz~16kHz의 주파수 성분만 갖는 MP3 디지털 음원

 그러나 근래에는 가청영역대를 모두 커버하기 위해서 샘플링 주파수를 44.1kHz로 설정하거나 96kHz로 설정하여 노이즈를 제거한 고음질의 음원을 공급하고 있다. 보통 말하는 CD급 음질이란 샘플링 주파수를 44.1kHz로 설정한 경우로 [그림3]과 같이 가청 최고음 20kHz 성분도 기록하고 재생하는 음원이다. 

[그림3] 가청영역을 모두 커버하는 WAV or CD 디지털 음원

 다음 양자화는 y축 상의 눈금을 매기는 작업이라고 볼 수 있다.  y축의 눈금을 몇개로 할 것이냐라는 문제는 결국 역동범위를 의미하는 것으로 몇 dB 또는 몇 볼트(volt)까지의 신호를 읽어낼 것이냐 하는 문제이다. 이는 몇 비트(bit)로 y값을 읽을 것이냐로 결정된다. 즉, 4비트로 읽게 되면 y축을 16등분하게 되고 8비트로 설정하면 2^8=256 등분하여 y축을 나누어 눈금을 주게된다. CD는 16비트로 설정하여 y축 눈금을 주기 때문에 y축을 2^16=65,536 등분을 하게되며 이는 20×Log(65,536)=96.3dB의 소리까지 디지털 값으로 읽을 수 있다는 의미가 된다.  그 보다 더 큰 소리는 정점 절단 시켜 읽을 것이므로 파형 변화에 따른 잡음이 발생할 수 있으나 이런 파형까지 보정하는 알고리즘을 개발하여 신호를 디지털화 한다면 녹음 및 디지털 신호처리(DSP) 기술의 진전을 이룰 것이다. 

 

 다음은 부호화로써 매겨진 y축의 눈금으로 시간축에 대응하는 신호의 값을 2진 코드로 읽어내는 일이다. 즉 아날로그 신호를 디지털 신호화하는 단계라고 할 수 있다. 부호화를 거쳐 구해진 디지털 신호를 원하는 알고리즘에따라 프로그램으로 가공 및 압축하는 DSP과정을 거쳐 기록하던지 이 신호를 다시 DAC(Digital to Analog Convertor)를 거쳐 아날로그 신호로 변환시켜 스피커에서 소리로 재생하게 된다. 

 

     --------------------- by  Dajaehun