3장 사운드(sound)contents.kocw.or.kr/document/03_sound.pdf · 2011-01-03 · 학습 목표. 2....

58
3장 사운드 (SOUND) 김성영교수 금오공과대학교 컴퓨터공학부

Upload: others

Post on 16-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

3장

사운드 (SOUND)

김성영교수

금오공과대학교

컴퓨터공학부

학습 목표

2

사운드의의미와기본요소를설명할수있다.

디지털사운드로의변환과정을설명할수있다.

디지털사운드의부호화방법을구분하여설명할수있다.

디지털사운드의압축방법을구분하여설명할수있다.

심리음향의특징에대해설명할수있다.

입체음향의원리및방식에대해설명할수있다.

개요

3

사운드(sound)란무엇인가? 귀로들을수있는모든정보를의미함

물체의진동(vibration of material)에의해발생하는물리적현상

공기분자의진동을나타내는하나의파형

종의진동 공기압의변화 고막의진동

기본요소 (Primitive)

4

주파수 (Frequency) 소리의높낮이

진폭 (Amplitude) 소리의크기

음색 (Tone Color, Timbre) 음의특징 (고유한소리의특징)

음압

시간

주기

진폭

주파수 (Frequency) : 1

5

초당사운드파형의반복횟수 (Hertz, HZ)

주기와는역수관계

주파수가높으면고음, 주파수가낮으면저음

1 초

주파수: 1Hz

1 초

주파수: 4Hz

음계 라(A3) 시(B3) 도(C4) 레(D4) 미(E4) 파(F4) 솔(G4) 라(A4)

주파수 220 250 262 294 330 349 392 440

주파수 (Frequency) : 2

6

음계주파수 = 'A'의주파수 x 2(N/12) (A: '라' 음, N: 1~12)

음계 음계 주파수

A 라 220Hz

A♯, B♭ ♯라, ♭시 220*21/12 = 233

B 시 220*22/12 = 250

C 도 220*23/12 = 262

C♯, D♭ ♯도, ♭레 220*24/12 = 277

D 레 220*25/12 = 294

D♯, E♭ ♯레, ♭미 220*26/12 = 311

E 미 220*27/12 = 330

F 파 220*28/12 = 349

F♯, G♭ ♯파, ♭솔 220*29/12 = 370

G 솔 220*210/12 = 392

G♯, A♭ ♯솔, ♭라 220*211/12 = 415

A 라 220*212/12 = 440

주파수 (Frequency) : 3

7

주파수에따른분류

저주파음 (Infrasonic): 0 to 20Hz

가청음 (Audiosonic): 20Hz to 20kHz

초음파음 (Ultrasonic): 20kHz to 1GHz

사람이낼수있는주파수대는약 100Hz ~ 6KHz 임

사람의청각은 1KHz ~ 6KHz 에가장민감함

순음

하나의주파수로만이루어진소리

진폭 (Amplitude) : 1

8

파형의기준선에서최고점까지의거리

소리의크기와관련있음

진폭 (Amplitude) : 2

9

소리의크기는음압변화의비율로표현

사람의귀는소리크기의변화보다변화의비율(logarithm)에영향을받음

최소음압: 20 X 10-6 Pascal

최대음압: 20 X 101 Pascal

bel: 소리크기(음압)에대한단위

실제사용시에는 bel값을 10배한 decibel을사용

진폭 (Amplitude) : 3

10

음압레벨 (dB) = 10 x 2 x log10 (P/P0)

P0: 기준음압, P: 현재음압

최소가청음압: 10x2xlog{(20x10-6)/(20x10-6)} = 0 dB

최대가청음압: 10x2xlog{(20x101)/(20x10-6)} = 140 dB

인간이 편하게 들을 수 있는 소리의 범위는 0db ~ 90db

음압 레벨(dB) 사운드

0 사람이 감지할 수 있는 최소 소리

10 조용한 숨소리, 나뭇잎 바스락 소리

20 매우 조용한 방

40~60 1m 정도의 거리에서 일상적인 대화 소리

60~80 10m 정도 거리에서 지나가는 자동차 소리

80~90 10m 정도 거리의 번잡한 거리의 소리

100 1m 정도 거리의 공기 드릴 소리

110~140 100m 정도 거리의 제트 엔진 소리

150 30m 정도 거리의 제트 엔진 소리

음색 (Tone Color, Timbre)

11

기음혹은기본주파수 (fundamental tone)

소리의높낮이를구분할수있는기본이되는주파수

배음혹은고조주파수 (harmonic overtone)

기음의정수배가되는주파수

기음과배음의구성이음색을결정짓는중요한요소임

1Hz

2Hz

3Hz

4Hz

기음 1차 배음 2차 배음 3차 배음

1초

기음과 배음

학습 목표

12

사운드의의미와기본요소를설명할수있다.

디지털사운드로의변환과정을설명할수있다. 디지털사운드의부호화방법을구분하여설명할수있다.

디지털사운드의압축방법을구분하여설명할수있다.

심리음향의특징에대해설명할수있다.

입체음향의원리및방식에대해설명할수있다.

아날로그 신호와 디지털 신호

13

아날로그 (Analog) 신호의특징

아날로그란소리와빛, 전류, 전압등과같이선형적인값을갖는연속된물리량형태의신호를의미함

신호를미세한단위로조정가능함

신호의처리속도가빠른장점이있음

잡음에의해신호가변하는단점이있음

디지털 (Digital) 신호의특징

디지털이란불연속적인단계의값을갖는신호를의미함

데이터에가공및변환이용이함

데이터가공단계에서열화가발생하지않음

디지털 사운드로의 변환

14

ADC(analog-to-digital converter) 변환장치사용

아날로그사운드의디지털변환단계

표본화(Sampling), 양자화(Quantizing) 및부호화(Coding)

아날로그 신호와 디지털 신호 간의 변환 과정

표본화 (Sampling) : 1

15

아날로그파형을디지털로변환하기위해표본을취하는과정

표본화율(Sampling Rate)

1초동안에취한표본수를의미

단위는주파수와같은 Hz를사용

(a) 아날로그 파형 (b) 표본화된 파형

아날로그 사운드의 표본화

표본화 (Sampling) : 2

16

표본화율이높을수록원음에가까운음으로디지털화되지만데이터양이증가

표본화 율의 차이

22,050Hz

44,100Hz

표본화 (Sampling) : 3

11,025Hz

22,050Hz

44,100Hz

표본화 (Sampling) : 4

18

Hz의의미

주파수: 1초동안의주기의반복횟수

표본화: 1초동안의표본화횟수

나이키스트정리 (Nyquist theorem)

표본화시원음을그대로반영하기위해서는원음이가지는최고주파수의2배이상으로표본화

음악 CD인경우표본화율이 44.1KHz이고여기서재생할수있는최고주파수는 22.05KHz임(사람의귀는 20KHz 이상의사운드는감지할수없음)

양자화 (Quantization) : 1

19

디지털형태로표현할때정밀도의정도를결정하는단계

음의해상도 : 값을표현하는정밀도 (Sampling Resolution)

양자화 (Quantization) : 2

20

표본화된데이터를위해사용되는비트수를결정

8 bit양자화→ 256 단계, 16bit양자화→ 65536 단계

3단계 양자화 5단계 양자화

양자화비트: 16비트

양자화비트: 4비트

양자화 (Quantization) : 3

21

양자화오차(Quantization error) 발생

원래신호와양자화된값사이의차이를의미함

디지털레벨(비트수)을조절함으로써적절한수준의양자화에러를유지

부호화 (Coding)

22

표본화및양자화된데이터를디지털형태로표현하여사운드파일에저장하는과정

사운드파일은크기가크기때문에부호화한과정에서일반적으로압축과정을수행

PCM, DPCM, ADPCM, DM, MPEG 등의압축방법사용가능

학습 목표

23

사운드의의미와기본요소를설명할수있다.

디지털사운드로의변환과정을설명할수있다.

디지털사운드의부호화방법을구분하여설명할수있다. 디지털사운드의압축방법을구분하여설명할수있다.

심리음향의특징에대해설명할수있다.

입체음향의원리및방식에대해설명할수있다.

PCM

24

Pulse Coded Modulation

입력된값그대로를기록하는방법 (용량이큼)

잡음과간섭에강하고전송중코딩된신호를재생가능

CD나 DAT(Digital Audio Tape) 등에서사용

♧ 빨간선에해당하는양이부호화되는것

DPCM

25

Differential Pulse Coded Modulation

표본화된신호의차이를저장하는방식

Interactive Multimedia Association; IMA

서로인접한샘플링지점의데이터값은크게변하지않는원리이용

DPCM은인접한값과의차이가크면비효율적이됨

ADPCM

26

Adaptive Differential Pulse Coded Modulation

인접한값과의차이가크면비효율적인 DPCM의단점을극복하기위해개발됨

적응적양자화방법사용

PCM 대비최대 4:1 정도까지압축이가능

DPCM과 ADPCM의 비교 예제

27

데이터: 8비트, 차이값: 5비트

원 데이터 16 40 89 75 24 32 66 19

DPCM

차이값 16 25 59 30 -36 -8 34 -28

부호화 +15 +15 +15 +15 -16 -8 +15 -16

복호화 15 30 45 60 44 32 47 31

ADPCM

차이값 16 25 50 6 -49 7 33 -46

부호화 +15 +12 +15 +1 -12 +3 +15 -11

복호화 15 39 69 73 25 33 65 21

스케일 x1 x2 x2 x4 x4 x2 x2 x4

ADPCM: 차이값이 범위를 초과하면 스케일은 2의 배수 단위로 증가하며 2회 연속으로 범위 내에 존재하면 감소

121

29

DM : 1

28

Delta Modulation

DPCM방식과동작하는원리는같으나두인접한표본의값의차이를1비트(DM비트)로표현

이전표본값에대하여증가하면 1, 감소하면 0, 변하지않으면 0과 1의값을교차하여전송

미리정해진차이값을더하거나빼서원래정보를복원

음질이중요하지않은음성을전송하기위해주로사용

특징

간단하면서도진폭이높은신호의잘림(peak-clipping)이없음

샘플크기변화가갑자기커질때 DM값이크기변화를따라가지못하는slope-clipping 문제발생

DM : 2

29

ADM

30

Adaptive DM

차이정보의순서에따라차이값의규모를변화시킴

p ⅹ q = 1, p > 1 (p, q는실수)

(+, +), (-, -) : 차이값의규모를키움→ L ⅹ p

(+, -), (-, +) : 차이값의규모를줄임→ L ⅹ q

DM에비해원래데이터와의오차를더줄임

DM과 ADM의 비교 예제

31

데이터: 8비트, p = 3/2, q = 2/3, L = 16

원 데이터 16 40 89 75 24 32 66 19

DM

부호화 + + + + - - + -

복호화 16 32 48 64 48 32 48 32

LDM 16 16 16 16 16 16 16 16

ADM

부호화 + + + - - + + -

복호화 16 40 76 52 16 40 76 52

LADM 16 24 36 24 36 24 36 24

115

95

디지털 사운드 파일의 크기 : 1

32

파일의크기 =표본화률 x 해상도 x 모드(mono=1, stereo=2) x 시간(초)

초당비트수(bps) =표본화률 X 해상도 X 모드

예)

1분길이의음악 CD= 44100 (Hz) x 16 (bit) x 2 (stereo) x 60 (초)= 84,672,000 bit = 10,584,000 byte = 10.6 MB

CD 한장에약 10곡에서 15곡의음악저장가능 (650MB 기준)

디지털 사운드 파일의 크기 : 2

33

표본화률 해상도 모드 bps Data size(1분당) 음질

11.025KHz 8 Mono 88.2 Kbps 650 KB 전화

22.05KHz 8 Mono 176.4 Kbps 1.3 MB AM Radio

22.05KHz 16 Stereo 705.6 kbps 5.25 MB FM Radio

44.1KHz 16 stereo 1411 kbps 10.6 MB CD

표본화, 양자화 및 모드에 따른 음질의 비교

학습 목표

34

사운드의의미와기본요소를설명할수있다.

디지털사운드로의변환과정을설명할수있다.

디지털사운드의부호화방법을구분하여설명할수있다.

디지털사운드의압축방법을구분하여설명할수있다. 심리음향의특징에대해설명할수있다.

입체음향의원리및방식에대해설명할수있다.

μ-law, A-law

35

전화망을통한디지털음성통신을목적으로정한압축방식

ITU-T G.711의 companding알고리즘 (1972년)

8비트를사용하여 14비트(μ-법칙) 혹은 13비트(A-법칙)와동일한음질을나타냄

PCM에서의비선형양자화방법을나타냄

ADPCM 관련 표준

36

이론적으로표준화되어있지만각방식간호환성은없음

ADPCM 관련표준

ITU-T 권고 G.721표본화율은 8KHz를사용하고차분양자화비트수를 4bit로압축하여 32Kbps로전송하는규격

이규격의 ADPCM 대규모집적회로가개발되어전송회선뿐만아니라음성사서함등에이용되고있음

ITU-T 권고 G.722표본화율은 16KHz를사용하고차분양자화비트수를 14bit로압축하여 64Kbps로전송하는규격

종합정보통신망(ISDN)의 64Kbps 디지털회선등과의정합성이높음

MP3 (MPEG Layer 3)

37

MPEG-1오디오부분에대한압축을의미

Layer 1(4:1), Layer 2(6:1~8:8), Layer3(10:1~12:1)

AAC(Advanced Audio Coding) : MPEG-2오디오부분

음성심리학적인방법인마스킹(Masking) 효과를이용

마스킹효과 : 큰소리와작은소리가동시에발생하면작은소리는들리지않게되는것처럼어떤소리에의해다른소리가가리워지는현상을의미

학습 목표

38

사운드의의미와기본요소를설명할수있다.

디지털사운드로의변환과정을설명할수있다.

디지털사운드의부호화방법을구분하여설명할수있다.

디지털사운드의압축방법을구분하여설명할수있다.

심리음향의특징에대해설명할수있다. 입체음향의원리및방식에대해설명할수있다.

최소 가청 한계 (Absolute Threshold of Hearing)

39

청각이감각할수있는음의최소레벨

라우드니스(Loudness)

40

사람은주파수에따라서소리의크기를다르게느낌

등라우드니스 곡선125Hz 4KHz

마스킹 효과 (masking effect)

41

큰소리에가려작은소리가들리지않는현상

임계대역 (critical band)

42

마스킹현상이발생하는주파수폭을의미

시간적 마스킹 효과

43

칵테일 파티 효과

44

동시에여러소리가나는환경에서도원하는(특정한) 소리만을들을수있는현상

선행음 효과

45

소리가먼저들리는곳에음원이있다고판단

선행음 효과 선행음 효과의 활용

사운드 저장 파일 형식

46

Wav (Wave) MS사와 IBM사가 PC상의사운드표준형식으로공동개발

Windows 기반 PC에서주로사용

구체적인압축방식은상이할수있음

일반적으로 PCM, ADPCM방식이많이사용되고, 그외에 Truespeech, μ-Law 등도많이사용

Au (Audio) μ-law 방식으로압축된형식으로유닉스환경에서사용

다른형식으로변환하기위한크로스플랫폼형식

Sun이나 NeXT가표준으로채택

사운드 저장 파일 형식

47

MP3 압축효과가뛰어나고, 음질도우수

인터넷상에서음악을압축하는데많이사용

Layer 2는 .mp2, Layer 3는 .mp3의확장자를가짐

AIFF/AIF (Audio Interchange File Format) WAV처럼샘플링된디지털오디오파일

8비트스테레오혹은모노로저장되지만압축되지않아파일크기가크다는것이단점

학습 목표

48

사운드의의미와기본요소를설명할수있다.

디지털사운드로의변환과정을설명할수있다.

디지털사운드의부호화방법을구분하여설명할수있다.

디지털사운드의압축방법을구분하여설명할수있다.

심리음향의특징에대해설명할수있다.

입체음향의원리및방식에대해설명할수있다.

입체음향

49

입체음향이란? 음원이존재하는공간에직접위치하지않은청취자가재생된음향을들었을때음향으로부터공간적단서(방향감, 거리감및공간감)를지각할수있는음향을의미

영화, TV 혹은오디오등에서는서라운드(Surround)방식으로입체음향을제공

입체음향

50

입체음향의원리

두귀에도달하는소리의시간차( Interaural Time Difference – ITD )

두귀에들어오는소리의시간차에의해음원의위치에대한방향성을인지할수있음

가까운방향에있는귀가먼저그소리를들음으로써음원의방향을알수있음

두 귀에 도달하는 소리의 시간차

입체음향

51

두귀에도달하는소리의세기차( Interaural Intensity Difference – IID )

두귀에들어오는소리의크기차에의해음원의위치에대한방향성을인지할수있음

소리의위치감과거리감을알수있음

그외에사람의다른공간적단서로는시각적효과, 머리의움직임, 소리의종류에따른친숙도등이있음

입체음향

52

서라운드(Surround) 사람이있는위치를기준으로사방에서소리를들려주는방식으로공간감및입체감제공 (5.1채널등)

스테레오와마찬가지로청취자가음의중심점에있어야입체감을적절하게느낄수있음

돌비서라운드(Dolby Surround), AC-3, DTS 등

Surround System(ITU-R BS.755-1)

2.2m

입체음향

53

2채널방식

2채널스테레오저장방식

전면의좌, 우스피커용 2채널, 센터스피커용채널, 후방의신호를재생하는서라운드(리어)채널의총 4개채널을 2채널로변경하여저장하는방식(1982년상용화됨)

종류

돌비서라운드(Dolby Surround): encoding technology

돌비프로로직 (Dolby Pro Logic): decoding technology

입체음향

54

5.1채널방식소리를각채널별로별도채집, 녹음하기때문에재생시음장감이뚜렷

저음부분이별도채널로구성돼서브우퍼로재생되므로현장감도우수

돌비디지털

극장용사운드시스템용도로개발

홈시어터시스템도기본지원

AC-3(Audio-Code 3)

‘배트맨’에최초로도입 (1992년)

DTS (Digital Theater System)

DTS Professional Audio Group에서개발한시스템

극장에서상영하는디지털화된음성을재생하기위한시스템

유니버설社의 “쥬라기공원”에최초로도입 (1993년)

학습정리 (1)

55

1. 사운드(sound)란 무엇인가?• 귀로들을수있는모든정보를의미함

• 물체의진동에의해발생하는물리적현상

2. 사운드의 기본 요소• 주파수 (Frequency):소리의높낮이

• 진폭 (Amplitude):소리의크기

• 음색 (Tone Color, Timbre):음의특징

학습정리 (2)

56

3. 아날로그 사운드의 디지털 변환 단계• 표본화(Sampling),양자화(Quantizing)및부호화(Coding)

4. 부호화 방법• PCM, DPCM, ADPCM, DM, ADM

학습정리 (3)

57

5. 디지털 사운드의 압축 방법• μ-law및 A-law, ADPCM, MP3

6. 심리음향의 특징• 최소가청한계:청각이감각할수있는음의최소레벨

• Loudness:사람은주파수에따라서소리의크기를다르게느낌

• 마스킹효과:큰소리에가려작은소리가들리지않는현상

• 임계대역:마스킹현상이발생하는주파수폭을의미

• 칵테일파티효과: 동시에여러소리가나는환경에서도원하는(특정한)

소리만을들을수있는현상

• 선행음효과:소리가먼저들리는곳에음원이있다고판단

학습정리 (4)

58

7. 사운드 저장 파일 형식• Wav, Au, MP3, AIFF/AIF, RealAudio, ASF

8. 입체 음향• 음원이존재하는공간에직접위치하지않은청취자가재생된음향을들

었을 때음향으로부터 공간적단서(방향감, 거리감 및공간감)를 지각할

수있는음향을의미

• 입체음향의원리:두귀에도달하는소리의시간차및세기차