유용한 정보:
[번역글] 음향 코덱의 원리- 심리음향학
PCM과 MP3의 음질차를 들어보자
===========================================
얼마 전에 이뤄졌던
시코인을 위한 청취 실험의 결과로는
간접적으로 ANOVA 상의 1/5 scale에 해당하는 *주관적 음질 차이를
*Perceptual Transparency
구분하신 분들이 전체 58명의 청취자 중 16 분이나 되었습니다.
이 분들은 정말 손실코덱의 미세한 bit-reduction을 가릴 수 있는 황금귀일까요?
분명 이 분들은 실험 목적이었던 '초보 청취자 이상의 능력 증명'을 이뤄내기는
했습니다만, 아쉽게도 그 이외의 확신할만한 결론을 도출 해 내기엔 실험 결과가
지나치게 형이상학적이었습니다.
(물론 나머지 42명의 청취 능력, 혹은 청취 조건은 상대적으로 부족했다고 봐야겠지요)
따라서 좀 더 실용적이면서도 직접적으로 음원을 평가하는 청음 실험이
필요하게 되었지요. 물론 커닝(cheating) 방지를 위해서 시각화 정보만으로는
절대로 음질을 구분할 수 없어야 합니다.
그래서 고안한 실험 방법이 아래와 같습니다:
- Lowpass 인코딩 옵션으로 재생 대역폭을 일정하게 통제, 시각적으로 차이가 없어진 서로 다른 압축률의 음원을 다수 비교. (대역폭 변조로 인한 transparency의 손실은 극히 미미)
- 청취 환경 및 방식은 청취자에 일임. 청취자 능력의 일부로 간주. (청취 환경이 열악할 수록 감별력 저하)
- 고음질 (192kbps 이상 500kbps 이하) 비교로 구별 난이도 상승.
- 청취자들에게 역플라시보를 야기할 수 있는 모든 독소적 요소를 제거, 청취에만 집중토록 도모.
- V2~500kbps의 올바른 순서를 추측 할 확률: 0.14 % = 1/720 (정답)
- V2~320kbps의 올바른 순서를 추측 할 확률: 0.28 % = 2/720
- V2~256kbps의 올바른 순서를 추측 할 확률: 0.83 % = 6/720
- V2~192kbps의 올바른 순서를 추측 할 확률: 3.33 % = 24/720
- V2의 올바른 위치를 추측 할 확률: 16.67 % = 120/720
- V2의 순서가 틀리면 청취자는 MP3 V2(167kbps) 이상의 음질차를 구분하지 못한다는 것을 의미.
- 청취 샘플은 유럽방송연합(European Broadcasting Union)에서 미세음질열화(Small impairment) 평가에 사용하는
음질평가자료(Sound Quality Assessment Material) 중 Bit-rate reduction 평가에 완벽히
검증된
음원을 채용.
===========================================
음원의 상세 정보:
예)
코덱 종류
재생 정보 (원음 보존률 / 압축비) - 파일 크기
▷ 파일명
WAV: 원본 Reference
PCM 1411kbps (100% / 1:1) - 2,822KB
▷ REF.WAV (EBU 홈피 원본은 팝노이즈가 있어서
MIT 제공 CD 직출본으로 대체)
OGG: aoTuV Beta5.7
CBR 500kbps (35% / 2.7:1) - 1,016KB
▷ ?.WAV
AAC-LC: Nero AAC Encoder 1.3.3.0
CBR 400kbps (28% / 3.5:1) - 809KB
▷ ?.WAV
MP3: Lame 3.98.2
CBR 320kbps (22% / 4.3:1) - 643KB
CBR 256kbps (18% / 5:1) - 515KB
CBR 192kbps (13% / 7:1) - 386KB
VBR 167kbps --vbr-new -V2 (11% / 8:1) - 336KB
▷ ?.WAV / ?.WAV / ?.WAV / ?.WAV
山米舛의 상기 음원 ABX 비교 실험 결과:
ABX_result.rar
VBR V2 對 CBR 192kbps : 20/20 (0.0%)
CBR 192kbps 對 CBR 256kbps : 20/20 (0.0%)
CBR 256kbps 對 CBR 320kbps: 20/22 (0.0%)
※ 청취 조건: Foobar2000 v0.8.3 (ABX comparator + SSRC Resampler @ 48kHz) + Creative SB Audigy 1 Platinum + 33ohm Impedance Adapter + Sennheiser PX200
-> 저역 컷오프 주파수: 24Hz
===========================================
실험 방법:
댓글로 원본 PCM의 음질과 가장 가깝다고 생각되는 순서대로 A, B, C, D, E, F를 나열 해 주시면 됩니다. [부등호(<,>)만 사용]
Foobar의 ABX을 이용하셔도 되고, 그냥 들어보고 비교하셔도 상관 없습니다.
각 음원에 대응되는 알파벳 및 정답에 대해서는 일주일 후 공개하도록 하겠습니다.
※주의1: 같은 음질을 가진 음원은 없습니다. 부등호만 사용하세요.
※주의2: 시각 정보에 함정은 없으니 안심하시길.
※주의3: 음원의 도입부에 발생하는 잔향의 느낌이 음질 열화를 감지하는 주요 포인트.
===========================================
청취 실험 시작:
모든 음원 및 시각화 정보 받기:
harpsichord.rar
PCM 원본:
A:
B:
C:
D:
E:
F: