音樂檔案格式的學習筆記

  • WAV(Waveform Audio File Format, WAVE)

是微軟與IBM公司所開發在個人電腦儲存音訊串流的編碼格式,在Windows平台的應用軟體受到廣泛的支援。大多數的WAV檔是用於CD儲存原聲帶的。


一般音樂的製作流程是歌手的音樂,經過錄音設備使用 96 KHz 的取樣頻率轉換成數位資料,再把每秒 96K 的資料量,壓縮到 44.1K 的資料量,再存到 CD。因此,一般的 CD 是以每秒 44.1K 的資料量,並且儲存兩個音道(左,右)的資料。

44.1KHz 的取樣頻率是因為人耳可接收的頻率在 2.05KHz 到 20KHz,以Nyquist Theorem 取樣頻率至少要大於 2 倍的目標頻率,所以取樣頻率等於 2 * ( 2.05 + 22) = 44.1 KHz  

  • MP3 (MPEG-1/2 Audio Layer Ⅲ)

由 Moving Pciture Experts Group (MPEG) 在1991 年發表,MEPG-1 Audio Layer Ⅰ/Ⅱ/Ⅲ。 MP3 是將音源檔(WAV)使用 1/4  到 1/20 的比率做壓縮。一般是採用 1/10 的壓縮比率做壓縮。

MP3 的發展史
  • 在 1980 年 - 德國太空中心(University of Erlangen-Nuremberg) 的 Karlheinz Brandenburg 開始研究如何壓縮數位音樂資料,並於 1989 完成 MPEG-1 Audio Layer 2(MP2)。
  • 1991 - 針對音樂壓縮提出兩個提案分別是MUSICAM (Masking pattern adapter Universal Subband Integrated Coding And Multiplexing) 和 ASPEC (Adaptive Spectral Perceptual Entropy Coding)。由一個跨國的工作小組結合 MUSICAM 及 ASPEC,再加上自己的主意,宣告了 MPEG-1 Audio Layer 3(MP3)。

SPEC
MPEG-1
Audio Layer Ⅲ
MPEG-2
Audio Layer Ⅲ
MPEG-2.5
Audio Layer Ⅲ
Sample Rate
32KHz
44.1KHz
48KHz
16KHz
22.05KHz
24KHz
8KHz
11.025KHz
12KHz
每秒的資料量
1024 Kbps
1411.2 Kbps
1536 Kbps
512 Kbps
705.6 Kbps
768 Kbps
256 Kbps
352.8 Kbps
384 Kbps
壓縮後每秒的資料量(較常使用的)
128 Kbps (*)
192 Kbps
256 Kbps
320 Kbps
64 Kbps
96 Kbps
128 Kbps
160 Kbps
32 Kbps
48 Kbps
64 Kbps
80 Kbps

  • 資料壓縮比率怎麼算-
    • Sample Rate 採用 44.1KHz
    • CD 支援 2 聲道,而每個聲道使用 16 bits 紀錄音源
    • 每秒的資料量是 44.1KHz * 16 bits * 2 channel = 1411.2 Kbits
    • 現今一般 MP3 壓縮是採用壓縮結果每秒只剩 128 Kbits
    • 所以壓縮比為 1411.2 : 128 兩邊同除以128,得到 11.025:1 ,也就是常說的約 11 倍的壓縮比。
  • 記憶卡可以存多少首歌,怎麼算
    • 假設記憶卡容量為 4GBytes = 4,000 MBytes
    • 現今一般 MP3 壓縮是採用壓縮結果每秒只剩 128 Kbits,而一分鐘為 128 Kbits * 60 = 7680 Kbits,再除以 1024 得到 7.5 Mbits
    • 假設一首歌為 4 分鐘,所以一首歌曲轉成 MP3 時,所使用的記憶體空間為 7.5Mbits * 4 = 30Mbits,其中 1Byte = 8 bits ,所以再除以 8 ,就得到 3.75 MBytes。在系統上查詢 MP3 歌曲的記憶體空間,是使用 Bytes 為單位。
    • 最後把 4000 MBytes / 3.75 MBytes = 1066.67,因為個人覺得歌聽到一半不舒服,所以採無修件捨去,得到 1066 首歌曲。

  • WMA (Window Media Audio)

由 Microsoft 所開發使用在 window / iTunes 的系統上。WMA pro 可支援 5.1 到 7.1 聲道。

SPEC
WMA
WMA pro
Sample Rate
44.1KHz / 2CH
48KHz / 5.1 CH
每秒的資料量
1411.2 Kbps
3072 Kbps (4 CH)
4608 Kbps (5.1 CH)
壓縮後每秒的資料量(較常使用的)
48 Kbps
64 Kbps (*)
96 Kbps
128 Kbps
160 Kbps
192 Kbps
128 Kbps (4 CH)
768 Kbps (5.1 CH)

  • AAC (Advanced Audio Coding)

由 Moving Pciture Experts Group (MPEG) 在 1997 年時,宣告的 MPEG-2 Audio Layer Ⅶ,包含 AT&T Bell Laboratories, Fraunhofer IIS, Dolby Laboratories, Sony Corporation 及 Nokia 都參與製訂。profile 包含
  • Low Complexity (LC) Profile - 最簡單也使用的最廣。
  • Main Profile - LC 再加 backward prediction
  • Sample-Rate Scalable (SRS) Profile - 取樣率變動

在 2000 年時,MPEG-4 Audio Layer Ⅲ,除支援 MPEG-2 Audio Layer Ⅶ 的 AAC 外,增加更多的 profile。
  • Scalable Audio Profile - 宣告於 1999 年,使用於 AAC-LC,AAC-LTP(Long Term Prediction),AAC Scalable
  • High Quality Audio Profile - 宣告於 2000 年,使用於 AAC-LC,AAC-LTP,AAC Scalable,ER-AAC-LC,ER-AAC-LTP,ER-AAC Scalable
  • Low Delay Audio Profile -  宣告於 2000 年,使用於 ER-AAC-LD
  • Low Delay AAC v2 Profile -  宣告於 2012 年,使用於 AAC-LD,AAC-ELD,,AAC-ELD v2
  • Mobile Audio Internetworking Profilr -  宣告於 2000 年,使用於 ER-AAC-LC,ER-AAC Scalable,ER-AAC-LD
  • High Efficiency AAC Profile -  宣告於 2003 年,使用於 AAC-LC,AAC-SBR(Spectral Band Replication)
  • High Efficiency AAC Profile -  宣告於 2006 年,使用於 AAC-LD,AAC-SBR,AAC-PS(Parameter Stereo)

AAC 和 MP3 的比較
  • 取樣頻率由 8 - 96 KHz
  • 最大支援到 48 channel
  • 位元數支援到 32 bits
  • 壓縮後資料量支援到 512 Kbps

  • FLAC (Free Lossless Audio Codec)

由 Josh Coalson 在 2000 年,發起並開發,在 2001-07-20 正式發表。

  • 取樣頻率由 1Hz - 655350Hz
  • 位元數支援由 4 - 32 bits
  • 壓縮資料程度由 0 - 8 個等級

留言

這個網誌中的熱門文章

EC 所需知識 - SMBUS

EC 所需知識 - KBC

EC 所需知識 - LPC