音樂檔案格式的學習筆記
WAV(Waveform Audio File Format, WAVE)
是微軟與IBM公司所開發在個人電腦儲存音訊串流的編碼格式,在Windows平台的應用軟體受到廣泛的支援。大多數的WAV檔是用於CD儲存原聲帶的。
一般音樂的製作流程是歌手的音樂,經過錄音設備使用 96 KHz 的取樣頻率轉換成數位資料,再把每秒 96K 的資料量,壓縮到 44.1K 的資料量,再存到 CD。因此,一般的 CD 是以每秒 44.1K 的資料量,並且儲存兩個音道(左,右)的資料。
44.1KHz 的取樣頻率是因為人耳可接收的頻率在 2.05KHz 到 20KHz,以Nyquist Theorem 取樣頻率至少要大於 2 倍的目標頻率,所以取樣頻率等於 2 * ( 2.05 + 22) = 44.1 KHz
MP3 (MPEG-1/2 Audio Layer Ⅲ)
由 Moving Pciture Experts Group (MPEG) 在1991 年發表,MEPG-1 Audio Layer Ⅰ/Ⅱ/Ⅲ。 MP3 是將音源檔(WAV)使用 1/4 到 1/20 的比率做壓縮。一般是採用 1/10 的壓縮比率做壓縮。
MP3 的發展史
- 在 1980 年 - 德國太空中心(University of Erlangen-Nuremberg) 的 Karlheinz Brandenburg 開始研究如何壓縮數位音樂資料,並於 1989 完成 MPEG-1 Audio Layer 2(MP2)。
- 在 1991 年 - 針對音樂壓縮提出兩個提案分別是MUSICAM (Masking pattern adapter Universal Subband Integrated Coding And Multiplexing) 和 ASPEC (Adaptive Spectral Perceptual Entropy Coding)。由一個跨國的工作小組結合 MUSICAM 及 ASPEC,再加上自己的主意,宣告了 MPEG-1 Audio Layer 3(MP3)。
SPEC
|
MPEG-1
Audio Layer Ⅲ
|
MPEG-2
Audio Layer Ⅲ
|
MPEG-2.5
Audio Layer Ⅲ
|
Sample Rate
|
32KHz
44.1KHz
48KHz
|
16KHz
22.05KHz
24KHz
|
8KHz
11.025KHz
12KHz
|
每秒的資料量
|
1024 Kbps
1411.2 Kbps
1536 Kbps
|
512 Kbps
705.6 Kbps
768 Kbps
|
256 Kbps
352.8 Kbps
384 Kbps
|
壓縮後每秒的資料量(較常使用的)
|
128 Kbps (*)
192 Kbps
256 Kbps
320 Kbps
|
64 Kbps
96 Kbps
128 Kbps
160 Kbps
|
32 Kbps
48 Kbps
64 Kbps
80 Kbps
|
- 資料壓縮比率怎麼算-
- Sample Rate 採用 44.1KHz
- CD 支援 2 聲道,而每個聲道使用 16 bits 紀錄音源
- 每秒的資料量是 44.1KHz * 16 bits * 2 channel = 1411.2 Kbits
- 現今一般 MP3 壓縮是採用壓縮結果每秒只剩 128 Kbits
- 所以壓縮比為 1411.2 : 128 兩邊同除以128,得到 11.025:1 ,也就是常說的約 11 倍的壓縮比。
- 記憶卡可以存多少首歌,怎麼算
- 假設記憶卡容量為 4GBytes = 4,000 MBytes
- 現今一般 MP3 壓縮是採用壓縮結果每秒只剩 128 Kbits,而一分鐘為 128 Kbits * 60 = 7680 Kbits,再除以 1024 得到 7.5 Mbits
- 假設一首歌為 4 分鐘,所以一首歌曲轉成 MP3 時,所使用的記憶體空間為 7.5Mbits * 4 = 30Mbits,其中 1Byte = 8 bits ,所以再除以 8 ,就得到 3.75 MBytes。在系統上查詢 MP3 歌曲的記憶體空間,是使用 Bytes 為單位。
- 最後把 4000 MBytes / 3.75 MBytes = 1066.67,因為個人覺得歌聽到一半不舒服,所以採無修件捨去,得到 1066 首歌曲。
WMA (Window Media Audio)
由 Microsoft 所開發使用在 window / iTunes 的系統上。WMA pro 可支援 5.1 到 7.1 聲道。
SPEC
|
WMA
|
WMA pro
|
Sample Rate
|
44.1KHz / 2CH
|
48KHz / 5.1 CH
|
每秒的資料量
|
1411.2 Kbps
|
3072 Kbps (4 CH)
4608 Kbps (5.1 CH)
|
壓縮後每秒的資料量(較常使用的)
|
48 Kbps
64 Kbps (*)
96 Kbps
128 Kbps
160 Kbps
192 Kbps
|
128 Kbps (4 CH)
768 Kbps (5.1 CH)
|
AAC (Advanced Audio Coding)
由 Moving Pciture Experts Group (MPEG) 在 1997 年時,宣告的 MPEG-2 Audio Layer Ⅶ,包含 AT&T Bell Laboratories, Fraunhofer IIS, Dolby Laboratories, Sony Corporation 及 Nokia 都參與製訂。profile 包含
- Low Complexity (LC) Profile - 最簡單也使用的最廣。
- Main Profile - LC 再加 backward prediction
- Sample-Rate Scalable (SRS) Profile - 取樣率變動
在 2000 年時,MPEG-4 Audio Layer Ⅲ,除支援 MPEG-2 Audio Layer Ⅶ 的 AAC 外,增加更多的 profile。
- Scalable Audio Profile - 宣告於 1999 年,使用於 AAC-LC,AAC-LTP(Long Term Prediction),AAC Scalable
- High Quality Audio Profile - 宣告於 2000 年,使用於 AAC-LC,AAC-LTP,AAC Scalable,ER-AAC-LC,ER-AAC-LTP,ER-AAC Scalable
- Low Delay Audio Profile - 宣告於 2000 年,使用於 ER-AAC-LD
- Low Delay AAC v2 Profile - 宣告於 2012 年,使用於 AAC-LD,AAC-ELD,,AAC-ELD v2
- Mobile Audio Internetworking Profilr - 宣告於 2000 年,使用於 ER-AAC-LC,ER-AAC Scalable,ER-AAC-LD
- High Efficiency AAC Profile - 宣告於 2003 年,使用於 AAC-LC,AAC-SBR(Spectral Band Replication)
- High Efficiency AAC Profile - 宣告於 2006 年,使用於 AAC-LD,AAC-SBR,AAC-PS(Parameter Stereo)
AAC 和 MP3 的比較
- 取樣頻率由 8 - 96 KHz
- 最大支援到 48 channel
- 位元數支援到 32 bits
- 壓縮後資料量支援到 512 Kbps
FLAC (Free Lossless Audio Codec)
由 Josh Coalson 在 2000 年,發起並開發,在 2001-07-20 正式發表。
- 取樣頻率由 1Hz - 655350Hz
- 位元數支援由 4 - 32 bits
- 壓縮資料程度由 0 - 8 個等級
留言
張貼留言