S e r v i c e | R e v i e w | M u s i c W o w | C o n n e c t U s | H o m e


數位基本認識 )_________________________________________________吳榮宗 主筆

從類比平台的操作文化,融入數位架構的組合,這個衝擊給咱們台灣圈內的應用文化,大大的革命
與改造!
應該是在 1995 認識了 Promix01,97 年我已經拿 O2R 在巡迴魔岩的校園場子。

這個的轉變是市場的原因,初期南部的同行看我在使用數位機器做場子時,都說一定掛場!
看看今日 04 年了,哪家音響公司沒數位設備的,勇敢些,只要接觸知識後,就一定有成長,那是美好
的,每看一頁書本,每聽一節課程,將使你遠離無知,接近成熟,對,沒錯,就是現在大家對數位的
組合,這幾年來運用在 SR 的領域裡,大家的思維都能接受了,也夠成熟,
藉於此,我把一些最基本底層的數位原理,介紹給各位認識,這樣子,增加本身的技術領域外,
再充實文科的不足,
這些文章並不是理論,而是科學,是能幫各位瞭解它們是怎麼工作的,
現在將它們整理後呈現出來。

何謂數位化?

簡單解說,數位化 ( Digital ) 就是以數字來描述事物。就聲音電器特性上,在當下的時間內,
給予電壓來區別記錄,有電壓提供的區塊我們付予 1 無電壓提供的區塊我們付予 0,然後再將編碼後
的數據組合起來還原真像,如此的記錄過程,就是一種數位化。
而跟數位常常一起被提到的字眼是類比 ( Analog / Analogue )。類比的意思是一種隨時間而改變的線性
記錄原則,它無法在現有的資料及設備內,獨立創造一樣的資料,它可用相似的東西去表達,
例如再運用另一組設備轉錄過來,相對的它必須遵循原有的時間過程,如此就是一種類比的紀錄方式。

類比訊號電平如何數位化?

將類比訊號數位化,根據早些年貝爾研究室 Nyquist,理論上我們只要用 40 kHz 以上的取樣率就可以完整紀錄 20 kHz 以下的訊號。我們再重提一下舊文章,就人們大概能聽取有聲音頻大概是
20 Hz ~ 20 KHz,這是何意?就音頻學,在物理上,1 Khz 的倍頻是 2 Khz,我們將其轉移到樂理上,
這個倍頻就包含一個音程,也就是那 7 個音階,亦稱為 7 均分律,若再加上 5 個半音,就是 12 均分律,
為不使轉換過程損失掉基本的頻域,我們必須高於 20 KHz,又它的倍頻就是 40 KHz,

20 Khz 的倍頻是 40 Khz,問題是為何現有的 CD 格式是 44 . 1 Khz 呢?
在 CD 發明前硬碟 ( Hard Disk ) 還很貴不是民生用品,
研發很貴,只有尋找在當時最近的資源,
拜謝那時的電影圈
1 / 24 秒 / 格的連續影像啟發,所以主要數位音訊儲存媒體的替代者是當下既有的
資源 ( 錄影帶 ),用黑白來記錄 0 與 1 的編碼
訊號。 ( 早期的影像是黑白的 )。
而格式就是每秒 30 張格,
而一張圖又可以分為 490 條掃瞄線,每一條線又可以儲存三個取樣訊號,
因此每秒有 30 ╳ 490 ╳ 3 = 44100 個取樣點。
這個成功研發的概念是由當年在貝爾研究室的 Harry Nyquist 研發出來的,為此,數位化的取樣頻率
我們就稱為 Nyquist frequency。簡單的說明如果我們欲將一類比訊號編碼記錄時,
如果每秒一格,那將會是低取樣比率,無法將過程還原,如果每秒 24 格或更多,那這個取樣比率將會
優於一格秒的記錄。
圖 1 裡的表達在說明高取樣的比率,事後才有能力供解碼還原成
之前的訊號。
低取樣的比率將無法記錄下過程,有的只是
pi pai 的數位雜音罷了。
_



圖 1,取樣的比值說明。
藉由上述的說明,數位的取樣比率格式,通常有:32、44 . 056、44 . 1、48、以及 96 KHz。
在國際上,聲音轉播放送
( on air ) 的頻寬也不過 15 Khz,因此 32 Khz 的取樣比率是如此的。

44 . 056 and 44 . 1 Khz 是供雷射 CD、音樂錄製、數位錄音使用,現在取樣比率的細調功能也都普遍
了,你可以方便的在 44 . 1 Khz
的位置,以百分比來增加或是減少比率值。
例如 Yamaha AW-4416 取樣頁面內,就有一個調整鈕來幫忙匹配這細微的取樣差。至於 48、 96 Khz
即是提供給 DVD 或是一些資料記錄方面,
尚有一些高品質的單位如 Super Audio Compact Disc
( SACD ),
目前都已發展到 192 Khz 的取樣技術了,唯獨其價前還是高高在上。

量子化 ( Quantization )

這個過程的解釋就是將一訊號波形,藉由電壓的變化,將其轉換刻錄在碟盤上。這個電壓值我們把它
量化成為兩個要素,
即二進位 ( binary digits ),或位元 bit 成為有意義的記錄。
利用此數學的方法將類比訊號的電壓轉變成為數字編碼,當輸出電壓是 off 的,我們定義為 ”0 ”,
反之我們將其定義為 “ 1 “。
Quantization 的動作就像是二進制的數學,1 0 就是兩位元,101即三位元,11010是五位元等,
所以 n 位元就等於 2n 位元字義。
所以量子化後的資料會依當下的訊號轉換類似 ----111、110、101、100、011……… 之類的資料,
在 0 與 1 的架構下,我們可以整理出:

1 個 bit 等於兩個 discrete level 及 0、1。

2個 bit等於四個discrete level 及00、01、11、10。

3個 bit等於八個discrete level 及000、001、010、011、100、101、110、111。
註,discrete level ( 分立的電平值 )

如上所釋,又想要得到好的轉換聲音訊號,量子化的位元愈長愈好,就這樣 8 bit 的量子解析是 256,
16 bit 是 65536,20 bit 是 1048576,
24 = 16777216。
會算了嗎?想再深入學習的人,可以到書電買本邏輯電路概念開始。

如下方圖 2 所示,不同的位元取樣,所得到的解析度是不一樣的,第四個圖示為16 bit 的取樣分析,
你可以看出有一個弦波的形狀了。
另外要說明的是這構成的圖像,若是在 44 . 1 Khz 時,它應該是有
44100 格的電壓解析區塊。
_



圖 2,取樣位元比值說明。
類比訊號在 Quanitzation 這些訊號電壓時,雖然取樣位元愈高,記錄就愈忠實,僅管如此,Quanitzation
後的訊號振幅結果,
多少會與真正原始的波形振幅表示,有一些誤差存在。這種情況,我們稱之為
Quanitzation noise 。
此一係值的多寡是隨著量子化的位元數增加而減少。
一樣的它也會關係到所謂的 signal – to – noise,一個類比轉換成數位的轉換元件,每增一個 bit 時,
所記錄的資料忠實度就會增加兩倍,
即與與實際波形間的誤差會變成 1 / 2,如果以分貝表示 ( dB ),
取樣忠實度的增加 2 倍,就會減少 6 dB 的噪音系數,則代表聲音強弱的動態範圍 ( Dynamic Range )
簡稱 D ,因此 16 bit 就會擁有
6 dB ╳ 16 bit = 96 dB 的動態範圍。
這相當於類比系統的 – 75 dB 左右
的噪音底層,不過就數位的領域裡,這 96 dB 噪音底層不過是一般
的條件,因此以 20 bit 為架構就可得到 120 dB 的噪音比,24 bit 會更好,達到 144 dB 之高!
註,Quanitzation noise l ( 量化噪音值 ),signal – to – noise ( 噪音底層 )。

圖 3 可以更清楚取樣位元多寡在 Quanitzation 過程的粗糙與細膩。
_



圖 3,取樣位元比值說明 2。
以上簡單的文章說明了數位的奧妙處,就它們普及化在市面上後,各種的數位格式就出現在生活裡,
在聲音領域裡,常被各位應用到的聲頻數位界面格式., 請各位參照我另一篇文章:認識聲頻數位格式,
在此我就不再寫出。

電腦硬碟格式錄音

轉換功能成熟後,聰明的商人組合它們成為生活必須品,從早期的帶子 DAT TAPE 錄音,到今日的硬碟
HARD DISK 錄音,線性及非線性不同的地方,凡是接觸過的人,皆有點滴… 在錄音的領域裡,
數位非線性 Digital 漸而取代類比線性 Analog 的工作方式,Hard Disk Recorder 將會取代 Tape Recorder ,
就 Audio 方面的故事,早期的硬碟錄放音模式,Hard Disk Recorder 以 Apple Macintosh Computer
做主平台。由 Digidesign 開發的兩軌聲音工具系統 Two Track Sound Tools System,除了多次的播放,
原音不變,剪接編輯,後製,再生種種多項的優點,改善了當初線性工作領域的瓶頸,也奠定了電腦數位
錄音的市場及成長。

當時的電腦 CPU 處理器速度比較慢,同時能處理的工作不多,兩軌的錄放音掛在平台上,其他的資源就別
想再動用到,後來跟隨著科技的進步,CPU 速度加快,再加上 DSP Cards 發展成功,
Recording 和 Playback 在這時候已有多軌的模式在線上運作了。
有了金錢,有了名,Sound Tools 即改名為 Pro Tools,由於當時並不是很大眾化的產品,所以它的價格都
很高,因此有一段時間是流行原有的類比設備參與電腦的部份功能交替作業,並不是完全交付電腦來完成
所有的事情。當 PC 開始接觸聲音多媒體這一塊領域時,它是被嘲笑的,剛開始的我就是如此,
幾乎無法勝任工作的,然而它夾帶著全世界使用的普及化,廉價,各項支援多,問題的發生,
很快就有人完成修正,又各項的軟體、輔助插件、儀錶等相關的,每個人想要的。
各方面的資訊就很快能夠提供。在目前的年代,PC 在錄音混音的市場上已是一大龍頭了,尤其是德國
Steinberg 公司所開發出來的 VST 架構,以及其相關的產品,如 Nuendo 、cubase、Wavlab,另外已讓售
給 SONY 的 Sonic Foundry,這些公司所製作出來的產品,在聲音圖形化的編輯剪接,專業領域上已經是必修的課目了,現今 Computer Audio 的市場已不再是 MAC 的天下了,反倒是 PC 漸漸的佔領這塊市場。

Hard Disk Multi Track Recorder ( 硬碟多軌記錄器 ),TASCAM MX-2424 就是業界的一個代表作品。
DAT 在記錄再生的過程裡,由於磁頭與磁帶間的接觸面有凹凸不均勻現象,或是帶子、或是磁頭清潔度
問題等,都有可能產生記錄訊號欠缺的問題,此現象我們稱為遺訊 ( Drop out )當 DAT ( Digital Audio Tape )
的領域過後,隨之而來的是人手一台的電腦時代,包括非線性的後製處理作業全都仰賴電腦。
而且直接將訊號轉換到硬碟上就沒有此種問題的產生。Quanitzation 完後的數據是龐大的位元數據,
這是電腦看不懂的格式,因為電腦是以字元來辨別容量的,所以我們必須
將位元 bit 轉成 字元 byte,
如此才能順利的將數位化之後的資料存入硬碟裡。

一般各位在製作數位錄音時,記錄這些轉換資料往往不清楚它們的架構,整場要配置多少空間的硬碟也
不清楚,甚至是自己攜帶的手提電腦想要側錄個兩軌訊號,都不知道可以錄多久,數不清的 mail 裡面,
問的也是這個問題,現在這個式子寫給大家,以後就不用擔心了。

1個 bit 等於 8 byte,所以如果有一類比訊號欲存錄到硬碟裡,那麼應該 如何計算才能知道所須的硬碟空間?
假設我們以 44 . 1 Khz 取樣頻率, 16 bit 的格式來錄音,我們就會有下面的數學出現:

44 ╳ 1024 ╳ 16 ÷ 8 = 90112 byte / 每秒

90112 ╳ 60 = 5406720 byte / sec = 5 . 4 Mbyte / 每分

5 . 4 ╳ 60 = 324 Mbyte / 每小時

這裡說明如果以 44 . 1 Khz / 16 bit 來做硬碟錄音時,那麼在每小時內,你會得到 324 MB 的資料,從這裡
不難看出,若是立體的兩軌音樂資料,它會是 648 MB,這就是為何一張標準的 CD 音樂片子,
它們的格式會是 650 MB / 74 分鐘。當然啦,時至今日,一些 CD 的播放器材也已脫離這樣的格式來迎應
一些超時,如 700 MB / 80 分鐘的 CD 格式。唯無論你事先是採用多高的取樣,多高的位元來記錄資料,
在完成作品後,一定是全要回歸到 44 . 1 Khz / 16 bit 的格式來。

ok,這篇就寫到此,整理一下,我們從數位的開頭一直到簡單介紹應用,又知道一些事情了,
各位,加油加油。

音匠 吳榮宗
_


S e r v i c e | R e v i e w | M u s i c W o w | C o n n e c t U s | H o m e