音を録音する場合、マイクロフォンやレコードプレーヤーなどの機器からノイズが発生することが避けられません。
記録された音声データに含まれている録音したい音の信号と各種のノイズとの比率で録音データの品質を表すことがあります。これを“S/N比”と呼びます。
まず、音響に関してよく使われるデシベルという言葉から説明します。電気通信や音響において、基準になる量Xに対する比較する量Yの比率の常用対数をベルという単位で表します。つまり、
ベル(BelあるいはB)=log10(Y/X)
デシベルはベルの1/10の大きさを表す単位です。つまり、
デシベル=dB=10log10(Y/X)
S/N比では、Yとして音声信号の強さの2乗、Xとしてノイズの強さの2乗を用います。つまり
S/N比=10log10(S/N)2=20log10(S/N)
代表的なアナログの録音媒体のS/N比は概ね次の表の通りと言われています。
レコード盤のS/N比について考えてみます。
50dB=20log10(S/N) なので log10(S/N)=2.5 ∴S/N=102.5=316.2
つまり、音声信号の1/316程度のノイズが含まれていることを示しています。
アナログ録音媒体のノイズの主要な部分は、テープでは磁性体を利用することによって生じるテープヒスノイズであり、レコード盤ではレコード盤の音溝とレコード針の接触によって生じるノイズです。これに対して音楽CDに記録された信号の読み出し=再生では基本的にノイズは生じないため、S/N比はあまり意味が無いと考えられます。音楽CDのS/N比は以下に示すダイナミックレンジとほとんど同義で用いられているようです。
ダイナミックレンジとは、音の強弱の表現力の指標です。表現できる最小の音に対する最大の音の比率で表わされる数値です。
ダイナミックレンジの大きな音楽としてはクラシック音楽のオーケストラの演奏が挙げられます。ソリストのピアニシモからオーケストラ全員のフォルテシモまで大きな幅があります。このような楽曲を再生するためにはダイナミックレンジの広い再生装置を用いることが必要になります。逆に、近頃のポップミュージックのように、最初から最後まで比較的同じような音量で演奏される音楽のダイナミックレンジは狭くなります。
アナログ媒体のダイナミックレンジはS/N比程度と考えられます。音楽CDのダイナミックレンジは量子化ビット数で決まります。16ビットであれば、最小の1から最大の216=65536までの範囲を表現できるので、理論的には次のように計算することができます。
CDのダイナミックレンジ=20log10(65536/1)=96.3dB
カセットテープやレコード盤の再生音をデジタル化する場合、カセットテープやレコード盤の再生によって不可避的にノイズが発生し、ノイズも含めてデジタルデータとして記録されます。そのため、デジタル録音したそのままの音声データはカセットテープやレコード盤の再生時のS/N比やダイナミックレンジを超えることは出来ません。
アナログ音源をただ単にデジタル録音したからといって、それだけで音質が向上することはありません。音声データをデジタル化することによって音声データを加工することが容易になるので、適切なノイズ低減処理を加えることによって音質を改善することが出来るのです。
次に代表的なノイズを紹介します。
クリックノイズあるいはクラックルノイズは、レコード盤の音溝についた塵や盤面の小さな傷による『パチッ』というごく短いノイズです。継続時間は短く、比較的取り除きやすいノイズです。
ノイズ部分を拡大すると次のような波形を持っています。
テープヒスノイズは、録音媒体として磁性体を使うことで生じるノイズであり、『シー』という微弱なホワイトノイズに似たノイズが音声データの全長にわたって生じています。
ヒスノイズはある程度取り除くことは可能ですが、音声信号にまで影響をあたえるため、過度の除去は音質を劣化させることになります。
クリッピングノイズは、録音レベルが大きすぎ、録音媒体の記録可能な信号の強さを超える場合に生じます。クリッピングノイズは音声波形を見ると一目で分かります。
クリッピングノイズの生じている部分を拡大したのが下の図です。音声波形が記録可能な範囲で不自然に潰れてしまっていることがわかります。
録音レベルを不適切に大きくした場合、全体としての音圧レベルは強くなり、大きな音になります。しかし、原音に対してダイナミックレンジが狭くなり、波形が潰れることでクリッピングノイズが生じ、音質が変化することになります。
アナログ音源をデジタル化する場合、原音の最大音量の波形の振幅が記録媒体の録音可能な最大値にちょうど収まる程度にすることが理想的です。これによって録音データのダイナミックレンジは最大となり、最も原音の波形に近い波形を再現することが出来るようになります。
録音レベルが大きすぎるとクリッピングノイズが発生し、ダイナミックレンジが狭くなります。逆に録音レベルが低すぎると記録媒体の持つダイナミックレンジが有効に活かせず、波形の歪が大きくなります。
■ノイズ低減処置の例
デジタル録音した音声データからクリックルノイズを除去し、更に背景のノイズを除去するDFKの標準的なノイズ処理の例を示します。 ■dBについての補足
前述のとおり、ベルあるいはデシベルという単位は特定の物理量に対する単位ではなく、二つの量の比率の常用対数をとった値です。そのため、同じデシベルという単位でも、その内容は様々です。これを混乱して使用している説明を見ることがありますので、注意が必要です。
ここではデシベルで表されている代表的な物理量とその意味を簡単に整理しておきます。まず、デシベルを次のように定義しておきます。
デシベル(dB)=10log10(Y/X)
記録された音声データに含まれている録音したい音の信号と各種のノイズとの比率で録音データの品質を表すことがあります。これを“S/N比”と呼びます。
まず、音響に関してよく使われるデシベルという言葉から説明します。電気通信や音響において、基準になる量Xに対する比較する量Yの比率の常用対数をベルという単位で表します。つまり、
ベル(BelあるいはB)=log10(Y/X)
デシベルはベルの1/10の大きさを表す単位です。つまり、
デシベル=dB=10log10(Y/X)
S/N比では、Yとして音声信号の強さの2乗、Xとしてノイズの強さの2乗を用います。つまり
S/N比=10log10(S/N)2=20log10(S/N)
代表的なアナログの録音媒体のS/N比は概ね次の表の通りと言われています。
オープンテープ | 60dB |
レコード盤 | 50dB |
カセットテープ | 40dB |
レコード盤のS/N比について考えてみます。
50dB=20log10(S/N) なので log10(S/N)=2.5 ∴S/N=102.5=316.2
つまり、音声信号の1/316程度のノイズが含まれていることを示しています。
アナログ録音媒体のノイズの主要な部分は、テープでは磁性体を利用することによって生じるテープヒスノイズであり、レコード盤ではレコード盤の音溝とレコード針の接触によって生じるノイズです。これに対して音楽CDに記録された信号の読み出し=再生では基本的にノイズは生じないため、S/N比はあまり意味が無いと考えられます。音楽CDのS/N比は以下に示すダイナミックレンジとほとんど同義で用いられているようです。
ダイナミックレンジとは、音の強弱の表現力の指標です。表現できる最小の音に対する最大の音の比率で表わされる数値です。
ダイナミックレンジの大きな音楽としてはクラシック音楽のオーケストラの演奏が挙げられます。ソリストのピアニシモからオーケストラ全員のフォルテシモまで大きな幅があります。このような楽曲を再生するためにはダイナミックレンジの広い再生装置を用いることが必要になります。逆に、近頃のポップミュージックのように、最初から最後まで比較的同じような音量で演奏される音楽のダイナミックレンジは狭くなります。
アナログ媒体のダイナミックレンジはS/N比程度と考えられます。音楽CDのダイナミックレンジは量子化ビット数で決まります。16ビットであれば、最小の1から最大の216=65536までの範囲を表現できるので、理論的には次のように計算することができます。
CDのダイナミックレンジ=20log10(65536/1)=96.3dB
カセットテープやレコード盤の再生音をデジタル化する場合、カセットテープやレコード盤の再生によって不可避的にノイズが発生し、ノイズも含めてデジタルデータとして記録されます。そのため、デジタル録音したそのままの音声データはカセットテープやレコード盤の再生時のS/N比やダイナミックレンジを超えることは出来ません。
アナログ音源をただ単にデジタル録音したからといって、それだけで音質が向上することはありません。音声データをデジタル化することによって音声データを加工することが容易になるので、適切なノイズ低減処理を加えることによって音質を改善することが出来るのです。
次に代表的なノイズを紹介します。
クリックノイズあるいはクラックルノイズは、レコード盤の音溝についた塵や盤面の小さな傷による『パチッ』というごく短いノイズです。継続時間は短く、比較的取り除きやすいノイズです。
ノイズ部分を拡大すると次のような波形を持っています。
テープヒスノイズは、録音媒体として磁性体を使うことで生じるノイズであり、『シー』という微弱なホワイトノイズに似たノイズが音声データの全長にわたって生じています。
ヒスノイズはある程度取り除くことは可能ですが、音声信号にまで影響をあたえるため、過度の除去は音質を劣化させることになります。
クリッピングノイズは、録音レベルが大きすぎ、録音媒体の記録可能な信号の強さを超える場合に生じます。クリッピングノイズは音声波形を見ると一目で分かります。
クリッピングノイズの生じている部分を拡大したのが下の図です。音声波形が記録可能な範囲で不自然に潰れてしまっていることがわかります。
録音レベルを不適切に大きくした場合、全体としての音圧レベルは強くなり、大きな音になります。しかし、原音に対してダイナミックレンジが狭くなり、波形が潰れることでクリッピングノイズが生じ、音質が変化することになります。
アナログ音源をデジタル化する場合、原音の最大音量の波形の振幅が記録媒体の録音可能な最大値にちょうど収まる程度にすることが理想的です。これによって録音データのダイナミックレンジは最大となり、最も原音の波形に近い波形を再現することが出来るようになります。
録音レベルが大きすぎるとクリッピングノイズが発生し、ダイナミックレンジが狭くなります。逆に録音レベルが低すぎると記録媒体の持つダイナミックレンジが有効に活かせず、波形の歪が大きくなります。
■ノイズ低減処置の例
デジタル録音した音声データからクリックルノイズを除去し、更に背景のノイズを除去するDFKの標準的なノイズ処理の例を示します。 ■dBについての補足
前述のとおり、ベルあるいはデシベルという単位は特定の物理量に対する単位ではなく、二つの量の比率の常用対数をとった値です。そのため、同じデシベルという単位でも、その内容は様々です。これを混乱して使用している説明を見ることがありますので、注意が必要です。
ここではデシベルで表されている代表的な物理量とその意味を簡単に整理しておきます。まず、デシベルを次のように定義しておきます。
デシベル(dB)=10log10(Y/X)
対象
|
基準値X
|
対照値Y
|
意味
|
音圧レベル | X=(p0)2 p0=2.0×10-5 [Pa] |
Y=p2 p[Pa] |
基準となる音圧p0との比率 dBspl(Sound Pressure Level) |
S/N比 | X=N2 N:ノイズの大きさ |
Y=S2 S:信号の大きさ |
ノイズに対する有用な信号レベルの比率 |
ダイナミックレンジ | X=(Smin)2 Smin:表現できる最小の信号 |
Y=(Smax)2 Smax:表現できる最大の信号 |
表現できる最小の信号レベルに対する最大信号の比率 |
AV機器の最大値など | X=(Smax)2 Smax:AV機器の規格上の信号の最大値 |
Y=S2 S:信号の値 |
例えばオーディオ機器のボリュームの最大値を0dBとして表す。範囲は(−∞〜0]。 |