広告 MP3、AAC音質関連

サウンドアプリに搭載されているMP3(AAC)エンコーダのビット深度を調べてみました。

スポンサーリンク

 

折角のハイレゾ(24bit)音源をMP3やAACにエンコードする時、出来るだけビット深度を維持したまま変換したい訳ですが、foober2000を除いてビット深度の設定が出来ず、サウンドアプリによってはビット深度を16bitに落としてエンコードされる場合があります。 

前回記事で使ったテストファイル(-90dbFS)を使って、サウンドアプリ「VinylStudio、iTunes、XLD、Audacity、foober2000」(5種類)に対してエンコードしたファイルの波形でビット深度を推定し、合わせてWindowsソフトのWaveGeneの姉妹ソフトであるWaveSpectra歪率も調べてみました。

 

評価用テストファイル(1khz正弦波 -90dbFS 24bit 44.1khz Wav)について

評価用のピュアー音源は、『ハイレゾ音源をMP3(AAC)にするなら、ビット深度を24bitに指定してエンコードすべき?』で使用したテストファイル(1khz正弦波 -90dbFS 5秒間 24bit 44.1khz Wavフォーマット)を使用します。

テストファイル

テストファイル( -90dbFS) の波形
(Audacityに取り込み、正規化(-3dbに増幅後)

-90dbFS(≒20log2^9bit-144)という微小レベルの波形は、まだ9bit分の分解能を有していますので綺麗な正弦波で再現されています。

sin1khz -90db_24441 .WAV
ダウンロード
  

テストファイルMediaInfo情報

フォーマット : PCM
設定 : Little / Signed
コーデック ID : 1
ながさ : 5秒 0秒
ビットレートモード : CBR モード
ビットレート : 2 117 Kbps
チャンネル : 2 チャンネル
サンプルレート : 44.1 KHz
BitDepth/String : 24 ビット
ストリームサイズ : 1.26 MiB (100%)

 

サウンドアプリ(MP3・AAC)エンコーダのビット深度の推定方法

考え方

エンコードした時に16bitにビット深度 を落すようなサウンドアプリですとテストファイルの記録レベルが-90dbFS≒20log(2^1bit)-96では、1bit(2値)の分解能になり、その波形は階段状になります。  blank

更に量子化ノイズにより歪率(THD+N)も30%以上になる筈なので、波形と歪率のステータスを見ればビット深度が16bitか24bitかを判別できると考えました。

  • テストファイルをエンコードしたファイルの波形を見るには、エンコードファイルをAudacityに取り込み、正規化(ノーマライズ)して-3dbまで増幅することで波形を観測します。 その波形が階段状ならビット深度が16bitと判定されます。 綺麗な正弦波なら24bitと判定できます。
  • エンコードファイルの歪率を測定するには、Windows版foober2000でエンコードファイルをビット深度24bitでWavファイルに変換して、WavファイルをWaveSpectraにドラッグ・アンド・ドロップすれば歪率(THD+N)を測定できます。 歪率(THD+N)が30%以上ならビット深度が16bitと推定されます。

 

エンコーダの基本設定

  • エンコードモードはCBR(固定ビットレート:constant bitrate)とします。
  • ビットレートは160kbpsとしました。

注意ポイント

上記に設定したとしても、MediaInfoでエンコードファイルの情報を見ると、VBRになったり、ビットレートも相違する場合があります。 このため、下記ビット深度の推定結果にMediaInfoの情報も合わせて添付しました。

なお、MAC OSは、OSX(version10.13.6)High Sierraを使用しています。

 

VinylStudio (V:11.0.7)の結果

MP3エンコーダの場合

【波形】

blank

〜〜〜〜〜〜

【歪率】

(THD+N):35.2077%

【ビット深度推定】16bit

AACエンコーダの場合

【波形】

正弦波
(画像割愛)

〜〜〜〜〜〜

【歪率】

(THD+N):0.19764%

【ビット深度推定】24bit

 

iTunes(V:12.8.2.3)の結果

MP3エンコーダの場合

【波形】

正弦波
(画像割愛)

〜〜〜〜〜〜

【歪率】

(THD+N):0.00500%

【ビット深度推定】24bit

AACエンコーダの場合

【波形】

正弦波
(画像割愛)

〜〜〜〜〜〜

【歪率】

(THD+N):0.18623%

【ビット深度推定】24bit

 

XLD [20161007 (149.3)]の結果

MP3エンコーダの場合

【波形】

正弦波
(画像割愛)

〜〜〜〜〜〜

【歪率】

(THD+N):0.25631%

【ビット深度推定】24bit

AACエンコーダの場合

【波形】

正弦波
(画像割愛)

〜〜〜〜〜〜

【歪率】

(THD+N):0.18372%

【ビット深度推定】24bit

 

Audacity (V:2.2.2)の結果

MP3エンコーダの場合

【波形】

blank

〜〜〜〜〜〜

【歪率】

(THD+N):35.4089%

【ビット深度推定】16bit

AACエンコーダの場合

【波形】

blank

〜〜〜〜〜〜

【歪率】

(THD+N):29.1738%

【ビット深度推定】16bit

 

foober2000 (v1.5.1)の結果

MP3エンコーダの場合

【波形】

正弦波
(画像割愛)

〜〜〜〜〜〜

【歪率】

(THD+N):0.25551 %

【ビット深度推定】24bit

AACエンコーダの場合

【波形】

正弦波
(画像割愛)

〜〜〜〜〜〜

【歪率】

(THD+N):0.18281%

【ビット深度推定】24bit

 

調査結果のまとめ

サウンドアプリ MP3 AAC
VinylStudio ビット深度推定 16bit 24bit
歪率 35.2077% 0.19764%
iTunes ビット深度推定 24bit 24bit
歪率 0.005% 0.18623%
XLD ビット深度推定 24bit 24bit
歪率 0.25631% 0.18372%
Audacity ビット深度推定 16bit 16bit
歪率 35.4089% 29.1738%
foober2000 ビット深度推定 24bit 24bit
歪率 0.25551 % 0.18281%

 

今回の実験ポイント

  • エンコード時のビット深度が24bitですと16bitに比べ歪率の点で非常に有利になり、弱音部(ピアニッシモ)の再現性に期待できると思います。
  • サウンドアプリのMP3(AAC)エンコーダは、元々CDベース(16bit)ファイルのエンコードを目的にビット深度を設定しているように思われますので、ハイレゾ(24bit)を維持してエンコードしたい場合には、お使いのサウンドアプリのエンコーダが24bitのビット深度に対応しているかを知っておく必要があると思います。 一度、お使いのサウンドアプリに対して、今回の「ビット深度の推定方法」をお試し頂ければと思います。
  • 今回の結果から、ハイレゾ音源をMP3のエンコードを避けるべきサウンドアプリは、VinylStudioとAudacityで、AACのエンコードを避けるべきサウンドアプリは、Audacityとなりました。
  • iTunesがテストファイルより歪率が低くなっています。 この原因は不明ですが、スペクトルから見ますとノイズ成分が低くなっているからかも知れません。

 

以上、サウンドアプリ毎にエンコーダのビット深度を調べてみました。 ハイレゾ音源をMP3(AAC)へエンコードする際の、ご参考にして頂ければと思います。

 

参考:ハイレゾ音質を極力低下させないAAC(MP3)変換を行うために

 

 

スポンサーリンク

 

スポンサーリンク

 

t