前回ブログで紹介しました様に、VinylStudioに、MP3エンコーダを導入しましたので、ハイレコ(ハイレゾ)音源をエンコードするなら非可逆圧縮形式のMP3 かAACのどちらが良いかスペクトルの相関係数から音質比較してみました。
更に、ピュア音源による評価も追記しました。(2024/8/28)
VinylStudioは、主にレコードの収録に特化したデジタイズ・アプリです。 レコードからADコンバータを介してハイレゾ収録した後、ノーマライズやイコライザー、プチノイズ抑制機能などで独自にマスタリング編集した後、ファイル分割を行なってwavやflacのファイル出力、更にAACやmp3 へのファイル出力もこなせるオールインワンアプリです。 (詳しくはここをクリック)
目 次
MP3及びAACについて(今後の趨勢)
先ず一般論として、AACとMP3はどちらも非可逆圧縮形式です。 つまり、元の音声情報の一部をカットすることで高い圧縮率を実現していますので劣化が伴うものです。 この劣化もエンコーダによってバラツキます。
エンコーダによって、再生できる上限周波数を制限するものや、入力のbit深度を16bitに落とすもの等がありエンコードする時に注意が必要です。(詳しくは「AAC(MP3)に変換する時の「5つのヒント」を参照してください) 実際のところAACかMP3かの選択は、試聴した上での個々の(好みの)判断になると思います。
但し、AAC(Advanced Audio Coding)は、一般にMP3より優れているとされる新しいフォーマットで、MP3 よりも高度な圧縮技術を使用しているため、ネット配信する場合などで低いビットレートでより良い音質を得ることができます。 また、Wikipediaによれば、「40携帯電話における既定もしくは標準の音声フォーマットである」との記述から、今後の趨勢はAACに傾いて行くと考えられます。
エンコードするハイレコ(ハイレゾ)音源について
LONDONレーベルの1966年録音、バーンスタイン指揮 ウィーンフィルでバーンスタイン本人がピアノを弾いているモーツァルト ピアノ協奏曲第15番変ロ長調 K.450 第2楽章です。
バーンスタインのピアノの演奏は、ピアニストと見紛うほど秀逸で、特に第2楽章は、素晴らしいと思います。
このレコードの録音は、VinylStudioのFLACでサンプリング周波数96khz、ビット深度24bitで録音しました。
MP3に変換した全楽章を試聴
(MP3-320kbps)
エンコード後のMP3とAACの各諸元
今回のAAC、MP3へのエンコードは、VinylStudioで行っています。 AAC、MP3のファイルを、MediaInfoと言うソフトで以下の諸元を抽出しました。
備考(注意ポイント)
- ここで注意して頂きたいのは、AAC諸元の中でVBRモードになっています。 今回のVinylStudioによるAACへのエンコードは、CBRで設定していますが、ビットレートがABR的に変動するようでMediainfoでみるとVBRモードになっています。 一方mp3エンコードのCBR設定では固定ビットレートが維持されMediainfoでみてもCBRになっています。
-
CBRモードでAACにエンコードしたファイルをMediainfoで確認するとVBRモードになる?
ことの発端は、VinylStudioを使ってAACでCBR設定したつもりでエンコードしたファイルをMediainfoでビットレート種別をみると何と言うことかVBRモードになっていました。 一方MP3の ...
- またVinylStudioでAACにエンコードしようとすると、「16ビット,48khzで保存される」旨の注意ダイアログが表示されます。 しかし、後段のピュア音源で評価すると AACエンコードの場合、ビット深度が24bitでエンコードされました。 一方のMP3では、注意ダイアログは表示されませんがピュア音源で確認すると16bitでエンコードされています。 この注意ダイアログと実際上の結果に相違があるかの理由は不明です。
ビット深度について、以下の記事をご参照ください。(2020/2/20追記)
-
サウンドアプリに搭載されているMP3(AAC)エンコーダのビット深度を調べてみました。
折角のハイレゾ(24bit)音源をMP3やAACにエンコードする時、出来るだけビット深度を維持したまま変換したい訳ですが、foober2000を除いてビット深度の設定が出来ず、サウンドアプリによっては ...
MediaInfo 情報
オリジナル | |||||
ビットレート | 2 609 Kbps | 128 Kbps | 320 Kbps | 128 Kbps (max196kbps) | 320 Kbps (max 414Kbps) |
ストリームサイズ | 142 MiB | 6.97 MiB | 17.4 MiB | 7.06 MiB | 17.4 MiB |
圧縮率 | 100% | 4.9% | 12.3% | 5.0% | 12.3% |
サンプルレート | 96.0 KHz | 48.0 KHz | 48.0 KHz | 48.0 KHz | 48.0 KHz |
ビットレートモード | VBR | CBR | CBR | VBR | VBR |
フォーマット | FLAC | MPEG Audio | MPEG Audio | AAC | AAC |
BitDepth/String | 24 ビット | ||||
ながさ | 7分 36秒 | 7分 36秒 | 7分 37秒 | 7分 36秒 | 7分 36秒 |
コーデック ID | mp4a-40-2 | mp4a-40-3 |
♬ モーツァルト・ピアノ協奏曲第15番変ロ長調 K.450 第2楽章
AAC(128kbps)を聴く
AAC(320kbps)を聴く
MP3(128kbps)を聴く
MP3(320kbps)を聴く
周波数分析と相関係数による解析・方法
「モーツァルト・ピアノ協奏曲第15番変ロ長調 K.450 第2楽章」のオリジナル音源(FLAC 96khz,24bit)に対して、ビットレート128kbpsと320kbpsで夫々のMP3、AACファイルを周波数分析し周波数帯域毎(1khz間隔)の相関係数で評価します。
方法
1 Audacityによる周波数分析・条件
- 関数窓:hanning 大きさ:65535ポイント
- 解析対象パート:楽曲先頭の109.2秒間
- エンコードしたファイルは、ハイレゾファイルのサンプリング周波数と合わせてリサンプリングした後、周波数分析します。
- 周波数分析データをテキストファイルに書出しExcelを使用しデータ解析します。
方法
2 1khz幅毎の相関係数・算出
- ハイレゾファイルとエンコードファイルに対する周波数と音圧レベルデータから、両者の相関係数を計算するために、1khz幅にブロック分けし音圧レベルの相関係数を算出します。計算はCORREL(コリレーション)関数を使います。
- 1khz周波数帯毎の音圧レベルの相関係数でハイレゾファイルとエンコードファイルとの相関の強さが判り、グラフ化することで可視化します。(相関係数が高ければ、両者の音圧波形は近似し誤差が少なく、低ければ、誤差が大きく音圧波形が不一致であることが判ります)
相関係数のグラフと評価
比較
1 128kbps ハイレゾ相関比較
❏ MP3(128kbps) vs ハイレゾ音源 <相関係数とスペクトル>
15khzから急激に音圧レベルが下がり、10khz付近から、オリジナル音源に対して相関係数が悪化し、17khz以上で相関が無くなっている。
❏ AAC(128kbps) vs ハイレゾ音源 <相関係数とスペクトル>
15khzから徐々に音圧レベルが下がり、10khz付近から、オリジナル音源に対して相関係数が悪化しているも、MP3では、17khzで相関ゼロに対して、AACでは相関を維持している。
比較
2 320kbps ハイレゾ相関比較
❏ MP3(320kbps) vs ハイレゾ音源 <相関係数とスペクトル>
19khzから音圧レベルが下がり、15khzまで、相関係数0.9以上を維持している。
❏ AAC(320kbps) vs ハイレゾ音源 <相関係数とスペクトル>
19khzから音圧レベルが下がり、MP3では15khzまで、相関係数0.9以上を維持していたが、AACでは、14khzから、相関係数0.9を切っている。(VinylStudioのAACは、16bitでエンコードされていることに影響か?) 320kbpsではMP3の方が音質優位と思われる。
相関係数による音質比較【まとめ】
ポイント
※ AAC、MP3へのエンコードは、VinylStudioで行っていますので、他のエンコーダを用いた場合は、この結果に差異が出る場合があることに注意してください。
- 相関係数のグラフ評価から、上限周波数付近に近づくにつれて相関が悪化する結果でした。 つまり、128kbpsのビットレートではAACが音質優位で、320kbpsビットレートではMP3が音質優位です。
- 「我が家のB級オーディオ」での聴感比較では、128bpsのビットレートであっても、320kbpsとの差は殆ど感じられませんでした。 ハイレゾ再生と128kbpsの比較では、プラシーボ効果もあるかも判りませんが、MP3(128bps)で高域に若干ザラつきを感じ ました。 ハイレゾ音源の方では、ザラつき無く安定感を感じました。
- MP3にしてもAACしても320kbpsでのファイルサイズは、ハイレゾのファイルサイズと比較して、1/10程度に圧縮されても、聴感上の音質差は、殆ど感じられないとことから、今更らながら恐るべきアルゴリズム技術と言えると思います。
- 総合して、ハイレゾをVinylStudioでエンコードするなら相関係数の結果から、128kbpsは避けて、出来れば、320kbpsのMP3でのエンコードを選択すべきかと思われました。
以上、スペクトルの相関係数から見た音質比較による「ハイレゾ音源をエンコードするならMP3かAACか」でした。
ピュア音源によるエンコーダの評価
下の「5つのヒント」に記述されたピュア音源による評価方法に沿ってVinylStudioのAAC及びMP3エンコーダの品質を確認してみました。 なお、評価対象は、AACとMP3ともサンプルレート:48khz、ビットレート:320kbpsで変換した音源ファイルです。 また、VinylStudioのバージョンはV15.0.0 ARM 64 bitです。
Hint
1 ビット深度が24bitに対応しているエンコーダか?
sin 1khz -90db・音源を変換した時の波形をAudacityで確認してみたのが下の波形です。
上段がAAC変換した波形で、下段がMP3変換した波形になります。 この波形から、AACは正弦波を維持しており24bitで、一方のMP3は矩形波になっており16bitで変換されているのが確認できました。
つまり、ハイレゾ24bit音源を変換するなら量子化ノイズが少ないAACがベターであることがわかります。 (量子化ノイズは、歪率(THD+N)に影響します。)
歪率比較
-20db sin 1khz音源ファイルをエンコードした時の歪率とCD歪率を比較しました。
(WaveSpectra条件:Hanning size=16384)
歪率 | AAC | MP3 | CD (参考) |
THD | 0.00086% | 0.00177% | 0.00032% |
THD+N | 0.00621% | 0.01438% | 0.01750% |
※歪率(THD+N)結果から、AAC は CD よりも優位、MP3はCDと同等です。
Hint
2 ハイレゾ音源を変換した時の上限周波数を確認
以上のF特グラフから、ハイレゾ音源のサンプリング周波数が192khzの場合、48khzへダウンサンプリングするため使用されるデシメーション・フィルター(エイリアシング防止用)の影響を受けてF特が15khz付近からブロードで減衰しています。
サンプルレートが48kHzですので本来的には24kHz(ナイキスト周波数)が再生できる上限周波数になる筈ですが Vinylstudioで変換するとAAC、MP3共に19.5khzでした。 このレベルの上限周波数なら、聴感上は問題にはならないとは思われるものの、オーディオ的には少々気になります。
Hint
3 上限周波数を改善させるには
デシメーション・フィルター(エイリアシング防止用)の影響を改善するには、VinylStudioでのレコード収録時に、初めからサンプルレートを48khzに落として収録し、AAC変換すれば上限周波数が24khzになる筈です。 但し、MP3はLameエンコーダのため、カットオフが20khzに設定されているので、上限周波数が20khzになると思われます。
サンプルレートを48khzに落としてレコード収録するのは得策でないので、Vinylstudioのエンコーダを使用しないで、後述の独立したオススメ変換アプリを使用するのがベターと思います。
Hint
4 エンコーダの劣化率を調べてみました
独自の手法になりますが、「Pink-noiseを使って絶対誤差から劣化率を求める方法」のテストです。 下のグラフ及びデータから
- AACは、Apple Musicアプリ(iTunes)の劣化レベルと略同等でした。
- 一方、MP3の劣化レベルは過去に調べたエンコーダの中でBestに位置するFFmpegのlibmp3lameと同等でした。 このことは、前述した相関係数とスペクトルから「320kbpsではMP3の方が音質優位」を裏付けている査証かも知れません。
Hint
5 タグ情報が引継がれる変換アプリを選択しよう
VinylStudioはタグ情報が引継がれますので、Hint5は割愛します。
ピュア音源による評価【まとめ】
総合して、VinylStudioでハイレゾ音源をエンコードするなら、MP3 を選ぶのがベターと思われるものの16bitで変換されることや上限周波数が低い問題も内在しています。 そのため、Vinylstudioに頼らない独立した変換アプリを選択するのも一つの方法です。 以下にオススメ変換アプリを紹介します。
オススメ変換アプリ(紹介記事)
-
WindowsCD音質を凌ぐ?「ハイレゾ音源のAAC変換」を行うために(その2:Windows版foober2000)
前回記事(その1)に引き続いて、ハイレゾ音源からCD音質を凌ぐAACにエンコードが可能か?Windowsのサウンド定番アプリfoober2000を使った場合の紹介です。 結論から言いますと、foob ...
24bitに対応しているMP3エンコーダ
-
MP3エンコーダFFmpegのlibmp3lameエンコーダを「5つの視点」で音質評価
MP3を今更評価を使う必要があるか?と思われれるかも知れませんが、今でも互換性が高く様々な機器で再生することができるメリットがあります。 例えばWordpressにMP3音源を埋め込んでブラウザで再生 ...