使用しているサウンドアプリの違いでAACにエンコードした時の音質に違いがあるようです。 そこで、ピュアー音源を使ってVinylStudio、iTunes、XLD、Audacityに搭載されている4種類のAACエンコーダで出力したAACファイルを周波数分析しスペクトルの形状比較で評価してみました。 評価にあたって、AAC設定は音質重視したモード設定でAACにエンコードしています。
注意
2019年8月20日に公開した記事ですが、エンコーダアプリによって、「AACファイルの波形が異なる原因と考察」を追加しましたので、2020年5月11日に記事を更新しました。
評価用ピュアー音源(ノコギリ波)について
評価用のピュアー音源は、『ピュアー音源から見た「MP3、AAC」の音質比較』で使用したピュアー音源(2.5khzノコギリ波 -20db 5秒間)を使用します。
このピュアー音源は8つの正弦波(2.5khzを基本波として最大:2.5khz✕8=20khzまでの整数倍周波数)をWaveGeneで加算して2.5khzのノコギリ波を生成しています。 AACエンコーダが48khz(若しくはCDフォーマットなら44.1khz)のサンプリング周波数であればナイキスト周波数は24khz(若しくは44.1khz/2=22.05khz)です。 一方、ピュアー音源(ノコギリ波)の最大周波数は20khzでナイキスト周波数以下ですので、エイリアスは原理的に発生しない評価用音源になっています。
Wav(192Khz 24bit MiB5.49 MiB) Down load
ピュアー音源のMediainfo情報
フォーマット : PCM
設定 : Little / Signed
コーデック ID : 1
ながさ : 5秒 0秒
ビットレートモード : CBR モード
ビットレート : 9 216 Kbps
チャンネル : 2 チャンネル
サンプルレート : 192 KHz
BitDepth/String : 24 ビット
ストリームサイズ : 5.49 MiB (100%)
評価するAACエンコーダー(4種類)の設定と変換されたAACファイル
MAC OSは、OSX(version10.13.6)High Sierraを使用しています。
評価するAACエンコーダー(4種類)は、Vinylstudio、iTunes, XLD, Audacity です。 以下をクリックすると、設定方法や変換したAAC音源が展開します。
<strong>+ クリックすると下に展開</strong>
VinylStudio (使用version:9.0.9)
VinylStudioは、LPレコード用に開発されたソフトで当サイトで使用しています。
step
1AAC設定
AACの設定は、ピュアー音源をインポートした後、Split Tracksタブでピュアー音源トラックをフォーカスし、右クリックでSave Track As....から以下画面の様に320kbpsでVBRのレ点を外してAACファイルを出力しました。
step
2VinylStudioでエンコードしたAACファイル
AAC 320kbps
Mediainfo情報
フォーマット : AAC LC
フォーマット/情報 : Advanced Audio Codec Low Complexity
コーデック ID : mp4a-40-2
ながさ : 7秒 0秒
Source_Duration/String : 7秒 19秒
ビットレートモード : VBR モード
ビットレート : 98.1 Kbps
ノミナル : 320 Kbps
最大 : 513 Kbps
チャンネル : 2 チャンネル
Channel layout : L R
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームサイズ : 83.8 KiB (95%)
注意ポイント
- vinyl studioでは、AACのビットレートモードの設定はVBRを選択するかしないかの二者択一になっていて、明示的にCBRを選択できません。 ここでは、VBRを選択していない状態でエンコードした場合をCBRでエンコードしたということにしています。(この設定で出力されたAACファイルをMediainfoで調べるとVBRモードと表示されます)
- AACにエンコードを実行するとき、「16ビット,48khzで保存される」旨の注意ダイアログが表示されます。 AACエンコードの場合、ビット深度24bitが16bitに変換後にエンコードされるようです。
iTunes (使用version:12.8.2.3)
iTunesは、MAC OS用に標準実装されているミュージックソフトです。 AACへエンコードする設定要点は以下の通りです。
step
1AAC設定
AACの設定は、iTunesの環境設定>読込設定 カスタム設定で320kbpsにしておきます。
AACにエンコードするときは、ピュアー音源(wavファイル)をiTunesへドラッグ・アンド・ドロップして、ピュアー音源をフォーカスした状態でファイル>変換>AACバージョンへ変換をクリックするとピュアー音源がAACファイルへ出力されます。 AACファイルの場所は、曲の情報からファイル場所が参照できます。
step
2iTunesでエンコードしたAACファイル
AAC 320kbps
Mediainfo情報
フォーマット : AAC LC
フォーマット/情報 : Advanced Audio Codec Low Complexity
コーデック ID : mp4a-40-2
ながさ : 5秒 56秒
ビットレートモード : VBR モード
ビットレート : 132 Kbps
ノミナル : 320 Kbps
最大 : 130 Kbps
チャンネル : 2 チャンネル
Channel layout : L R
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームサイズ : 82.7 KiB (91%)
注意ポイント
- iTunesでは、AACのビットレートモードの設定は可変ビットレート(VBR)を選択するかしないかの二者択一になっていて、明示的にCBRを選択できません。 ここでは、VBRを選択していない状態でエンコードした場合をCBRでエンコードしたということにしています。(この設定で出力されたAACファイルをMediainfoで調べるとVBRモードと表示されます)
XLD (使用version:20161007 (149.3))
XLDは、Mac OS X用のCDリッピング定番ソフトです。 AACへエンコードする設定要点は以下の通りです。
step
1AAC設定
AACの設定は、XLDの環境設定(一般)出力フォーマットで「MPEG-4 AAC設定」を選択しオプションでで320kbpsにしておきます。
AACにエンコードするときは、ファイルから開く>ピュアー音源(wavファイル)を選択すると環境設定(一般)で設定した場所にAACファイルが出力されます。
step
2XLDでエンコードしたAACファイル
AAC 320kbps
Mediainfo情報
フォーマット : AAC LC
フォーマット/情報 : Advanced Audio Codec Low Complexity
コーデック ID : mp4a-40-2
ながさ : 5秒 56秒
ビットレートモード : VBR モード
ビットレート : 324 Kbps
最大 : 314 Kbps
チャンネル : 2 チャンネル
Channel layout : L R
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームサイズ : 198 KiB (76%)
注意ポイント
- XLDでは、AACのモード設定をCBRに設定しているもののAACファイルをMediainfoで調べるとVBRモードと表示されます
Audacity (使用version:2.2.2.0)
Audacityは、多機能なフリーのオーディオ編集ソフトです。 機能の中に周波数分析データをテキストに書き出せる機能があり当記事もこの機能を利用させて頂いてエクセルでスペクトルグラフを作成しています。 AACへエンコードする手順要点は以下の通りです。
step
1AAC設定
AACにエンコードするときは、ピュアー音源(wavファイル)をAudacityへドラッグ・アンド・ドロップします。 全体を選択した後、ファイル>Export>選択したオーディオの書き出しを選択すると下の画面になり、ファイルタイプの中から「MA4(AAC)ファイル(FFmpeg)」を選びます。ビットレートは選択できませんが品質を最高の500にして「保存」をクリックするとAACファイルが出力されます。
step
2AudacityでエンコードしたAACファイル
AAC Q500
Mediainfo情報
フォーマット : AAC LC
フォーマット/情報 : Advanced Audio Codec Low Complexity
コーデック ID : mp4a-40-2
ながさ : 5秒 34秒
Duration_LastFrame : -1秒
ビットレートモード : CBR モード
ビットレート : 196 Kbps
チャンネル : 2 チャンネル
Channel layout : L R
サンプルレート : 48.0 KHz
フレームレート : 46.875 fps (1024 SPF)
ストリームサイズ : 120 KiB (98%)
注意ポイント
- Audacityでは、ビットレートの設定がありません。 品質の最高設定(500)でのAACファイルをMediainfoで調べると196KbpsでCBRモードと表示されます。 (品質を半分にしても196KbpsでCBRモードでした。)
展開を「閉じる」
AACファイルの波形比較
ピュアー音源(2.5khzノコギリ波)及び各アプリでエンコードしたAACファイルをAudacityに取り込んだ波形を示します。
注意ポイント
ピュアー音源のWavフォーマットは192khzのサンプリングです。 一方AACのサンプリングは48khzですので、サンプリングポイントを合わせるために、Audacityのリサンプリングで48khzから192khzにアップコンバートした表示波形を示しています。
AACファイルの波形が異なる原因と考察(2020年5月10日 追記)
AACへエンコードした後のノコギリ波・波形は、エンコーダアプリの違いで波形の再現性にバラツキがあります。 このバラツキの原因は何なのか? ノコギリ波を構成している周波数の異なる正弦波(8波)の波高値の再現性の違いによるものと想定できます。(つまりエンコーダ周波数特性(F特)の高域減衰のバラツキ)
そこで、WindowsソフトのWaveSpectra(以下WS)を用いてノコギリ波を形成している周波数の異なる正弦波(8波)の夫々のスペクトルのピークレベルを測定することにしました。
<strong>+測定方法はここをクリック(下に展開します)</strong>
step
1夫々AACファイルをWaveファイルに変換
WSで測定するには、Waveファイルが必要です。 ファイル変換するツールは、Audio to WAVE 44.1K Droplet.appを使用しました。 詳しい変換方法は、「Apple Digital MastersのAAC音質(その1)」をご参照ください。
step
2AACファイルから変換されたWaveファイルをWSでスペクトルを描画しピークレベルを測定
簡単な流れ
- WSを起動した後、AACファイルから変換されたWaveファイルをWSのWindowにドロップし再生ボタンを押すとスペクトルが描画されます。
- ストップボタンを押して再生を途中で停止させると、静止したスペクトルが描画されます。
- スペクトルのピーク部分にポインターのカーソルを合わせると赤矢印部分に周波数とレベル値(db)が表示されるので、その値を読み取りグラフ化します。
(注記)スペクトル条件:hanning窓でサイズは32768にしています。
展開を「閉じる」
元のピュアー音源を基準にして波高値レベルの差異を測定したグラフ
(注記)
このグラフは、元のピュアー音源スペクトルのピークレベルを基準にした乖離レベルを示しているので、夫々のAACエンコーダのF特(周波数特性)を表しているグラフと置き換えることができます。
ポイント
波形比較マトメ
- ピュアー音源の波形に最も近似しているのがiTunesでした。 F特グラフを見ると、17.5khzまでフラットで20khzで-1dbの減衰に収まっているため、ピュアー音源の波形に最も近似したものと考えれれます。
- iTunesの次にピュアー音源の波形に最も近似しているのがAudacityでした。 F特グラフを見ると17.5khzまでフラットで20khzの減衰量が-7.5dbになって急減しています。 ピュアー音源の波形の再現性のキーは、17.5khzまでフラットである必要があると思われます。
- 最も、ピュアー音源の波形と相違しているのが、Vinylstudioでした。 F特グラフを見ると15khzから減衰が始まっているのがその原因と思われます。
以上から、波形の再現性とF特(高域減衰)の良さからみて順位を付けると以下になります。
iTunes > Audacity > XLD > VinylStudio
AACファイルの周波数分析方法
評価用音源と上記 各AACファイルをAudacityに取り込み周波数分析します。
<strong>+周波数分析方法の詳細はここをクリック (下に展開します)</strong>
step
1周波数分析エリアの選択
注意ポイント
周波数分析するに当たり、評価用ピュアー音源ファイル(Wavフォーマット 192khz)と出力されたAACファイル(48khz)のサンプリング周波数を合わせるために、予めAACファイルを48khzから192khzにリサンプリングを行っておきます。 リサンプリングの方法は、以下です。
Audacityに取り込んだAACファイル(波形)を選択した後、トラック>リサンプリングを選んで192khzにリサンプリングします。
Audacityに取り込んだ夫々のファイル(波形)を以下のように約4秒間(周波数分析エリア)を選択します。
step
2スペクトル(周波数分析)の実行
解析 >スペクトル表示 を実行すると以下のスペクトル画面が表示されます。
この画面で、関数窓はHanningにしています。 FFTサイズを選択した後、「書き出しボタン」をクリックすると、周波数分析データがテキスト形式で書き出されます。 このテキストデータファイルをエクセルなどを使ってグラフ化して評価します。
注意ポイント
FFTサイズについて
FFTサイズはサイズを大きくするとスペクトルの分解能が高まります。
以前のブログ『ピュアー音源から見た「MP3、AAC」の音質比較』では、FFTサイズを「4096」にしていましたが、今回は分解能を高めた「65536」と以前の「4096」の2様の条件でスペクトルを確認しようと思います。
展開を「閉じる」
各音源の周波数分析(スペクトル)結果
オリジナル音源(ピュアー音源)と合わせて各AACファイルのスペクトルをグラフ描画しました。
VinylStudio AACファイル
ポイント
5khzズームで、-100db以下で発振状ノイズがサイドローブが現れていますが、これはAACにエンコードを実行するとき、ビット深度24bitを16bitにデグレード(degrade)にしている影響かもしれません。
iTunes AACファイル
ポイント
5khzズームで、-100db以下に発振状ノイズがサイドローブが現れており、これはVinylStudio AACファイルと非常に近似しています。 また、Mediainfoの情報も似ています。 iTunesも、AACにエンコードを実行するとき、ビット深度24bitが16bitに変換(degrade)されているかもしれません。
XLD AACファイル
ポイント
5khzズームで、両サイドローブのノイズレベルはランダムノイズでレベル最も低く、またオリジナル音源のカーブと一致していて、4つのAACエンコーダの中でXLDが最も音質的に優れているのではないかと思われます。
Audacity AACファイル
ポイント
5khzズームで、サイドローブの発振状ノイズレベルが-100dbを超えています。 これは、Mediainfoでのビットレートが196kbpsと4つのエンコーダの中で最も低くなっているためかもしれません。
マトメ (考察)
今回の評価実験でわかったこと。
- 音質を聞き分け出来るか否かは別にして、AACでビットレート(再生上限周波数と相関)が決まれば音質が決まるという単純なものでなくサウンドアプリに搭載されているエンコーダー(プログラム仕様の違い?)によって出力されるAACファイルの音質に差が生じることが今回の実験で分かりました。
- 波形比較ではiTunesのAACがピュアー音源の波形・形状に最も近似していました。 これは、スペクトルの20khzピークレベルがピュアー音源と一致していることから高域の減衰が少ないためと思われます。(iTunesの再評価を行いました。 詳しくは、ここをクリックして参照してください。 2021/12/28追記)
- レベルが低く聴感は問題ないと思われるものの、XLDを除いて、5khzズームスペクトルに発振状サイドローブが現れていました。
スペクトルのサイドローブとF特グラフ(高域減衰)を加味したAAC音質・総合順位
XLD ≒ iTunes > Audacity > VinylStudio としました。
(2020年5月11日:変更)
最後までお読み頂きありがとうございます。 今回の実験がご使用されているサウンドアプリに搭載されているAACエンコーダの音質を評価するときの一助になれば幸いです。
最近のApple MusicやiTunesはハイレゾ音源からAACベースに変換したApple Digital Mastersで配信されて来ています。 このAAC音質とXLDのAAC音質を比較評価した下の記事もご覧ください。
オススメ
-
-
Apple Digital MastersのAAC音質(その2:ピュアー音源による評価)
「Apple Digital MastersのAAC音質(その1)」に引き続いて、評価用ピュアー音源として①レベルを変えた1khz正弦波Wav Fileと②2.5khzノコギリ波Web Fileを使っ ...
続きを見る