ピュアー音源(2.5khzのノコギリ波)をエンコードした非可逆圧縮音源(MP3やAAC)で、DSEEが正しく高域補完されていないのではないか?という事象(「ピュアー音源によるsony HAP-Z1ESのDSEE機能・再確認」記事参照)が見られました。
この事象について、SONYの相談窓口に問い合わせしたところ「製品の内部仕様を開示することになるので、個別の検証・評価をお受けできない」との残念な回答を受けてしまいました。
HAP-Z1ES
詳しくは、ここをクリック
そこで、もう少し条件を広げてDSEE機能をテストすると、一部の条件(周波数等)で高域補完されるものの殆どの条件下では正しく高域補完されていないことが分かりました。 実際の音楽ソースをAAC(又はMP3)にエンコードしたリアル音源では、不特定多数の周波数が混在しているので「DSEE」機能の高域補完は望めないことが分かりました。
目 次
我が家のHAP-Z1ES・事前確認
1.我が家のHAP-Z1ESに機能上の問題がないか?
2.本体のファームウェアバージョン
DSEEの定義(想定)
sonyからは、明快なDSEEの定義が示されいませんので、カタログ等から独自に定義を想定しました。 DSEEについて、カタログ等の記載を、「ピュアー音源によるsony HAP-Z1ESのDSEE機能・再確認」にマトメていますのでご参照ください。
定義想定
DSEEとは、ビットレートに基づいて上限周波数がカットされている非可逆圧縮音源を低域データから、カットされいる高域の倍音成分を推定し、カットされている高域に推定した倍音成分を付加し元の音源に復元する技術(アルゴリズム)であろうと勝手に想定しました。
この定義(想定)から、倍音成分が連続しているプリミティブなノコギリ波をMP3等に変換した非可逆圧縮音源をHAP-Z1ESに転送し、DSEEで再生すれば、カットされた上限周波数が、DSEEによって倍音が復元される筈で、スペクトル確認すれば容易にDSEE機能の評価ができると考えました。
評価方法の実際(手順)
関連記事:
-
ピュアー音源から見た「MP3、AAC」の音質比較
前回ブログの正弦波の組合せで作ったエイリアシングノイズの無いノコギリ波(ピュアー音源)をVinylStudioでインポートした後、MP3、AACへ夫々出力したピュアー音源ファイルのスペクトル比較を行っ ...
1.ノコギリ波音源を生成する
WindowsソフトのWaveGeneでエイリアシングが発生しない加算モードで、wav音源ファイルを作成します。
スペクトルを見ると倍音が連続的に整列しています。
2.ノコギリ波音源を非可逆圧縮音源(MP3etc)へ変換する
生成したノコギリ波wavファイルをVinylStudioにインポートします。 次にVinylStudioによって、ビットレートやサンプリング周波数を決めて非可逆圧縮音源へエンコードします。 スペクトルを見ると、ビットレートによる、上限周波数以上の倍音成分が欠落(カット)しているのが分かります。
3.DSEE Autoで非可逆圧縮音源を再生し機能判定する
「DSEE」機能 判定基準
ノコギリ波・非可逆圧縮音源をHAP-Z1ESに取り込み、HAP-Z1ESでDSEE Autoで再生し、アナログ出力(Line出力)をAudacityで録音して上限周波数のスペクトルを確認します。
- 正しく倍音が補完されていればDSEE機能はOKと判定します。
- 倍音があるべき周波数にスペクトルのピークが無かったり、倍音とは別の位置にピークがあればNGと判定します。
<DSEE機能 OK判定の例>
<DSEE機能 NG判定の例>
非可逆圧縮音源の条件とDSEE機能 (判定結果)
以上のDSEE評価方法に基づき、各種の圧縮音源の条件下で、DSEE(Auto)の機能(高域補完)がどのような判定になるかを下記表にマトメました。
(画面よりはみ出たら、横にスクロールできます。)
条件 | DSEE機能 スペクトル (hanning size16384) | DSEE 補完判定 | ノコギリ波 周波数 | 圧縮形式 Sampling 周波数 | ビット レート |
1 | OK 倍音周波数と一致して高域補完されている。 | 1khz | AAC 48khz | 128kbps | |
2 | OK 倍音周波数と一致して高域補完されている。 | 1khz | MP3 48khz | 128kbps | |
3 | OK 倍音周波数と一致して高域補完されている。 | 2khz | AAC 48khz | 128kbps | |
4 | NG 倍音周波数以外の赤丸成分が発生。 | 1khz | AAC 48khz | 320kbps | |
5 | NG 倍音周波数以外の赤丸成分が発生。 | 2.5khz | AAC 48khz | 128kbps | |
6 | NG 倍音周波数以外の赤丸成分が発生。 | 1khz | AAC 44.1khz | 128kbps | |
7 | NG 倍音周波数以外の赤丸成分が発生。 | 2.5khz | AAC 44.1khz | 128kbps | |
8 | NG 倍音周波数以外の赤丸成分が発生。 | 4.41khz | AAC 44.1khz | 128kbps |
DSEEの評価(考察とマトメ)
上の表から、
高域補完がOKとなる組み合わせ条件は、AAC(MP3)のサンプリング周波数が48khzでビットレートが128kbpsで、且つノコギリ波・周波数1khz又は2khzのみでした。 他の条件下では、全て倍音成分が再現できておらず、高域補完NGでした。
例えば、ノコギリ波が1khzであっても、サンプリング周波数やビットレートを変えると高域補完がNGになり、サンプリング周波数やビットレートが同じでも、ノコギリ波周波数が2.5khzや4.41khzにすると高域補完がNGになってしまいます。
これでは、実際の音楽ソースは不特定多数の周波数が混在しているので、非可逆圧縮音源(MP3やAAC)をDSEEに通すと、何らかの高域成分が付加されるものの正しく高域補完はされていないことが容易に想定されます。
以上から、sonyのDSEEの定義付けは、「非可逆圧縮音源の低域周波数成分から、高域に、ある周波数成分を付加した”味の素的”高域補完」ということなのかもしれませんね。
更に いただけないのは、320kbpsのAAC等でDSEEがOffなら、上限周波数の関係から、少なくも20khzまでは再生できますが、DSEE(Auto)を通すと、 上記表の条件−4のスペクトルのとおり18khz以上で、倍音周波数と関係の無い周波数成分が生じており、原音を汚しているところです。 DSEEがAutoなので 320kbpsを自動的に判別して DSEEをOffする様な仕様にすべきではないでしょうか。
そこで、リアルな音楽を再生したらどうなるか? リアルな非可逆圧縮音源をDSEEに通して再生試聴すると、スペクトルの結果からみて原音とは、音色が違ったものになる筈です。
オーディオ愛好家のK氏によると、「高音のきれいなソースを使って(トライアングル他)聴き比べをしましたが違いますね。 全体の印象はDSEEの方が落ち着いたなめらかな印象ですが、”OFF”にした方がストレートに聴こえ、好みは分かれるでしょうが、ストレートに聴こえるOFFの方がいいですね。」とのことでした。
注意ポイント
今後に期待を込めて、SONYへの要望!!
- 誤解を招かないためにも、DSEE効果に対する正確な定義(考え方)付けを要望します。
- 少なくとも、非可逆圧縮音源のビットレートが320kbpsであれば、上限周波数は、20khz以上あるので、DSEEは自動的にOFFにするようなファームウェアのバージョンアップを要望します。
DSEEの使い方(提案)
このデータを踏まえると、インターネットラジオなど含めて、非可逆圧縮音源(AAC、MP3)のビットレートを確認して192kbps以上であれば、上限再生周波数が19khzは確保できるので、DSEEをOffして使用することをお勧めします。
DSEEに関連した記事