sony HAP-Z1ES「DSEE」の真実

スポンサーリンク

 

ピュアー音源(2.5khzのノコギリ波)をエンコードした非可逆圧縮音源(MP3やAAC)で、DSEEが正しく高域補完されていないのではないか?という事象(「Pure音源によるsony HAP-Z1ESのDSEE機能・再確認」ブログ記事参照)について、SONYの相談窓口に問い合わせしたところ「製品の内部仕様を開示することになるので、個別の検証・評価をお受けできない」との残念な回答を受けてしまいました。

そこで、もう少し条件を広げてDSEE機能をテストすると、一部の条件(周波数等)で高域補完されるものの殆どの条件下では正しく高域補完されていないことが分かりました。 実際の音楽ソースをAAC(又はMP3)にエンコードしたリアル音源では、不特定多数の周波数が混在しているので「DSEE」機能の高域補完は望めないことが分かりました。

 

スポンサーリンク

 

我が家のHAP-Z1ES・事前確認

1.我が家のHAP-Z1ESに機能上の問題がないか?

友人宅のHAP-Z1ESにて、同条件でテストして頂いたところ、同じ結果でしたので、我が家(検証対象)のHAP-Z1ESには機能上の問題が無いことが確かめられたと思います。 このことから、本件の事象は、製品全体に関わることと思います。

 

2.本体のファームウェアバージョン

2017年2月28日付け「0018120R」です。

 

DSEEの定義(想定)

sonyからは、明快なDSEEの定義が示されいませんので、カタログ等から独自に定義を想定しました。 DSEEについて、カタログ等の記載を、「ピュアー音源によるsony HAP-Z1ESのDSEE機能・再確認」にマトメていますのでご参照ください。

定義想定

DSEEとは、ビットレートに基づいて上限周波数がカットされている非可逆圧縮音源を低域データから、カットされいる高域の倍音成分を推定し、カットされている高域に推定した倍音成分を付加し元の音源に復元する技術(アルゴリズム)であろうと勝手に想定しました。

この定義(想定)から、倍音成分が連続しているプリミティブなノコギリ波をMP3等に変換した非可逆圧縮音源をHAP-Z1ESに転送し、DSEEで再生すれば、カットされた上限周波数が、DSEEによって倍音が復元される筈で、スペクトル確認すれば容易にDSEE機能の評価ができると考えました。

 

評価方法の実際(手順)

関連記事:

ピュアー音源から見た「MP3、AAC」の音質比較

前回ブログの正弦波の組合せで作ったエイリアシングノイズの無いノコギリ波(ピュアー音源)をVinylStudioでインポートした後、MP3、AACへ夫々出力したピュアー音源ファイルのスペクトル比較を行っ ...

1.ノコギリ波音源を生成する

WindowsソフトのWaveGeneでエイリアシングが発生しない加算モードで、wav音源ファイルを作成します。

スペクトルを見ると倍音が連続的に整列しています。

 

2.ノコギリ波音源を非可逆圧縮音源(MP3etc)へ変換する

生成したノコギリ波wavファイルをVinylStudioにインポートします。 次にVinylStudioによって、ビットレートやサンプリング周波数を決めて非可逆圧縮音源へエンコードします。 スペクトルを見ると、ビットレートによる、上限周波数以上の倍音成分が欠落(カット)しているのが分かります。

 

3.DSEE Autoで非可逆圧縮音源を再生し機能判定する

「DSEE」機能 判定基準

ノコギリ波・非可逆圧縮音源をHAP-Z1ESに取り込み、HAP-Z1ESでDSEE Autoで再生し、アナログ出力(Line出力)をAudacityで録音して上限周波数のスペクトルを確認します。

  • 正しく倍音が補完されていればDSEE機能はOKと判定します。
  • 倍音があるべき周波数にスペクトルのピークが無かったり、倍音とは別の位置にピークがあればNGと判定します。

<DSEE機能 OK判定の例>

<DSEE機能 NG判定の例>

 

非可逆圧縮音源の条件とDSEE機能 (判定結果)

以上のDSEE評価方法に基づき、各種の圧縮音源の条件下で、DSEE(Auto)の機能(高域補完)がどのような判定になるかを下記表にマトメました。

(画面よりはみ出たら、横にスクロールできます。)

条件 DSEE機能
スペクトル
(hanning size16384)
DSEE
補完判定
ノコギリ波
周波数
圧縮形式
Sampling周波数
ビット
レート
1 OK
倍音周波数と一致して高域補完されている。
1khz AAC
48khz
128kbps
2 OK
倍音周波数と一致して高域補完されている。
1khz MP3
48khz
128kbps
3 OK
倍音周波数と一致して高域補完されている。
2khz AAC
48khz
128kbps
4 NG
倍音周波数以外の赤丸成分が発生。
1khz AAC
48khz
320kbps
5 NG
倍音周波数以外の赤丸成分が発生。
2.5khz AAC
48khz
128kbps
6 NG
倍音周波数以外の赤丸成分が発生。
1khz AAC
44.1khz
128kbps
7 NG
倍音周波数以外の赤丸成分が発生。
2.5khz AAC
44.1khz
128kbps
8 NG
倍音周波数以外の赤丸成分が発生。
4.41khz AAC
44.1khz
128kbps

 

DSEEの評価(考察とマトメ)

上の表から、

高域補完がOKとなる組み合わせ条件は、AAC(MP3)のサンプリング周波数が48khzでビットレートが128kbpsで、且つノコギリ波・周波数1khz又は2khzのみでした。 他の条件下では、全て倍音成分が再現できておらず、高域補完NGでした。

例えば、ノコギリ波が1khzであっても、サンプリング周波数やビットレートを変えると高域補完がNGになり、サンプリング周波数やビットレートが同じでも、ノコギリ波周波数が2.5khzや4.41khzにすると高域補完がNGになってしまいます。

これでは、実際の音楽ソースは不特定多数の周波数が混在しているので、非可逆圧縮音源(MP3やAAC)をDSEEに通すと、何らかの高域成分が付加されるものの正しく高域補完はされていないことが容易に想定されます。

以上から、sonyのDSEEの定義付けは、「非可逆圧縮音源の低域周波数成分から、高域に、ある周波数成分を付加した”味の素的”高域補完」ということなのかもしれませんね。

更に いただけないのは、320kbpsのAAC等でDSEEがOffなら、上限周波数の関係から、少なくも20khzまでは再生できますが、DSEE(Auto)を通すと、 上記表の条件−4のスペクトルのとおり18khz以上で、倍音周波数と関係の無い周波数成分が生じており、原音を汚しているところです。 DSEEがAutoなので 320kbpsを自動的に判別して DSEEをOffする様な仕様にすべきではないでしょうか。

そこで、リアルな音楽を再生したらどうなるか? リアルな非可逆圧縮音源をDSEEに通して再生試聴すると、スペクトルの結果からみて原音とは、音色が違ったものになる筈です。
オーディオ愛好家のK氏によると、「高音のきれいなソースを使って(トライアングル他)聴き比べをしましたが違いますね。 全体の印象はDSEEの方が落ち着いたなめらかな印象ですが、”OFF”にした方がストレートに聴こえ、好みは分かれるでしょうが、ストレートに聴こえるOFFの方がいいですね。」とのことでした。

注意ポイント

今後に期待を込めて、SONYへの要望!! 
  •  誤解を招かないためにも、DSEE効果に対する正確な定義(考え方)付けを要望します。
  •  少なくとも、非可逆圧縮音源のビットレートが320kbpsであれば、上限周波数は、20khz以上あるので、DSEEは自動的にOFFにするようなファームウェアのバージョンアップを要望します。

 

DSEEの使い方(提案)

このデータを踏まえると、インターネットラジオなど含めて、非可逆圧縮音源(AAC、MP3)のビットレートを確認して160kbps以上であれば、上限再生周波数が19khzは確保できるので、DSEEをOffして使用することをお勧めします。

 

DSEEに関連した記事

 

 

以上と合わせて、ソニーに対して「本道の技術」を訴求してもらいたいと思い以下のブログをUPしました。

 

スポンサーリンク

 

関連記事(一部広告含む)

 

 

Blog オススメ記事(コンテンツ選択)

ボタンを押してコンテンツ選択

レコード音質とハイレゾ化

CD音質と圧縮音源 AAC等

WebデザインやiPhone・PCなど

ツールと閑話ブログ

スポンサーリンク

© 2021 ハイレコのブログ Powered by AFFINGER5