「HAP-Z1ESのDSEEとDSDリマスタリングエンジンの効果検証」(以前のブログ記事)は、 実際のLPレコードからハイレゾ化したリアルサウンドでDSEEを評価したものでした。
今回は、正弦波の組合せで作ったピュアー音源で作成したノコギリ波をMP3やAACにエンコードした音源をHAP-Z1ESで再生した時に、DSEE機能により高域補完された倍音成分が再現できるのかを確認してみます。
HAP-Z1ES
詳しくは、ここをクリック
結果は期待に反し、何らかの高域成分は生成するものの正しい倍音成分は、再現されませんでした。
なお、このピュアー音源については、「音質評価用 ノコギリ波PCM音源の作成」や「ピュアー音源から見た「MP3、AAC」の音質比較」をご参照ください。
DSEEについて(おさらい)
DSEEについて、ウィキペディアによれば
DSEE(ディーエスイーイー、Digital Sound Enhancement Engine:デジタルサウンドエンハンスメントエンジン)は、ソニーが開発した非可逆圧縮音楽ファイル用の音質向上技術である。同社のウォークマンやフリーウェアのSonicStage CP(Version 4.2以上)、x-アプリ、Music Center for PCに搭載されている。動作としてはMP3・ATRAC3・AAC・WMAなどの非可逆圧縮音楽ファイルを解析し、圧縮によって失われた高域の音を予測演算、補完することで音質向上を図るものである。
また、DSEEについて、SONYによれば
出典先:SONYのカタログ抜粋
ハイレゾ音源の多くは、非圧縮のリニアPCMやロスレス圧縮など、さまざまなかたちで配信されています。さらに普及率の高いMP3やAACなどの不可逆圧縮音源など、デジタルデータで提供される音楽データは多種多様です。HAP-Z1ESでは、そうした数多くのデジタル音源データを高音質で再生するため、高音質技術「DSEE」を搭載。MP3やAACなどの不可逆圧縮音源に対しては、圧縮によって失われがちな高音域を20kHzまで周波数補完します。また、すべての非可逆圧縮音源とリニアPCM音源やロスレス音源に対して、40bit浮動小数点で演算を行い、ノイズシェーピング処理により32bit固定小数点に変換してDA変換器に伝送することで、通常の32bit精度を遥かに超えた精度の高いビット拡張を実現します(*)。これらにより、ハイレゾ音源はもちろん、あらゆるデジタル音源データの微小領域の信号を復元し、より原音に近い自然で表現力豊かなサウンドを楽しめます。
更に、SONYの開発担当者の記述によれば
「DSEE」は、MP3のような圧縮音源を対象とした再生帯域の拡張技術です。楽曲を波形データとして見ると、低い周波数から高い周波数へと信号が連続してつながっています。たとえばバイオリンやギターの心地よい倍音の響きは、波形が大小の山と谷になって連続してあらわれますし、ヴォーカルの場合は大きな山と谷があらわれます。圧縮音源では、このスペクトル波形が高音域までつながっているはずのところが、途中から不自然なかたちでなくなってしまっているんですね。この高音域で失われているスペクトル波形を低音域のスペクトル波形から予測して復元するのが「DSEE」です。
以上をマトメてみますと、DSEEは、不可逆圧縮音源(MP3やAAC等)のもつ再生上限周波数以下のスペクトルから倍音成分を推定して失われた高域部分にコピーすることで,倍音構造を保存したまま高域成分を再現しようとするアルゴリズムと思われます。
例えば、2.5khz ノコギリ波をMP3 128kbpsにエンコードした音源を、HAP-Z1ES(DSEE off)で再生してみますと、以下のスペクトルグラフのように、MP3で128kbpsでは再生上限周波数が15,2khzですので、17.5khz、20khzの周波数成分が欠落します。

そこで、高域補完(=DSEE)により低域の周波数から倍音推定してペーストすることで、以下の図のように、欠落した17.5khzと20khzが復元される機能と思われました。
DSEE機能の確認・手順
• 2.5khzノコギリ波のピュアー音源ファイル作成
• MP3(or AAC)音源ファイルのHAP-Z1ESへ転送
• HAP-Z1ESで再生・録音
• 録音ファイルの周波数分析とスペクトルのグラフ化し、DSEE機能の確認を行います。
録音したファイルをAudacityで周波数分析した後、テキストに書出しExcelでスペクトルをグラフ化しました。 周波数分析の関数窓は、hanningで sizeは16358です。
HAP-Z1ES・DSEE機能の実際
❏ MP3の場合
(画面よりはみ出たら、横にスクロールできます。)
bit レート | DSEE Off | DSEE Auto |
128kbps |  |  |
320kbps |  |  |
❏ AACの場合
(画面よりはみ出たら、横にスクロールできます。)
bit レート | DSEE Off | DSEE Auto |
128kbps |  |  |
320kbps |  |  |
マ ト メ
ポイント
ピュアー音源(2.5khzノコギリ波)・MP3 128kbpsの場合、HAP-Z1ESのDSEEを機能(Auto)させた、上のスペクトルの結果から、欠落した高域倍音周波数(17.5khzと20khz)にピークの出現が無く、高域補完されているとは言い難い結果でした。 更に倍音とは別の周波数成分が出現しているのも問題であると思われます。
以上の状況は、ビットレートを320kbpsにしても、AACにしてもほぼ同じような結果でした。
今回テストしたHAP-Z1ESに何らかのトラブルがあり、高域補完されていないことも考えられますので、メーカへ問合せを行っていきたいと思います。
取敢えず、HAP-Z1ESで不可逆圧縮音源(MP3やAAC等)を再生するなら、320kbpsで再生し、DSEEは、Offにするのが現状はベターであると思われます。
上記の結果を踏まえ、「HAP-Z1ESのDSEEとDSDリマスタリングエンジンの効果検証」を一部訂正追記しました。