
DSD 三角波 入出力シミュレーション 波形
レコードをハイレゾ化(デジタル録音)する際、DSD形式とPCM形式のどちらで録音すべきか?悩みますね。
DSD(Direct Stream Digital)は、量子化ノイズをノイズシェーピングにより可聴帯域外へ追いやるので、理論的には可聴帯域のノイズが非常に少なく、アナログテープやレコードの音質に近い自然な再現性が魅力です。 また、過大入力にも強いという特性もあります。
一方で、録音後に「プチノイズ除去」や「EQ補正」などの音質編集を行いたい場合はPCM(Pulse Code Modulation)形式の方が実用的です。
本記事では、現実的な観点から、レコードのハイレゾ化を行う場合のフォーマットはどちらが最適か?について考察します。 また、DSDフォーマットに特有なノイズシェーピングノイズについても、シミュレーション解析を行ってみました。
レコードをハイレゾ化するためのADC(A/Dコンバータ)
レコードをハイレゾ化するには、レコードプレーヤから出力されたアナログ信号をハイレゾ対応のADC(Analog Digital Converter)でデジタル信号に変換しUSB経由でPCに取り込みデジタイズ(ハイレゾ化)します。 (詳しくは、「レコードのハイレゾ化のススメ」を参照してください。)
一般的にレコードプレーヤーから出力される信号はmV単位ですので、フォノアンプ(RIAAイコライザ)内蔵ADCをオススメします。 但し、プレーヤで使われているMMカートリッジは、出力電圧が高いので問題ありませんが、低出力電圧のMCカートリッジ(Ex.オルトフォンのMC20は0.07mV)ではフォノアンプのゲインが不足し昇圧トランス等が必要になる場合があります。
下に示すUSB ADCは、DSD形式でもPCM形式にも対応していますのでオススメです。
KORG(コルグ) DS-DAC-10Rの特徴
- アナログ入力:PHONO / LINE
- DSD:2.8224MHz / 5.6448MHz
- PCM:16bit / 24bit 44.1khz〜192khz
- USB2.0
- リングLEDインジケーター:サンプリング周波数とREC状態を色で表示
DSDとPCMの特徴から見たレコード録音時のオススメ形式を考察
| 項目 | DSD形式 | PCM形式 |
| 方式 | パルス密度変調 | パルス符号変調 |
| サンプリング(fs) | 1bit(fs: 2.8MHz以上) | 16〜32bit(fs:44.1khz以上 ) |
| 量子化ノイズ | 可聴帯域内でノイズ少 | アリ:bit深度逆比例 |
| 編集処理(DSP対応) | 難しい(PCM変換が必要) | 容易 |
| ファイル形式 | .dsf, .dff | .wav, .aiff, .flac など |
| 高域ノイズ | アリ:ノイズシェービングによる | 無し |
補足
サンプリング(fs):
DSDは、fsが2.8Mhz以上、対してPCMのCDでは44.1khzなので、桁違いにDSDのサンプリング周波数が高いです。 これが滑らかさ(分解能)の要因に繋がります。
量子化ノイズ:
DSDでは、ノイズシェービングにより量子化ノイズは高域に追いやるので可聴帯域でのノイズは少なくなります。 一方のPCMでは、ビット深度を24bit以上にすれば実際上の量子化ノイズは殆ど無視できます。
| 形式 | 可聴帯域でのノイズ |
| DSD64〜256 | 約-120db(後述のsin 1khzシミュレーション参照) |
| PCM 16bit | -96db(理論値) |
| PCM 24bit | -146db(理論値) |
編集処理:
DSDは1bitストリームのため、加算・乗算などの演算処理(ノーマライズ・EQ・ノイズ除去など)は、多くの編集アプリの場合いったんPCMに変換してから編集します。
高域ノイズ:
DSDは、復調処理時に40kHz付近から100kHzの範囲においてノイズシェーピングの残滓が生じる可能性があります。 次節で詳しく説明します。
DSDかPCMか
レコードを録音した音源は、後から音量適正化のノーマライズやプチノイズ除去などの編集処理が必要になることが多いです。DSDの場合、これらの処理を行うには、多くの場合一度PCM形式に変換し、編集処理後に再びDSDに戻す必要があります。 これではDSDを選択する意味が薄れてしまいますね。 また、DSDは、可聴帯域で量子化ノイズが少ないと言う点に対しては、PCMでビット深度を24bit以上のハイレゾで録音すれば、実用上ほとんど無視できるレベルになります。 更に、DSDの滑らかさの要因に繋がるサンプリング周波数(fs)については、PCMにおいてfsを高く設定(出来れば192khz)することで、DSDとの聴覚的な差異を識別することが困難な場合が多いとされています。
結論:アナログレコードをデジタル録音する際に、プチノイズ除去やノーマライズなどの編集処理が必要なら、DSD形式よりもPCM形式でハイレゾ録音(24ビット以上、96kHz以上)を行うことをオススメします。 但し、編集処理を行わず「アナログの滑らかさや空気感」を重視する場合は、少々スキルが必要ですがDSD録音も魅力的な選択肢になり得ます。
DSDで発生する高域ノイズ異常の実際とその原因
高域ノイズ異常の実際
あるハイレゾDLサイトから、チャイコのバイオリンコンチェルトをPCM(Flacファイル 192Khz、24Bit)でDL購入しました。 WAVファイルも平行販売されています。 たまたま、このPCMファイルを、Audacityでスペクトルを確認したところ、高域(40khz以上)に高域に異常と思われるノイズ成分が存在していました。

この高域ノイズ異常は何であるか、色々調べて行くうちに、購入したPCMファイルは、元々DSDソースをPCM変換して販売しているのではないか?と思い至りました。
FLACファイルをDSD64に変換
試しに、Flacファイル(192Khz、24Bit)をXLDソフトで、DSD64(2.8Mhz)に変換したファイルを、HDDプレーヤのHAP-Z1ESに入れて、再生し、VinylStudioで録音(Flac192Khz、24Bit)してみました。 下に示しますように、やはり高域ノイズ異常が確認できました。

高域ノイズ異常の発生原因
DSDは、PCM(サンプリングに基づき、アナログ信号の振幅を数値化する方式)とは異なり、1bitのデルタ・シグマ変調(ΔΣ変調)方式を用いており、音声レベルに応じてパルスの密度が変化するパルス密度変調方式で記録されます。
このデルタ・シグマ変調は、量子化ノイズ(変換誤差)を高域へ追いやるノイズシェーピング技術を採用しているため、アナログ信号へ復調(DAC)する際には、比較的単純なローパスフィルター(=積分器)を通して100kHz以上のノイズ成分を除去し、アナログ波形を再現します。
しかし、このノイズシェーピングによって発生するノイズは40kHz付近から増加するため、カットオフ周波数が約100kHzのローパスフィルターでは、一部の高域ノイズが残留します。
したがって、DSDファイルをPCM(例:192kHz / 24bit)に変換した場合、サンプリング定理によりエイリアシング防止フィルターはサンプリング周波数の1/2(192kHz ÷ 2 = 96kHz)付近でカットされます。
そのため、PCMのサンプリング周波数によっては、40kHz〜96kHzに存在するノイズシェーピング由来の高域ノイズ成分が完全には除去されず、高域ノイズ異常として現れる可能性があります。 この高域ノイズは、オーディオアンプ周波数帯域内にあり、混変調歪も発生する原因にもなり得ると思われます。 アンプやスピーカーによっては高域負荷が増える可能性があり、あまり精神衛生上良くありませんね。
高域ノイズの抑制を考察:LTspiceでDSDのノイズシェーピングをシミュレーション
DSDのデルタシグマADC回路は、原理的には非常にシンプルな回路構成で成り立っています。(実際には、段数を増やしていますが。)
CQ出版社の ネットに掲載されている「ΔΣ変調を使用したA-D/D-A変換回路はどっち?」の 回路図を利用させて頂き、LTspiceで、ΔΣ-ADC回路の入力波形やクロック周波数(fs)の条件を変えてシミュレーションを行い、FFT解析で高域ノイズ(ノイズシェーピング)を確認しました。
LTspiceは、以下からダウンロードできます。
LTspiceの入手先URL:https://www.analog.com/jp/design-center/design-tools-and-calculators/ltspice-simulator.html
<CQ出版社の回路図をLTspiceへ書き写し>

DSDの種類を変えてシミュレーション
クロック(サンプリング周波数=fs)の違いで、DSD64、DSD128、 DSD256などの種類に分けられます。 表にしますと以下の通りです。
| 名称 | クロック(fs) | CD 44.1kHzの倍数 | 備考 |
| DSD64 | 2.8224 MHz | 64 × 44.1kHz | SACD品質 |
| DSD128 | 5.6448 MHz | 128 × 44.1kHz | DSD64の2倍の帯域 |
| DSD256 | 11.2896 MHz | 256 × 44.1kHz | DSD128の2倍の帯域 |
それぞれのDSDの種類に対して、1kHzの正弦波(sin)信号を入力した場合の高域ノイズ(ノイズシェーピング)についてDA出力をFFT解析で確認し、高域ノイズ抑制について考察しました。
Case
1 DSD64(fs=2.8Mhz) 正弦波1khz
- 可聴帯域のノイズ:約-120db
- 70Khz付近のノイズレベル:約-60db
Case
2 DSD128(fs=5.6Mhz) 正弦波1khz
- 可聴帯域のノイズ:約-120db
- 70Khz付近のノイズレベル:約-70dbで、DSD64より低下している。
Case
3 DSD256(fs=11.2Mhz) 正弦波1khz
- 可聴帯域のノイズ:約-120db
- 70Khz付近のノイズレベル:約-80dbで、DSD128より低下している。
高域ノイズ抑制について【考察】
以上のシュミレーションから、クロック(fs)を高くすると、下表のように、70khz付近のノイズが低減する傾向になることが分かりました。
| DSD種類 | クロック(fs) | 70khz ノイズレベル |
| DSD64 | 2.8Mhz | -60db |
| DSD128 | 5.6Mhz | -70db |
| DSD256 | 11.2Mhz | -80db |
この結果より、高域ノイズを抑制するには、以下を考慮する必要があることが分かりました。
- ファイルサイズが大きくなるが、DSD128以上の採用を検討(高域ノイズを遠ざける)
- 再生時にアナログローパスフィルタ(40 kHz前後)の挿入を検討
- PCM変換は、ナイキスト周波数が48 kHz以下になるように、サンプリング周波数を96 kHz以下に設定
他の波形でシミュレーション
1kHzの矩形波と三角波を入力した場合の高域ノイズ(ノイズシェーピング)についてDA出力をFFT解析で確認しました。
Case
1 矩形波 1khz
Case
2 三角波 1khz










