Direct Stream Digital

ダイレクトストリームデジタル英語: Direct Stream Digital, DSD)とは、スーパーオーディオCD(SACD)で使用されているアナログ音声をデジタル信号化する際の方式についてのソニーフィリップスによる商標である。CDDVDで使用されているパルス符号変調 (PCM) ではなくパルス密度変調 (PDM) を用いているのが特徴である(ΔΣ変調)。新譜で高音質を追求するために選択される他、アナログマスターテープアナログレコードなど過去資産のデジタル化において、アナログ的な特性を可能な限り保存したい場合にも選択されるフォーマットである。

パルスで構成される粗密波に着目した記録方式である。従って、PCM方式とは異なりビット深度が1bitである代わりにサンプリング周波数を高く取る。例えば、DSD64フォーマットのサンプリング周波数は2.8224MHzであるが、これはCD-DAの規格である44.1kHzの64倍にあたる。(一方、CD-DAのビット深度が16bitであり、DSDのビット深度は1bitであるため、非圧縮の場合のビットレートは4倍となる。)DSD128のサンプリング周波数は44.1kHzの128倍である5.6MHz(もしくは48kHzの128倍である6.144MHz)、DSD256のサンプリング周波数は44.1kHzの256倍である11.2896MHz(もしくは48kHzの256倍の12.288MHz)、DSD512のサンプリング周波数は22.5792MHz(または24.576MHz)である。この高いサンプリング周波数により、時間領域で見たときの音の記録タイミングの正確性がPCMよりも遥かに優れている。時間領域での正確性は高品質なアナログ音源に近い空気感にも寄与している。DSDのスペクトルについても、日本音響学会は「ディジタル信号でありながらアナログ信号のスペクトルを保存している」と評価している[1]。但し、高周波数帯域の量子化ノイズが極めて大きいという弊害があるため、純粋にナイキスト周波数近辺までを音として取り出せる訳ではない(再生装置ではツイーターの焼損を防ぐために、70kHz程度を高音域の上限とする事が多い)。実例として、黎明期にはDSDの信号をそのまま増幅してスピーカーに送り込み、ボイスコイルの慣性をローパスフィルタの代わりとすることで波形崩れの少ない高音質な再生を期待する製品が存在したが、量子化ノイズのエネルギーによってスピーカーのボイスコイルを飛ばすような事故が多発したため、以降の製品ではローパスフィルタで帯域制限が行われるようになった。また、DSD256以上のフォーマットになると音楽ソフトとしてはあまりにもオーバースペックで扱いが難しいため、既存データの再生時にアップサンプリング先とする用途以外での活用が殆ど進んでいない。

日本音響学会によれば、「的確なディザ処理が行われている場合,標本化周波数を非常に高くすれば信号帯域内に一様に分布する量子化雑音が減少し原理的にはΔΣ変調を用いずに 1 ビット量子化で信号帯域内のダイナミックレンジを確保することも可能」とのことで、実現に向けたシステムの研究も進められている[1]

既存データからの変換

既存のPCMデータが保持する本質的な情報を引き出しアナログの滑らかさに近づけるため、PCMデータをDSDデータに変換して再生する試みも行われている。この手法はPCMのハイレゾデータでも有効であるが、ハイレゾデータが存在しない時代のコンテンツ(CD-DAやCD時代のマスターデータ等)のほうが更に大きな効果を発揮する。例えば、過去に制作された44.1kHz/16bitのデータをそのままDAC出力のフィルタに通すと、精度の悪いアナログフィルタでの遮断周波数が可聴帯域に近いため可聴帯域の情報劣化が大きくなり、音がこもったりステレオ感を失ったりする原因になる。この場合、既存のデータを元に存在しないサンプルデータを数学的に推測・補間[2]してDSD512等の上位のフォーマットに引き上げることで、ある程度まで発音タイミングが復元でき、可聴帯域の近傍で高音域の減衰や位相の狂いなども殆ど無い格段に高い精度での再生が期待できる。結果として高音の抜けや音の空間表現などが大幅に改善できる。こうした変換処理は内部にサンプル間の依存性を形成するフィードバックループが存在するため並列化が出来ず非常に高負荷でもあるが、FPGA等で変換アルゴリズムがハードウェア実装されたDAC[3][4]でリアルタイム実行が可能である他、2010年代以降の高性能なPCであればソフトウェアのみでもリアルタイム実行が可能になりつつある[5][6]。基本原理としては古くからDAC内部で行われているオーバーサンプリングと同様である[7]が、大きな計算リソースを用いて非常に高い精度で実行する点が異なっている。

特徴

長所

理論上100kHzまでカバーする可聴周波数帯域(ただし周波数特性や位相特性がフラットであるとは限らない)と低ノイズ、PCMを遥かに超えるMHz帯の高周波数に由来する記録タイミングの正確性、そして音の情報量が多いにもかかわらず、再生音の周波数帯域が近いPCM192kHzサンプリングと比較した場合、データ容量が軽く(少なく)済むという特長がある。時間領域の音の記録タイミングの正確さではPCMを遥かに凌いでおり、DSDでは微小なタイミングの違いも記録可能である。事例を挙げて比較すると、44.1kHzのPCMで22.68μs、384kHzのPCMでも2.60μsの時間分解能であるのに対して、2.8224MHzのDSDでは0.35μsの時間分解能である。従って、DSDの再生音は生演奏のノリの再現性が良かったり、高品質なアナログ音源のような瑞々しい空気感を持つ。

また、DSDからのDA変換もアナログローパスフィルタを通すだけの非常にシンプルなハード設計が可能で、アナログ→DSD変換のLSIのコストが低く、消費電力も抑えられるので、DSD録音再生機器だけでなく、スマートフォンや携帯型CDプレーヤーなどに搭載するような普及型のDACチップやデジタルパワーアンプにも使われている。従って、再生するデータはどうであれ、一般人も日常的にDSD変換を経由した音は聴いていることになる(但し、DSD変換機能に特化した製品からすれば低品質な変換である)。

短所

電磁波の放出

DSDで伝送・処理される信号は数MHz帯~数十MHz帯の電波を盛大に放出するが、この帯域の電波は遮蔽が難しく、他の回路や筐体外に影響を与えないために高度なシールド技術が要求される。同一周波数帯を利用する無線通信も存在し、特に大電力信号を扱う場合にシールドが甘いと電波障害にも繋がり得る。

高周波数帯域に寄せ集められた量子化ノイズ

短所としては、まず「高周波数になるほど量子化ノイズが増える」というものがあり、高周波数帯域が持つエネルギーが非常に大きくなる。この特性によりSACDの製品化初期の頃、スーパーツイーターの焼損やアンプの焼損が頻発したため、現在では35kHz~45kHz程度を遮断周波数とするローパスフィルタを搭載した再生機器が一般的となり、100kHz以上は出力されないように対策されている。なお、サンプリング周波数が非常に高いので、人間が聴取可能な周波数帯域という意味ではこの問題は感知されない。変換誤差や高調波ひずみが発生しやすいという点は回路設計上大きな課題となっている。

高速伝送の必要性

もう一つの短所として、DSDの原理と特性により伝送に用いるケーブルは1ビットパルスの高周波の信号を波形の崩れや歪みがほとんど無いように保ってシリアルで伝送できるケーブルでなければ正確な伝送が出来ないことがある(1ビットパルスの幅が伝送で変化してしまうと最終的なアナログ信号の波形が変化する)。これはパラレル系でもシリアル系ケーブルでも正確な伝送が可能であるPCM方式との大きな違いでもある。実際にパイオニアやソニーなどのメーカー各社では、SACDとAVアンプの間を1ビットデジタルでシリアル伝送するためにはiLINKを採用していた。同期回路のクロック精度に由来するジッターについてもPCMより影響を受けやすいため、高精度のクロックを使用するなどの対策が行われている。

後処理を行う上での制限

制作側から見た場合、1bit・ΔΣ変調の原理からミキシングはおろかイコライジングさえ出来ず、2対ないし4対パラレルでマルチビット伝送するLANケーブルを用いるDante規格などのパラレル系機器が(制作音源の品質上)使い物にならない。現状では光ファイバーを用いるMADI規格かthunderbolt対応機器を使用して伝送する、PyramixやSonomaなどのマルチトラックダイレクトストリームデジタル録音システムを用いながらミキシング/イコライジングなどのプロセスはアナログ機器に頼るか、DSD-Wide、Digital eXtreme Definition英語版などのマルチビット信号にデジタル変換して行われている。

DSDの記録方式

記録方式には以下の方法が存在している。DSD規格では以下のいずれかの方法が用いられている。そのため、SACDのソフトによっては、録音・記録方法が異なっている。

DSDレコーディング
オリジナルレコーディングからすべてDSD方式で録音されているマスターを使用。 DSD方式で音楽情報を余すことなく録音することで、 DSDの持つ高いサウンドクオリティをスーパーオーディオCDで再現することが可能。
DSDミキシング
アナログあるいはデジタルのマルチチャンネル・レコーダーから直接DSDにミックスダウンされたマスターを使用する方式。スーパーオーディオCDでは、ミキシングによって増大するダイナミックレンジやリミッタ処理によって発生する高調波などもそのまま収録することが可能となった。
DSDマスタリング
アナログあるいはデジタルのオリジナルマスターから、直接DSD方式でマスタリングしたマスターを使用。例えばハイビット・ハイサンプリングのマスターのサウンドも品質を損なわずにスーパーオーディオCDに収録可能。

DSDディスク

後述のDSFファイルをDVD±R、DVD±RWに記録するためのフォーマット。「Sound Reality」搭載のVAIOおよびKORGのPC用アプリケーションソフト「AudioGate」で作成することができるほか、音楽配信サイトからDSD音源を購入し、市販のライティングソフトでDVD±R、DVD±RWに記録して作成することもできる。

SACDとは完全に別物であるため、通常のSACDプレーヤーで再生することはできないが、ソニーのSCD-XA5400ESやSCD-XE800など一部のSACDプレーヤー、ティアックのPD-501HRなど一部のCDプレーヤー、SIEプレイステーション3(SACD再生非対応モデルを含む)は再生に対応している。なおDSDディスクをVAIOで製作した場合、PCMへ変換出力するDirectShowプラグインが書き込まれているため、DSD対応機能「Sound Reality」搭載のVAIO以外のPCでも(PCMとしてではあるが)再生できる。

ファイルフォーマット

DSDには様々なファイルフォーマットが存在している。いずれにおいても互換性はない。

DSDIFF (Direct Stream Digital Interchange File Format)
主に業務用に用いられており、DSDファイルフォーマットの中で最も使われている。PyramixやSonomaなどの業務用機器に対応製品が多い。民生用では、コルグのPC用アプリケーションソフト「AudioGate」か同社のレコーダー(MRシリーズ)、TASCAM(≒ティアック)のレコーダーなどで再生できる。
DSF (DSD Stream File)
ソニーが2005年秋冬モデルのVAIO向けに開発した民生用途向けファイルフォーマット。「Sound Reality」搭載のVAIOに付属しているソフトウェア「DSD Direct」を用いることによりWAVから変換でき、DSDディスク作成に用いられる。再生には「Sound Reality」搭載のVAIO、あるいはコルグのPC用アプリケーションソフト「AudioGate」か同社のMRシリーズで再生可能。
2010年よりコルグが展開・発売する業務用1bitデジタルオーディオレコーダー「MRシリーズ」(一般用ポータブル機の「MR-2」含む)、および2013年にソニーから発売された一般用ポータブルリニアPCMレコーダー「PCM-D100」、2017年にティアックから発売された一般用据置型ハイレゾオーディオレコーダー「SD-500HR」(TEACブランド)と業務用据置型ハイレゾオーディオレコーダー「DA-3000」(TASCAMブランド)、2024年にティアックが発売する一般用据置型ハイレゾオーディオレコーダー「SD-550HR」(TEACブランド)と業務用据置型ハイレゾオーディオレコーダー「DA-3000SD」(TASCAMブランド)ではいずれもDSFファイルフォーマットを用いて録音する機能が標準で搭載されており、DSFファイルフォーマットで録音可能なサンプリング周波数の上限はMR-2とPCM-D100は2.8MHz/1bit(DSD64)が、MR-2を除く他のMRシリーズとSD-500HR、SD-550HR、DA-3000、DA-3000SDは5.6MHz/1bit(DSD128)がそれぞれ上限となっている。
WSD (Wideband Single-bit Data)
「1ビットオーディオコンソーシアム(早稲田大学パイオニアシャープ共同の推進グループ)」が策定したファイル・フォーマット。チャンネル数やサンプリング周波数に制限がなく、あらゆる形式のデータに対応できることを特長としている。仕様が公開されているのも特徴である。コルグのPC用アプリケーションソフト「AudioGate」か同社のMRシリーズで再生可能。

脚注

  1. ^ a b 音のなんでもコーナー Q and A | 日本音響学会”. acoustics.jp. 2021年12月2日閲覧。
  2. ^ 計算量無限大発散する点を除けば、理想的な性能のローパスフィルタsinc関数インパルス応答を入力信号に畳み込むことで実現できることが知られている。実際のアップサンプリング処理では有限計算量しか許容できないため、sinc関数を参考にしつつ、トレードオフを考慮して様々な計算量省略のテクニックが用いられている。こうしたローパスフィルタによるアップサンプリング処理でナイキスト周波数以上のエイリアスノイズのみをより強力に除去する方法以外にも、入力信号のフォーマットの記録上限を超えた高域成分を倍音構成などから推測・復元しつつアップサンプリング処理を行う更に高度なアルゴリズムも開発されている。
  3. ^ CPUではリアルタイム処理が到底不可能な膨大なタップ数のフィルタアルゴリズムをFPGAでそのままハードウェア化した『CHORD DAVE』などが存在する。
  4. ^ DAVE”. Chord Electronics Products (2011年11月1日). 2023年5月25日閲覧。
  5. ^ Foobar2000に向けてDSD変換機能(DSD Processor)を提供する追加コンポーネントが存在する。 多数の処理が直列に並ぶという変換アルゴリズムの構造上、処理並列化が難しく、特定のスレッドに処理が集中するため、高クロックのCPUが必要になる。 CPUでマルチコアをフル活用した場合と比較してシングルスレッドの処理能力には大きな制約があり、CPUによるリアルタイムDSD変換時のサンプル補間フィルタのタップ数は100程度が上限となる。
  6. ^ Super Audio CD Decoder” (英語). SourceForge (2023年5月24日). 2023年5月25日閲覧。
  7. ^ 株式会社インプレス (2016年7月11日). “【藤本健のDigital Audio Laboratory】 「アップサンプリング」で音は良くなる? 変わらない? 独自手法を提案する技術者に聞く”. AV Watch. 2023年5月29日閲覧。

関連項目