将来採用して欲しい、広ダイナミックレンジなデジタルソース用の音量基準。

(未来:シャープの「QUADTRON(クアトロン)」は、テレビ画面を「絵作りされた写真」から、「ただのガラスの小窓」へと誘導するための、第一段階なのだと思う。 - 雑記/えもじならべあそび)
(関連:【まとめ】音の焦点を容易に調整するために必要な設備。 - 雑記/えもじならべあそび)
(未来:妄想は、いつの間にか現実になる……という法則。 - 雑記/えもじならべあそび)


 【たぶん、「地上デジタル放送のおかげで」DVD-Audio対応機はSACD対応機に勝るシェアを確保する。 - 雑記/えもじならべあそび】と【(メモ段階)ラウドネスコンバーター。 - 雑記/えもじならべあそび】に書いたことを表っぽくしてみた。
 絶対dBというのは「スピーカから音を出したときの、スピーカーから1m離れたときの音量レベル(騒音計とかで測るときの値)」なので、こいつはアンプ・スピーカ・部屋までを含めてフィードバックしないといけないから無理がある……けれど、そこへいくまでの前段階として、まずはデジタル配信段階のソース音量を原寸大にして欲しいんですよね……。


 今までの常識として「フルビットを使いきらなきゃ!」というところがあった……のだけれど、そういうのはいっそのこと止めるべきだと思うわけで。
 ソース収録の音が100dB(flat)であってかつプリアンプのボリウムを「±0dBu」に設定したときに、スピーカから1m離れた場所では100dB(flat)の音量で聞こえる……という風にして、高ビット収録の余裕部分を「大音量方向の余裕として」生かしていけば、かつてのようなコンプレッサ&リミッタによる違和感なしに、「もっと自然に、実際の音らしく」聴こえるはずだと思う*1


 とりあえず「RealSizeVolume」って名づけてみれば良い……のだろうか?ッて、適当な命名だなぁ……。

相対dB(CD) Bit(CD) 16/24bit相対差 (dB) 相対dB (24bit) Bit(24bit) dBu (24dB) 絶対dB 絶対dBに関する備考*2
× × +30dB +144dB 24bit +30dBu +130dB(flat)
× × +24dB +138dB 23bit +24dBu +124dB(flat)
× × +18dB +132dB 22bit +18dBu +118dB(flat)
× × +12dB +126dB 21bit +12dBu +112dB(flat)
× × +6dB +120dB 20bit +6dBu +106dB(flat)
96dB 16bit × +114dB 19bit 0dBu +100dB(flat)
90dB 15bit × +108dB 18bit -6dBu +94dB(flat)
84dB 14bit × +102dB 17bit -12dBu +88dB(flat)
78dB 13bit × +96dB 16bit -18dBu +82dB(flat)
72dB 12bit × +90dB 15bit -24dBu +76dB(flat)
66dB 11bit × +84dB 14bit -30dBu +70dB(flat)
60dB 10bit × +78dB 13bit -36dBu +64dB(flat)
54dB 9bit × +72dB 12bit -42dBu +58dB(flat)
48dB 8bit × +66dB 11bit -48dBu +52dB(flat)
42dB 7bit × +60dB 10bit -54dBu +46dB(flat)
36dB 6bit × +54dB 9bit -60dBu +40dB(flat)
30dB 5bit × +48dB 8bit -66dBu +34dB(flat)
24dB 4bit × +42dB 7bit -72dBu +28dB(flat)
18dB 3bit × +36dB 6bit -78dBu +22dB(flat)
12dB 2bit × +30dB 5bit -84dBu +16dB(flat)
6dB 1bit × +24dB 4bit -90dBu +10dB(flat) 最高感度帯でもほぼ可聴音量以下。
× × -6dB +18dB 3bit -96dBu +4dB(flat) 最高感度帯でも可聴音量以下。
× × -12dB +12dB 2bit -102dBu -2dB(flat) 最高感度帯でも可聴音量以下。
× × -18dB +6dB 1bit -108dBu -8dB(flat) 最高感度帯でも可聴音量以下。

 FS=+30dBu=+130dB(flat)という基準は「ロックなどのコンサートをするときに、アーティストが受ける音圧(+140dBu)」を収容するには不足する……のだけれど、リスニングポイントで「音楽を聴く」ということを考える限り、パッケージメディアとして確保するべき値はFS=+30dBu=+130dB(flat)が現実的だと思う。
 従来のCDが持つ最大音量を±0dBuに規定*3して、ここから+30dB上に当たる部分を24bitフォーマットのFS=+30dBu=+130dB(flat)と規定すれば、従来の運用から極端に物事が離れずにすみそうな。


 FS=+30dBu=+130dB(flat)にしてしまえば『そもそもコンプレッサ&リミッタを使って良いという理由はほぼなくなる』ので、録音現場でモニタースピーカが吐いている「加工前の音」をそのまま収容するより他に、手段のとりようはなくなるはず……そういう時代が来ないと、結局再生音楽の世界自体が「変なオーディオアクセサリー」から脱却することは出来ないような。
 将来、チューニングを含めたフルデジタル環境が普及した場合に備えて、こういったあたりはきちんと整備して欲しいよなぁ……と思う。


 マトモなシステムの能力が存分に発揮されて、かつそうではないシステムからも「それなりに良い音」を出そうとすると、たぶん行く先はこうなるとおもう。
 それと、コンプレッサ&リミッタの機能は、普通は再生側機器に装備されるべきでもある……それを録音側でやるなんて「激しく大きなお世話」なわけで。ポータブル機器や、深夜再生を主眼に置くオーディオシステムが、かつての「ラウドネス調整機能」の代用として「ダイナミックレンジ圧縮回路」を組み込んで解決するべき話だと思う(安価な機器にはそれらが無くてもいいし)。


 #というか、こういう基準がないから【「CMの時には音量が上がる」現象が、地上デジタル放送ではモロばれになっていたりする件について。 - 雑記/えもじならべあそび】という問題が起きたり、あるいはそれを恐れて「現行デジタル放送がコンテンツごとにバラバラの音量で送出される」とかいう間抜けな問題を生み出している気も……。

(2008年10月13日22:26:39追記)地上デジタル放送に関する基準。

 ……もう、いい加減「CMの時には音量を上げて放送してますよw」ってのを、素直にばらしたほうがいいんじゃないかと思う。
 そのうえで、

  • 24またはそれ以上のビット数で送信する音声については、上記のように「FS=+30dBu=+130dB(flat)」とする方法をとり、コマーシャルは+6dB以内の音量増加で送出するルールを作る。
  • 16ビット送信の音声については、一番上のビット(6dB分)を「コマーシャルビット」と規定して、コマーシャル時の余裕分として使う。本放送はコマーシャルビットを使わないように1ビット落として(その分の解像度低下はビクターのK2技術により補って)送出する。
    • NHKの場合はコマーシャルビットを基本的には使わない。また、生命に関わる緊急放送については、コマーシャルビットを使うことにする。

という方法を取るようにして、とにかく「コンテンツ内での音量ばらつきを排除する」方向に行かないとダメ。
 ……利用者の「音量がコンテンツごとにバラバラなのはヤだ!」ってゆー話と、広告主側の「コマーシャルはこっそり大きめの音量にしたい!」ってゆー話を調停する方法は、他にはないと思う。

(2008年10月13日22:36:08追記)「24ビットのFS=+30dBu=+130dB(flat)」を実現するために必要な考慮点。

 この場合、「フルビットで音質破綻を起こさないこと」は、全く重要ではなくなる。フルビットでは歪んでいてもいい!と。
 その分、逆に「+6dBu程度の音量で特に音質が良く、そこから下の16ビット分が綺麗に再現されること」がとても重要になる。
 ……根本的に、DACの設計方針&ターゲットが変わってくると思うし、音量送出の決まり&機器感送出レベルも変わってくると思う。
 結局は「フルビットを使いたい病」をどう抑えるか……がキモ、なのだけれど、ここは「24ビットのFS=+30dBu=+130dB(flat)」の環境が普遍化していくことではじめて変わるはずなので、順番的には後から……になると思う。
 アナログ時代の「あの瑞々しくとげの有る音声」を、デジタル時代に生かしていくためには、そもそもビットの使い方についての概念をひっくり返さないといけない気がする。

2009年1月22日23:28:42追記。

 そういえば……これを書くに至った体験があったことを思い出した。

 インディーズでMD直録したソースとかと、全く同じ匂いのする声が聞こえた……という意味で、これは衝撃的だったんですよね……。

*1:こういうのは電線とかバイアンプ化で調整するべき話ですらないし、そもそも(問題が根本的に違うのだから)できるはずがない。ソースがコンプレッサ&リミッタでつぶされる度合いによって決まる問題。

*2:この「備考」は、2008年10月25日13:04:06に追記しました。

*3:日本のCDはFS=±0dBuと決めて使っている……らしい?海外ではFS=+6dBuと決めているとかいう話も。いずれにせよ「溢れる部分はつぶして収録する」わけで、自然さが消えてしまうのは当然のような。