5  実装および結果

実験の第一歩として用いた一般的な不変FDNについては、 第1章で詳細に述べ、さらにFig 3.8に示した。  どんな変調であれ、ネットワークに加える前にはいくつかの基本的なパラメータを求めねばならない。 例えばフィードバック行列、ディレイラインの長さ、ベクトルbおよびcの係数、 そして吸収と音質補正フィルタの伝達関数などだ。  これらのパラメータを求めるのに使った選択手順については5.1節で詳述するつもりである。

かつて、よく鳴動する部屋をシミュレートするのに十分なエコー密度と周波数密度を持つ 不変アルゴリズムが分かったとき、ネットワークのディレイラインに変調を加え、 その変調処理に関係する各構成要素の影響について吟味した。  吟味の対象となった入力信号は多岐にわたり、 ピアノのドライ録音、サックス、インパルス応答などが挙げられる。  5.2節では変調源の速度および深度を変えたときの影響について述べるつもりだ。  次に5.3節では、5.2節で決定された最も音の良い変調速度・深度を前提として、 様々な補完形式を評価することになるだろう。

それから変調と補完法の計算要求をそれぞれ分析し、 全体の処理要求を軽減するためにいくつかのアルゴリズム最適化を提案するつもりだ。  この章の締め括りとして、提案したアルゴリズムを評価したリスニングテストの結果を示すことになるだろう。

5.1  一般的なFDNパラメータの選択

計算を最小限に抑えたまま十分なエコー密度を得るためには、 フィードバック行列の選択が重要である。  最も一般的な可逆フィードバック行列は3.3.3節で示した。  単位行列や三角行列のようなある特定の行列は、 既知の並列コムフィルタや直列オールパスフィルタをそれぞれ導くことが分かった。  しかしながら既に見たように、これらの行列は多くの無意味な係数を含むため、 相当な数のディレイラインを用いたとしても満足な水準のエコー密度をもたらさない。

RocchessoおよびSmithの循環行列とJotのハウスホルダー行列については、 両方とも比較的高速な行列の乗算を可能としながら最大限のエコー密度を供給しうるものとして前述した。  最も効率的に行列の乗算ができることから、今回のテストではJotのハウスホルダー行列の類 (( 3.25 )で定義されたもので、Jが循環順列行列)を選択することにする。

最高のエコー密度を得るために、単射行列として単位ベクトルb = [1 1 ... 1]Tを利用する。  N x 1ベクトルの代わりに3.3.1節で提案したN x 2行列をcにすることで、 ステレオ出力を生成した。

( 5.1 )

cの第1列がリバーブ・アルゴリズムの左チャンネル出力、 第2列が右チャンネル出力に相当するようにアルゴリズムを組み立てた。  第1列は、3.3.3節で説明したようにリバーブ後部のクリック音を回避するよう選択されている。  リスニングテスト [15] [39]が聞き手の耳に渡るリバーブの相関を解くと 空間的な印象が改善されることを示唆していることから、 cの第2列(右チャンネル出力に相当)はできるだけ第1列と異なるものを選択した。  これは無相関のように知覚される出力を生み出し、リバーブの空間的な印象を改善するだろう。

3.2節で言及したように、共通の方法は時間および周波数応答における ピークの重ね合わせを回避するのに不十分となるディレイ長を選択することである。  時間領域で重なり合わないディレイラインの長さを選ぶのには素数が有用であることが分かった。  周波数領域でのピークの重なり合いを回避すべく、 様々な素数ディレイライン長の組み合わせにおけるリバーブの周波数応答をプロットし、 より平坦な周波数応答を生み出すディレイ長の組み合わせを精選した。

少量のメモリで2秒のリバーブについてエコーおよび時間密度を得るには、 少なくとも12個のディレイラインが必要であった。

( 5.2 )

これらのディレイラインがDf=0.26の周波数密度をもたらし、 メモリ消費量は12kワード以下であることに注目しよう。 (サンプリングレート44.1 kHzのシステムで1/4秒について)  このメモリ消費量を正しい相関関係で表現すると、 PlayStation1および2におけるリバーブ・アルゴリズムは 完成した状態で最大100kバイトまで消費することができる。

変調を使うことで、次のように選定された8個のディレイラインを用いて 12個のディレイラインを用いたシステムと知覚的に同等のリバーブ品質を達成したい。

( 5.3 )

このシステムは周波数密度Df = 0.16を持ち、 全体で7kワード未満(160 ms未満)のメモリを使用する。  これは12個のディレイラインのアルゴリズムによってメモリの60%が利用されることを示す。

ディレイラインの長さの選択はリバーブ・アルゴリズム全体の音について重要な要素である。  ( 3.5 )によれば、あるアルゴリズムにおけるディレイの総量はそのアルゴリズムの周波数密度に対応する。  また、2.4節ではRTが1.8秒の中規模のホールにおけるリバーブは、20 Hz以上において 平均2.2 Hz間隔のピークから構成される周波数応答を持つことを述べた。  このことから周波数密度Df  = 0.45が導かれ、 よってこれを人工的にシミュレートするためには合計450 msのディレイ長が必要となるだろう。 (サンプリングレート44.1 kHzにおいて約20kワード)  しかしながらディレイ長を賢明に選択することにより、 この大体半分の周波数密度(Df = 0.26)を持ち、 限られた量の共振周波数を持つRT = 2 sの不変リバーブ・アルゴリズムを得ることができた。  目標は、たった0.16 モード/Hzのモード密度を持つ可変リバーブを用いて、 同一と知覚できる周波数密度を達成することである。

3.2.4節で利用した吸収フィルタと音質補正フィルタについては3.2.4節中で既に述べた。  開発の過程で、低周波には3秒、高周波には1.25秒のリバーブ・タイムを用い、 それらの値がよく鳴動するホールの平均的なリバーブ・タイムに近くなるようにした。  その音質補正フィルタは、3.2.4節で議論した手法を使って吸収フィルタの影響を補正するように設定された。  12個のディレイラインを持つ非変調のアルゴリズムのEDRをFig. 5.1に示す。

Fig. 5.1.  12個のディレイラインを持つ不変FDNのエネルギー・ディケイ・レリーフ

5.2  変調の選択

5.2.1  変調速度と深度

様々な変調速度と深度の効果をはっきりと見るために、 まずは1個のディレイラインからなる単純なネットワークを試した。  その変調源として、シヌソイド・トーン・ジェネレータを高品質な補完と組み合わせて利用した。  600、1000、1500サンプルの名目ディレイ長を検証した。

共振周波数の形成を回避するための変調の効率性は変調深度に比例する。  しかしながら、変調深度はリバーブにおける音程変化の量にもまた直接関係する。  従って、リバーブ後部のコーラス・エフェクトやビブラートを避けるには 変調深度を慎重に選ぶことが重要である。  8サンプルあるいはそれ以上の変調深度は、サックスやピアノのような 持続的な入力信号について知覚可能な音程変化をもたらすことが分かった。    これにひきかえ、4サンプルの変調深度ではリバーブ後部の共振を壊す役には立たないことが分かった。  変調の効率性と知覚可能な音程変化の間での十分な妥協案であることから、 最終的な実装においては6サンプルの変調深度を選択した。

最適な変調速度を決定するのはより難しい。なぜなら全てのディレイ長が 他よりうまく機能する明確な変調周波数を持つように見えるからである。  唯一の共通規則は、0.5 Hz未満の変調では等価な変調されていない出力に対し ほとんど何の改善ももたらさないということであった。  他方、2 Hzを越える変調速度では、いくつかのディレイラインと入力信号の組み合わせにおいて いとも簡単に知覚することができた。

次に、それらの仮説が未だ有効であるかを確かめるために、 8個のディレイラインを持つFDN一式を試した。  全ての変調装置を同位相で組み合わせたとき、 適度な変調深度および速度であっても明らかな音程変化を聞き取ることができることが分かった。  しかしながら、各変調装置の間で45°もしくは90°異なる位相とした場合、 音程変調はより見分けがつかないものとなり、全体の音程に顕著な変化は見られなかった。  6サンプルの変調深度でも明白な音程変化は見られないことが分かった。

5.2.2  変調形式

これまでの検証は全てシヌソイドによって行われたが、 擬似乱数列も変調装置として使われた。  各ディレイラインの変調装置で異なる種を用いたとき、 特有の音程変化なしに、より滑らかなリバーブの後部を得られることが分かった。  しかしながら、異なる種を使ったとしても全ての変調装置が同時に同じ方向に 動いてしまう危険が常にあった。  この一点に集中する動作は出力に明確な音程変化を作り出す。  また、一部の期間に全ての変調装置から小さな振幅が出力される状態になる危険もある。  これは変調をより効率的でないものにしてしまうだろう。  シヌソイド変調装置を用いることで両方の問題を解決することができる。 これは、全ての変調装置が常に同じ位相量によって相殺されるためである。  また、変調装置の振幅が一定であることから、共振周波数の削減に関してより一貫性のある 結果を作り出すことになる。

5.3  補完形式の選択

次に、2 Hzの速度と6サンプルの深度を持つシヌソイド変調装置を使って様々な補完形式を試験した。  前章で見たように、ラグランジュ補完(FIR設計)は信号の高周波を弱める。  明らかに、次数N = 1(線形補完)やN = 2では、 そのロールオフが自然な音のするリバーブのためには目立ち過ぎ、許容できない。  ほぼ平坦と知覚できる周波数応答を得るには、4次かさらに高次のラグランジュ補完が必要である。

幸いにも、最大限に平坦なグループ・ディレイ補完のようなIIRオールパス設計ならば、 1次設計でオールパス応答を得ることができる。  しかしながら、この設計においては可変フィルタ係数から生じる非定常波が原因でいくらかの歪みが生じるかもしれない。  けれども、この歪みはほとんどのケースでは許容できるほど十分に少ない。  元の設計(方程式( 4.28 ))と元の設計の近似(方程式( 4.29 ))両方を試した。  試したすべての入力について、オールパス補完アルゴリズムの二つの変形の間に いかなる違いも聞き取ることはできなかった。

5.4  実装の詳細

この節では興味深い最適化と、 全体のアルゴリズムをより効率的にするために使われた実装法の一部について考察するつもりである。  それらのアルゴリズムはC++で32ビットアプリケーションとしてコーディングされ、 インテルPentiumプロセッサファミリに合わせて設計されている。  しかしながら、このプラットフォーム用の市販アプリケーションでは 一般的にアセンブリ言語を利用したよりいっそうの最適化が必要とされるであろうことに留意すべきである。

5.4.1  シヌソイド・トーン・ジェネレータの実装

利用したシヌソイド・アルゴリズム(4.1.1節で述べたもの)は1つの乗算と1つの加算で構成されている。  Fig. 5.2はこのアルゴリズムの実装を示している。  ここで留意すべきはfoscを音色の周波数、 fsをサンプリング周波数としたとき、 であるということである。

Fig. 5.2.  シヌソイド・トーン・ジェネレータの実装

このアルゴリズムは2倍精度であるときでさえ、 丸め誤差のため全ての周波数について安定なわけではない。  例えば、係数aは有限ワード長を用いてメモリに格納されねばならない。  低周波について、係数aを計算するのに使ったコサインの値は1に近くなる。  例えば、fosc = 2 Hertzでfs = 44.1 kHzの場合、 のようになる。  そして、係数aに相当するバイナリ表現は 1.1111 1111 1111 1111 1111 1110 1010 0010 となる。  従って、16あるいは24ビットの係数を用いるプロセッサでは、 振動数に多数の誤差を取り入れずにこの値を格納することができないだろう。  正確な周波数を得ることが重大な目的ではないため、この誤差は許容することができるかもしれない。  buffer1buffer2といった中間値の格納でも、 多数の誤差が存在することになるだろう。  係数aにおける誤差とは違って、 これらの誤差は発振器の周期毎に累積されるだろう。  実際には、これら丸め誤差はいくつかの周波数についてシステムを不安定にすることがある。 (32あるいは64ビットワード長についてさえ)

従って、システムは必ずあらゆる周波数について安定であることが望ましい。  また、システムの出力は[-1.0, 1.0]の区間に収まらなければならない。  これらの要求を達成するための最も簡単な方法は、Fig. 5.3に示すように、 出力が1.0より上がったり-1.0より下がったりしたときにアルゴリズムをリセットすることである。 ここでfoscを音色の周波数、 fsをサンプリング周波数とすると、 である。

Fig. 5.3.  溢れ防止付のシヌソイド・トーン・ジェネレータの実装

元のアルゴリズムに対するこの変更は、 安定化機構がアルゴリズムをリセットしなければならなくなったとき、 音色の周波数にいくらかの突然な、ほんの僅かな変化を引き起こす。  これは変調速度の変化を引き起こす。  しかしながら、今回の用途のような状況で用いる場合、 それは気づかないほどに小さいため影響はない。

5.4.2  フィルタ処理された乱数ジェネレータの実装

RNGアルゴリズムそれ自身は2つの乗算と2つの加算から構成される。  モジュロ演算がプロセッサの32ビットレジスタを自動的にオーバーフローさせて行われることに留意すべきである。  結果的なアルゴリズムをFig. 5.4に示す。

Fig. 5.4.  線形RNGの実装

前章で述べたように、この数列はローパスフィルタによりフィルタ処理されるべきである。  利用したフィルタは、4.1.2節で述べた2段階の2次バイカッドフィルタを使って実装されたものである。  それぞれのバイカッド部分はFig. 5.5に示すように直接形態I実装として実装される。

Fig. 5.5.  バイカッドフィルタの直接形態1実装のブロック・ダイアグラム

しかしながら、特定のフィルタについては係数b0b2が等しく、アルゴリズムを最適化することができる。  最終実装(Fig. 5.6に示す)は4つの乗算と4つの加算を必要とするのみである。

Fig. 5.6.  修正された直接形態1の a) ブロックダイアグラムおよび b) バイカッドフィルタの実装 (ただし k = b0 = b2、b1'= b1/k)

5.4.3  補完の実装

4.2.2節で見たように、ラグランジュ係数は( 4.26 )を用いて計算され、 ここで分母因子はあらかじめ格納されている。  これはNをフィルタの次数としたとき、 (N+1)2に比例するかなりの回数の乗算を必要とする。  しかしながら、Murphy [28]は4次のフィルタについて約50%の計算時間を節約し、 4(N+1)-8回の乗算だけで係数を計算する方法を提案した。  この方法を使うと、最初に部分積を算出するときに分子因子が計算される。

( 5.4 )

ここでppf0...N-1および ppr0...N-1は一時的に格納されなければならない 前と後の部分積を表している。  それからこれらは次式を使って合成され、( 4.26 )の分子を生じさせる。

( 5.5 )

あらゆる補完処理を最適化するひとつの方法は N個目のサンプルごとに補完係数を更新することである。  例えば、変調源の周波数を2 Hzの代わりに0.2 Hzに設定することができる。  その結果、10オーディオサンプルに1回補完係数を計算するために、 サンプリングレートから起算して1/10個目の出力を取ることができる。  この係数を更新する方法は、25サンプル以下ごとであれば可聴の歪みをもたらさないことが分かった。  50サンプルに1回の割合でそれらを更新すると、リバーブの減衰時にごくわずかなノイズが発生する。  75以上の割合では減衰時に可聴のノイズが加わる。

5.5  計算要求

このアルゴリズムは浮動小数点精度を使い、 インテルPentium II 266MHzプロセッサ上で、64MBのRAMを用いて実行される。  ディレイラインや変調装置といったすべてのアルゴリズム・モジュールがC++オブジェクトであるとはいえ、 あらゆる十分に小さな関数は設計を簡略化するためにinlineで計算される。  それゆえに、基本的に関数呼び出しのオーバーヘッドはない。  コンパイラの最適化設定は実行速度を最速にするようにした。  リバーブ・アルゴリズムは5512個のオーディオサンプルのブロックを処理し、 200を越えるブロックの平均処理時間をアルゴリズムの平均処理時間として以下の表で使用した。  このアルゴリズムは常にプリ・ディレイを含むものの、 アーリー・リフレクションや音質補正フィルタを含まないことに留意すべきである。  実在の状況では、それらモジュールをアルゴリズムに加えることになり、 恒常的要因によるアルゴリズムの総合処理時間平均は増加することになるだろう。

Table Iは8、12、16個のディレイラインを用いたときの 元のアルゴリズム(変調なし)の平均処理時間を示している。 アルゴリズムの総合処理時間はおおよそディレイラインの数に比例すると見られ、 それはディレイライン毎に約0.24 micro_secである。

TABLE  I - 変調なしフィルタの処理時間
 アルゴリズムの説明 総合処理時間
 N = 16 (変調なし) 3.7micro_sec
 N = 12 (変調なし) 2.8 micro_sec
 N = 8 (変調なし) 1.9 micro_sec

Table IIは8個の変調されたディレイラインを用いた同じ基本的なアルゴリズムの計算時間を示している。  これに見られるように、全体のアルゴリズムの所要処理時間は元の非変調アルゴリズムに比べると飛躍的に増す。  また、変調装置のアルゴリズムそれ自体の処理時間を計算した。(2段目に示す)  それぞれ、シヌソイド・トーン変調装置とRNG変調装置が30%および50%、 補完アルゴリズムが残りの70%と50%の追加された計算時間を要することを見出した。

TABLE  II - 様々な変調装置形式の処理時間
 アルゴリズムの説明 変調装置の処理時間 総合処理時間*
 シヌソイド・トーン・ジェネレータ 8 x 0.18 micro_sec = 1.4 micro_sec 6.9micro_sec
 フィルタ処理されたRNG数列 8 x 0.43 micro_sec = 3.4 micro_sec 8.7 micro_sec
 * N = 8および近似された1次のオールパス補完を使用

5.2.2節でシヌソイド・トーン変調装置がRNG変調装置より一貫性のある結果をもたらす (そしてより効率的である)ことが分かったので、最終実装でも使い続けることに決めた。

Table IIIはシヌソイド・トーン変調装置を利用した場合の様々な補完方法の計算時間を示している。  4次のラグランジュFIR補完とほぼ同じくらい音が良く、それに比べ約55%の計算しか必要ないため、 近似された1次のオールパスIIR補完を選択した。

TABLE  III - 様々な補完形式の処理時間
 アルゴリズムの説明 補完時間 総合処理時間*
 1次のラグランジュFIR 4.0 micro_sec 7.3 micro_sec
 2次のラグランジュFIR 5.0 micro_sec 8.3 micro_sec
 3次のラグランジュFIR 5.4 micro_sec 8.7 micro_sec
 4次のラグランジュFIR 6.5 micro_sec 9.8 micro_sec
 1次のオールパスIIR (近似) 3.6 micro_sec 6.9micro_sec
 1次のオールパスIIR 5.0 micro_sec 8.3 micro_sec
 * N = 8 およびシヌソイド・トーン変調装置を使用

補完処理を最適化するひとつの方法はN個目のサンプル毎だけに補完係数を更新することである。  Table IVは近似された1次のオールパスIIR補完を利用したときのアルゴリズムの計算時間を示している。 このとき、係数は1、10、50、100サンプル毎に更新される。  付け加えられるノイズと要求される計算効率性の間で、 補完係数を50サンプル毎に更新することが優れた妥協案であることが分かった。

TABLE  IV - 様々な係数更新比率と処理時間
 係数更新比率 総合処理時間*
 1サンプル毎 6.9 micro_sec
 10サンプル毎 4.1 micro_sec
 50サンプル毎 3.7 micro_sec
 100サンプル毎 3.6 micro_sec
 * N = 8、シヌソイド・トーン変調装置、近似された1次オールパス補完を使用

最後に、ネットワーク全体の内数個のディレイラインだけを変調することで アルゴリズムの総合処理時間をいっそう減らすために音質に関して妥協することができる。  しかしながら、変調の恩恵もほぼ比例して減少するだろう。  Table Vは8個のうち8、4、0個の変調されたディレイラインを用いたアルゴリズムの 総合処理時間を示している。

TABLE  V - 変調されたディレイラインの変動比率と処理時間
 変調されたディレイラインの数  総合処理時間*
 8個 3.7 micro_sec
 4個 2.7 micro_sec
 0個 1.9 micro_sec
 * N = 8、シヌソイド・トーン変調装置、近似された1次オールパス補完を使用

8個のディレイライン全てを変調されたアルゴリズムの処理時間が 16個の変調されていないディレイラインを使ったときの処理時間に等しいことに注目すると興味深い。  しかしながら重要な結果は、8個のうち4個のディレイラインが変調されたアルゴリズムの所要計算時間 (2.7 micro_sec)が、 12個の変調されていないディレイラインを用いたアルゴリズム (2.8 micro_sec)よりも僅かに小さいことである。  最後のアルゴリズムを使うことで、メモリ消費を60%、処理時間を約4%減少させた。  次節では、これら最後の二つのアルゴリズムの音質が比較された リスニングテストの結果を示すことになるだろう。

5.6  リスニングテスト

リスニングテストは8個のうち4個のディレイラインが変調されたリバーブ・アルゴリズム (アルゴリズムBと呼ぶことになるだろう)が 基準たる12個の変調されていないディレイラインを用いるアルゴリズム(アルゴリズムA)と同じくらい、 あるいはより優れた音であろうかということを確認するために行われた。  アルゴリズムBは基準より僅かに高速であり(5.5節)、 その上アルゴリズムAの60%しかメモリを要求しないことが分かっている(5.1節)。  従って、変調を利用したアルゴリズムはより多くのディレイラインを含む変調されていないアルゴリズムと 同じかいっそう優れたリバーブ品質を達成できることを証明したい。

5.6.1  手順

アルゴリズムの種々の側面を検証するため、 試験には4つの異なるスタジオ録音が利用された。  使われた1番目のオーディオサンプルは、 自然な音で、幅広い周波数を含むアコースティック・ギターの録音である。  2番目の録音はソロの男声ボーカルである。  3番目のオーディオサンプルはアルトサックスによるアルペジオ付のジャズのソロ演奏である。  最後の録音はスネア打ちで終わるロックビートを演奏するフルドラムセットである。  これら全ての楽器は44.1 kHzでデジタル録音され、 マイクは楽器の近くに位置取られた。  リバーブを除くオーディオサンプルの長さは3〜9秒であった。

次に、各サンプルには2形式のリバーブが加えられた。  典型的なプロのスタジオ演奏で使われるであろうような人工的なリバーブを 使うのが目的であった。  リバーブ・タイムやリバーブ・レベルといったリバーブ・パラメータは、 自然な雰囲気を生み出すためにそれぞれの楽器に異なったものが選ばれた。  もちろん、ある楽器について両方のリバーブ形式は同じパラメータを用いて付与された。  また、より実際的なリバーブを作るため、 両方のアルゴリズムにはアーリー・リフレクションが加えられた。

それからCDが楽器毎10トラックに編集され、 各トラックは3つの音声部分を含むことになった。  リバーブ形式Aが利用された最初の部分、 形式Bが利用された2番目の部分、形式Xが利用された3番目の部分である。 ここでXはAまたはBのどちらかから無作為に選ばれた。

検証手順の最初の部分で、典型的なABXリスニングテストが 形式AおよびBのリバーブの間の違いを見分けられるかどうかという被験者の確認に利用された。  40トラックを聞き、各トラックで3つ目の音声部分がどちらのリバーブ形式であるかを 識別できるかと被験者に質問した。  すなわち、リバーブ形式Xを識別するために楽器毎10回の試行を行ったわけである。  この最初の部分が完了するとすぐに、2番目の検証手順に進んだ。  2番目の部分の目的は聞き手が好むリバーブ形式を見出すことであった。  それぞれの楽器について、聞き手に、どちらが好むリバーブ形式であるか(AあるいはB)、 またそれは何故かを一言書くように依頼した。

CDはソニー製のポータブルCDプレイヤーおよび ソニー製のスタジオヘッドフォンMDR-V600を利用して静かな部屋で再生された。  リスニングテストを解釈するために質問した題目は20個にのぼる。  テストを受けたのは全員音楽環境といくらかのスタジオ経験を持つ大学生(院生と学部生両方)であった。  彼らは望むだけ何回でもオーディオサンプルを聞くことが許された。

5.6.2  結果の有意性

テスト結果の有意性を判断するために、 特定のスコアが機会に対するのか聞こえの違いによるのかどうかを確認しなければならなかった。 (例えば、10回のうち8回は正しく識別できるなど)  これについて、2つの仮説から1つを選ぶ必要があった。  最初の1つは帰無仮説(H0)で、スコアは機会に起因するという考え方である。  もう1つの仮説(H1)はスコアは聞こえの違いに起因するという考え方である。  あらゆるスコアについて、確率は機会に起因するという、 危険率有意水準alphaと呼ばれるものを統計は提供する。  スコアの危険率有意水準alphaが十分に低ければ、 その結果は機会の結果ではないという結論を下し(H0を却下)、 それは聞こえの違い結果であると結論するのである(H1を承認)。  alphaが十分に低いとされるしきい値は、 有意性の判定基準alpha'と呼ばれる。  それは一般的な認識によって決定され、alpha' = 0.05 が最も一般的に利用される値である。

H0を承認するか却下するかの決断を下すときには、2つのエラーの危険がある。  最初のひとつ、タイプ1エラーはalpha'とも呼ばれ、 それが実際は正しいときでもH0を却下してしまう危険である。 (例えば、聞き手が8/10以上のスコアを出してしまったときなど)  二つ目、タイプ2エラーはbetaと呼ばれ、 H0が実際には正しいときでも仮説H0を承認してしまう危険である。 (例えば、聞き手が7/10以下のスコアを出してしまったときなど)

合計n回の試行のうちc回正しい認識がなされる確率は パラメータnpの2項分布により与えられる機会に起因する [2]。

( 5.6 )

ここでであり、 pは唯一の機会について正しい識別が行われる確率を表す。 (ABXテストではp = 0.5)  従って、その危険率有意水準は、 機会に対するn回の試行でc回かかそれより正しい識別を行う確率である。

( 5.7 )

n = 10回の試行について( 5.6 )と( 5.7 )を用いることで、 8/10のスコアの危険率有意水準はalpha = 0.058 であることが分かった。  9/10のスコアについて同じ計算をするとalpha = 0.011となる。  alpha' = 0.058を有意性の判定基準として利用することに決めた。(10回のうち8回の正答に相当する) これは、これが最も通例の値alpha' = 0.05に近いからである。  それは、もし聞き手が与えられた楽器について8回以上正しいリバーブ形式を識別できたら、 彼あるいは彼女がリバーブ・アルゴリズムAとBの違いを見分けられると思うだろうということを意味する。 (仮説H1が承認されるだろう)

5.6.3  結果

ABXテストの結果をTable VIに示す。  それぞれの楽器について、リバーブ・アルゴリズムAとBとの間の違いを見分けられた聞き手の数を示してある。  ギターおよびドラムのサンプルについては平均して60%の被験者が違いを知覚できるのに対し、 ボーカルやサックスの録音についてはそれぞれ40%と30%しかリバーブ形式を区別できなかったことが分かる。  3人の被験者だけが4つの楽器すべてについてリバーブ・アルゴリズムを正しく識別することができた。 さらに、5人の被験者はどのアルゴリズムも識別することができなかった。  アルゴリズム間の違いを見分けられる人々でさえ、 2つのリバーブ形式を区別するのは非常に大変であったと言ったことにも留意すべきである。

TABLE  VI - ABXリスニングテストの結果(相違を発見できた聞き手の数)
ギター ボーカル サックス ドラム
12/20  (60%) 8/20  (40%) 6/20  (30%) 12/20  (60%)

それから検証手順の2番目の部分として、 楽器におけるリバーブ形式の識別の違いを知覚できた聞き手に どちらのアルゴリズムが良い音がすると見られるかを質問した。  この2番目の部分の結果をTable VIIに示す。

TABLE  VII - テストの2番目の部分の結果(リバーブ形式Bを好んだ聞き手の数*)
ギター ボーカル サックス ドラム
7/12  (58%) 6/8  (75%) 5/6  (83%) 4/12  (33%)
 * 意見を述べるように依頼された、 相当する楽器における違いを聞き分けられる聞き手のみ

4つの楽器のうち3つの楽器について、 リバーブ・アルゴリズムの違いを区別することができた聞き手は形式Bを好んだ。  ほとんどの聞き手はソースの形式に依存して異なる好みを示した。  例えば、ある聞き手がドラムにおいてリバーブAを好んだのに、 他の全てについてリバーブBを好むといった具合である。  アルゴリズムAを好んだ聞き手は、それが一般的により自然で豊かな音がすると感じ、 アルゴリズムBはわずかにより人工的な音がすると感じた。  とりわけボーカルとサックスの録音については、 ほとんど全員がアルゴリズムBがより滑らかな減衰をすることを認め、 リバーブAの後部にいくらかのうなりとはためきを聞き取ることができた。  つまり、リバーブBはより人工的な音がするかもしれないが、 リバーブAの後部にあるような共振音色を弱めるのに役立つのである。  それはドラムにおいて聞き手がリバーブAを好んだ事実を説明している。 なぜなら、リバーブAはこの特定の録音については減衰中の可聴の共振周波数を持たないからである。  面白いことに、20人の聞き手のうちただ1人は楽器の1つでアルゴリズムBの後部にわずかな音程誤差を聞き取った。 (過大な変調深度に関連した)

変調されたアルゴリズム(形式B)が基準のアルゴリズムよりも概ね良い音がすると判断された事実は 驚くべきことかもしれないが、基準のアルゴリズムが完璧ではないことを肝に銘じておかなければならない。  12個のディレイライン(あるいはそれ以上)を用いたアルゴリズムでさえ 平坦な周波数応答を提供することはできないだろう。  そんなわけで、変調の利用は人工的なリバーブ・アルゴリズムの周波数応答において ピークの可聴の影響を減らすためには非常に強力なのである。