2014年5月20日火曜日

制御変量法のそれらしい解釈

制御変量法を用いることでなぜ分散が減少するのかについてそれっぽい解釈を思いついた

たとえばモンテカルロシミュレーションで求めた$Y$には真の値からの誤差$\delta _Y$が存在する。
また$\hat{\theta _c}=Y+c(Z-E(Z)) $の$Z$も真の値$E(Z)$からのずれ(誤差)$\delta _Z$が存在する。
これらを前記事(1)に代入すると

\begin{equation}
\hat{\theta _c}=Y+c(Z-E(Z))\\
=Y_{true}+\delta _Y +c(Z_{true}+\delta_Z-E(Z))
\end{equation}

$Z_{true}=E(Z)$とすると

\begin{equation}
\hat{\theta _c}=Y_{true}+\delta _Y +c\delta_Z
\end{equation}

となる。$\delta_Y$と$\delta_Z$はシミュレーションによって生じた真の値からの誤差であるが、YとZの間になんらかの相関があればこれら$\delta_Y$、$\delta_Z$の間にもそれに近い相関があると考えられる。

cの値を適切に選ぶことで$\delta _Y +c\delta_Z$の分散を小さくしようというのが制御変量法の発想だと思う。ふたつの相関する乱数である$\delta _Y$と$\delta_Z$に対して、cを前記事のように$c^*=\frac{\rm{cov}(Y,Z)}{\rm{var}(Z)}$と選ぶと分散を圧搾できると考えられる。


これと同じような考えで、モンテカルロシミュレーションである量$f(x)$の1階微分を求めるとき

\begin{equation}
\frac{df}{dx}=\rm{lim}_{\Delta x\rightarrow \infty}\frac{f(x+\Delta x)-f(x)}{\Delta x}
\end{equation}
の式を用いるが、$f(x+\Delta x)$と$f(x)$を求めるとき、同じ乱数列を用いるほうがよいのか、異なる乱数列を用いるほうがよいのかというお話がある。

さきほどの考えで行くと、$f(x+\Delta x)$と$f(x)$のどちらも真の値から誤差があるが、どちらの計算にも同じ乱数列を用いると、それらの誤差は$\Delta x$による差しか生じないためかなり相関していると考えられる。しかし異なる乱数列を用いるとこの相関はなくなってしまう。

 $\frac{df}{dx}$を求めるときには$f(x+\Delta x)$と$f(x)$の差をとるため、これらの誤差に相関があれば、差をとったときに誤差も相殺してしまうことができる。このため、$\frac{df}{dx}$の値の分散は同じ乱数列を用いたときのほうが異なる乱数列を用いたときより小さくなるだろう。