アンサンブルの問題

ゼミで紹介した論文で使われていた解析方法にひっかかる。
fMRIの多変量解析(multivariate analysis)の方法として、
試行を偶数回と奇数回に分けて、条件Aと条件Bのデータを、
A_even vs. A_odd の相関とA_even vs. B_odd の相関を比較して、
B_even vs. B_odd の相関とB_even vs. A_odd の相関の比較もして、
それぞれ、前者の方が後者よりも有意に高いかどうか?
みたいなことを解析するやり方を使っていた。


よくあるのは、全試行の平均を取って、「A_allの平均 - B_allの平均」
ということをやるわけだけれど、そうすると消えてしまう情報を、
平均しないで、データを半分ずつに分割してそれぞれの間で
考えられる組み合わせの相関を計算して調べるということらしい。


でもたとえば、偶数回目のAのデータと奇数回目のAのデータの相関、
というのが何を見ようとしているのか、というのがどうも分からない。
試行間で同じようなパターンがあるかどうかとか、一貫性の有無とか、
そういうことを計算していることになるのかな。違うのかな。


いくつかのデータの「近さ」みたいなものを調べるのに、今までは、
平均や分散を比較するか、内積くらいしか思いつかなかったけれど、
内積も結局はどちらか一方のベクトルに射影したときにどれくらい
重なっているかを数えているだけなので、もう少し別の方法が
ないものかとずっと考えていた。


ただし、偶奇で分けて相関を取るという操作の意味というか
計算の詳細がどうもつかめていないので、たとえば、これが
自己相関や相互相関とどれくらい違うものを計算しているのか
というところが分かっていない。同じようなことをやっている
ような気もするし、全然、概念として違うような気もする。
いやまったく違う?パターンそのものを抽出しようとするか、
パターンの概形そのものが分からなくてもどれくらいの
類似度が存在するかどうかだけを判別するかの違いかな。


Buzsákiが繰り返し、平均を取ると相殺してしまうものに
今まで我々の見落としてきた情報があるかもしれない、
というようなことを書いていたのを思い出す。
それは単に、試行間や被験者間の変動はとりあえず全部
ノイズとして取り除けば、残ったものが首尾一貫したもので、
それが見たい条件間の違いをもっとも反映するはずだ、
という考え方はたぶん間違ってはいないけれど、ただし、
その操作で消えた部分にどんな情報が乗っていたのか
ということは絶対に分かりようがないし、もったいないことを
している可能性は排除できない。もったいながっていても
とりあえず解析方法がなかったら仕方なかったのだろうけれど、
理論とか手法をもっとよく考えなかった怠慢かもしれない。


fMRIに限らず、何かのデータの平均で比較する以外に
やれることがあるはずという例としては勇気が出た。
多くの場合、かなり多次元のデータが得られるわけで、
それを圧縮して一つの統計量とか指標にするときに、
どうやって情報を抽出するか、情報などと言わずに、
意味を見いだすかと言ってもいいけれど、その方法で
考えられてこなかったところをもうすこし突き詰める
ということもやられていいと思う。というより、
解析に何か応用できそうな気がして、もうすこし
調べて何をやってるかを理解しないといけない。


偶数回と奇数回のデータの間の関係性を調べるのは、
アンサンブルの取り方の問題とも関係してる気がする。
同じ条件でも、偶数回と奇数回で比較するというのは
特殊なこと(実は単純かもしれないが)をやっていて、
それで得られるものは何を表しているんだろう。