診断薬開発雑記

臨床検査試薬を開発するバイオ技術のブログ。誰かの役に立つかもしれない事を思い付くままに書いています。

2019年01月

コラム:相関係数の幾何学的解釈

相関性試験を教えると、まず聞かれるのが、
「相関係数って何?」という当然の質問です。
これが、上手く説明出来ないんですよ。

相関係数1

こんな式見せられても、理解しろっていう方が無理ですよね。

私はこういう解釈が気に入っています。
「高校数学で習った【ベクトルの内積】で、cosθが出てきたでしょう。
 あのcosθが相関係数rなんですよ。」

内積3

例えば試料を100例測定して、相関性試験をしたとしましょう。
そうした時に、x軸側の測定値(から平均値を引いたもの)を100次元の一つのベクトル、y軸側の測定値も100次元の一つのベクトルと見なす事ができるのです。

内積1

100次元、というととんでもない事のように思うかもしれませんが、例えば2次元のベクトル2本には、1つの角度θができます。

Cos2D

3次元にしてみましょう。やはり1つの角度θができます。

Cos3D

4次元以上になると図で書けませんが、例え100次元であっても、2本のベクトルの間には1つの角度θができるのです。

角度θを求めるのに、ベクトルの内積を使う事ができます。
内積の求め方は2つあって、一つは先ほどの、絶対値と角度を使った方法です。
内積3
これを変形した、こんな公式を覚えさせられましたね。
内積5

もう一つはベクトルの成分を掛け合わせて足す方法です。
内積4

さて、ベクトルの絶対値も、ベクトルの成分を使って以下のように計算する事ができます。
内積2

これをcosθを計算する公式に当てはめると、こうなります。

相関係数2

このように、相関係数rは、測定法Xと測定法Yの測定値をそれぞれベクトルと見なした時に、その『なす角』をコサインで表したもの、と解釈する事ができるのです。

同じ方向を向いていると、角度が小さくなってcosθは1に近づきます。
無関係な方向を向いていると、直角に近くなってcosθは0に近づきます。
全く逆を向いていると、角度は180度に近づいてcosθは-1に近づきます。

高校ではベクトルの内積の使い方までは教えてくれなかったでしょう。
実はこんな所にも活用されているのです。

相関性試験 (3)開発には向かない試験?

さて前回、相関性試験のことを「数学でいう相関性のやり方を、ちゃっかり利用しただけ」と説明しました。
それでは相関性試験から何かを導き出し、開発に役立てる事はできないのでしょうか。

「そんな事はない」という答えを期待するかもしれませんが、残念ながら役に立たない事がほとんどなのです。

相関性は必ずしも因果関係を意味していない。
これが相関性試験の落とし穴。

例を挙げてみます。

相関試験3

50例測定したら、1例の乖離検体がありました。
これを見て、あなたならどうしますか?

適当な非特異抑制物質を試薬に放り込んで、相関性試験をやり直すとか。
そういうやり方が一番良くないのです。
当たり外れのクイズをしているのではありません。

相関性試験にさっさと見切りを付けて、希釈試験とか添加回収試験のような分析的アプローチに切り替えるのが正解と考えます。

開発にPDCAサイクルがあるとすれば、相関性試験では因果関係を明らかにできないので、CheckやActionに回せないんですよ。
だから因果関係を調べる事ができる試験を進めた方が良い、という事です。

先ほどの例で、こう考えてみて下さい。
50例測定して、乖離する検体に当たらなかったら、それで試薬性能に問題がないと考えて良いのでしょうか?
いえ、たまたま当たり(ハズレ?)を引いただけですよね。
相関性試験なんて、その程度の試験なのです。
手間の割に得られるものは少ないです。
プロフィール

技術者TH

Twitter プロフィール
バイオ系実験あるある等を気まぐれにつぶやいています。
楽天市場