診断薬開発雑記

臨床検査試薬を開発するバイオ技術のブログ。誰かの役に立つかもしれない事を思い付くままに書いています。

2018年09月

特異性試験①正確性

臨床検査での「特異性」にも色々あって、試薬の性能試験としては「正確性」をテストすることが多いです。
AccuracyとPrecisionでいう、Accuracyの方ですね。

Accuracy(正確度)とPrecision(精度)というのは、よく的の例えで示されるもので、
中心からのズレがAccuracy
ばらつきがPrecision
と覚えておけば良いでしょう。

Accuracy

実際の体外診断薬では、予め表示値を定めた試料を作っておきます。
例えば、濃度既知の濃いサンプルを重量法で希釈して、正確な希釈倍率を求め、濃度を算出する方法が一般的です。
イムノアッセイは高感度すぎるので、吸光度とかタンパク定量法などで測定できる高い濃度の試料を作って、それをイムノアッセイの測定範囲まで正確にトレースする方法ですね。

そしてその試料を複数回(3回以上)測定して、表示値から何%ズレているかを計算します。
複数回測定した各測定値(平均値ではない)が全部、規格の%内に入れば合格。

と、簡単にできる試験なのですが、実は問題もあって、
表示値を付ける方法には何の規定もないのです。
要するに性悪説に基づいて、値を測定してから表示値を操作すれば、合格にできてしまうということです。

だからこの方法は出荷判定の時には必ず実施することになっていますが、試薬の開発においてはあまり重視していません。
それより相関試験の傾きや切片を見た方が、試薬性能を端的に表していると思うし、トレーサビリティーを重視して開発を進めた方が後々面倒が少ないからです。

コラム:ばらつきを図形に例えてみよう。

もう一つコラム。

ばらつきを扱う計算を教えていると多いのが、
「なんで標準偏差を二乗するの?」
「分散の加法性ってどういうこと?なんで標準偏差足しちゃいけないの?」
という、ごく自然の疑問。
高校数学で計算のやり方だけ丸暗記で覚えちゃってたんだと思います。

私がよく使う例え話はこんなものです。

「『ばらつき』には、『形』があるので、図形と同じ扱いをするんですよ」

分散の形

「ばらつきは図形とよく似た性質を持っているんですよ。
形を無視して大きさだけを表したのが、図形では『面積』、ばらつきでは『分散』です。」

「ばらつきの大きさを『標準偏差』で表すことが多いけど、
ばらつきの基本的な統計量は『分散』という二次元の数字なんですよ。
図形で言うと『面積』に相当するんです。
『標準偏差』は『分散』の√をとって一次元にした数字にすぎないんですよ。
そうすることで『長さ』と同じように比較できるようにしているのです。」

面積と分散

「ばらつき(の大きさ)を足すというのは、図形で言えば『面積』を足すと言うこと。
つまり足せるのは『面積」に相当する『分散』の方です。
この事を『分散の加法性』と言っているのですよ。」

分散の加法性

二次元の数字を扱うというのは、数学の世界ではごく当たり前に行われていること。
三平方の定理とか、二次元の足し算です。
ベクトルとか行列では3次元、4次元…という計算も行えます。
プログラミングの世界では、PythonのNumpyが得意で、機械学習に応用されています。

私たちにも異分野の技術を扱う時代が来ている、と最近よく思うのです。
そのために基礎をしっかり教えておこうと工夫しているのです。

コラム:自由度は「ばらつきの数」という解釈

感度試験があまりにもしんどかったので、ちょっと一息。

統計の勉強をしている人はみんな、
「自由度って何?なんで1を引くの?」
と悩みます。
本を調べても、「自由度という概念」とか書いてあって、説明になっていませんね。

私は以下のように解釈しています。今のところこれで困ったことはありません。
もしこれでわかってくれる人がいれば光栄です。

まず、データが一つだけあったとしましょう。
一点だけなので、ばらつきはありません。0個です。
データ一つでは、ばらつきの計算ができないのです。

自由度0

次にデータを二つにしましょう。
二点あるので、ばらつきが1個測れます。やっとばらつきの計算ができます。

自由度1

さらにデータを三つにしましょう。
三点あるので、ばらつきは1個増えて、2個になります。
3個じゃないの?と思われるかもしれませんが、③=①+②なので、③は①と②さえあれば計算できる値です。独立と従属という言葉で表現すれば、従属ですね。
独立したばらつきは実質①と②の2個分になるのです。

自由度2

それでは、ここで3点の平均値を取ってみましょう。
各点から平均値を引いたものが3つできるはずです。
統計の世界ではこういう式がよく出てきます。
この時のばらつきの数はいくつ分でしょうか?

自由度2b

答えは2個分。
平均値は3つの点から計算した値なので従属。独立したデータが増えた訳ではありません。
二つ上の図と同じように、データが3つだからばらつきは実質2個分なのです。

このように、計算上扱う独立したばらつきが実質何個分なのかを表現しているのが「自由度」で、計算方法は、データの数-1となります。

それでは、ばらつきは平均いくつなの?という計算をする時には
1. ばらつきの偏差平方和を取って、
2. (実質的なばらつきの個数である)自由度で割るのです。
これが(不偏)分散です。

QC検定3級ぐらいで出てくる内容です。
私たちの仕事では2級ぐらいは取ってほしい所です。
がんばって勉強勉強。
プロフィール

技術者TH

Twitter プロフィール
バイオ系実験あるある等を気まぐれにつぶやいています。
楽天市場