FC2ブログ

脳外科麻酔の現場

脳外科麻酔についての備忘録 An actual spot of the neurosurgical anesthesia.

140. 医療統計140.01. オッズ比、相対リスク、絶対リスク減少率、Number Needed to Treat


目次
140. 医療統計
140.01. オッズ比、相対リスク、絶対リスク減少率、Number Needed to Treat
○ OR, RR, ARR, NNT―これらのうち、我々はどれを使うべきか
○[要旨] はじめに:データの統計的解析及び医療データを理解する際に、医学文献では大いに注意を払うが、にもかかわらず臨床医の間には混乱を生じる。それぞれの研究者は治療法の比較に異なる方法を用いている。例えばエンドポイント(結果)が2つからなる場合、疾病がある場合とない場合には通常の指標はオッズ比、相対リスク、相対リスク減少率、絶対リスク減少率、及びNumber Needed to Treat(NNT)である。その際、臨床医が直面する質問は:私のPtに最良の治療を選ぶ際に助けになるなるのはどれでしょうか?である。
[方法] この論文の目標は例を用いて、どのようにそれぞれの指標は使われ、それは何を意味するのか、その欠点と利点は何かを説明することである。
[結果] いくつかの指標の対は同等の情報を表わす。さらに異なる指標は結果として異なる印象を与える。
[結論] 研究者は相対的及び絶対的指標を表示し適当な信頼区間を用いて表示することを推奨する。
[Keywords] odds ratio, risk reduction, number needed to treat, 医学的意思決定
○[はじめに] 近年医学文献で利用できる情報量は急速に増加しており、さらなる研究もなされるにつれて、結果はより容易に利用しやすくなっている。Ptでさえもインターネット時代においては最近の研究について気付いている。問題は種々の発表されている研究におけるエビデンスを如何に審査して新しいものに既存の治療法を変えて、正当化するかどうかを決めることである。「統計」という言葉が出ると多くの臨床医は混乱し不快感のうめき声をあげて反応する。
・異なる治療法の比較をする時の主なる困難さはあらかじめ計画された研究ではほぼお互いに比較されることはないという事実である。代わりにほとんどの研究は新しい治療と偽薬と比較されている。さらに研究のエンドポイントが異なっており疾病のはじめの重症度が異なる場合もある。その研究は前もって異なる薬物に曝露されているPtの集合を見ている場合もあり、アウトカム(結果)の基準が異なっているかもしれない。この問題は調整目的でデザインされたプラセボ(偽薬)対照の試験のシステマティックレビューの限界を示している。明らかにいくつかの治療法を比較する最も良い方法は全ての比較されるべき治療法を含めてデザインすることであるが、調整目的のために成し遂げるのは困難な仕事である。
・ここ数年のうちにいくつかの独立した研究の結果を統合した問題が、多くの文献の話題になっている。いくつかは相対リスクだけあるいは絶対リスク減少率だけを使用する一方、他の論者はNNT基準の使用を主張している。何人かは選択の基準としてオッズ比を考えている。明らかに方法の選択は研究の型とそのデザインに結びついている。後ろ向き研究retrospective studyと横断研究cross-sectional studyのためには、そこでは目的は差異よりも関連性を見ているのでオッズ比が推奨される。そこでは相対リスクやリスク差risk difference(=ARR)は意味ありげに計算される事はない。リスク計算はフォローアップ研究(追跡調査研究)で意味があるだけである。オッズ比はまたケースコントロール研究でだけ使われ、相対リスクは推定できない。
○[方法] この文献では我々は主に比較研究 controlled studyに関与する。我々は近年医学文献に報告された治療効果の、その利点と欠点に沿って異なる指標に関して述べ、論争のいくつかをどちらが使われるべきかについてまとめる。治療効果の判定は使われた指標に依存するので臨床医及びPtが指標間の差を理解することが重要である。この理解が症例のための適切な指標の選択を助け、相対的かつ絶対的指標より完全な絵を与えるために報告されることを望んでいる。
○[[一般的指標]]
・[絶対リスク減少率] 基本的で最も単純な指標は絶対リスク減少率absolute risk reduction(ARR)で、risk difference(リスク差)とも呼ばれている。治療を行った結果として、イベントのリスクは臨床的に有意義な量、減少したか?ということである。計算法はまさにコントロール群のイベントのリスクと治療群のイベントのリスクの差である。
・推定されたARRの利点は計算が容易で得られた信頼区間は理解され易く、(そして標準的な統計パッケージで容易に利用できる)、治療を行わない場合の基礎となるリスクと治療に伴うリスク減少率の両方を反映している。明確な意味があり、臨床医に訴える明らかな意味を持っている。ゼロを含む信頼区間は治療薬と偽薬placeboの間にリスクの点からは有意の差がないことを示している。1つの欠点はリスクが0や1に近い時に、リスクが範囲の中央近くにある時よりも固定されたサイズのリスクの差が、より大きな重要性を持つかもしれないということである。0.010と0.001の差は、人々がより大きな副作用をこうむるリスクを考える際に、0.410と0.401の差よりもより著しいということです。
・[Number Needed to Treat] 絶対リスク減少率ARRに基づいた関連ある指標がnumber needed to treat(NNT)でARRの逆数と定義されている。この指標の意味するところは、そうでなければ利益を得ることできなかった1人のPtで望ましい結果outcomeを得るために治療される必要があるPtの数である。
*[注]その治療の1例の効果を観察するためには、その治療を何人のPtに用いなければならないかという指標。
また結果outcomeが2つである時は費用対効果比は増加する費用とNNTの産物になる。NNTの信頼区間(CI)は絶対リスク減少率の上限及び下限の信頼限界の逆数で得られる。NNTは医学文献の中で論ぜられる利点も欠点もある。それは容易に理解され“「………」は我々が我々のPtにとって最良の決定をなす手助けになるであろう”と言って使われる。ElferinkとVan Zwieten-BootはNNTの使用を推奨し、NNTは絶対的利益を考慮に入れ、容易に解釈されるという意味で統計的及び臨床的意義を述べるので有益な指標であるといっている。NNTの数値が病気やinterventionや結果の機能であると気付く価値がある。結果が非常に深刻である場合の10のNNTはより穏やかな結果であるNNT5よりも異なって判定されるかもしれない。それ故に同じ状態、重症さ、結果の治療が比較される際にのみ、NNTを直接比較するのは適切である。
*[注]ORとRRよりもARRとNNTを使うよう奨められている。そうすることにより1人のPtを救うためにどれだけの費用と薬が必要なのか明確になる。
・治療群とコントロール群にリスク差がない時は絶対リスク減少率ARRは0で、NNTは無限大となる。また差が有意でない時は、絶対リスク減少率ARRの信頼区間CIは0を含むであろう。NNTのCIはARRのCIの逆数を取って得られるから、0.1のARRで―0.05~0.25の95%CIが得られる。それで10のNNTと-20~4の95%CIを生じる。この区間CIについては2つの問題がある。第1にNNTは正の数であるべきで、、第2にCI信頼区間は点推定値を含むべきではない。この場合はNNTは10に等しい。これに対しMcQuaryとMooreは推定値だけを使うよう示唆している。しかしながらCIのためには結果が有意のときのみ提示されるのは十分であるとは言えない。NNTが負である時の解釈は次のようになっている:もしもNNTのPtが新しい治療法で治療された時は1人の少ないPtが彼らが全て対照で治療された時よりも利益を得られないということ。NNTは負である時にはそれはNNHと呼ばれる。
*[注]NNTがマイナスである時は対照群より成績が悪いことを示している。
The number needed to harm. ARRが0に近づくときは新しい治療法とコントロールに差はないことを意味する。それ故、1人が良くなるために無限に多くのPtが必要となり、それは誰も持っていない。(95%CIが-20~4)というようなCIの解釈の問題がまだ存在する。なぜならARR 0はNNTが無限大に等しいと解釈されるから。1つの単純な解決法は2つに分けた区間として報告することである:NNH(20―∞とNNT(4―∞)。Altmanは2つの区間を1つにまとめることを提案しているNNTH 20 to ∞ to NNTB 4)。
・欠点を打ち負かすためにNNTはそれらが適応される対照群のイベント率とそれらから得られる相対リスクとCIによってに伴われると示唆される。NewcombeはARRはより基本的な量であり、より多く誤解される可能性が少なく、NNTにとって好ましい。NNTの特異性の問題のためにNNTとそのCIが、ARRが十分ゼロから離れている時に代替法として使われると示唆している。
・[相対リスクと相対リスク減少率] 次の2つのよく知られた指標が相対リスクRRと相対リスク減少率RRRである。治療法の相対リスクは治療群とコントロール群のリスクの比で、またリスク比risk ratioと呼ばれいる。相対リスク減少率は1から相対リスクRRを引くことで得られる。それはARRとコントロール群のリスクの比と同じである。
・RRは計算と解釈が簡単で、標準的な統計ソフトウェアに含まれている。信頼区間CIはlog(RR)のためのCIの下限、上限のべき乗をとって計算される。それは一般的公式では  CI=log(RR)±1.96×SE(log(RR))。 (1)
しかしCIを計算する簡単な方法はよく行われてない。それで、Equiv Test及びCIAが使われるが、それらはいまだ広く利用されていない。
・RRの欠点の1つはその値が非常に異なった臨床的状況でも同じになりうるということである。例えば、RRが0.167という値は次のような臨床上の状況の両方の結果となる。
1) 治療群とコントロール群のリスクがそれぞれ0.3と0.05である時[0.05/0.3=0.167]
2) 治療群のリスク0.84、コントロール群のリスク0.14の場合[0.14/0.84=0.167]
・RRは比例スケールとして明確であるが、絶対的値に実際の意味がない。それ故、具体的な臨床や公衆衛生の状況へエビデンスのまとめや絶対的指標を応用する時の相対的効果の指標として使用する意味合いが一般的である。
○ [オッズ比Odds ratio] オッズ比(OR)は効果の大きさの一般的指標で症例対照研究case control studyやコホート研究cohort study,臨床研究clinical trialで報告されるかもしれない。そして後ろ向き研究や横断研究でも使われ、そこではゴール(目的)は差異よりも関連性を見ることである。オッズはロジスティック回帰モデリングにおける効果の大きさの自然な指標で基準を満たすPtの数とそうでないPtの数、あるいはイベントの起こらない数と関連した出来事の数の比として解釈される。
・オッズ比は治療群のオッズとコントロール群のオッズの比である。それはその信頼区間CIと共に標準的統計ソフトで得られる。オッズもオッズ比もディメンション(次元)がない。1より小さいオッズ比ORはオッズが減少したことを意味し、1より大きなORはオッズが増えたことを意味する。ORは理解するのが難しく、しばしば相対リスクとして理解されていることに注意を払うべきである。結果outcomeが比較的稀な時にはORは相対リスクRRに近いが、当初のリスクが高い時には相対リスクRRの良い近似ではないことは認識された問題である。さらにORはいつも相対リスクRRに比べて効果の大きさが誇張されるであろう。ORが1より小さい時はそれはRRより小さく、1より大きい時はORはRRを越える。しかしながら解釈は一般的にこの矛盾によっては影響されないであろう。なぜなら矛盾は効果の大きさが大きく陽性のときか陰性の時だからである。その様な症例は質的結論は変わりないままであるから。
・RRとORは下記のように注意することには意義がある。
RR=OR*(1+(n21/n22))/(1+(n11/n12)), (2)
ここでn11は(yes, group1)の頻度;n21は(yes, group2)の頻度;n22は(no, group2)の頻度;n12は(no, group1)の頻度である。
この公式はn11, n22, すなわち”yes”の結果の頻度がそれぞれn12, n22に比べて小さい時にORがRRとよく近似することを説明している。これは「稀なoutcome結果の仮定」として知られている。
・オッズ比は単にロジスティックモデルから直接推定される関連性の指標であり、研究デザインがfollow upやcase-controlやcross sectional横断研究であるかどうかに関係なく特別な想定を求めることはない。Case-controlや横断研究ではオッズ比は下記のように4つの確率に依存している。
OR={P(E=1|D=1)/P(E=0|D=1)}/{P(E=1|D=0)/P(E=0|D=0)}   (3)
ここでPtが曝露されていればE=1,それ以外はE=0, Ptに疾病があればD=1,それ以外ならD=0。リスクはcase control study, 横断研究から推定されることはできないと気付くことは価値がある。なぜなら利用することができないP(D|E)型の条件付きの確率を必要とするので。
○ [[結果]]
○ [仮定的例]
・一部分McQuaryとMooreに使われた仮定的例はその異なる指標を信頼区間CIを付けて使われるであろう。研究の目的はplacebo偽薬を受けたコントロール群と新しい抗片頭痛治療薬を受けた治療群で片頭痛の再発を比較することである。説明のためにコントロール群と治療群の4つの異なった可能性がありうる結果outcomeを調べてみる。Stage1のためのC1とM1、stage2のためのC2とM2、stage3のためのC3とM3、stage4のためにC4とM4を示す。全グループは1000名と仮定する。
・研究終了時にコントロール群C1の30%で片頭痛が起こった(risk, 0.3), 治療群M1は5%、コントロール群C2では84%、治療群M2で14%、コントロール群C3で10%、治療群M3で1.7%、C4で95%、M4で70%でTable1にまとめられている。
・使われた指標は95%CI付き絶対リスク減少率ARR、リスク、95%CI付きNNT、95%CI付き相対リスクRR、リスク減少率、オッズ、95%CI付きオッズ比ORで、以下のことが分かる。
1. はじめの3つのcaseは同じ相対リスクRRと相対リスク減少率RRRであるが、一方case4は著しく異なっている。しかし絶対リスク減少率ARR、NNT、オッズ比ORは3つのcaseでは著しく異なっている。(オッズ比ORはcase1及び3では同じであるがcase2は異なっている。
2. Case1,4は同じARR、NNT、ORであるが、RR、RRR、基準のリスクは非常に違っている。     Table1
 C1M1C2M2C3M3C4M4
Event3005084014010017950700
No event70095016086090098350300
Risk of event0.30.050.840.140.10.0170.950.7
ARR 0.25 0.7 0.083 0.25
   CI 0.217-0.283 0.656-0.744 0.062-0.104 0.217-0.283
NNT 4 1.43 12.05 4
   CI 3.53-4.64 1.34-1.52 9.65-16.02 3.53-4.60
RR 0.167 0.167 0.17 0.74
   CI 0.125-0.222 0.143-0.195 0.101-0.282 0.706-0.769
RRR 0.833 0.833 0.83 0.26
Odds0.4290.0535.250.1630.1110.017192.33
OR8.140.12332.250.0316.420.1568.150.123
   CI 0.090-0.168 0.024-0.04 0.092-0.262 0.090-0.168

○ [実際の例] 次の例は前向き研究で早期のParkinson病でropinirole(ROP)か、levodopa(LD)服用後のジスキネジアの頻度を比べている。結果はropiniroleを飲んだ179例中17例、levodopaを飲んだ89例中23例でジスキネジアが起こっている。データはTable2にまとめられている。
Presence of dyskinesia
YesNoTotal
Levodopa236689
Ropinirole17162179
Total40228268
・LDを飲んだPtのジスキネジアPtのリスクは23/89=0.258,一方ROPの方のPtのジスキネジア出現のリスクは17/179=0.163. 
それ故、絶対リスク減少率ARR=0.258―0.095=0.163  リスク差
ARRの分散varianceは V(ARR)=0.258(1-0.258)/89+0.095(1-0.095)/179=0.00263
従って比率の違いに対する95%信頼区間は以下のようになる
  0.163±1.96√0.00263=(0.0636―0.264)
ここで1.96は95%CIのstandard normal tableから取られた上限2.5%である。
・NNTとそのCIはARRとそのCIから逆数を取って得られる。
すなわちNNT=1/ARR=1/0.163=6.13、CIは((1/0.264)-(1/0.063))=(3.79―15.87)
相対リスクは0.095/0.258=0.368
・信頼区間は次のように得られる:logRRのCIが得られ、下限及び上限は望む区間を得るために変換される
・log(RR)の分散は下記のように与えられる
 V(log(RR))=(1/23)-(1/89)+(1/17)-(1/179)=0.08551
 それ故 log(RR)の95%CIは次のようになる
 Log(0.368)±1.96√0.08551=(-1.5727から-0.4265)
信頼区間をべき乗して、RRの95%CIが提供される:(0.207―0.653)。
・LDを飲んだPtでジスキネジアが起こるオッズは(23/66)=0.348. 
ROPを飲んだPtでジスキネジアが起こるオッズは(17/162)=0.105、それ故オッズ比は0.105/0.348=0.302
信頼区間を得る手順は次の通り:ORのlogのCIが得られ、下限及び上限は望む間隔に変換される。
log(OR)の分散は次のようになる
V(log(OR)=((1/23)+(1/66)+(1/17)+(1/162))=0.1236
それ故、log(OR)の95%CIは
Log(OR)±1.96√0.1236=-1.198±1.96×√0.35157=(-1.887から-0.508)
下限、上限をべき乗してORの95%CIを得る(0.151―0.602)
相対リスクRRは釣り合ったスケールであるが、絶対的なスケールに対して実際の意味を持たないのでエビデンスをまとめる相対的効果の指標を使うことと具体的な臨床や公衆衛生の状況にそれを適応させる絶対的指標を両方報告するのが最適であろう。
我々の例でいうと、全ての統計はROPがジスキネジアを予防することをよりよく示している。しかしながらLDに伴うリスクはROPに伴うリスクより3倍高く、ROPを使うことによって、ジスキネジアが発症するリスクは16%減少したと報告するのが最良である。情報のこれら2つの部分は絵を完成させる。
・Malenkaらによって報告された興味深い研究によれば利点に対するPtの理解は、どのように利点が示されるかに影響される― 相対的あるいは絶対的という用語に。
利点やリスク、相対的 対 絶対的という用語の組み立てはPtの好みに大きな影響を持つかもしれないということを見出した。その利点が相対的用語で表現された薬物治療はPtの56.8%で選択され、一方絶対的用語で用語で表現された薬物治療は14.7%であった。
○[[結語]] 上述及び仮定的例での議論は、治療の選択は使われる指標によることを示すことが目的である。それ故、異なった指標が実際に表現すること及びどれが特別なPtの状況にとってより適切であるかを臨床医が理解することが重要である。例えばARRやNNTは絶対的指標であり、一方RRやRRRは相対的指標である。より完全な絵を描くためには相対的及び絶対的指標の両方が報告されることが推奨される。
◇ Edna Schechtman, PhD:Odds Ratio, Relative Risk, Absolute Risk Reduction, and the Number Needed to Treat―Which of these Should We Use? VALUE IN HEARTH, Vol5, No5, 2002,p431-435 <11/10/2016>
スポンサーサイト



PageTop

コメント


管理者にだけ表示を許可する