とある統計学者の技術 Tips

統計学の話はしないかもしれません

Population Attributable Fraction (PAF)の話

外が暑すぎて,夜間の室内プールの温度まで高めなんですよね.最近. あんまり冷たいと脚が攣るのでよくないんですが,温いとそれはそれで気持ち悪い…(泳ぐ距離を短くする言い訳).

本題ですが,今日はPopulation Attributable Fraction (PAF)について見ていきます.日本語で「人口寄与割合」と訳されることもあるようですが,ちょっとずれているような気もするので,無理に訳さない方向で行きます.参考文献の和訳のようなものなので,原文を読まれることを推奨します.

Population Attributable Fraction (PAF)とは

疫学分野で重要なのは,曝露の結果に対する影響の大きさである.PAFもこの目的に沿って開発された指標で,特定の疾患を持っていたり,特定のイベントを発現した集団に対して,以下のように定義される.

\begin{align} \displaystyle & PAF = \frac{(O - E)}{O} \\ & O: Observed~number~of~cases \\ & E: Expected~number~of~cases~under~no~exposure \end{align}

解釈としては,罹患者全体のうち,もしも曝露がなければイベントが発現しなかったであろう割合を示している. では,Observed numberはいいとして,Expected numberはどのように求めたらいいのだろうか.
Expected numberは,曝露の有無に関するイベント発現の相対リスク( RR)と,集団中の曝露患者の割合( p_c)によって次のように計算できる.

\begin{align} \displaystyle PAF = p_c \left(1 - \frac{1}{RR} \right) \end{align}

例えば,イベント発現のリスクを2倍にするExposureが全患者の3割に存在していた場合, PAF = 0.3*(1-0.5) = 0.15である.PAFは通常百分率で表現される.

Confounder(交絡因子)の調整について

観察研究では通常,ExposureとOutcomeの間に交絡が存在するため,未調整のRRは使用されない.疾患の発現率が十分小さい場合には,logistic回帰から推定されたORがRRのよい近似となるため,未調整のRRに代わって使用される.

PAFの背後にある重要な仮定について

PAFを使用・解釈するにあたり,以下の仮定が必要なことは理解しておく必要がある.
1. RRの推定モデルは交絡因子を網羅したバイアスのないモデルである
2. Exposureを取り除くことが,他のリスク因子に影響しない
3. Exposureを取り除く完全な介入が実施されている

1はどのようなモデル解析にも言えることである.
2は例えば喫煙への曝露を取り除いくと,アルコールへの曝露も減少する傾向にあるため,両因子が影響する心血管系疾患への影響評価は困難になる.
3についても,例えば喫煙への曝露を完璧に取り除くのは,実践的には困難と言える.3に対する回答として,generalized impact fractionという手法が開発されている.

References

  • Mansournia, Mohammad Ali, and Douglas G. Altman. "Population attributable fraction." Bmj 360 (2018): k757.
  • Brady A. "Adjusted population attributable fractions from logistic regression." Stata Tech Bull 1998;42:8-12.