Lewer D, Brothers T, O'Nions E, Pickavance J. BMJ Medicine. 2025;4:e001375.
doi:10.1136/bmjmed-2025-001375
メモ日:2025年12月11日
「factors associated with(〜に関連する因子)」と題する多変量解析研究の多くが、統計的因果推論の基本原則を満たしていないと批判している。こうした研究は科学的に誤解を招き、医学研究の進歩に資さないため、本来は掲載すべきではないと主張している。
統計的因果推論では、まず主たる解析対象である「アウトカム − 主要曝露」を明確に定義し、そのうえで交絡因子・媒介因子・コライダーの関係を DAG(directed acyclic graph で明示し、バックドア基準に基づいて調整変数を選択する必要がある。これにより、因果構造を前提とした統計モデルが構築され、推定される効果(オッズ比やリスク差など)は因果効果として解釈可能になる。
一方、"factors associated with" 研究では、主要曝露が設定されず、くわえて DAG を描かず、交絡因子・媒介因子・コライダーが区別されないままに多数の変数を機械的に相互調整するため、因果経路が適切に閉じない。その結果、推定量は因果効果として解釈不能であり、読者に誤解を与えると論文は指摘している。また多くのこうした研究では「因果を主張しないための婉曲表現」が用いられるが、実際には因果推論を意図している場合が多い。にもかかわらず因果推論の手続きを踏まないため、統計量は意味をなさず、誤った因果印象を与える。
この方法論上の欠点を、(1) 統計調整の原則がないこと(Table 2 fallacy)、(2) 多重検定による偽陽性の濫発、(3) 事後仮説(HARKing)による説明の恣意性、という三点に整理している。これらの問題は上述の因果推論の枠組みに移行すれば回避可能である。すなわち、解析前に因果構造を明示し、交絡因子のみを調整して媒介因子やコライダーを誤って調整しないこと、また明確な「アウトカム − 主要曝露」の関係性に着目した解析を行うことが求められ、事前登録された解析計画に基づいて透明性を確保することが望ましい。
もう一つの重要な論点として、「因果推論(causal inference)」と「予測(prediction)」の混同も批判している。多変量回帰モデルは 因果効果の推定(暴露を変えたときアウトカムはどう変化するか)か 予測(誰がアウトカムの高リスクか)のいずれか一方には用いられるが、同時に両方を達成することはできない。しかし “factors associated with” 研究では、因果推論で用いるような調整済みオッズ比を提示しつつ、同時に予測研究のような言語を併用することが多く、目的が混在するために統計量の意味が不明瞭になる。予想が主目的の解析では、調整後の相関係数は解釈が困難であり、非調整の係数あるいはモデル全体での予測性能を議論すべきである。
なお、DAG の描き方を厳密に規定した国際的ガイドラインは現時点で存在しないが、以下は実務上有用である:
・Tennant らの総説(Int J Epidemiol, 2021;50:620–632, doi:10.1093/ije/dyaa213)
・DAGitty マニュアル(https://www.dagitty.net/manual-3.x.pdf)
二次解析などにおける解析計画の事前登録では、OSF(Open Science Framework が広く用いられる。タイムスタンプや DOI も発行される。
・OSF(Open Science Framework): https://osf.io