お買い得アイテムが大集合!買うならやっぱり楽天市場

2025年07月28日

Cox回帰分析

Cox回帰分析とは回帰分析の一つで、
生存時間データを対象とした解析に用います。

ちなみにCoxの由来は開発者の名前です。
Cox回帰分析は1972年にイギリスの統計学者の
デイビッド・コックスが提唱した方法だからです。
比例ハザードモデルとか、Cox比例ハザード回帰モデルとか
様々な名前で呼ばれています。

ちなみにデイヴィットコックス先生は
ロジスティック回帰や、
生存分析におけるログランク検定も開発されています。

さて。。。

Cox回帰分析の前提として重要なのは比較ハザード性で、
ハザード比は時間に依存しないということです。

これを理解するためにはもう少し詳しく見ていきます。

ベースラインハザードという概念が導入されました。
つまり基準群において時刻tのハザードを決めるということです。
それに対して各群の特徴量をexpでかける事によって
各群のハザード関数を定義します。

 ※わかりやすくするために
  定数を線形ではなくわざわざexpにする意味は省きます。
  機会があればまた別に記載します。

つまり、、、

 λ(t|Z) = λ0(t) exp(βT・Z)
 ※Tは転置を意味しています
  (つまりβという定数とZという各患者の特徴量の内積が取れるようにしているだけです)

という事です。

ハザード比HR = λ(t|Z = z1) / λ(t|Z = z0)なので、
exp(βT・(z1-Z2))と変形され時刻tという成分が
約分されて消失するという事です。

ということでハザード関数を決定していきますが、
このときにβを推定していくのですが、
部分尤度法を使っていきます(ここも詳細を省きます)。

その結果回帰係数βの推定量が算出されてきます。
そして回帰係数の検定を行うのは他の回帰分析と同様です
(ここも詳細を省きます)。

この結果を用いてハザード比が計算されます。

 HR>1ならz1症例でイベントが発生しやすい
 HR=1なら同等
 HR<1ならz0症例でイベントが発生しやすい

まずは重要な前提を理解することと
その後の流れを把握してみてください。
細かいところは掘ればさらに色々学べますが、
重要なのは思考の流れだと思います。

よろしければ応援クリックお願いします!
にほんブログ村 病気ブログ 医者・医師へ
にほんブログ村
posted by いしたん at 22:22| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする

2025年06月26日

欠損値 原因

欠損値は臨床研究における大きな問題です。
欠損値 とはも参照してください。

さて、この欠損データがどうやって生じるのか、
原因を知ることは実際に解析をする上でも
とても重要になります。
ちなみに発生原因を
欠損データメカニズムと呼ぶこともあります。

Xが共変量、Yを目的変するとする

Missing completely at random(MCAR)
 完全にランダムに値が欠測する(XにもYにも欠損は無関係)
 ※一般的に臨床試験において(特にdrop outによる)欠測値の発生でMCARの仮定は成立しない
 例
  計器の不具合などでデータが得られなかった場合
  引越しで測定不可
 分析
  無視可能

Missing at random(MAR):最も多い原因
 欠損がYの値には無関係だが、Xには依存する
 MARが満たされるために(MNARを避けるために)は補助変数(auxiliary variable)が多い方がいい(Enders 2008)
 確認
  欠測値を含む変数、アウトカムの変数と関連が示唆される(r≒0.4)変数を補助変数として補完データにするとMARを仮定できる
   Psychol Methods . 2001 Dec;6(4):330-51.
 例
  女性は男性よりも体重の項目に欠損値を多く含む
  欠測が実験条件には依存しないもののマウスのある週齢以上ではランダムにデータが欠測する
 分析
  推定を工夫してバイアスを減らす

Missing not at random(MNAR)
 Yの値によって欠損値が生じ、その他ので欠損の有無を説明できない
 例
  検出限界を超えたデータが欠損した
  実験条件やサンプルの状態(薬剤の投与/非投与など)で欠測が発生
 分析
  深刻
 対応
  予防しかない

欠損データメカニズムが
いずれに該当するのか検討することで
以降の解析の前提・仮定が満たされるのか
判断できるようになると思います。

よろしければ応援クリックお願いします!
にほんブログ村 病気ブログ 医者・医師へ
にほんブログ村
posted by いしたん at 20:00| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする

2025年05月27日

欠損値

欠損値(欠測値、欠損データ)とは
本来入力されるべきデータがない状態のことです。

言い換えればデータベースの中で、

 空欄
 NA(Not available)
 ''
 9999などの極端な数字

といった数値等が入力されているところです。

欠損データによる問題点としては
代表的には3つの問題を生じうることと
認識しておきたいものです。

1:バイアス

 ICH E9でも欠損値は臨床試験において
 偏りを起こし得る代表的な原因とされています。

 影響としては内的妥当性が低下します。
 つまり研究対象者と同じ集団に対して
 同様の介入を行った場合でも
 同等の結果が再現される可能性が低くなるということです。

 また比較可能性が低下します。
 RCTで群間での欠損割合、欠損理由が異なる場合、
 ランダム化で保証された比較可能性が崩れます。
 つまり治療効果の比較にバイアスが生じるということです。

2:測定精度/研究の質の低下

 情報量が減り、治療効果等の推定精度が下がります。
 つまり欠損値が多い程、研究の質が低下します。

3:統計的処理が不可能になる

 統計モデルや解析手法によっては
 欠損値を含むと統計的処理が不可能になる場合があります。

ということで欠損値が発生しないように
できるだけ色々な対策をしましょう。

もちろん欠損値データの解析という分野があり、
補完などの善後策もありますが、
やっぱり欠損値がない方が1番ですからね。

よろしければ応援クリックお願いします!
にほんブログ村 病気ブログ 医者・医師へ
にほんブログ村
ラベル:欠損値 とは 補完
posted by いしたん at 18:50| Comment(0) | TrackBack(0) | 統計 | このブログの読者になる | 更新情報をチェックする
SEO対策テンプレート
医師の気持ち