ヒューリンクステクニカルサポート
SYSTAT の生存分析
SYSTAT 製品ページ

TOP > 生存分析> 例

ステップワイズ回帰

あるモデルの指定よりも別のモデルを使用する必要があるという理論的な理由がほとんどない場合、共変量を選択するステップワイズ手法が便利なことがあります。特に、潜在的な共変量が多数ある場合に便利です。SURVIVAL では前方と後方のステップワイズな共変量選択が可能で、特定の共変量を強制的にモデルに追加したり、追加と削除の基準を制御することができます。SURVIVAL ではどのモデルでもステップワイズ法が使用できますが (層別化モデルを除く)、前方選択 (STEP/FORWARD) は、1 つ以上の共変量を強制的にモデルに追加しない限り、Cox モデルでは使用できません。一般的に、潜在的に重要な予測変数を見逃す可能性が低いので、すべてのステップワイズ法で後方の削除 (STEP/BACKWARD) を使用することをお勧めします。

変数の追加基準は、現在の共変量リストに追加されるときに変数の係数が 0 であるという仮説の Lagrange 乗数検定 (または Rao のスコア検定) に基づきます (Peduzzi et al. , 1980、Engel, 1984)。自由度 1 の、このカイ 2 乗統計量の符号付き平方根は、次に有意性を計算するために正規確率変数として扱われます。

変数を削除する場合、情報マトリクスの逆マトリクスから得られる、標準誤差の係数比を基にする t 統計量 (実際には漸近的な正規統計量) が使用されます。デフォルトの ENTER と REMOVE の水準を無効にする場合、変数が繰り返しモデルに追加/削除されないように注意が必要です。

非線形でのステップワイズモデルの選択には、ステップワイズ線形回帰と同じ問題があります。特に、従来の仮説検定は誤解を招きやすく、モデルは実際よりもよく見えます。ステップワイズモデリングの問題の一般的な解説については、Hocking の論文 (1983 年)、および一般線形モデルの参考文献に記載されています。

例を示します。入力は次のようになります。

USE MELANOMA
SURVIVAL
MODEL TIME = ULCER,DEPTH,NODES / CENSOR=CENSOR
START / COX,BACK,ENTER=.05,REMOVE=.05
STEP / AUTO
有意でない効果をモデルから強制的に取り除くために、"remove p" の値をデフォルトの 0.15 から 0.05 に変更しています。

出力は次のようになります。

SYSTAT Rectangular file C:\Program Files\SYSTAT 11\Data\MELANOMA.SYD,
created Fri Jun 25, 2004 at 16:20:20, contains variables:

TIME	CENSOR	WEIGHT	SEX	PA	PB
ULCER	DEPTH	NODES	SEX$

Time variable: TIME
Censor variable: CENSOR
Weight variable: 1.0
Input records:           69
Records kept for analysis:           69

Weighted
Censoring          Observations   Observations

Exact Failures                 36
Right Censored                 33

Covariate means

ULCER       =       1.507
DEPTH       =       2.562
NODES       =       3.246

Type 1, exact failures and right censoring only.
Analyses/estimates: Kaplan-Meier, Cox and parametric models
Overall time range: [      72.000 ,     7307.000]
Failure time range: [      72.000 ,     1606.000]

Step number 0
Log-likelihood = -127.813
Variables included:
ULCER              -2.063        0.039
DEPTH               1.885        0.059
NODES               2.490        0.013

Step number 1
Log-likelihood = -129.259
Variables included:
ULCER              -2.577        0.010
NODES               2.524        0.012
Variables excluded:
DEPTH               1.941        0.052
t-ratio          "p"
Further stepping impossible.

Final Model Summary

Parameter                Estimate         S.E.      t-ratio      p-value
ULCER                      -0.926        0.359       -2.577        0.010
NODES                       0.136        0.054        2.524        0.012

95.0 % Confidence Intervals
Parameter                  Estimate        Lower        Upper
ULCER                      -0.926       -1.631       -0.222
NODES                       0.136        0.030        0.241

Covariance matrix

ULCER        NODES
ULCER               0.129
NODES              -0.005        0.003

Correlation matrix

ULCER        NODES
ULCER               1.000
NODES              -0.280        1.000