ヒューリンクステクニカルサポート
SYSTAT の生存分析
SYSTAT 製品ページ

TOP > 生存分析> 例

Cox の回帰

比例ハザード回帰 (Cox の 1972 年の論文)は、ハイブリッドモデルです。カプランマイヤー推定量のような任意の生存関数を使用できるという点で部分的にノンパラメトリックであり、共変量が任意のハザード関数の比例シフトを起こすという前提がある点で、部分的にパラメトリックです。カプランマイヤーの推定量は、共変量のない Cox のモデルと同等です。SURVIVAL では、Cox のモデルではタイプ 1 のデータだけを使用できます。比例ハザードモデルは、次の式をとるという前提を持ちます。

h (t, z) = b(t) f (z.β)

b(t) はノンパラメトリックのベースラインハザード、 f (z.β) は共変量ベクトル z とパラメータベクトル β のパラメトリックシフト関数です。一般的に f (z.β)exp(ziβ) として表され、ziβ はベクトルの内積で、これは SURVIVAL で使用される式です。

SURVIVAL は β の最尤推定値をレポートし、LTAB コマンドで h (t, z)b(t) にアクセスすることができます。モデルは、MODEL コマンドと共変量のリストで指定されます。

例を示します。

USE MELANOMA
SURVIVAL
MODEL TIME = ULCER,DEPTH,NODES / CENSOR=CENSOR
ESTIMATE / COX

上記の入力は、3 つの共変量を持つ比例ハザードモデルを当てはめ、次の出力を表示します。

SYSTAT Rectangular file C:\Program Files\SYSTAT 11\Data\MELANOMA.SYD,
created Fri Jun 25, 2004 at 16:20:20, contains variables:

TIME	CENSOR	WEIGHT	SEX	PA	PB
ULCER	DEPTH	NODES	SEX$

Time variable: TIME
Censor variable: CENSOR
Weight variable: 1.0
Input records:           69
Records kept for analysis:           69

Weighted
Censoring          Observations   Observations

Exact Failures                 36
Right Censored                 33

Covariate means

ULCER       =       1.507
DEPTH       =       2.562
NODES       =       3.246

Type 1, exact failures and right censoring only.
Analyses/estimates: Kaplan-Meier, Cox and parametric models
Overall time range: [      72.000 ,     7307.000]
Failure time range: [      72.000 ,     1606.000]

Cox Proportional Hazards Estimation
Time variable: TIME
Censoring: CENSOR

Weight variable: 1.0
Lower time: Not specified

Iter  Step            L-L
0     0       -137.527
1     0       -136.100
2     0       -127.887
3     0       -127.813
4     0       -127.813

Results after 4 iterations
Final convergence criterion:        0.000
Maximum gradient element:        0.000
Initial score test of regression:       37.083 with 3 df
Significance level (p value):        0.000
Final log-likelihood:     -127.813
-2*[LL(0)-LL(4')] TEST:       19.429 with 3 df
Significance level (p value):        0.000
Parameter                Estimate         S.E.      t-ratio      p-value
ULCER                      -0.776        0.376       -2.063        0.039
DEPTH                       0.094        0.050        1.885        0.059
NODES                       0.131        0.053        2.490        0.013

95.0 % Confidence Intervals
Parameter                  Estimate        Lower        Upper
ULCER                      -0.776       -1.514       -0.039
DEPTH                       0.094       -0.004        0.192
NODES                       0.131        0.028        0.235

Covariance matrix

ULCER        DEPTH        NODES
ULCER               0.142
DEPTH               0.006        0.002
NODES              -0.005       -0.000        0.003

Correlation matrix

ULCER        DEPTH        NODES
ULCER               1.000
DEPTH               0.293        1.000
NODES              -0.255       -0.052        1.000

反復ログのサマリーが出力されます。偏尤度は、パラメータのベクトルがすべて 0 である -137.527 から開始され、-127.813 で終了します。

出力には、3 つの係数がすべて初期値 (この場合は 0) に等しいという仮説のスコア検定もレポートされます。自由度 3 を持つカイ 2 乗統計量は 37.083 で、p 値は 0.001 未満です。この検定は、線形回帰を行う SYSTAT モジュール MGLH がレポートする F 検定に似ており、係数の初期値で評価を行うときの対数尤度関数の勾配が 0 であるという仮説の単純な検定です。

Cox モデルの初期値は 0 なので (ユーザーが設定した場合を除く)、統計量は標準的な帰無仮説の検定を行います (ESTIMATE コマンドの START オプションを使用して、他の帰無仮説を簡単に検定することができます)。 前述のスコア検定は、尤度の最終値と初期値の差の 2 倍として定義される尤度検定と漸近的に等しくなります。標本数が多い場合、2 つの検定は一般的によく一致します。この例のように標本数が少ない場合は、統計量にかなりの差が見られることがあります。

Cox モデルのパラメータ推定量を、Weibull のようなフルに指定されたパラメトリックモデルと比較する場合、係数が異なる符号を持つと予測され、尺度係数により異なるということに注意する必要があります。データが実際に、係数と形状パラメータを持つ Weibull モデルに従う場合、比例ハザードのパラメータは (-β / σ) になります (Kalbfleisch と Prentice の 2002 年の論文)。

 

前のページにもどる