9.8 交差検証 (Cross-validation) と Jackknife 分析

GS+ には、2つのタイプの検証 (Validation) 法が用意されています。Cross-validation と Jackknife analysis の2つです。Cross-validation 分析では、空間的領域の測定ポイントのそれぞれが領域から1つずつ除外され、それが無いものとして推定値が計算されます。計算が終わると除外されたポイントは元にもどされ、別のポイントが除外され、以下同様に計算がおこなわれます。こうして、領域内のサンプル位置のそれぞれについて、実際の値に対する推定値で構成されるグラフが作成されます。

Jackknife analysis では、インプットデータとして利用するのとは異なる地点の集合に関して測定値に対して推定値を比較します。jackknife データは、“Define” コマンドを押すと表示されるワークシートで指定します。

Cross-validation と Jackknife 分析は、Conditional Simulation では利用できません。

Cross-validation と Jackknife グラフの各ポイントは、インプットデータセットの中にある実際の値と推定値の位置をあらわします。画面の下側に個々のポイントに関する情報が表示されます。カーソルをポイントに置くとそれぞれの情報が表示されます。上記の例は、ウィンドウの下部に表記されているように、レコード番号 100 をあらわすポイント上にカーソルを置いたものです。グラフを右クリックすると、全てのポイントデータを一覧表示させることができます (下記参照)。

グラフの下に表記される回帰係数 (regression coefficient) は、線形回帰方程式であらわされる最小二乗モデルに関する当てはまりの良さの尺度をあらわします。当てはまりが 1:1 で完全であれば、回帰係数 (傾き) は 1.0 になり、最良の当てはめ直線 (上記グラフの実線) はグラフ上の点線であらわされる 45度線と一致することになります。標準誤差 (上記では SE = 0.162) は、回帰係数の標準誤差のことです。r2 値は、最良の当てはめ直線によって説明される変動の割合です (このケースでは 37.9%、相関係数の二乗です)。また、最良の当てはめ直線の y 切片 (y-intercept) も記載されます。SE Prediction 項は、SD x (1 - r2 ) 0.5 として定義されるもので、ここで、SD = 実際のデータ (グラフの y-軸データ) の標準偏差です。

インプットデータに逆変換なしの変換を選択していれば (Data Summary ウィンドウ参照)、内挿系の正確性とは無関係に Estimated Z 値と Actual Z とは非常に異なるものになります。