17.7 予測や相関の手法を選ぶ

ある変数の値を、それ以外の単一または複数の変数から予測したい場合は、回帰手法を使用して予測方程式を推測することで、ある変数が他の変数と関連性があるか否かをあらわす相関係数を計算することができます。

 

3.7.1 変数の予測に回帰を使用する場合

回帰手法は、数学的モデルの係数を見積もることによって、ある変数 (従属変数) の値を単一または複数の独立変数から予測するのに使います。回帰では、従属変数の値は常に独立変数の値によって決定されることが仮定されます。回帰は、データに対する直線または曲線の当てはめとしても知られています。

回帰は、残差 (予測値と観測される従属変数の値との差: residuals) が一定の分散で正規分布に従うと仮定するパラメトリックな統計手法です。

使用する回帰プロシージャのタイプは、独立変数の数と、従属変数と独立変数の関係の形によって変わります。回帰の実行には、Simple Linear Regression (単純線形回帰), Multiple Linear Regression (多重線形回帰), Multiple Logistic Regression (多重ロジスティック回帰), Polynomial Regression (多項式回帰)、および、Nonlinear Regression (非線形回帰) を使用することができます。

独立変数の候補が多重線形回帰モデルに寄与するか否かを判断するには、Forward and Backward Stepwise Regression (前進型・後退型の段階的回帰) または Best Subset Regression (ベストサブセット回帰) を使います。

Tip:これらのプロシージャを使って多重線形回帰 (Multiple Linear Regression) モデルを求めることができます。曲線型のデータセットには、多項式 (Polynomial) または非線形回帰 (Nonlinear Regression) を選択してください。

 

3.7.2 相関を使用する場合

2変数間の関係 (relationship) を、どちらが従属変数でどちらが独立変数かを指定せずに数量化したい場合は、相関係数 (correlation coefficient) を計算します。相関は、ある変数の値から別の変数の値を予測するものではありません:ある変数と別の変数との間の関係の強度を数量化するのみです。

計算できる相関係数には次の2つの種類があります:Pearson Product Moment Correlation ピアソンの積率相関係数と、Spearman Rank Order Correlation スピアマンの順位相関係数です。

ピアソンの積率相関は、正規性と定分散を前提としているため、スピアマンの順位相関と比べて感度が若干高い (例えば、検出力の値が高い) というメリットがあります。