22.4 主成分分析オプションを設定する
主成分分析オプションを使うのは:
- 分析の行列オプションを設定するとき。
- 固有値を設定するとき。
- 前提条件のチェック (assumption checking) オプションを設定するとき。
- 残差の表示とワークシートへの保存を指定するとき。
- データの統計サマリを表示するとき。
- 検出力、すなわち、この検定の感度を計算するとき。
オプションの設定は、SigmaPlot を次回起動したときも引き継がれます。
オプションを変更するには:
- Analysis タブの Statistics グループにある Select Test ドロップダウンリストから Principal Component Analysis を選択します。
- Options をクリックします。Options for Principal Component Analysis ダイアログボックスに以下の4つのタブが表示されます:
※ Tip: 検定オプションの変更後に検定を実行するに際して、検定の実行前にデータを選択しておきたい場合は、対象とするデータ列をポインターでドラッグしておきます。 |
オプションの設定内容は、SigmaPlot を次回起動するときも保持されます。
- 検定を続行するには、Run Test をクリックします。
- 現在の設定内容を適用して、オプションダイアログを閉じるには、OK をクリックします。
Options for Principal Components Analysis: Criterion
ダイアログボックスの Criterion タブをクリックすると、Matrix for Analysis と Selection Method for
Components オプションが表示されます。
- Matrix for Analysis:選択した行列に応じてオリジナルの変数の尺度が変わります。
- Correlation:観測データの尺度が変数によって異なる場合は Correlation (相関) を選択します。Correlation の方が一般的であるためこれがプログラムのデフォルトとなっています。
- Covariance:観測データの尺度が変数によって殆ど同じ場合は Covariance (共分散) を選択します。こちらのオプションが統計量は多くなります。
- Selection Method for Components:モデルにあらわれる主成分は、共分散行列や相関行列の特定の閾値より上にあるデータの全分散への寄与率が最大となる固有値 (eigenvalues) に対応します。
- Average eigenvalue:これがデフォルトになります。
- Minimum eigenvalue:データ縮約モデルに含める行列の全ての固有値をこの値以上にしたい場合は、Minimum eigenvalue (最小固有値) を選択します。デフォルトの値はゼロで、この場合は全ての固有値が含まれます。
- Minimum percent of total:行列の固有値を、最大から初めて、その合計がこの値以上になるまで追加したい場合は Minimum percent of total (全分散の最小百分率) を選択します。ここで追加された固有値はいずれもデータ縮約モデルに含まれます。デフォルトの値はゼロで、この場合は全ての固有値が含まれます。
- Number of components:このオプションを選択し、その値に n を入力すると、固有値の最大数 n に対応する成分がデータ縮約モデルに含まれることになります。
- Significance level for hypothesis (仮説検定の有意水準):P 値を設定します。デフォルトの値は .05 です。固有値の等しさの検定、スコアに関する Hotelling の T 二乗統計量、および、残差に関する Q 統計量に使用します。
- Confidence level (信頼水準):信頼水準の百分率を設定して固有値の信頼限界を設定します。有効な値は 1 から 99 までの整数です。デフォルトの値は 95% です。
Options for Principal Components Analysis: Assumption Checking
正規性の前提条件の検定では、母集団が正規分布に従っているかチェックします。
※ Tip: 主成分分析には、Equal Variance の選択肢はありません。主成分分析は、選択した母集団の個体それぞれに対してではなく各個体の変化に基づいて検定を行うからです。従って、等分散性を検定する必要はありません。 |
Assumption
Checking オプションを表示した
Options for Principal Component Analysis ダイアログボックス
 |
Normality の検定:SigmaPlot の主成分分析では、母集団の分布の正規性検定に Henze-Zinkler または Mardia's test for
skewness and kurtosis のいずれかを使用します。
- P Value to Reject:P Value to Reject ボックスに該当する P 値を入力します。P 値により、データが正規分布していないと誤って結論付ける確率が決定されます (P 値は、データが正規分布しているという帰無仮説を誤って棄却してしまうリスクです)。検定によって求められた P 値が、ここで設定した P 値よりも大きければ、帰無仮説が採択 (Pass) されます。
正規性と等分散のいずれか又は両方の要件をより厳密なものにするには、この P 値を大きくします。パラメトリックな統計手法では、仮説の棄却が比較的ロバスト (頑健) に検出されることから、SigmaPlot ではこの値を 0.050 としています。P 値をこれよりも大きくすると (例えば、0.100)、そのデータに正規性がないとの判定が出やすくなります。
正規性の要件を緩和するには、P 値を小さくします。正規性があるという仮説を棄却するための P 値に小さい値しか要求しないということは、前提とする正規分布からデータが外れていても、それが非正規であると判定される前に、それだけ広く受け入れたいとする意思があることを意味します。例えば、P 値を 0.050 とした場合、あるデータを非正規であると判定するには、0.100 の場合と比べてそれだけ大きく正規性を逸脱していなければなりません。
※ 制限事項:この正規性の検定は、ロバスト (頑健) に母集団のデータを非正規であると検出しますが、データの分布が極端な状態にあると検定できない場合があります。このような条件の場合は、前提条件の自動検定に頼らずにデータを視覚的に調べることで容易に見分けることができます。 |
Options for Principal Components Analysis: Residuals
- Component Scores:結果をワークシートに表示させたい場合は、このオプションを選択したあと、in
Column ドロップダウンリストから (none) または First Available Column を選択します。
- Residuals:ワークシートに残差を表示するには、このオプションを選択したあと、 in Column ドロップダウンリストから (none) または First Available Column を選択します。
残差オプションを選択した Options for Principal Component ダイアログ
 |
Options for Principal Components Analysis: Results
以下の結果をレポートやワークシートの列に出力します。
- Covariance matrix
- Component loadings
- Proportion of variance explained by in-model components
- Fitted covariance matrix
- Difference between original and fitted covariance matrix
Results オプションを選択した Options for Principal Component ダイアログ
 |