21.3 分割表のカイ二乗分析

分割表の χ2 分析を使うのは:

2 x 2 分割表のセルのいずれかに観測値が5つより少ないものがある場合は、フィッシャーの直接法を使います。詳しくは、フィッシャーの直接法 (Fisher Exact Test) をご覧ください。χ2 検定の計算は、行と列が独立であることが前提条件になります。行と列に依存関係がある場合、すなわち、同一の群が連続する2つの処理を受ける場合は、マクニマーの検定を使います。詳しくは、マクニマーの検定 (McNemar’s Test) をご覧ください。

 

1. カイ二乗検定について

カイ二乗検定で分析するのは分割表 (contingency table) のデータです。分割表とは、それぞれの群の個体数がカテゴリごとに分類されたテーブルです。特性やカテゴリの違いが表の列に、群の違いが表の行 (またはその反対) になります。カテゴリと群を組み合わせであるテーブルの各セルには個体数がリストされます。

例えば、2 x 2 分割表では2つの群と2つのカテゴリ (2つの行と2つの列) があり、2 x 3 分割表では、2つの群と3つのカテゴリ、あるいは、3つの群と2つのカテゴリがあるという具合になります。

異なる地域で発見された Lowland (スコットランド) 種と
Alpine (アルプス) 種の個数をあらわす分割表の例
Species Location
  Tundra
(ツンドラ)
Foothills
(山ろく地帯)
Treeline
(高木限界線)
Lowland
(スコットランド)
125 16 6
Alpine
(アルプス)
7 19 117

χ2 検定では、各セルの行の合計と列の合計の百分率をそれぞれ使用して、処理効果がないかセル毎に期待される観測数を計算します。χ2 統計量は、期待度数と観測度数の間の差を要約します。

 

2. カイ二乗検定を実行する

カイ二乗検定 (Chi-Square Test) を実行するには:

  1. ワークシートに適切なデータを入力または配置します。詳しくは、カイ二乗検定のデータを配置するをご覧ください。

  2. 必要があれば、Chi-Square オプションを設定します。

  3. Analysis タブをクリックします。

  4. SigmaStat グループにある Tests ドロップダウンリストから以下を選択します:

    Rates and ProportionsChi-Square

  5. 検定を実行します。

  6. Chi-Square レポートを表示して解釈します。詳しくは、分割表のカイ二乗分析の結果を解釈するをご覧ください。

 

3. カイ二乗検定のデータを配置する

ワークシートに配置できるデータは、分割表形式のデータまたはインデックス付きの生データ形式のいずれかです。

異なる地域で発見された Lowland (スコットランド) 種と
Alpine (アルプス) 種の個数をあらわす分割表の例
Species Location
  Tundra Foothills Treeline
Lowland 125 16 6
Alpine 7 19 117
上記テーブルを元に分割表のデータを配置したワークシートデータ

上記ワークシートの列1から3までが表形式、列4と5が生データになります。

 

4. カイ二乗オプションを設定する

カイ二乗オプションを使用するのは:

 

カイ二乗オプションを変更するには:

  1. 検定オプションの変更後に検定を実行するに際して、検定の実行前にデータを選択しておきたい場合は、対象とするデータ列をポインターでドラッグしておきます。

  2. Analysis タブの SigmaStat グループにある Select Test ドロップダウンリストから Chi-square を選択します。

    Options for Chi-Square ダイアログボックスが表示されます。
    Options for Chi-Square ダイアログボックス

  3. 検定オプションを有効または無効するにはチェックボックスをクリックします。SigmaPlot を次回以降起動するときは、ここで選択したオプションの内容が全て保持されます。

  4. 検定を続行するには、Run Test をクリックします。

  5. 現在の設定内容を適用して、オプションダイアログを閉じるには、OK をクリックします。

 

7.3.4.1 Options for Chi Square

 

5. カイ二乗検定を実行する

検定を実行するには、検定するデータを選択する必要があります。検定ウィザードの Select Data パネルを使用して、検定したいデータを含むワークシートの列を選択したり、お持ちのデータがどのような状態でワークシートに配置されているかを指定します。

カイ二乗検定を実行するには:

  1. 検定の実行前にデータを選択しておきたい場合は、対象とするデータ列をポインターでドラッグしておきます。

  2. Analysis タブをクリックします。

  3. SigmaStat グループにある Tests ドロップダウンリストから次を選択します:

    Rates and ProportionsChi-Square

    Chi-Square — Data Format ダイアログボックスが表示され、データフォーマットを選択するよう指示されます。

  4. Data Format ドロップダウンリストから適切なデータフォーマットを選択します。分割表のデータを検定する場合は、Tabulated を選択します。お持ちのデータが生データの形式で配置されている場合は Raw を選択します。詳しくは、カイ二乗検定のデータを配置するをご覧ください。
    データフォーマットの選択を指示する Chi-Square — Data Format ダイアログ

  5. Next をクリックして検定に使用するデータ列を選択します。検定を選択する前に列を選択していれば、選択された列が selected columns リストに表示されます。列をまだ選択していない場合は、データを選択するようダイアログボックスで指示されます。

  6. Selected Columns リストに別のワークシート列を割り当てたい場合には、ワークシートで直接その列を選択するか、Data for Observations または Data for Category ドロップダウンリストからその列を選択します。

    最初に選択した列は、Selected Columns リストの Observation または Category 行に割り当てられ、二番目以降の列は それぞれ次の行に割り当てられます。各行には、選択した列のタイトルが表示されます。生データの場合、ワークシートの列を2つ選択するよう指示されます。表形式のデータの場合は、64 列を上限とする列を選択するよう指示されます。

  7. 選択した内容を変更するには、リストの割り当てを選択したあと、ワークシートから列を選択しなおします。Selected Columns リストの内容をダブルクリックすることによって、列の割り当てを消去することもできます。
    データ列を選択するよう指示する Chi-Square — Select Data ダイアログボックス

  8. Finish をクリックすると、検定が実行されます。期待値が5よりも小さいセルが分割表に多くある場合、SigmaPlot は以下のいずれかをおこないます:

    分割表の群やカテゴリを見直して、セル数を減らしたり、1セルあたりの観測数を増やすように提案します。テーブルが 2 x 2 分割表の場合は、フィッシャーの直接法が提案されます。

    期待される観測数が5以下のセルが多数ある場合、理論的な χ2 分布では実際の χ2 検定統計量を正確にあらわされないので、算出される P 値に精度を期待できません。

    フィッシャーの直接法 (Fisher Exact Test) では、観測した特定の 2 x 2 分割表の両側確率を正確に計算しますので、全てのセルの期待度数が5を上回る必要はありません。この検定が完了すると、 χ2 検定のレポートが表示されます。詳しくは、分割表のカイ二乗分析の結果を解釈するをご覧ください。

 

6. 分割表のカイ二乗分析の結果を解釈する

χ2 検定のレポートには、分割表データのサマリー、その分布を元に算出された χ2 統計量、および、χ2 の P 値が一覧で表示されます。

カイ二乗検定の結果のレポート例

 

結果の説明

数値による結果に加えて、拡張された結果の説明が表示されることがあります。この説明テキストは、Options ダイアログボックスで有効または無効にすることができます。また、表示する小数点以下の桁数についても Options ダイアログボックスで設定できます。

 

6.1 分割表のサマリー

テーブルのセル毎に各種統計量があらわされます。

 

6.2 カイ二乗

テーブルの各セルの観測度数と期待度数の差の二乗を合計したもので、次式であらわされます。

この計算では、行と列が互いに独立であることが仮定されます。

もし、 χ2 の値が大きいものであれば、分布に差がある (例えば、期待度数と観測度数の間に行と列が独立であることを示す大きな差がある) と結論付けることができます。

χ2 の値がゼロ付近であれば、分割表のパターンが無作為な度数の分布であるときに期待されるものと差がないことを示します。

 

6.3 検出力 (Power)

カイ二乗検定の検出力 (Power)、すなわち感度は、群間に真の差がある場合、その検定で群間の差を検出できる確率です。検出力が 1 に近づくほど、その検定の感度は高くなります。カイ二乗の検出力は、サンプルサイズと測定された各標本の割合によって影響を受けます。この結果は、Options for Chi-Square ダイアログボックスで無効にしない限り表示されます。