Tabulated Data :表形式のデータは、観測数を分割表の各セルに配置してあらわしたものです。ワークシートの行と列は、それぞれ群とカテゴリに対応します。観測数は整数である必要があります。なお、群とカテゴリに対応する行列の並びと配置は、重要ではない点に注意してください。カテゴリに行を、群に列を使っても、その逆を使ってもかまいません。
Raw Data:ワークシートの1つの列に群を、もう一つの列に対応するカテゴリを配置することによって個々の観測データの群とカテゴリをレポートすることができます。それぞれの行は1つの観測データに対応するので、データの行数は観測データの総数と同じだけあることになります。SigmaPlot はこれらのデータがら自動的にクロス表を作成し、できあがった分割表に対して χ2 分析を実行します。
SigmaStat グループにある Tests ドロップダウンリストから次を選択します:Rates and Proportions → Chi-SquareChi-Square — Data Format ダイアログボックスが表示され、データフォーマットを選択するよう指示されます。
Data Format ドロップダウンリストから適切なデータフォーマットを選択します。分割表のデータを検定する場合は、Tabulated を選択します。お持ちのデータが生データの形式で配置されている場合は Raw を選択します。詳しくは、カイ二乗検定のデータを配置するをご覧ください。 データフォーマットの選択を指示する Chi-Square — Data Format ダイアログ
Next をクリックして検定に使用するデータ列を選択します。検定を選択する前に列を選択していれば、選択された列が selected columns リストに表示されます。列をまだ選択していない場合は、データを選択するようダイアログボックスで指示されます。
Selected Columns リストに別のワークシート列を割り当てたい場合には、ワークシートで直接その列を選択するか、Data for Observations または Data for Category ドロップダウンリストからその列を選択します。最初に選択した列は、Selected Columns リストの Observation または Category 行に割り当てられ、二番目以降の列は それぞれ次の行に割り当てられます。各行には、選択した列のタイトルが表示されます。生データの場合、ワークシートの列を2つ選択するよう指示されます。表形式のデータの場合は、64 列を上限とする列を選択するよう指示されます。
Yates Correction:イェーツの補正を使って χ2 を補正します。これによって、2 x 2 分割表の P 値が実際の χ2 分布を反映するように精度を高めます。イェーツの補正を有効にするには、Options for Chi-Square ダイアログボックスで指定しますが、適用できるのは 2 x 2 分割表のみとなります。
P Value:P 値は、観測数の分布に真の差があると誤って結論付けてしまう確率です (例えば、χ2 に基づいて帰無仮説を誤って棄却する、すなわち第一種の誤り (Type I error) を犯す確率)。 P 値が小さいほど、標本がカテゴリ間に異なる分布をもつ母集団から抽出される確率は高くなります。伝統的には、P < 0.05 であれば、有意差があると結論付けることができます。
6.3 検出力 (Power)
カイ二乗検定の検出力 (Power)、すなわち感度は、群間に真の差がある場合、その検定で群間の差を検出できる確率です。検出力が 1 に近づくほど、その検定の感度は高くなります。カイ二乗の検出力は、サンプルサイズと測定された各標本の割合によって影響を受けます。この結果は、Options for Chi-Square ダイアログボックスで無効にしない限り表示されます。
アルファ:アルファ (α) は、誤って差があると結論付けすることが許容される確率です。この誤りを、第一種の誤り (Type I error) と呼ぶこともあります (第一種の誤りは、効果がないという帰無仮説が真であるにもかかわらずそれを棄却するときです)。α 値は、Power Option ダイアログボックスで設定します。提示される α = 0.05 という値は、許容する誤りを 20分の1にすることを示します。α の値を小さくするほど、有意差があるとの結論に至る要件はそれだけ厳格になりますが、その反面、差があるにもかかわらず差がないと結論付けてしまう可能性は高くなります (第二種の誤り:Type II error)。α の値を大きくすれば、差があるという結論付けは容易になりますが、その反面、誤った差をレポートするリスクが高まります (第一種の誤り:Type I error)。