日本語 English
株式会社ヒューリンクス
TEL:03-5642-8384
営業時間:9:00-17:30

17.4 群比較に使用する検定を選ぶ

平均値や中央値で標本の差を検定するには、群比較のプロシージャが各種用意されています。

Advisor Wizard を使って使用するデータと最終目標に関する質問に答えれば、適切な検定を選び出すことができますが、比較の要件について既に詳しい知識をお持ちであれば、適切な検定を直接指定することもできます。適切なプロシージャを選択するのに必要な条件は以下のとおりです:

  • 比較する群の数。比較する対象は、異なる2群ですか、それとも、多群ですか?
  • 標本データの従う分布。使用する標本の元になる母集団の分布は、ベル型の正規 (ガウス) 曲線に従っていますか、従っていませんか?正規母集団に由来する標本の比較には、正規分布に従う母集団の平均値と標準偏差を決めるパラメータに基づくパラメトリック検定を使用します。母集団が正規分布に従わない場合は、ノンパラメトリック、すなわち、検定を行う前に新たな順序尺度に沿って値に順位を付ける、分布によらない (distribution-free) 検定を使用することになります。
Tip:SigmaPlot では、正規性と等分散の仮説が自動的に検定されます。詳しくは、2群以上を比較する をご覧ください。
  1. 2群の比較を使う場合
  2. 多群の比較を使う場合
  3. 1元、2元、および、3元配置の分散分析を使う場合
  4. 異なる群を決定する方法

1. 2群の比較を使う場合

使用するデータが異なる2群の被験者から収集されたものである場合 (例えば、異なる2群の魚種、あるいは、異なる2つの地域の有権者など)、2群の比較を使用して、無作為に抽出した場合に起こり得る差を上回る有意な差があるかを検定します。

t 検定とマン=ホイトニーの順位和検定を使う場合

2群の比較には、2種類の検定を実行できます:対応のない t 検定と、マン=ホイトニーの順位和検定 (Mann-Whitney Rank Sum Test) です。

  • 収集した標本の母集団が正規分布に従うもので、2つの母集団の分散が等しい場合は、対応のない t 検定を選択します。対応のない t 検定は、標本データを直接比較するパラメトリック検定です。詳しくは、対応のない t 検定 をご覧ください。
  • 収集した標本の母集団が正規分布に従わないものであるか、または、分散が等しくないものであるかのいずれかまたは両方である場合、マン=ホイトニーの順位和検定 (Mann-Whitney Rank Sum Test) を選択します。マン=ホイトニーの順位和検定では、データを直接的に検定するのではなく、データを順位付けした集合として配置したあと、その順位の合計に対して対応のない t 検定を実行します。詳しくは、マン=ホイトニーの順位和検定 をご覧ください。
  • 標本が、悪い (poor)、まあまあ (fair)、良い (good)、非常に良い (very good)、といった定性的な階級に従って既に順位付けされている場合は、マン=ホイトニーの順位和検定 (Mann-Whitney Rank Sum Test) を使用します。

正規性と等分散性を前提条件とする t 検定の長所は、マン=ホイトニーの順位和検定よりも若干感度が高い (例えば、検出力が高い) 点にあります。これらの前提条件が満たされなければ、マン=ホイトニーの順位和検定を使います。

Tip:お持ちのデータの正規分布と等分散性の検定は SigmaPlot を使って分析することができます。正規性と等分散性を仮定する前提条件が退けられた場合は、別のパラメトリック検定またはノンパラメトリック検定が提案されます。各前提条件の検定の有効化と設定は、t 検定およびマン=ホイトニーの順位和検定のオプションダイアログボックスで行います。

SigmaPlot の正規性 (Normality) の検定では、シャピロ=ウィルク (Shapiro-Wilk) またはコルモゴロフ=スミノフ (Kolmogorov-Smirnov) 検定のいずれかが、また、等分散性 (Equal Variance) の検定ではルビーンの中央値検定 (Levene Median test) が使用されます。

2. 多群の比較を使う場合

3群以上の異なる被験者からデータを収集した場合、ANOVA (analysis of variance) プロシージャのいずれかを使用して、無作為に抽出した場合に起こり得る差を上回る差が群間に存在するかどうかを検定します。

利用できるプロシージャには以下の4つがあります:

  • 1因子または一元配置分散分析 (One Way ANOVA)。詳しくは、一元配置分散分析 (ANOVA) をご覧ください。
  • 二元配置分散分析 (Two Way ANOVA)。詳しくは、二元配置分散分析 (ANOVA) をご覧ください。
  • 三元配置分散分析 (Three Way ANOVA)。詳しくは、三元配置分散分析 (ANOVA) をご覧ください。
  • クラスカル=ウォリスの順位に基づく分散分析。詳しくは、クラスカル=ウォリスの順位に基づく分散分析 をご覧ください。
  • 標本を採集した母集団が、正規分布に従い、かつ、分散が等しい場合は、一元、二元、または、三元配置分散分析を選択します。一元、二元、および、三元配置分散分析は、標本を算術的に直接比較するパラメトリック検定です。
  • 標本を採集した母集団が、正規分布に従わないか、等分散でないかのいずれか又は両方の場合は、一元配置分散分析のノンパラメトリック版であるクラスカル=ウォリスの順位に基づく分散分析 (Kruskall-Wallis ANOVA on ranks) を選択します。クラスカル=ウォリスの順位に基づく分散分析では、データを直接使用するのではなく、データを順位付けした集合として配置したあと、これらの順位を元に分散分析を行いますので、正規性と等分散性を前提条件とする必要はありません。

パラメトリックな ANOVA を使うメリットは、母集団の正規性と等分散性の前提条件が満たされたときは、こちらの方が順位に基づく分析と比べて感度がわずかに高くなる (例えば、検出力が高くなる) という点にあります。この前提条件が満たされない場合は、クラスカル=ウォリスの順位に基づく分散分析 (Kruskall-Wallis ANOVA on ranks) を使います。

制限事項:SigmaPlot には、2因子について順位に基づく分散分析を実行できる機能はありません。

なお、SigmaPlot でデータの正規性と等分散性を分析することもできます。正規性と等分散性の前提条件が退けれられた場合は、別のパラメトリック検定またはノンパラメトリック検定が提案されます。正規性と等分散性の検定は、Options ダイアログボックスで指定します。

現在使用している検定のダイアログボックスを開くには、その Options ボタンをクリックします:

SigmaPlot の正規性 (Normality) の検定では、シャピロ=ウィルク (Shapiro-Wilk) または (コルモゴロフ=スミノフ) Kolmogorov-Smirnov 検定のいずれかが、また、等分散性 (Equal Variance) の検定ではルビーンの中央値検定 (Levene Median test) が使用されます。

3. 1元、2元、および、3元配置の分散分析を使う場合

1元、2元、および、3元配置の分散分析の違いは、データを作成する実験計画 (design) の違いにあります。

  • 互いに関連する一組の治療 (処理) を異なる複数の実験群がそれぞれ受ける場合は (例えば、1因子)、一元配置分散分析 (One Way ANOVA) を使います。詳しくは、一元配置分散分析 (ANOVA) をご覧ください。この計画は、対応のない t 検定と基本的に同じものです (2群の一元配置分散分析では、対応のない t 検定とまったく同じ P 値を求めます)。詳しくは、対応のない t 検定 をご覧ください。
  • 実験因子が実験群のそれぞれに2つある場合は、二元配置分散分析 (Two Way ANOVA) を使います。詳しくは、二元配置分散分析 (ANOVA) をご覧ください。
  • 実験因子が実験群のそれぞれに3つある場合は、三元配置分散分析 (Three Way ANOVA) を使います。詳しくは、三元配置分散分析 (ANOVA) をご覧ください。

例えば、進化論に関する知識について、異なる3つの州の生物学の教師の間に差があるかどうかを比較する場合は、一元配置分散分析 (One Way ANOVA) を使うことになるでしょう。このとき変動させる因子は州になります。

例えば、進化論に関する知識について、異なる3つの州からそれぞれ教育水準の異なる教師を選び、その間に差があるかどうかを比較する場合は、二元配置分散分析 (Two Way ANOVA) を使うことになるでしょう。この場合、州と就学年数が異なる2つの因子となります。この2因子の計画で検定されるのは、州と教育水準に関する以下の3つの仮説です:

  • 州間に教師の意見に関する差はない。
  • 教育水準間に知識に関する差はない。
  • 州と教育水準の間に知識に関する交互作用はない。教育水準の違いでもたらされる知識の差はあるにせよ、それらは全ての州で同じである。

例えば、進化論に関する知識について、異なる3つの州からそれぞれ教育水準の異なる教師を男女別に選び、その間に差があるかを比較する場合は、三元配置分散分析 (Three Way ANOVA) を使うことになるでしょう。この場合、ジェンダー、州、および、就学年数の3つがそれぞれ因子となります。この3因子の計画で検定される仮説は以下のとおりです:

  • ジェンダー間に教師の意見に関する差はない。
  • 州間に教師の意見に関する差はない。
  • 教育水準間に知識に関する差はない。
  • ジェンダー、州、および、教育水準の間に知識に関する交互作用はない。教育水準の違いでもたらされる知識の差はあるにせよ、それらは全ての州のすべての男女で同じである。

4. 異なる群を決定する方法

分散分析の手法では (パラメトリックであってもノンパラメトリックであっても) 、群間に差がないという仮説を検定しますが、その差が何であるかを指し示すわけではありません。SigmaPlot に用意されている多重比較プロシージャ (post-hoc tests: 事後検定) を使えば、これらの差を区別することができます。

群間の差を常に検定するには、ANOVA オプションダイアログにある Post Hoc TestsAlways Perform を選択します。Only When ANOVA P Value is Significant オプションを選択して、その条件とする P 値を選択すれば、ANOVA の P 値が有意であるときのみ多重比較で差の検定を使用するよう指定することもできます。

各 ANOVA で使用する特定の多重比較プロシージャは、Multiple Comparison Options で選択します。このダイアログを開くには:

  1. Analysis タブの Analysis グループにある Options をクリックします。