三元配置分散分析 (Three Way ANOVA) では、各因子水準に従って群分けされた標本間の差と因子間の交互作用を検定します。
例えば、異なる2種類の薬品の作用について性別による効果の違いを期間を分けて分析するような場合、性別 (gender)、薬品の種類 (drugs)、期間 (time period) がその因子となり、男性 (male) と女性 (female) が Gender 因子の各水準に、薬品の種類 (Drug A と Drug B) が Drug 因子の各水準に、日数が Time Period 因子の各水準に、水準間 (Gender, Drug, Time Period) の異なる組み合わせが群、すなわちセルになります。
三元配置分散分析のデータ
Gender
Male
Female
Drug
Drug A
Drug B
Drug A
Drug B
Time Period
Day
1
Day
2
Day
3
Day
1
Day
2
Day
3
Day
1
Day
2
Day
3
Day
1
Day
2
Day
3
Reaction
1
13
25
2
14
26
3
15
27
4
16
28
5
17
29
6
18
30
7
19
31
8
20
32
9
21
33
10
22
34
11
23
35
12
24
36
因子に該当するのは、性別 (gender)、薬品の種類 (Drug)、および、期間 (Time Period) です。各因子の水準は、それぞれ Male/Female, Drug A/Drug B, および Day 1, 2, 3 になります。
Three Way ANOVA の理想的なデータは、完全に釣り合いがとれているものです。例えば、ある実験における各群またはセルの観測数がそれぞれ同じで、欠損データが無いものです。ただし、欠損値や釣り合いがとれていないデータがあっても、それらは自動的に SigmaPlot によって適切な処理が行われます。
欠損データポイント欠損値 (missing value) が存在する場合、SigmaPlot は一般線形モデル (general linear model) によるアプローチを使用して自動的に処理します。このアプローチでは、周辺平方和 (marginal sums of squares:一般にタイプ III の平方和、または、調整平方和 (adjusted sums of squares) とも呼ばれます) を使用した仮説検定が構成されます。
正規性および等分散の P 値:P Value to Reject ボックスに該当する P 値を入力します。P 値により、データが正規分布していないと誤って結論付ける確率が決定されます (P 値は、データが正規分布しているという帰無仮説を誤って棄却してしまうリスクです)。検定によって求められた P 値が、ここで設定した P 値よりも大きければ、検定は採択 (Pass) されます。正規性と等分散の要件をより厳密なものにするには、この P 値を大きくします。パラメトリックな統計手法では、仮説の棄却が比較的ロバスト (頑健) に検出されることから、SigmaPlot ではこの値を 0.050 としています。P 値をこれよりも大きくすると (例えば、0.100)、そのデータに正規性がないとの判定が出やすくなります。正規性の要件を緩和するには、P 値を小さくします。正規性があるという仮説を棄却するための P 値に小さい値しか要求しないということは、前提とする正規分布からデータが外れていても、それが非正規であると判定される前に、それだけ広く受け入れたいとする意思があることを意味します。例えば、P 値を 0.050 とした場合、あるデータを非正規であると判定するには、0.100 の場合と比べてそれだけ大きく正規性を逸脱していなければなりません。
※ Note:データの分布が極端な状態にあり、これらの手法では検定できない場合があります。たとえば、ルビーンの中央値検定 (Levene Median test) では、分散の大きさが数次の場合は差の検出ができません。このような条件の場合は、前提条件の自動検定に頼らずにデータを視覚的に調べることで容易に見分けることができます。
4.2 Options for Three Way ANOVA: Results
Options for Three Way ANOVA ダイアログボックスに Summary Table, Residuals オプションを表示した例。
Multiple Comparison (多重比較):三元配置分散分析 (Three Way ANOVA) では、幾つかの処理群の間に差がないという仮説を検定しますが、どの群に差があるのか、すなわち、群間の差の大きさは分かりません。三元配置分散分析で差が検出されたときに、多重比較によりこれらの差を特定します。ANOVA で差を検出するか否かの判定に使用する P 値は、Options ダイアログボックスの Report タブで設定します。三元配置分散分析 (Three Way ANOVA) で求められた P 値が、このボックスで指定した P 値よりも小さければ、群間に差が検出されたことになるので、多重比較が実行されます。
Always Perform:Three Way ANOVA で差が検出されたか否かにかかわらず常に多重比較を実行します。
Only When ANOVA P Value is Significant:ANOVA で差が検出されたときだけ多重比較を実行します。
Significance Value for Multiple Comparisons:Significance Value for Multiple Comparisons ドロップダウンリストから .05 または .01 を選択します。この値は、多重比較で処理間に有意差があると誤って結論付ける見込みを決定します。値が .05 であれば、多重比較で誤って差を検出する可能性が 5% 以下であれば多重比較で差が検出されることになります。値が .10 であれば、多重比較で誤って差を検出する可能性が 10% 以下であれば多重比較で差が検出されることになります。(※ v14 では Σ > Options > Report タブの Test Results で指定します)
SigmaStat グループにある Tests ドロップダウンリストから次を選択します:Compare Many Groups → Three Way ANOVAThe Three Way ANOVA — Select Data パネルが表示されます。 Three Way ANOVA — Select Data ダイアログボックス
Selected Columns リストに別のワークシート列を割り当てたい場合には、ワークシートで直接その列を選択するか、Data for Data ドロップダウンリストからその列を選択します。Selected Columns リストの一行目に割り当てられるのは最初に選択した列で、以後同様に列を選択するごとにリストの2行目以降に割り当てられてゆきます。各行には、選択した列の番号またはタイトルが表示されます。ワークシートの3列を最低限選択するよう指示されます。
正規性と等分散性を検定するよう選択しており、 お持ちのデータがどちらの検定にも合格しなかった (failed) 場合、 そのまま検定を続けるか、または、データを変換したあと、その変換したデータに対して Three Way ANOVA を実行するかを選択できます。 お持ちのデータに欠損データポイント、欠損セルがある場合、すなわち、釣り合いが取れていない場合、適切なプロシージャを実行するよう指示されます。
6. 三元配置分散分析の多重比較オプション
Three Way ANOVA Options ダイアログボックスで、多重比較を実行するよう選択しており、3つの因子のいずれか、または、3因子の間の交互作用について、ANOVA で算出された P 値が、多重比較のトリガーとなる P 値と等しいか小さかった場合、Multiple Comparison Options ダイアログボックスが表示され、多重比較の検定法を指定するよう指示されます。
このダイアログボックスには、3つの実験因子の P 値と因子間の交互作用の P 値が表示されます。選択できるオプションは、Options ダイアログボックスで指定した値と同じか小さい P 値を持つもののみです。選択されたオプションをクリックすることで、その因子の多重比較検定を無効にすることができます。いずれの因子も選択していなければ、多重比較の結果はレポートされません。
完全な Three Way ANOVA レポートには、各因子とそれらの交互作用に関連する変動をあらわす分散分析表が表示されます。この表に表示される内容は、自由度 (DF: degrees of freedom)、平方和 (SS: sum of squares)、データテーブルの各要素の平均平方 (MS: mean squares)、および、F 統計量とそれに対応する P 値です。
Three Way ANOVA のレポート例
因子別の最小二乗平均 (Least square means) と3つ全ての因子を組み合わせた最小二乗平均のサマリー表を作成することも可能です。この結果とそれ以外の結果は、Options for Three Way ANOVA ダイアログボックスで有効にすることができます。選択したチェックボックスをクリックすることで、検定オプションを有効または無効にすることができます。オプションに設定した全ての内容は、SigmaPlot を次回起動したときも引き継がれます。
また、多重比較の表を作成することも可能です。多重比較の結果についても、Options for Three Way ANOVA ダイアログボックスで指定します。多重比較で使用される検定法は、Multiple Comparison Options ダイアログボックスで指定したものです。
正規性の検定:正規性の検定 (Normality test) の結果には、正規母集団から抽出されたデータであるという前提条件の検定にお持ちのデータが合格したか (passed) 不合格したか (failed) 、および、この検定で算出された P 値が表示されます。全てのパラメトリック検定では、元になる母集団が正規分布に従っていることが要求されます。この結果は、Options for Three Way ANOVA ダイアログボックスで正規性の検定を有効にしている場合に表示されます。
等分散性の検定:等分散性の検定 (Equal Variance test) の結果には、同じ分散を持つ母集団から標本が抽出されているという前提条件の検定にお持ちのデータが合格したか (passed) 不合格したか (failed) 、および、この検定で算出された P 値が表示されます。元になる母集団の分散が等しいことは、全てのパラメトリック検定の前提条件となります。この結果は、Options for Three Way ANOVA ダイアログボックスで等分散性の検定を有効にしている場合に表示されます。
分散分析表:分散分析表には、三元配置分散分析の結果が一覧で表示されます。
※ Note:欠損データが存在する場合、これらの値を見積もる最良の方法は、一般線形モデル (general linear model ) を使用して自動的に計算することです。
DF (Degrees of Freedom: 自由度):自由度 (Degrees of freedom) は、分散分析の感度 (検出力) に影響する各因子の群数とサンプルサイズをあらわします。
交互作用を検定する F 比は: F 比が 1 前後である場合、因子水準の間に有意差がないか、因子間に交互作用がないと結論付けることができます (例えば、すべての標本が同じ母集団から抽出されているという帰無仮説にデータ群が一致する)。
F 統計量が大きい値の場合、その因子または因子の組合せの標本のうち少なくとも1つは、異なる母集団から抽出されたものであると結論付けることができます (例えば、そのばらつきは、母集団のランダムな変動から期待されるものよりも大きい)。具体的にどの群が異なっているかを判断するには、多重比較の結果を調べます。
P 値:P 値は、群間に真の差があると誤って結論付けてしまう確率です (例えば、F 値に基づいて帰無仮説を誤って棄却する、すなわち、第1種の誤り (Type I error) を犯してしまう確率です) 。P 値が小さいほど、異なる母集団から標本が抽出されている確率は大きくなります。伝統的には、P < 0.05 の場合は、有意差があると結論付けることができます。
Power:Three Way ANOVA の検出力 (Power)、すなわち感度は、群間に真の差がある場合、その検定で群間の差を検出できる確率です。検出力が 1 に近づくほど、その検定の感度は高くなります。2つの因子内の群比較の検出力と、交互作用の比較の検出力が全て表示されます。これらの結果は、Options for Three Way ANOVA ダイアログボックスで設定します。ANOVA の検出力は、サンプルサイズ、比較する群の数、誤って差があるとレポートする可能性、すなわち、α (alpha)、観測される群の平均値の差、および、観測される標本の標準偏差によって影響を受けます。
Alpha:アルファ (α) は、誤って差があると結論付けすることが許容される確率です。この誤りを、第一種の誤り (Type I error) と呼ぶこともあります (第一種の誤りは、仮説が真であるにもかかわらずそれを価値がないとして棄却するときです)。アルファ (α) の値は、Options for Three Way ANOVA ダイアログボックスで設定します。提示される α = 0.05 という値は、許容される誤りが 20分の1であること、すなわち、P < 0.05 であれば有意差があると結論付けることを示します。α の値を小さくするほど、有意差があるとの結論付けに至る要件はそれだけ厳格になりますが、その反面、差があるにもかかわらず差がないと結論付けてしまう可能性は高くなります (第2種の誤り:Type II error)。α の値を大きくすれば、差があるという結論付けは容易になりますが、その反面、差があると誤って判断してしまうリスクは高くなります (第1種の誤り:Type I error)。
サマリーテーブル:それぞれの因子ごと、および、各因子の組合せ (サマリーテーブルのセル) ごとに最小二乗平均 (least square means) と平均値の標準誤差 (Standard error of the means) が表示されます。欠損値がある場合、一般線形モデルを使用して最小二乗平均が計算されます。
多重比較:群間に差が見つかった場合、多重比較表が計算されます。多重比較プロシージャーは、Options for Three Way ANOVA ダイアログボックスで有効にします。多重比較で使用する検定法は、Multiple Comparisons Options ダイアログボックスで設定します。ANOVA の結果からは、3つ以上の群に差があるかどうかまでしか分からないため、具体的にどの処理 (処置) が異なっているかを判断するには、多重比較の結果を使用します。完全三元配置分散分析の3因子の多重比較では、次も比較します: