19.7 三元配置分散分析 (ANOVA)
三元配置 (Three Way) すなわち3因子の ANOVA (分散分析) を使うのは:
- 2つ以上の異なる実験群が3つの異なる因子によって影響を受けるか否か、3つの因子に交互作用があるか否かを調べたいとき。
- 標本が分散の等しい正規分布の母集団から抽出されているとき。
実験群に対する単一または2因子の効果を考慮する場合は、一元配置分散分析または二元配置分散分析を使います。詳しくは、一元配置分散分析 (ANOVA)、または、二元配置分散分析 (ANOVA) をご覧ください。非正規母集団から抽出された標本の3因子を比較するノンパラメトリック的手法は SigmaPlot には用意されていません。お持ちのデータが正規分布に従っていない場合は、トランスフォーム機能を使用して、そのデータを分散分析の前提条件を満たすように変換することができます。標本サイズが大きく、実行するのがノンパラメトリック検定である場合、Rank トランスフォームを使用して観測値を順位に変換したあと、その順位に基づいて三元配置分散分析を実行します。
- 三元配置分散分析について
- 三元配置分散分析を実行する
- 三元配置分散分析のデータを配置する
- 欠損データと空白セルデータ
- 連結データと非連結データについて
- ワークシートデータを入力する
- 三元配置分散分析オプションを設定する
- Options for Three Way ANOVA: Assumption Checking
- Options for Three Way ANOVA: Results
- Options for Three Way ANOVA: Post Hoc Tests
- 三元配置分散分析を実行する
- 三元配置分散分析の多重比較オプション
- 三元配置分散分析の結果を解釈する
- 結果の説明
- 三元配置分散分析のレポートグラフ
- Three Way ANOVA レポートのグラフを作成する方法
1. 三元配置分散分析について
三元配置 (three way) すなわち3因子の分散分析では、実験群ごとに異なる3つの実験因子 (experimental factor) があります。各因子水準に従って群分けされた標本間の差と因子間の交互作用を検定するには、3因子の計画を使います。
3因子の分散分析では次の4つの仮説を検定します:
- 第一因子の水準間に差はない。
- 第二因子の水準間に差はない。
- 第三因子の水準間に差はない。
- 因子間に交互作用はない。例えば、ある因子において群間に何らかの差があるとすれば、その差は第二および第三因子の水準がどうであっても変わらない。
三元配置分散分析 (Three Way ANOVA) は、すべての標本が分散の等しい正規分布母集団から抽出されていることを前提条件とするパラメトリック検定です。
2. 三元配置分散分析を実行する
三元配置分散分析 (Three Way ANOVA) を実行するには:
- ワークシートに適切なデータを入力または配置します。詳しくは、三元配置分散分析のデータを配置する をご覧ください。
- 必要があれば、Three Way ANOVA オプションを設定します。
- Analysis タブをクリックします。
- SigmaStat グループにある Tests ドロップダウンリストから以下を選択します:
Compare Many Groups → Three Way ANOVA
- 検定を実行します。
- レポートグラフを作成します。詳しくは、三元配置分散分析のレポートグラフ をご覧ください。
3. 三元配置分散分析のデータを配置する
三元配置分散分析 (Three Way ANOVA) では、各因子水準に従って群分けされた標本間の差と因子間の交互作用を検定します。
例えば、異なる2種類の薬品の作用について性別による効果の違いを期間を分けて分析するような場合、性別 (gender)、薬品の種類 (drugs)、期間 (time period) がその因子となり、男性 (male) と女性 (female) が Gender 因子の各水準に、薬品の種類 (Drug A と Drug B) が Drug 因子の各水準に、日数が Time Period 因子の各水準に、水準間 (Gender, Drug, Time Period) の異なる組み合わせが群、すなわちセルになります。
三元配置分散分析のデータ
Gender |
Male |
Female |
Drug |
Drug A |
Drug B |
Drug A |
Drug B |
Time Period |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Reaction |
1
13
25 |
2
14
26 |
3
15
27 |
4
16
28 |
5
17
29 |
6
18
30 |
7
19
31 |
8
20
32 |
9
21
33 |
10
22
34 |
11
23
35 |
12
24
36 |
因子に該当するのは、性別 (gender)、薬品の種類 (Drug)、および、期間 (Time Period) です。各因子の水準は、それぞれ Male/Female, Drug A/Drug B, および Day 1, 2, 3 になります。
お持ちのデータに欠損データポイントがあったり、セルが丸ごと空白になっている場合は、SigmaPlot によりこれが検出され、適切な処理が実行されます。詳しくは、欠損データと空白セルデータ をご覧ください。
三元配置分散分析で有効なデータフォーマットの例
 |
列1は第1因子のインデックス、列2は第2因子のインデックス、列3は第3因子のインデックス、そして、列4がデータになります。
3.1 欠損データと空白セルデータ
Three Way ANOVA の理想的なデータは、完全に釣り合いがとれているものです。例えば、ある実験における各群またはセルの観測数がそれぞれ同じで、欠損データが無いものです。ただし、欠損値や釣り合いがとれていないデータがあっても、それらは自動的に SigmaPlot によって適切な処理が行われます。
- 欠損データポイント
欠損値 (missing value) が存在する場合、SigmaPlot は一般線形モデル (general linear model) によるアプローチを使用して自動的に処理します。このアプローチでは、周辺平方和 (marginal sums of squares:一般にタイプ III の平方和、または、調整平方和 (adjusted sums of squares) とも呼ばれます) を使用した仮説検定が構成されます。
Male, Drug A, Day 1
セルに欠損値がある三元配置分散分析のデータの例
Gender |
Male |
Female |
Drug |
Drug A |
Drug B |
Drug A |
Drug B |
Time Period |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Reaction |
1
– –
25 |
2
14
26 |
3
15
27 |
4
16
28 |
5
17
29 |
6
18
30 |
7
19
31 |
8
20
32 |
9
21
33 |
10
22
34 |
11
23
35 |
12
24
36 |
このような状況では、一般線形モデルによるアプローチを使用します。
- 空白セル
例えば、空白のセルが1つ存在する場合、3つの因子の水準を組合せた観測データの1つがありませんので、二元配置または一元配置の計画を使用してこのデータを分析するか否かを質問するダイアログボックスが表示されます。二元配置計画を選択した場合、SigmaPlot はお持ちのデータを2つの交互作用を使って分析を試みます。2つの交互作用の観測データがなければ、SigmaPlot は、一元配置分散分析を実行します。詳しくは、一元配置分散分析(ANOVA) をご覧ください。
問題を二元配置分散分析として取り扱う場合、因子のいずれか一つを削除するかどうかを確認するダイアログボックスが表示されます。削除する因子を選択したら、OK をクリックします。これにより二元配置分散分析が実行されます。詳しくは、二元配置分散分析 (ANOVA) をご覧ください。
問題を一元配置分散分析として取り扱う場合、表の各セルは単一の実験因子の異なる水準として取り扱われます。このアプローチは、データや実験計画のもつ性質に関して特別な前提条件を要しないことから最も保守的な分析法となります。
空白セル (Male/Drug A, Day 1)
を持つ三元配置分散分析のデータ
Gender |
Male |
Female |
Drug |
Drug A |
Drug B |
Drug A |
Drug B |
Time Period |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Reaction |
– –
– –
– – |
2
14
26 |
3
15
27 |
4
16
28 |
5
17
29 |
6
18
30 |
7
19
31 |
8
20
32 |
9
21
33 |
10
22
34 |
11
23
35 |
12
24
36 |
2因子の分析、または、因子間に交互作用がないことを前提条件とする分析を使用することができます。
交互作用がないという前提条件では、各処理の主効果が個別に分析されます。
※ DANGER :3つの因子間に交互作用がないことを三元配置分散分析の前提条件にするのは危険性が伴います。状況によっては、とりわけ交互作用効果を調べることに関心がある場合、この前提条件によって分析そのものが無意味になることがあります。 |
3.2 連結データと非連結データについて
空白セルが1つ以上ある場合、交互作用がないという前提条件は、2因子の分析で常に許容される訳ではありません。計算を実行するためには、空白でないセルが幾何学的に連結 (geometrically connected) している必要があります。非連結データについては、三元配置分散分析を実行することはできません。
データを2次元グリッドに配置したとき、占有する全てのセルは、空白セルでは向きを変えずに縦または横方向に一続きの直線を描画できるように接続している必要があります。
連結データを通る縦および横方向の直線を描画した例。
 |
なお、上記の要件に合致しない場合でも、そのデータが非連結であることを意味する訳ではありませんので注意してください。例えば、以下に示す表のデータは連結していることになります。
一連の縦または横方向に直線を描画できない連結データの例。
 |
SigmaPlot は自動的にこの連結をチェックします。もし、三元配置分散分析で非連結データが見つかった場合は、SigmaPlot により、この問題を二元配置分散分析として取り扱うよう提案されます。二元配置分散分析でも非連結データが見つかった場合は、一元配置分散分析が実行されます。
非連結データの例
Gender |
Male |
Female |
Drug |
Drug A |
Drug B |
Drug A |
Drug B |
Time Period |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Day
1 |
Day
2 |
Day
3 |
Reaction |
– –
– –
– – |
– –
– –
– – |
– –
– –
– – |
4
16
28 |
5
17
29 |
6
18
30 |
7
19
31 |
8
20
32 |
9
21
33 |
– –
– –
– – |
– –
– –
– – |
– –
– –
– – |
このデータは、幾何学的に接続していませんので (このデータには共通する因子水準がありません)、三元配置分散分析を実行することも、交互作用がないという前提条件で実行することもできません。
3.3 ワークシートデータを入力する
三元配置分散分析を実行できるのは、3因子のインデックス付きデータに対してのみです。3因子のインデックス付きデータの配置は4列になります。すなわち、三元配置のインデックス付きデータポイントは、第1の因子を1列目に、第2の因子を2列目に、第3の因子を3列目に、データポイントを4列目に配置して構成します。
4. 三元配置分散分析オプションを設定する
Three Way ANOVA オプションを使用するのは:
- 検定パラメータを調整して、お持ちのデータの正規性と等分散性の基準を緩和したり厳格にするとき。
- データの統計サマリーテーブルをレポートに表示し、残差をワークシートに保存するとき。
- 検定の検出力 (power)、すなわち、感度 (sensitivity) を計算するとき。
- 多重比較検定を有効にするとき。
Three Way ANOVA オプションを変更するには:
- 検定オプションを変更したあと検定を実行するにあたり、検定の実行前にデータを選択しておきたい場合は、使用するデータをポインターでドラッグします。
- Analysis タブの SigmaStat グループにある Select Test ドロップダウンリストから Options をクリックします。
Options for Three Way ANOVA
ダイアログに以下の3つのタブが表示されます:
- Assumption Checking:データの正規性と等分散性の基準を緩和または厳格にするには、このパラメータを調整します。詳しくは、Options for Three Way ANOVA: Assumption Checking をご覧ください。
- Results:レポートにデータの統計サマリーと信頼区間を表示したり、ワークシート列に残差を保存するかを指定します。詳しくは、Options Three Way ANOVA: Results をご覧ください。
- Post Hoc Tests:検出力 (Power)、すなわち、検定の感度を計算するかを指定します。詳しくは、Options Three Way ANOVA: Post Hoc Tests をご覧ください。
※ Tip:検定オプションを変更したあと検定を実行するにあたり、検定の実行前にデータを選択しておきたい場合は、使用するデータをポインターでドラッグします。
設定したオプションの内容は、SigmaPlot を次回使用するときも保持されます。 |
- 検定を継続するには、Run Test をクリックします。検定ウィザードの Select Data パネルが表示されます。
- 現在の設定内容を適用して、オプションダイアログを閉じるには、OK をクリックします。
4.1 Options for Three Way ANOVA: Assumption Checking
Options ダイアログボックスの Assumption Checking タブを選択すると、Normality (正規性) と Equal Variance (等分散性) に関するオプションが表示されます。正規性 (Normality) の前提条件の検定では、母集団が正規分布に従っているかをチェックします。等分散 (Equal Variance) の前提条件の検定では、各群の平均値の周りのばらつきをチェックします。
Options for Three Way ANOVA ダイアログボックスの Assumption Checking オプションの表示例。
 |
- Normality の検定:SigmaPlot では、母集団の分布の正規性検定に Shapiro-Wilk または Kolmogorov-Smirnov のいずれかを使用します。
- Equal Variance の検定:SigmaPlot では、群平均のばらつきをチェックすることで等分散性を検定します。
- 正規性および等分散の P 値:P Value to Reject ボックスに該当する P 値を入力します。P 値により、データが正規分布していないと誤って結論付ける確率が決定されます (P 値は、データが正規分布しているという帰無仮説を誤って棄却してしまうリスクです)。検定によって求められた P 値が、ここで設定した P 値よりも大きければ、検定は採択 (Pass) されます。
正規性と等分散の要件をより厳密なものにするには、この P 値を大きくします。パラメトリックな統計手法では、仮説の棄却が比較的ロバスト (頑健) に検出されることから、SigmaPlot ではこの値を 0.050 としています。P 値をこれよりも大きくすると (例えば、0.100)、そのデータに正規性がないとの判定が出やすくなります。
正規性の要件を緩和するには、P 値を小さくします。正規性があるという仮説を棄却するための P 値に小さい値しか要求しないということは、前提とする正規分布からデータが外れていても、それが非正規であると判定される前に、それだけ広く受け入れたいとする意思があることを意味します。例えば、P 値を 0.050 とした場合、あるデータを非正規であると判定するには、0.100 の場合と比べてそれだけ大きく正規性を逸脱していなければなりません。
※ Note:データの分布が極端な状態にあり、これらの手法では検定できない場合があります。たとえば、ルビーンの中央値検定 (Levene Median test) では、分散の大きさが数次の場合は差の検出ができません。このような条件の場合は、前提条件の自動検定に頼らずにデータを視覚的に調べることで容易に見分けることができます。 |
4.2 Options for Three Way ANOVA: Results
Options for Three Way ANOVA ダイアログボックスに Summary Table, Residuals オプションを表示した例。
 |
- Summary Table:Report 欄の Summary Table を選択すると、列または群の観測数 (N)、列または群の欠損値の数 (Missing)、列または群の平均値 (Mean)、列または群の標準偏差 (Std Dev)、および、列または群の平均値の標準誤差 (SEM) が表示されます。
- Residuals in Column:Residuals in Column ドロップダウンリストでは、レポートに残差を表示し、ワークシートの指定列に検定の残差を保存します。列番号を入力するか、ドロップダウンリストから列を選択します。
4.3 Options for Three Way ANOVA: Post Hoc Tests
Power と
Multiple Comparisons を表示した
Options for Three Way ANOVA ダイアログボックスの例
 |
- Power:ある検定の検出力 (Power) または感度は、もし群間に真の差がある場合、その差を検定によって検出できる確率です。
- Use Alpha Value:Alpha Value ボックスの数値を編集することで危険率 (α) を変更できます。アルファ (α) は、誤って差があると判断しても良しとする確率です。SigmaPlot で提示される値は、α = 0.05 です。この設定は、誤りを許容する確率が 20分の1であることを示します。すなわち、P < 0.05 あであれば有意な差があると判断できることになります。
α 値を小さくすると、有意差があると結論付ける要件がそれだけ厳格なものになりますが、差があるにもかかわらずないと結論付けてしまう可能性はそれだけ大きくなります。α 値を大きくすると、差があると結論付ける要件はそれだけ容易になりますが、誤判定 (false positive) をレポートしてしまうリスクが増加することになります。
- Multiple Comparison (多重比較):三元配置分散分析 (Three Way ANOVA) では、幾つかの処理群の間に差がないという仮説を検定しますが、どの群に差があるのか、すなわち、群間の差の大きさは分かりません。三元配置分散分析で差が検出されたときに、多重比較によりこれらの差を特定します。
ANOVA で差を検出するか否かの判定に使用する P 値は、Options ダイアログボックスの Report タブで設定します。三元配置分散分析 (Three Way ANOVA) で求められた P 値が、このボックスで指定した P 値よりも小さければ、群間に差が検出されたことになるので、多重比較が実行されます。
- Always Perform:Three Way ANOVA で差が検出されたか否かにかかわらず常に多重比較を実行します。
- Only When ANOVA P Value is Significant:ANOVA で差が検出されたときだけ多重比較を実行します。
- Significance Value for Multiple Comparisons:Significance Value for Multiple Comparisons ドロップダウンリストから .05 または .01 を選択します。この値は、多重比較で処理間に有意差があると誤って結論付ける見込みを決定します。値が .05 であれば、多重比較で誤って差を検出する可能性が 5% 以下であれば多重比較で差が検出されることになります。値が .10 であれば、多重比較で誤って差を検出する可能性が 10% 以下であれば多重比較で差が検出されることになります。
(※ v14 では Σ > Options > Report タブの Test Results で指定します)
※ Note:多重比較が開始されると、Multiple Comparison Options ダイアログボックスが表示され、多重比較の手法を選ぶよう指示されます。 |
5. 三元配置分散分析を実行する
検定を実行する前にお持ちのデータを選択しておきたい場合は、対象となるデータをマウスポインタでドラッグしておきます。
- Analysis タブをクリックします。
- SigmaStat グループにある Tests ドロップダウンリストから次を選択します:
Compare Many Groups → Three Way ANOVA
The Three Way ANOVA — Select Data パネルが表示されます。
Three Way ANOVA — Select Data ダイアログボックス
 |
- Selected Columns リストに別のワークシート列を割り当てたい場合には、ワークシートで直接その列を選択するか、Data for Data ドロップダウンリストからその列を選択します。
Selected Columns リストの一行目に割り当てられるのは最初に選択した列で、以後同様に列を選択するごとにリストの2行目以降に割り当てられてゆきます。各行には、選択した列の番号またはタイトルが表示されます。ワークシートの3列を最低限選択するよう指示されます。
- 選択した内容を変更するには、リストの割り当てを選択したあと、ワークシートから列を選択しなおします。Selected Columns リストの内容をダブルクリックすることによって、列の割り当てを消去することもできます。
- Finish をクリックすると、Three Way ANOVA が実行されます。
次の場合は、Three Way ANOVA レポートが表示されます:
- 正規性と等分散性を検定するよう選択し、お持ちのデータがどちらの検定にも合格 (Pass) した場合。
- お持ちのデータに、欠損データポイントや欠損セルがない場合、すなわち、釣り合いが取れている場合。
- 多重比較を実行しないように選択している場合、または、P 値が有意なときだけ多重比較を実行するよう選択しており、P 値が有意でない場合。
正規性と等分散性を検定するよう選択しており、 お持ちのデータがどちらの検定にも合格しなかった (failed) 場合、 そのまま検定を続けるか、または、データを変換したあと、その変換したデータに対して Three Way ANOVA を実行するかを選択できます。 お持ちのデータに欠損データポイント、欠損セルがある場合、すなわち、釣り合いが取れていない場合、適切なプロシージャを実行するよう指示されます。
6. 三元配置分散分析の多重比較オプション
Three Way ANOVA Options ダイアログボックスで、多重比較を実行するよう選択しており、3つの因子のいずれか、または、3因子の間の交互作用について、ANOVA で算出された P 値が、多重比較のトリガーとなる P 値と等しいか小さかった場合、Multiple Comparison Options ダイアログボックスが表示され、多重比較の検定法を指定するよう指示されます。
ThreeWay ANOVA の Multiple Comparison Options ダイアログボックス
 |
このダイアログボックスには、3つの実験因子の P 値と因子間の交互作用の P 値が表示されます。選択できるオプションは、Options ダイアログボックスで指定した値と同じか小さい P 値を持つもののみです。選択されたオプションをクリックすることで、その因子の多重比較検定を無効にすることができます。いずれの因子も選択していなければ、多重比較の結果はレポートされません。
Three Way ANOVA で選択できる多重比較の検定法には以下の7種類があります:
Multiple Comparison Options ダイアログボックス。 対照群 (Control Group) を選択するよう指示されます。
 |
Three Way ANOVA で選択できる多重比較には2つのタイプがあります。選択できる比較タイプは、選択した多重比較検定法によって変わります。
- All pairwise 比較は、各処理間の差や2因子内の水準の差 (例えば、データテーブルの異なる行と列どうし) をそれぞれ個別に検定します。
- Versus Control (対照群との多重比較) は、各因子の全ての組み合わせ (例えば、データテーブルの全てのセル) の差を検定します。
2つの因子を個別に比較する場合、一方の因子内の各水準が、他方の因子とは無関係にそれぞれ比較されます。これらの結果は、交互作用が統計的に有意でないときに使用します。
交互作用が統計的に有意であれば、各実験因子の水準間の多重比較を解釈しても意味がありません。そのような場合、SigmaPlot によって全てのセル間の比較を実行するよう提案されます。
両比較結果は、例えば、それぞれの群の間に検出できる差があるか否かによって、同系の異なる群の対ごとに一覧表示されます。不確実性からの影響を受けない統計的検定はありませんので、場合によっては多重比較プロシージャによる群分けが判然としないこともあります。
7. 三元配置分散分析の結果を解釈する
完全な Three Way ANOVA レポートには、各因子とそれらの交互作用に関連する変動をあらわす分散分析表が表示されます。この表に表示される内容は、自由度 (DF: degrees of freedom)、平方和 (SS: sum of squares)、データテーブルの各要素の平均平方 (MS: mean squares)、および、F 統計量とそれに対応する P 値です。
Three Way ANOVA のレポート例
 |
因子別の最小二乗平均 (Least square means) と3つ全ての因子を組み合わせた最小二乗平均のサマリー表を作成することも可能です。この結果とそれ以外の結果は、Options for Three Way ANOVA ダイアログボックスで有効にすることができます。選択したチェックボックスをクリックすることで、検定オプションを有効または無効にすることができます。オプションに設定した全ての内容は、SigmaPlot を次回起動したときも引き継がれます。
また、多重比較の表を作成することも可能です。多重比較の結果についても、Options for Three Way ANOVA ダイアログボックスで指定します。多重比較で使用される検定法は、Multiple Comparison Options ダイアログボックスで指定したものです。
7.1 結果の説明
数値による結果に加えて、拡張された結果の説明が表示されることがあります。この説明テキストは、Options ダイアログボックスで有効または無効にすることができます。
表示される小数点以下の桁数についても Options ダイアログボックスで指定できます。
- 欠損データセルがある場合:お持ちのデータに空白セルではない欠損値が含まれている場合、一般線形モデルを使用して算出された結果であることがレポートに表示されます。
お持ちのデータに空白セルが含まれている場合、問題を交互作用のないことを前提条件として分析したか、または、問題を二元配置分散分析として処理したことになります。
- 交互作用がないことを選んだ場合、因子の交互作用に関する統計量は計算されません。
- 二元配置または一元配置分散分析を実行した場合、表示される内容は二元配置または一元配置分散分析の結果と同じになります。詳しくは、一元配置分散分析の結果を解釈する をご覧ください。
- 従属変数:三元配置分散分析を分析したワークシートのインデックス付きデータの列タイトルが従属変数になります。この列内の値が因子水準の違いによって影響を受けるか否かを判定することが、三元配置分散分析の目的です。
- 正規性の検定:正規性の検定 (Normality test) の結果には、正規母集団から抽出されたデータであるという前提条件の検定にお持ちのデータが合格したか (passed) 不合格したか (failed) 、および、この検定で算出された P 値が表示されます。全てのパラメトリック検定では、元になる母集団が正規分布に従っていることが要求されます。
この結果は、Options for Three Way ANOVA ダイアログボックスで正規性の検定を有効にしている場合に表示されます。
- 等分散性の検定:等分散性の検定 (Equal Variance test) の結果には、同じ分散を持つ母集団から標本が抽出されているという前提条件の検定にお持ちのデータが合格したか (passed) 不合格したか (failed) 、および、この検定で算出された P 値が表示されます。元になる母集団の分散が等しいことは、全てのパラメトリック検定の前提条件となります。
この結果は、Options for Three Way ANOVA ダイアログボックスで等分散性の検定を有効にしている場合に表示されます。
- 分散分析表:分散分析表には、三元配置分散分析の結果が一覧で表示されます。
※ Note:欠損データが存在する場合、これらの値を見積もる最良の方法は、一般線形モデル (general linear model ) を使用して自動的に計算することです。 |
- DF (Degrees of Freedom: 自由度):自由度 (Degrees of freedom) は、分散分析の感度 (検出力) に影響する各因子の群数とサンプルサイズをあらわします。
- 各因子の自由度は、各因子内の水準数の尺度です。
- 交互作用の自由度は、セルの総数の尺度です。
- 誤差の自由度は (残差 (residual) または群内 (within groups) の自由度とも言う)、因子と交互作用を計算した後のサンプルサイズの尺度です。
- 全体 (total) の自由度は、サンプルサイズ全体の尺度です。
- SS (Sum of Squares: 平方和):平方和 (sum of squares) は、ANOVA データテーブルにおける各要素に関するばらつきの尺度です。
- 因子の平方和は、テーブルの行間または列間の個別のばらつきの尺度です。
- 交互作用の平方和は、セル間の平均差のばらつきに行列間のばらつきを加えた個別の尺度です。因子間の交互作用の基準となります。
- 誤差の平方和 (残差または群内の平方和とも言う) は、例えば、因子やそれらの交互作用とは関係のないデータの背景にあるランダム変動の尺度です。
- 全体の平方和は、データ全体のばらつきの尺度です。欠損データがない場合、全体の平方和は他のテーブルの平方和の合計と同じになります。
- MS (Mean Squares:平均平方):平均平方 (mean squares) には、各種の母分散の推定量が算出されます。これらの分散推定量の比較が分散分析の基礎となります。
- 各因子の平均平方:
は、因子の水準間のばらつきから算出される母集団に存在する分散の推定量です。
- 交互作用の平均平方:
は、因子間の交互作用に関連するばらつきから算出される母集団に存在する分散の推定量です。
- 誤差の平均平方 (残差、または群内):
は、観測データのランダム成分から算出される母集団に存在する分散の推定量です。
- F 統計量:F 検定の統計量は、各因子内、および、因子間の比較について算出されます。
- 各因子を検定する F 比は:
- 交互作用を検定する F 比は:
F 比が 1 前後である場合、因子水準の間に有意差がないか、因子間に交互作用がないと結論付けることができます (例えば、すべての標本が同じ母集団から抽出されているという帰無仮説にデータ群が一致する)。
F 統計量が大きい値の場合、その因子または因子の組合せの標本のうち少なくとも1つは、異なる母集団から抽出されたものであると結論付けることができます (例えば、そのばらつきは、母集団のランダムな変動から期待されるものよりも大きい)。具体的にどの群が異なっているかを判断するには、多重比較の結果を調べます。
- P 値:P 値は、群間に真の差があると誤って結論付けてしまう確率です (例えば、F 値に基づいて帰無仮説を誤って棄却する、すなわち、第1種の誤り (Type I error) を犯してしまう確率です) 。P 値が小さいほど、異なる母集団から標本が抽出されている確率は大きくなります。
伝統的には、P < 0.05 の場合は、有意差があると結論付けることができます。
- Power:Three Way ANOVA の検出力 (Power)、すなわち感度は、群間に真の差がある場合、その検定で群間の差を検出できる確率です。検出力が 1 に近づくほど、その検定の感度は高くなります。2つの因子内の群比較の検出力と、交互作用の比較の検出力が全て表示されます。これらの結果は、Options for Three Way ANOVA ダイアログボックスで設定します。
ANOVA の検出力は、サンプルサイズ、比較する群の数、誤って差があるとレポートする可能性、すなわち、α (alpha)、観測される群の平均値の差、および、観測される標本の標準偏差によって影響を受けます。
- Alpha:アルファ (α) は、誤って差があると結論付けすることが許容される確率です。この誤りを、第一種の誤り (Type I error) と呼ぶこともあります (第一種の誤りは、仮説が真であるにもかかわらずそれを価値がないとして棄却するときです)。
アルファ (α) の値は、Options for Three Way ANOVA ダイアログボックスで設定します。提示される α = 0.05 という値は、許容される誤りが 20分の1であること、すなわち、P < 0.05 であれば有意差があると結論付けることを示します。α の値を小さくするほど、有意差があるとの結論付けに至る要件はそれだけ厳格になりますが、その反面、差があるにもかかわらず差がないと結論付けてしまう可能性は高くなります (第2種の誤り:Type II error)。α の値を大きくすれば、差があるという結論付けは容易になりますが、その反面、差があると誤って判断してしまうリスクは高くなります (第1種の誤り:Type I error)。
- サマリーテーブル:それぞれの因子ごと、および、各因子の組合せ (サマリーテーブルのセル) ごとに最小二乗平均 (least square means) と平均値の標準誤差 (Standard error of the means) が表示されます。欠損値がある場合、一般線形モデルを使用して最小二乗平均が計算されます。
- Mean:列の平均値です。観測値が正規分布に従う場合、平均値は分布の中心になります。
- 平均値の標準誤差 (SEM):標本を元に算出した平均値から真の母平均を近似するときの目安となる尺度です。
欠損データがない場合、最小二乗平均は、セルおよび周辺 (行と列) の平均値と同じになります。欠損データがある場合、一般線形モデルを使用してこれらの値の最良の推定量が最小二乗平均で算出されます。多重比較を実行する際に、これらの平均値と標準誤差を使います (詳しくは、以下を参照)。
- 多重比較:群間に差が見つかった場合、多重比較表が計算されます。多重比較プロシージャーは、Options for Three Way ANOVA ダイアログボックスで有効にします。多重比較で使用する検定法は、Multiple Comparisons Options ダイアログボックスで設定します。
ANOVA の結果からは、3つ以上の群に差があるかどうかまでしか分からないため、具体的にどの処理 (処置) が異なっているかを判断するには、多重比較の結果を使用します。完全三元配置分散分析の3因子の多重比較では、次も比較します:
- 各因子内の群を他の群とは無関係に比較 (例えば、テーブル内の列または行のみを比較する周辺比較 (marginal comparison) です)。
- 因子の全ての組合せを比較 (テーブル内の全てのセルをそれぞれ比較します)
多重比較の結果の特定のタイプは、使用する比較検定法、および、比較の仕方、すなわち、全ての組み合わせ (pairwise) か、対照群との比較 (versus a control) かによって異なります。
- 全ての対の組み合わせ (All pairwise comparison) の結果には、組み合わせ可能な全ての群の対の一覧が表示されます。全ての対の組み合わせには、Tukey, Student-Newman-Keuls, Fisher LSD, Duncan’s test, Dunnett’s および Bonferroni t-test があります。
- 単一の対照群との比較では、選択した対照群 (control group) との比較しか表示されません。対照群は実際に行う多重比較プロシージャで指定します。対照群との比較検定には、Bonferroni t-test と Dunnett’s test があります。
- Bonferroni t 検定の結果:Bonferroni t-test には、各群の対の平均値の差が一覧で表示され、各対の t 値が計算され、その比較について P < 0.05 であるか否かが表示されます。Bonferroni t-test は、全ての群の比較にも、対照群との比較にも利用できます。
t 値が大きいものであれば、比較した2群の差は統計的に有意であると結論付けることができます。
比較した P 値が 0.05 より小さい場合は、誤って有意差があると結論付けてしまう可能性は 5% よりも小さくなります。この値が 0.05 より大きければ、確信を持って差があると結論付けることはできません。
この平均値の差が比較する水準やセル間の差の大きさの尺度となります。
周辺比較の自由度 DF は、比較する因子内の群 (水準) 数の尺度になります。全てのセルを比較するときの自由度は、因子と交互作用を計上したあとのサンプルサイズの尺度になります。これは、誤差または残差の自由度と同じです。
- Tukey, Student-Newman-Keuls, Fisher LSD, Duncan’s, および Dunnett’s Test の結果:Tukey, Student-Newman-Keuls (SNK), Fisher LSD, および Duncan’s tests は、いずれも群の全ての対の組み合わせを比較するものです。これに対して、Tukey, Fisher LSD, および Duncan’s は、対照群とそれ以外の群との比較に使用するものですので、このタイプの比較では推奨されません。
対照群とその他の全ての群とを比較できるのは Dunnett’s test のみです。いずれの検定も、q 検定統計量、比較 p の間の平均値の数を計算し、その対比較で P < 0.05 または < 0.01 であるか否かを表示します。
q 値が大きいものであれば、比較した2群の間の差は統計的に有意であると結論付けることができます。
比較した P 値が 0.05 より小さい場合は、誤って有意差があると結論付けてしまう可能性は 5% よりも小さくなります。この値が 0.05 より大きければ、確信を持って差があると結論付けることはできません。
p は、q の算出に使用するパラメータです。p が大きければ、有意差を示すのにそれだけ大きな q が要求されます。p は、比較する群平均の順位に関する差の指標です。群平均には大きいものから小さい順にそれぞれ順位を付け、比較における平均値の数の隔たりが p になります。例えば、比較する平均値が4つある場合、最大と最小を比較すると p=4 となり、二番目に小さなものと最小のものを比較すると p=2 になります。
ある群が他の群と比べて有意差がないことが分かった場合、差のない2群の順位 p の間にある順位 p を持つ全ての群についても、有意差がないとみなされますので、これらの比較については DNT (Do Not Test) という結果が表示されます。
Difference of the Means (平均値の差) が比較する群またはセルの間の差の大きさの尺度となります。
周辺比較の自由度 DF は、比較する因子内の群 (水準) 数の尺度になります。全てのセルを比較するときの自由度は、因子と交互作用を計上したあとのサンプルサイズの尺度になります (これは、誤差または残差の自由度と同じです) 。
8. 三元配置分散分析のレポートグラフ
Three Way ANOVA の結果を使用して以下に示すグラフを4つまで作成できます:
8.1 Three Way ANOVA レポートのグラフを作成する方法
- Three Way ANOVA test レポートを選択します。
- Report タブで、Results Graphs グループにある Create Result Graph をクリックします。
Create Result Graph ダイアログボックスが表示され、その中に Three Way ANOVA の結果で利用できるグラフのタイプが表示されます。
- Graph Type リストの中から作成したいグラフタイプを選択して、OK をクリックします。選択したグラフがグラフウィンドウに表示されます。