11) 交互作用のある 2元配置 ANOVA
食品のタイプによって栄養素の値が異なるかどうかを調べてみましょう。
使用するサンプルデータについてはこちらをご覧ください。
前の散布図に、他の食品よりカルシウムの値の高い食品の小さな集団がありました。 2 標本 t 検定では、ダイエット食品 (yes) と通常の食品 (no) のカルシウム含有量の平均値の差を調べることはできませんでした。 食品の種類 (FOOD$) と用途 (DIET$) の両方を使用してセルを定義し、詳しく調べてみることにしましょう。つまり、2 元配置分散分析を実行してみます。
「クロス集計」のカウント機能を使用すれば、この標本には牛肉製品、鶏肉製品、パスタが含まれていますが、DIET$ が yes の群には牛肉製品が存在していないことが分かります(SYSTAT では、欠測値を含むデザインの ANOVA を行なうことができます。)
FOOD$ から Beef 値を持つケースを除外する
「Data (データ)」メニューの「Select Cases (ケースの選択)」を使用して牛肉製品を除外し、2 × 2 デザイン(DIET$ が yes および no、食品の種類が chicken および pasta)の分散分析を実行します。
- 次のようにメニューを選択します。
- 「Data (データ)」>
「Select Cases (ケースの選択)... 」
- 「Select Cases」ダイアログ ボックスで、Avairable variable (利用可能な変数) から 「FOOD$」を選択し、Add to の Expression1 をクリックします。
- Operator (演算子) のドロップダウン リストで <> 不等号を選択します。
- Expression2 のボックスに「beef」と入力します (コマンドを使用する場合は引用符号が必要ですが、ダイアログボックスではその必要はありません。)。
- 「OK」をクリックしてコマンドを実行します。
3D 棒グラフで分布を確認する
- セルの平均値の棒グラフを生成するには次のようにメニューを選択します。
- 「Graph (グラフ)」>
「Bar Chart (棒グラフ)...」
- Z-変数として「CALCIUM」を、Y-変数として「DIET$」を、X-変数として「FOOD$」を選択します。
- Error Bars タブをクリックし、Type グループから None を選択します。
- Fill タブをクリックし、Fill pattern グループから Select fill を選択し、Fill Pattern に塗りつぶしを選択します。
- 「OK」をクリックします。
出力は次のようになります。
ヒント:ダイナミック エクスプローラを使用して、この3D 棒グラフを回転させることができます。
この 2 標本 t 検定のボックスプロットをご覧ください。yes 群のカルシウム含有量および no 群のカルシウム含有量の分布はいずれも一方が大きく傾斜しており、広がりは一様ではありません。CALCIUM の分布が釣り合いの取れるように、値を平方根に置き換てみましょう。
CALCIUM の値を平方根に置き換える
分散分析を実行する前に、CALCIUM 各値の平方根を取り、変換を行います。
- 次のようにメニューを選択します。
- 「Data (データ)」>
「Transform (変換)」>
「Let...」
- 「Let」ダイアログボックスで、「CALCIUM」を選択し Add to の Variable (変数) ボタンをクリックし、数学関数のリストから「SQR (平方根)」を選択して Add をクリックします。変数リストから「CALCIUM」を選択して Add to の Expression ボタンをクリックして式に追加します。「Expression (式)」ボックスは次のようになります:SQR(CALCIUM)
- 「OK」をクリックしてコマンドを実行します。
最後の例の手順を繰り返して分散分析を実行します。ただし、ここでは、従属変数 (Dependent) として CALCIUM を、因子変数 (Factors) として「DIET$」および「FOOD$」を使用します。
OK をクリックすると以下の結果が得られます。
DIET$ と FOOD$ の有意な交互作用は、主効果の判定に注意が必要なことを示しています。DIET$ の主効果には意味がないようですが (p = 0.247)、散布図で確認してみることにしましょう。
散布図の作成
- 次のようにメニューを選択します。
- 「Graph (グラフ)」>
「Scatterplot (散布図)...」
- Y -変数として「CALCIUM」を、Grouping variable (群分け変数) として「DIET$」を選択します
(SYSTAT では、自動的にケース番号が X -変数として使用されます)。
- 「複数グラフを単一枠に重ね合わせ」を選択します。
- 「Symbol and Label」タブをクリックし、「Select symbol」をクリックし、最初のシンボルとして丸を、2 番目のシンボルとして三角形を選択します。
- 「Case labels」グループボックスから「Display case labels (ケースラベルを表示)」をチェックし、ケースラベル変数として「FOOD$」を選択します。
- 「Fill (塗りつぶし)」タブをクリックし、「塗りつぶしパターン」グループボックスから「Select Fill (塗りつぶしを選択)」を選択し、最初と 2 番目の塗りつぶしパターンとしてべた塗りを選択します。
- 「OK」をクリックします。
この散布図から、CALCIUM の平方根が 4 以上の食品はすべてパスタ食品 (pasta) であることが分かります(FOOD$ の有意な主効果と一致します)。また、CALCIUM の最も高い値のものは通常の食品(DIET$ = no)であることも分かります。これらは更なる調査で証明されるかもしれないことを示唆しています。