SYSTAT 13 テクニカルサポート SYSTAT 製品ページ
更新日: 14/05/13

6) 群分けされた散布図行列とカーネル密度曲線

部分母集団 (Subpopulations) が存在すると正しい相関の大きさが求められないことがあります。 前の例では、相関を使用して、DIET$ をグループ化変数として指定しましたが、今度は、データをグラフ化し、75% ノンパラメトリックカーネル密度等高線を使用して、ダイエットが yes の群と no の群を調べてみることにします。また、両群の単変量カーネル密度曲線も調べてみることにします。

使用するサンプルデータについてはこちらをご覧ください。

群分けされた散布図行列とカーネル密度曲線の作成

CALORIESFAT の関係をご覧ください。単変量密度曲線が二つに分離しています。

右下 (COST) のダイエット食品の価格 (青の曲線) においては、通常の食品の価格 (赤の曲線) の範囲内に収まっていることに注目してください。一番下の行にあるプロットの Y 変数はいずれも COST です。どちらの群 (no/yes) においても、COST は、CALORIES や FAT と、ほとんど無関係であることが分かります。 ただし、通常の食品 (DIET$=no) では、COST と PROTEIN との間には正の相関関係があるようです (COST 対 PROTEIN のプロット内の円)。

散布図行列の行変数を変更してみる

一番下の行にあるプロットの Y 変数が COST です。 価格 (COST) と栄養価 (VITAMINA、CALCIUM、および IRON のデータ) との間には有意な関係はみられません。ただし低価格の食品でカルシウムを豊富に含む食品の小さな群が存在するようです。 これは、パスタ製品であることが後で分かります

トップへ