SYSTAT 13 テクニカルサポート SYSTAT 製品ページ
更新日: 14/05/13

4) 記述統計

記述統計を実行すること自体は簡単です。ただし、算出された平均および標準偏差を、分布の状態をグラフでよく確認せずに報告するのは避けるべきです(分布の形状が大きく歪んでいる場合は、実態とは異なる値が算出されることもあるからです)。ある値が欠損値であるか否かは、変数ごとに標本の大きさを調べることで判断できます。

基本統計には、観測数 (N)、最小値、最大値、算術平均 (AM)、幾何平均、調和平均、合計、標準偏差、分散、変動係数 (CV)、範囲、中央値、算術平均の標準誤差などがあります。

使用するサンプルデータについてはこちらをご覧ください。

SYSTAT では、欠損値を除外したケースの数 (N of Cases)、最大値 (Maximum)、最小値 (Minimum)、平均値 (Arithmetic Mean)、および標準偏差 (Standard Deviation) が変数 (CALORIES, FAT, PROTEIN, ...) ごとに表示されます。

CALORIES (カロリー) を見ると、値の範囲は 160 ~ 550 で、平均値は約 300 (正確には 303.214)となっています。

VITAMINA (ビタミンA 含有量) を見ると、値の範囲は 0% ~ 100% で平均値は 18.9% となっています。この平均値は範囲の中心から外れていますから、この分布が大きく偏ったものであるか、あるいは、極端な値が存在している可能性が高いといえます。

グループ別の統計

「Data (データ)」メニューの「By Goups (グループ化)」を使用して分析を層化することができます。

ダイエット食品13種類 (DIET$=yes: 下の表) のタンパク質 (PROTEIN) の中央値 (Median) は 17 グラムで平均値 (Arithmetic Mean) は 16.8 グラムです。通常食品15 種類 (DIET$=no: 上の表) では、中央値 (Median) が 22 グラム、平均値 (Arithmetic Mean) が 22.1 グラムです。 後で、2標本 t 検定を実行し、有意差があるかどうかを調べてみましょう。

ダイエット食品 (DIET$=yes) の平均価格 (COST) の 95% 信頼区間は $2.27 ~ $2.75 です。 通常食品の平均価格の 95% 信頼区間は、これより大きく、$2.21 ~ $2.94 です。

グループ化変数 DIET$ は、以降のグラフ表示および統計解析でも使用します。グループ化変数をリセットするには、「By Grpups (グループ化)」ダイアログボックスに戻り、「Turn off (グループ化オフ)」を選択してください。

トップへ