17.3 基本統計量でデータを説明する

SigmaPlot を利用して、測定データの基本統計量、すなわち、平均値 (mean)、中央値 (median)、標準偏差 (standard deviation)、百分位数 (percentiles) などを計算することで、お持ちのデータの要約 (サマリー) を作成することができます。

データの説明に必要な作業は以下のとおりです:

  1. 記述統計のデータを配置する
  2. 記述統計のオプションを設定する
  3. 記述統計の検定を実行する
  4. 記述統計量の出力結果
  5. 記述統計の結果グラフ
    1. 記述統計の結果グラフを作成する

 

1. 記述統計のデータを配置する

記述統計 (Descriptive Statistics) を実行する対象はデータの列です。従って、分析を行いたい群や変数のデータをそれぞれ列ごとに分けて配置します。

図 3.2:処理または群を列ごとに分けたデータ配置

データ列を選択する

統計量の計算は、列の全て、または、一部の列に対して行うことができます。記述統計プロシージャの実行に際しては、以下のことができます:

Tip
データの範囲を限定して統計量を計算するには、検定を実行する前にデータを選択します。記述統計に選択できるデータの列数は、最小1列から最大32列までです。

 

2. 記述統計のオプションを設定する

計算したい統計量は、Descriptive Statistics Options ダイアログで選択します。

記述統計の検定オプションを変更するには:

  1. 検定オプションを変更してから検定を行うに際して、事前にデータを選択しておきたい場合は、そのデータ範囲にポインタをドラッグします。

  2. Options for Descriptive Statistics ダイアログボックスを開くにはAnalysis タブの SigmaStat グループにあるドロップダウンリストの中から Descriptive Statistics をクリックします。

  3. Options をクリックします。

    Options for Descriptive Statistics ダイアログボックスが表示されます。
    図 3.3: Options for Descriptive Statistics ダイアログボックス

  4. このうちレポートに含めたくない統計量があれば、そのチェックを解除します。詳しくは、記述統計量の出力結果 をご覧ください。

    与えられたデータセットにふさわしい要約統計量は、そのデータの性質によって異なります。測定値が正規分布に従っていれば、平均値 (mean) と標準偏差 (standard deviation) でそのデータの特徴をうまく説明できます。もしそうでなければ、多くの場合、中央値 (median) と百分位数 (percentiles) でデータの特徴をうまく説明できます。

  5. 信頼区間 (confidence interval) を変更するには、Confidence Interval Mean ボックスに 1 から 99 までの任意の数を入力します (最もよく使われる区間は 95 と 99 です)。

  6. 計算する百分位数 (percentiles) または信頼区間 (confidence intervals) を変更するにはPercentile ボックスの値を編集します。

  7. 全ての統計量のオプションを選択するには、Select All をクリックします。全ての選択を解除するには、Clear をクリックします。

  8. Run Test をクリックすると、選択されたオプション設定をもとに検定が実行されます。
Tip
小数点以下の桁数の表示を設定するには、Sigma ボタンをクリックして Options をクリックします。Options ダイアログボックスの Report タブをクリックしたら Number of significant digits で変更したい桁数を選択します。

 

3. 記述統計の検定を実行する

このプロシージャを実行する前にお持ちのデータを選択したい場合は、そのデータにポインタをドラッグします。お持ちのデータの記述統計を行うには:

  1. Analysis タブの SigmaStat グループにある Tests ドロップダウンリストをクリックしたら Describe Data を選択します。

    Descriptive Statistics - Select Data ダイアログボックスが表示されますのでデータ形式を指定します。
    図 3.4: Descriptive Statistics - Select Data ダイアログボックス

    Tip
    検定を選択する前に列を選択していれば、選択された列が Select Columns リストに自動的に表示されます。

  2. Selected Columns リストにワークシートの目的の列を割り当てるには、ワークシートで直接その列を選択するか、Data for Data ドロップダウンリストから対象となる列を選択します。
    最初に列を選択すると Selected Columns リストの最初のエントリにその列が割り当てられ、続けて列を選択すると、そのリストに続けて割り当てられることになります。各エントリには、選択した列の番号またはタイトルが表示されます。Descriptive Statistics Test (記述統計検定) で選択できるデータ列の最大数は 64 列となります。

  3. 選択状態を変更するには、変更したいエントリをリストで選択してから、変更後の列をワークシートで選択します。既に割り当てられた列を消去するには、Selected Columns リストのアイテムをダブルクリックして行うこともできます。

  4. Finish をクリックすると、選択した列にあるデータを使用して検定が実行されます。計算が完了すると、レポートが表示されます。

 

4. 記述統計量の出力結果

計算結果のレポートには、以下に示すような各種統計量が表示されます。それぞれの値は、選択した列ごとに計算されたものです。Options for Descriptive Statistics で選択した統計量についてそれぞれ計算が行われることになります。

図 3.5:記述統計の結果をあらわすレポート

 

5. 記述統計の結果グラフ

記述統計のグラフを元に最大5種類のグラフを作成することができます。以下にそのグラフを示します:

 

5.1 記述統計の結果グラフを作成する

記述統計レポートのデータからグラフを作成するには:

  1. Descriptive Statistics のレポートが現在表示されていることを確認します。

  2. Report タブの Result Graphs グループにある Create Result Graph をクリックします。Create Result Graph ダイアログボックスに Descriptive Statistics レポートで利用可能なグラフタイプが表示されます。
    図 3.6: Create Result Graph ダイアログボックス

  3. Graph Type リストの中から作成したいグラフタイプを選択したら OK をクリックします。指定したグラフがグラフウィンドウまたはレポート内に表示されます。
Tip
リスト内のグラフをダブルクリックして作成することもできます。