抽出したデータの母集団に正規性がないことが分かっている場合は、マン=ホイトニーの順位和検定 (Mann-Whitney Rank Sum Test) を使います。詳しくは、マン=ホイトニーの順位和検定 をご覧ください。比較する群が2つ以上ある場合は、一元配置分散分析 (One Way Analysis of Variance) を実行します。詳しくは、一元配置分散分析 (ANOVA) をご覧ください。
※ Tip: 非正規母集団や分散の等しくない母集団に対して t 検定を実行しようとする場合、お使いの t 検定のオプション設定によっては、SigmaPlot により、そのデータが t 検定にふさわしいものではないとの警告が表示され、代わりにマン=ホイトニーの順位和検定を実行するよう提案されます。
対応のない t 検定は、標本を抽出する正規分布母集団のパラメータである平均値と標準偏差の推定量に基づくパラメトリック検定です。2群の間に無作為な抽出によって生じるばらつきよりも大きな差があるかどうかを検定します。対応のない t 検定の帰無仮説は、「標本の平均値とそれを抽出した母集団の平均値は等しい」です。この仮説を確実に棄却することができれば、2つの平均値の間に差があると結論付けることができます。
SigmaStat グループにある Tests ドロップダウンリストから次を選択します:Compare Two Groups → t-test検定ウィザードの Data Format パネルで、データフォーマットを選択します。
Data Format を指定する t-test の Data Format パネル。
Data Format ドロップダウンリストから該当するデータフォーマットを選択します。詳しくは、群比較検定のデータフォーマット をご覧ください。
Next をクリックして、検定するデータ列を選択します。この検定を選択する前に列を選択していれば、Selected Columns リストに選択した列が表示されます。
Selected Columns リストに別のワークシート列を割り当てたい場合には、ワークシートで直接その列を選択するか、Data for Data ドロップダウンリストからその列を選択します。Selected Columns リストの一行目に割り当てられるのは最初に選択した列で、以後同様に列を選択するごとにリストの2行目以降に割り当てられてゆきます。各行には、選択した列のタイトルが表示されます。生データとインデックス付きデータの場合は、ワークシートの2列を選択するよう指示されます。要約統計データの場合は、3つの列を選択することになります。
Normality Test:Normality Test の結果には、そのデータが正規母集団から抽出されたものであるという前提条件の検定に合格したか否か (Passed または Failed)、および、この検定で計算された P 値が表示されます。全てのパラメトリック検定では、ソースとなる母集団が正規分布に従っている必要があります。この結果は、Options for t-test ダイアログボックスで設定します。
差の標準誤差 (standard error of the difference) は、2つの平均値の差を見積もるための精度の指標です。
t の絶対値が「大きい」ものであれば、それらは異なる母集団から抽出された標本であると結論づけることができます。t が大きければ、サンプリングの変動のみによって期待される差よりも、処理群の平均値の間の差が大きいことを示します (例えば、2群の間の差が統計的に有意であるような場合)。t の値が小さければ (殆ど 0 に近い場合)、標本間に有意な差が存在しないことを示します。
Degrees of Freedom (自由度):自由度 (Degrees of freedom) は、 t 検定で平均値の差の検出能力に影響を及ぼすサンプルサイズをあらわします。自由度 (サンプルサイズ) が大きいほど、より小さな t で差を検出できる能力が高まります。
P Value (P 値):P 値 (P value) は、2群の間に真の差があると誤って結論付けてしまう確率です (例えば、t に基づいて帰無仮説を誤って棄却する、すなわち第一種の誤り (Type I error) を犯す確率)。P 値が小さいほど、標本が異なる母集団から抽出される確率は高くなります。伝統的には、P < 0.05 であれば、有意差があると結論付けることができます。
平均値の差に関する信頼区間:信頼区間 (confidence interval) にゼロが含まれていなければ、指定した信頼水準の割合の間に有意差があると結論付けることができます。信頼区間は、P < α (alpha) とあらわすこともできます。ここで、α は、誤って差があると結論付けすることが許される確率です。信頼水準は、 Options for t-test ダイアログボックスで調整します:通常は、100 (1 – α)、すなわち 95% に設定します。信頼の値を大きくするほど間隔が広くなり、値を小さくするほど間隔は狭くなります。α に関する詳しい説明は、次の Power (検出力) をご覧ください。この結果は、Options for t-test ダイアログボックスで設定します。
Power (検出力):t 検定の検出力 (Power)、すなわち感度は、群間に真の差がある場合、その検定で群間の差を検出できる確率です。検出力が 1 に近づくほど、その検定の感度は高くなります。t 検定の検出力は、両群のサンプルサイズ、誤って差があるとレポートする可能性、すなわち、α (alpha)、平均値の差、および、標準偏差によって影響を受けます。この結果は、Options for t-test ダイアログボックスで設定します。
アルファ:アルファ (α) は、誤って差があると結論付けすることが許容される確率です。この誤りを、第一種の誤り (Type I error) と呼ぶこともあります (第一種の誤りは、効果がないという帰無仮説が真であるにもかかわらずそれを棄却するときです)。アルファ (α) の値は、Options for t-test ダイアログボックスで設定します。α = 0.05 という値は、許容される誤りが 20分の1であること、すなわち、P < 0.05 であれば有意差があると結論付けたいことを示します。α の値を小さくするほど、有意差があるとの結論付けに至る要件はそれだけ厳格になりますが、その反面、差があるにもかかわらず差がないと結論付けてしまう可能性は高くなります (第二種の誤り:Type II error)。α の値を大きくすれば、差があるという結論付けは容易になりますが、その反面、偽陽性 (false positive) をレポートするリスクが高まります。
7. t 検定のレポートグラフ
t-Test の結果を使用して以下を含む最大5つのグラフを作成できます:
列平均の棒グラフ (Bar chart of the column means):t 検定の棒グラフでは、標準偏差をあらわすエラーバーと共に各群の平均値が垂直の棒としてプロットされます。詳しくは、Bar Charts of the Column Means をご覧ください。
列平均のエラーバー付き散布図 (Scatter plot with error bars of the column means):t 検定の散布図では、各群の平均値が1つの点としてプロットされ、それぞれの点には標準偏差をあらわすエラーバーが付けられます。詳しくは、Scatter Plot をご覧ください。
列平均のポイントプロット (Point plot of the column means):t 検定のポイントプロットでは、各列の全ての値がグラフ上の点としてプロットされます。詳しくは、Point Plot をご覧ください。
残差のヒストグラム (Histogram of the residuals):t 検定のヒストグラムでは、指定した範囲の生の残差が定義した間隔セットを使用してプロットされます。詳しくは、Histogram of Residuals をご覧ください。
残差の正規確率プロット (Normal probability plot of the residuals):t 検定の確率プロットでは、生の残差の度数がプロットされます。詳しくは、Normal Probability Plot をご覧ください。
7.1 t 検定データのグラフを作成する方法
t-test のレポートを選択します。
Report タブをクリックします。
Results Graphs グループにある Create Result Graph をクリックします。Create Result Graph ダイアログボックスが表示され、その中に t-Test の結果で利用できるグラフのタイプが表示されます。
t-test Report の Create Result Graph ダイアログボックス
Graph Type リストの中から作成したいグラフタイプを選択して OK をクリックするか、リスト内のグラフをダブルクリックします。選択したグラフがグラフウィンドウに表示されます。詳しくは、レポートグラフ をご覧ください。