20.3 対応のある t 検定
対応のある t 検定 (Paired t-test) は、測定された処理効果が正規分布に従うことを前提条件とするパラメトリックな統計手法です。同一個体に対して単一の実験的介入を行い、その事前と事後の変化を調べることでその処理に有意な効果があるかないかを判断します。介入の事前と事後に測定した値の代わりにその変化を調べることで、個体応答に由来する差が取り除かれ、感度がより敏感な、検出力の高い検定になります。
対応のある t 検定を使うのは:
- 同一個体に対する単一処理の効果が有意であるか否かを調べたいとき。
- 処理効果 (例えば、処理前の個体と処理後の個体の変化) が正規分布に従っているとき。
測定される効果が正規分布に従っていないことが分かっている場合は、ウィルコクソンの符号付き順位検定 (Wilcoxon Signed Rank Test) を使います。詳しくは、ウィルコクソンの符号付き順位検定をご覧ください。同一個体に対する複数処理の効果を比較する場合は、反復測定分散分析 (Repeated Measures Analysis of Variance) を実行します。詳しくは、フリードマンの順位に基づく反復測定分散分析をご覧ください。
- 対応のある t 検定を実行する
- 対応のある t 検定のデータを配置する
- 対応のある t 検定オプションを設定する
- Options for Paired t-test: Assumption Checking
- Options for Paired t-Test: Results
- Options for Paired t-Test: Post Hoc Tests
- 対応のある t 検定を実行する
- 対応のある t 検定の結果を解釈する
- Normality Test
- Summary Table
- Difference
- t Statistic
- Confidence Interval for the Difference of the Means
- Power (検出力)
- 対応のある t 検定のレポートグラフ
- 対応のある t 検定データのグラフを作成する方法
1. 対応のある t 検定を実行する
対応のある t 検定を実行するには:
- ワークシートに適切なデータを入力または配置します。詳しくは、対応のある t 検定のデータを配置するをご覧ください。
- 必要があれば、Paired t-test オプションを設定します。
- Analysis タブをクリックします。
- SigmaStat グループにある Tests ドロップダウンリストから以下を選択します:
Before and After → Paired t-test
- 検定を実行します。
- レポートグラフを作成します。
2. 対応のある t 検定のデータを配置する
検定するデータのフォーマットには、生データ (raw data) またはインデックス付きデータ (indexed data) のいずれかを使用することができます。生データの場合はワークシートの2列にデータを配置し、インデックス付きデータの場合はワークシートの3列 (被験者、因子、データの3列) にデータを配置します。生データの2列は、長さを同じにする必要があります。もし欠損値が発見された場合、その個体は無視されます。反復測定の検定には統計的要約データを使用することはできません。
対応のある t 検定の有効なデータフォーマットの例
|
上記ワークシートの列1と列2には、生データを配置しています。列3、4、5には、インデックス付きデータを配置しており、そのうち、列3が被験者列、列4が因子列、そして、列5がデータ列となります。
3. 対応のある t 検定オプションを設定する
Paired t-test オプションでできること:
- 検定の各種パラメータの調整。データの正規性の基準を緩和または厳格にすることができます。
- データに関する統計サマリーの表示。
- 検出力 (Power)、すなわち、検定の感度を計算するか否かの指定。
オプションの設定内容は、SigmaPlot を次回起動したときも保持されます。
Paired t-test オプションを変更するには:
- Analysis タブの SigmaStat グループにある Select Test ドロップダウンリストから t-test を選択します。
- Options をクリックします。
Options for Paired t-test ダイアログボックスに以下の3つのタブが表示されます:
- Assumption Checking:データの正規性と等分散性の基準を緩和または厳格にするには、このパラメータを調整します。詳しくは、Options for Paired t-test: Assumption Checking をご覧ください。
- Results:レポートにデータの統計サマリーを表示したり、ワークシート列に残差を保存するかを指定します。詳しくは、Options for Paired t-Test: Results をご覧ください。
- Post Hoc Tests:検出力 (Power)、すなわち、検定の感度の計算するかを指定します。詳しくは、Options for Paired t-Test: Post Hoc Tests をご覧ください。
設定したオプションの内容は、SigmaPlot を次回使用するときも保持されます。
※ Tip: 検定オプションを変更したあと検定を実行するにあたり、検定の実行前にデータを選択しておきたい場合は、使用するデータをポインターでドラッグします。 |
- 検定を継続するには、Run Test をクリックします。検定ウィザードの Select Data パネルが表示されます。
- 現在の設定内容を適用して、オプションダイアログを閉じるには、OK をクリックします。
3.1 Options for Paired t-test: Assumption Checking
正規性 (Normality) の前提条件の検定では、母集団が正規分布に従っているかをチェックします。
※ Tip:対応のある t 検定には、Equal Variance の選択肢はありません。対応のある t 検定は、選択した母集団の個体それぞれに対してではなく各個体の変化に基づいて検定を行うからです。従って、等分散性を検定する必要はありません。 |
Options for Paired t-test
ダイアログボックスの
Assumption Checking オプションの表示例
|
- Normality の検定:SigmaPlot では、母集団の分布の正規性検定に Shapiro-Wilk または Kolmogorov-Smirnov のいずれかを使用します。
- P Value to Reject:P Value to Reject ボックスに該当する P 値を入力します。P 値により、データが正規分布していないと誤って結論付ける確率が決定されます (P 値は、データが正規分布しているという帰無仮説を誤って棄却してしまうリスクです)。検定によって求められた P 値が、ここで設定した P 値よりも大きければ、帰無仮説が採択 (Pass) されます。
正規性と等分散のいずれか又は両方の要件をより厳密なものにするには、この P 値を大きくします。パラメトリックな統計手法では、仮説の棄却が比較的ロバスト (頑健) に検出されることから、SigmaPlot ではこの値を 0.050 としています。P 値をこれよりも大きくすると (例えば、0.100)、そのデータに正規性がないとの判定が出やすくなります。
正規性の要件を緩和するには、P 値を小さくします。正規性があるという仮説を棄却するための P 値に小さい値しか要求しないということは、前提とする正規分布からデータが外れていても、それが非正規であると判定される前に、それだけ広く受け入れたいとする意思があることを意味します。例えば、P 値を 0.050 とした場合、あるデータを非正規であると判定するには、0.100 の場合と比べてそれだけ大きく正規性を逸脱していなければなりません。
※ 制限事項:この正規性の検定は、ロバスト (頑健) に母集団のデータを非正規であると検出しますが、データの分布が極端な状態にあると検定できない場合があります。このような条件の場合は、前提条件の自動検定に頼らずにデータを視覚的に調べることで容易に見分けることができます。 |
3.2 Options for Paired t-Test: Results
- Summary Table:列または群の観測数 (N)、列または群の欠損値の数 (Missing)、列または群の平均値 (Mean)、列または群の標準偏差 (Std Dev)、および、列または群の平均値の標準誤差 (SEM) を表示します。
- Confidence Intervals:平均値の差の信頼区間を表示します。この区間を変更するには、1 から 99 までの任意の数値を入力します (最も良く使われる区間は 95 と 99 です)。
- Residuals in Column:レポートに残差を表示し、検定の残差を指定したワークシートの列に格納します。列番号の数値を入力するか、ドロップダウンリストから番号を選択します。
3.3 Options for Paired t-Test: Post Hoc Tests
- Power:検出力 (Power) すなわち検定の感度は、もし群間に真の差がある場合、その差を検定によって検出できる確率です。
- Use Alpha Value:アルファ (α) は、誤って差があると判断しても良しとする確率です。SigmaPlot で提示される値は、α = 0.05 です。この設定は、誤りを許容する確率が 20分の1であることを示します。すなわち、P < 0.05 であれば有意な差があると判断できることになります。
α 値を小さくすると、有意差があると結論付ける要件がそれだけ厳格なものになりますが、差があるにもかかわらずないと結論付けてしまう可能性はそれだけ大きくなります。α 値を大きくすると、差があると結論付ける要件はそれだけ容易になりますが、誤判定をレポートしてしまうリスクが増加することになります。
Options for Paired t-test
ダイアログボックスに表示される Power オプションの例
|
4. 対応のある t 検定を実行する
検定を実行する前にお持ちのデータを選択しておきたい場合は、対象となるデータをマウスポインタでドラッグしておきます。
- Analysis タブをクリックします。
- SigmaStat グループにある Tests ドロップダウンリストから次を選択します:
Before and After → Paired t-test
検定ウィザードの Paired t-test — Data Format パネルで、データフォーマットを選択します。
Data Format の選択を指定する Paired t-test — Data Format パネル
|
- Data Format ドロップダウンリストから該当するデータフォーマットを選択します。詳しくは、反復測定検定のデータフォーマット をご覧ください。
- Next をクリックして、検定するデータ列を選択します。この検定を選択する前に列を選択していれば、Selected Columns リストに選択した列が表示されます。
データ列の選択を指示する検定ウィザードの Select Data パネル
|
- Selected Columns リストに別のワークシート列を割り当てたい場合には、ワークシートで直接その列を選択するか、Data for Data ドロップダウンリストからその列を選択します。
Selected Columns リストの一行目に割り当てられるのは最初に選択した列で、以後同様に列を選択するごとにリストの2行目以降に割り当てられてゆきます。各行には、選択した列のタイトルが表示されます。生データとインデックス付きデータの場合は、ワークシートの2列を選択するよう指示されます。
- 選択した内容を変更するには、リストの割り当てを選択したあと、ワークシートから列を選択しなおします。Selected Columns リストの内容をダブルクリックすることによって、列の割り当てを消去することもできます。
- Finish をクリックすると、選択した列に基づく一元配置分散分析が実行されます。計算が完了すると、レポートが表示されます。詳しくは、対応のある t 検定の結果を解釈する をご覧ください。
5. 対応のある t 検定の結果を解釈する
対応のある t 検定のレポートには、t 統計量、自由度、および、この検定の P 値が表示されます。レポートに表示されるその他の結果は、Options for Paired t-test での選択に依存します。
結果の説明
数値による結果に加えて、拡張された結果の説明が表示されることがあります。この説明テキストは、Options ダイアログボックスで有効または無効にすることができます。また、表示する小数点以下の桁数についても Options ダイアログボックスで設定できます。
5.1 Normality Test
Normality Test の結果には、そのデータが正規母集団から抽出されたものであるという前提条件の検定に合格したか否か (Passed または Failed)、および、この検定で計算された P 値が表示されます。全てのパラメトリック検定では、ソースとなる母集団が正規分布に従っている必要があります。
この結果は、Paired t-test Options ダイアログボックスで無効にしていない限り表示されます。
5.2 Summary Table
SigmaPlot は、サンプルサイズ N、欠損値の数 (Missing)、平均値 (Mean)、標準偏差 (Std Dev)、および、標準誤差 (SEM)を一覧にしたサマリーテーブルを作成します。この結果は、Paired t-test Options ダイアログボックスで無効にしていない限り表示されます。
- N (Size):該当する列または群の観測値の数です。
- Missing:該当する列または群の欠損値の数です。
- Mean:列の平均値です。観測値が正規分布に従う場合、平均値は分布の中心になります。
- 標準偏差 (Std Dev):ばらつきの尺度です。観測値が正規分布に従う場合、平均値の上下1標準偏差分の間に約3分の2が収まり、平均値の上下2標準偏差分の間に観測値の約 95% が収まります。
- 平均値の標準誤差 (SEM):標本を元に算出した平均値から真の母平均を近似するときの目安となる尺度です。
5.3 Difference
処理の事前と事後の被験者内の平均値の差 (変化) 、および、標準偏差と平均値の標準誤差の差に関して、群の処理の事前と事後の差が表示されます。平均値の標準誤差の差は、母集団に存在する真の差を平均値の差で推定する精度の尺度です。
5.4 t Statistic
t 検定の統計量は、実験の被験者それぞれについて処置後に測定された値から処置前の値を差し引くことによって算出します。残りの分析は、これらの差について実施します。
t 検定の統計量は次の比であらわされます:
t の絶対値が大きければ (~2 よりも大きければ)、その処理は関心のある変数に影響を及ぼしていると判断することができます (差がないという帰無仮説は棄却されます)。t の値が大きいものであれば、処理の事前と事後の測定値の差が効果のばらつきだけから期待される差よりも大きい (例えば、その効果が統計的に有意である) ことを示します。t の値が小さければ (殆ど 0 に近い場合)、標本間に有意差はない (処理の事前と事後の平均値に差は殆どない) ことを示します。
- Degrees of Freedom (自由度):自由度 (Degrees of freedom) は、 t 検定で平均値の差の検出能力に影響を及ぼすサンプルサイズをあらわします。自由度 (サンプルサイズ) が大きいほど、より小さな t で差を検出できる能力は高まります。
- P Value (P 値):P 値 (P value) は、2群の間に真の差があると誤って結論付けてしまう確率です (例えば、t に基づいて帰無仮説を誤って棄却する、すなわち第一種の誤り (Type I error) を犯す確率)。P 値が小さいほど、標本が異なる母集団から抽出される確率は高くなります。伝統的には、P < 0.05 であれば、有意差があると結論付けることができます。
5.5 Confidence Interval for the Difference of the Means
平均値の差に関する信頼区間:信頼区間 (confidence interval) にゼロが含まれていなければ、指定した信頼水準の割合の間に有意差があると結論付けることができます。信頼区間は、P < α (alpha) とあらわすこともできます。ここで、α は、誤って差があると結論付けすることが許される確率です。
信頼水準は、 Options for Paired t-test ダイアログボックスで調整します:通常は、100 (1 - α)、すなわち 95% に設定します。信頼の値を大きくするほど間隔が広くなります。この結果は、Options for Paired t-test ダイアログボックスで設定します。
5.6 Power (検出力)
t 検定の検出力 (Power)、すなわち感度は、群間に真の差がある場合、その検定で群間の差を検出できる確率です。検出力が 1 に近づくほど、その検定の感度は高くなります。
この結果は、Options for Paired t-test ダイアログボックスで無効にしない限り表示されます。
- アルファ:アルファ (α) は、誤って差があると結論付けすることが許容される確率です。この誤りを、第一種の誤り (Type I error) と呼ぶこともあります (第一種の誤りは、効果がないという帰無仮説が真であるにもかかわらずそれを棄却するときです)。
この値は、Options for Paired t-test ダイアログボックスで設定します。提示される α = 0.05 という値は、許容する誤りを 20分の1にすることを示します。α の値を小さくするほど、有意差があるとの結論に至る要件はそれだけ厳格になりますが、その反面、差があるにもかかわらず差がないと結論付けてしまう可能性は高くなります (第二種の誤り:Type II error)。α の値を大きくすれば、差があるという結論付けは容易になりますが、その反面、偽陽性 (false positive) をレポートするリスクが高まります。
6. 対応のある t 検定のレポートグラフ
6.1 対応のある t 検定データのグラフを作成する方法
- Paired t-Test のレポートを選択します。
- Report タブをクリックし、Result Graphs グループにある Create Result Graph をクリックします。
Create Result Graph ダイアログボックスが表示され、その中に Paired t-test の結果で利用できるグラフのタイプが表示されます。
Paired t-test Report の Create Result Graph ダイアログボックス
|
- Graph Type リストの中から作成したいグラフタイプを選択して OK をクリックするか、リスト内のグラフをダブルクリックします。
選択したグラフがグラフウィンドウに表示されます。
レポートデータの正規確率プロット
|