2群の間に無作為なサンプリングによる変動から生じる差よりも大きな差があるか否かを検定するには、マン=ホイトニーの順位和検定 (Mann-Whitney Rank Sum Test) を使います。帰無仮説は「2つの標本は異なる中央値 (median) の母集団から抽出されたものではない」です。
順位和検定 (Rank Sum Test) は、前提条件に正規性や等分散性を必要としないノンパラメトリックな検定法です。観測されたデータがいずれの群から抽出されたものであるかにかかわらず、観測された全てのデータについて、その最小から最大までに順位を付けます。付けられた順位は、各群ごとに合計し、その順位和を比較します。
正規性および等分散の P 値:P 値により、データが正規分布していないと誤って結論付ける確率が決定されます (P 値は、データが正規分布しているという帰無仮説を誤って棄却してしまうリスクです)。検定によって求められた P 値が、ここで設定した P 値よりも大きければ、帰無仮説が採択 (Pass) されます。正規性と等分散のいずれかまたは両方の要件をより厳密なものにするには、この P 値を大きくします。パラメトリックな統計手法では、仮説の棄却が比較的ロバスト (頑健) に検出されることから、SigmaPlot ではこの値を 0.050 としています。P 値をこれよりも大きくすると (例えば、0.100)、そのデータに正規性がないとの判定が出やすくなります。正規性の要件を緩和するには、P 値を小さくします。正規性があるという仮説を棄却するための P 値に小さい値しか要求しないということは、前提とする正規分布からデータが外れていても、それが非正規であると判定される前に、それだけ広く受け入れたいとする意思があることを意味します。例えば、P 値を 0.010 とした場合、あるデータを非正規であると判定するには、0.050 の場合と比べてそれだけ大きく正規性を逸脱していなければなりません。
※ 制限事項
データの分布が極端な状態にあり、これらの手法では検定できない場合があります。たとえば、ルビーンの中央値検定 (Levene Median test) では、分散の大きさが数次の場合は差の検出ができません。このような条件の場合は、前提条件の自動検定に頼らずにデータを視覚的に調べることで容易に見分けることができます。
Finish をクリックすると、選択した列にもとづく Rank Sum Test (順位和検定) が実行されます。正規性と等分散性を検定するよう選択した場合、SigmaPlot により、正規性の検定 (Shapiro-Wilk または Kolmogorov-Smirnov) と等分散性の検定 (Levene Median) が実行されます。お持ちのデータがいずれの検定にも合格した場合、SigmaPlot により、その結果が報告され、対応のない t 検定を用いて分析を続行するよう提案されます。詳しくは、対応のない t 検定 をご覧ください。計算が完了すると、レポートが表示されます。
6. 順位和検定の結果を解釈する
この順位和検定では、マン=ホイトニーの T 統計量 (Mann-Whitney T statistic) とその T に関する P 値が計算されます。これらの結果は、順位和検定の実行後に表示される Rank Sum Test レポートに表示されます。レポートに表示されるその他の結果は、Options for Rank Sum Test ダイアログボックスで有効または無効にすることができます。
Normality Test:Normality Test の結果には、そのデータが正規母集団から抽出されたものであるという前提条件の検定に合格したか否か (Passed または Failed)、および、この検定で計算された P 値が表示されます。ノンパラメトリックの検定法では、母集団の正規分布を前提条件としないのでこの検定には合格しません (Failed になります)。この結果は、Options for Rank Sum Test ダイアログボックスで設定します。
Equal Variance Test:等分散性の検定 (Equal Variance test) の結果には、そのデータが同じばらつきを持つ母集団から抽出されたものであるという前提条件の検定に合格したか否か (Passed または Failed)、および、この検定で計算された P 値が表示されます。ノンパラメトリックの検定法では、母集団の等分散性を前提条件としません。この結果は、Options for Rank Sum Test ダイアログボックスで設定します。
Summary Table:SigmaPlot では、サンプルサイズ N、欠損値の数 (Missing)、中央値 (Median)、および、2つのパーセンタイルを一覧にしたサマリーテーブルが作成されます。この結果は、Options for Rank Sum Test ダイアログボックスの Summary Table オプションを無効にしない限り表示されます。
T 統計量:T 統計量は、小さい方の標本群、または、両群のサイズが同じ場合は最初に選択した群の順位の合計です。この値を、全ての可能な順位の母集団と比較して、この T が発生する確率を決定します。
P 値:P 値は、2群の間に真の差があると誤って結論付けてしまう確率です (例えば、T に基づいて帰無仮説を誤って棄却する確率、すなわち、第一種の誤り (Type I error) です)。P 値が小さいほど、異なる母集団から標本が抽出される確率が高くなります。
伝統的には、P < 0.05 の場合は、有意差があると結論付けることができます。
7. 順位和検定のレポートグラフ
順位和検定の結果を利用して、以下に示す最大2つのグラフを作成できます:
列データのパーセンタイルと中央値の箱ひげ図 (Box plot of the percentiles and median of column data):順位和検定のボックスプロットでは、列データのパーセンタイルと中央値がプロットされます。その両端が 25% 点と 75% 点で定義されるボックスには、中央値をあらわす一本のライン、および、10% 点と 90% 点で定義されるエラーバーが追加されます。詳しくは、Box Plot をご覧ください。
列データのポイントプロット (Point plot of the column data):順位和検定のポイントプロットでは、列ごとの全ての値がグラフ上の点としてプロットされます。詳しくは、Point Plot をご覧ください。
7.1 順位和検定のレポートグラフを作成する方法
Rank Sum Test のレポートを選択します。
Report タブをクリックします。
Results Graphs グループにある Create Result Graph をクリックします。 Create Result Graph ダイアログボックスが表示され、その中に Rank Sum Test の結果で利用できるグラフのタイプが表示されます。
Rank Sum Test Report の Create Result Graph ダイアログボックス
Graph Type リストの中から作成したいグラフタイプを選択して OK をクリックするか、リスト内のグラフをダブルクリックします。選択したグラフがグラフウィンドウに表示されます。詳しくは、レポートグラフ をご覧ください。