更新日: 16/07/07

分布の異なる複数のデータセットを同じプロット範囲のヒストグラムで比較したい

質問

ヒストグラムウィザード を使って、分布の異なる2つのデータのヒストグラムを同じ Bin 数で作成しました。作成した2つのヒストグラムを比較するために、X 軸のプロット範囲を同じにしたところ、ヒストグラムの棒の幅が縮尺されてしまいます。同じ幅で比較するにはどうしたらよいですか?

散らばりの異なる2つのヒストグラムを作成して、

 

X 軸範囲を同じにしたら、棒の幅が変わってしまう


上記データは、Quick Transform に以下の式を適用して作成たものです。
col(1) = gaussian(100,0/0,0,1)
col(2) = gaussian(105,0/0,0,2)

 

回答:

それぞれの元データに、両方の範囲を少し超えるような調整用データを各列にそれぞれ追加して、ヒストグラムを作成します。ヒストグラムができたら、調整用データの値を削除します。

  1. 2つのデータの Min と Max をそれぞれ確認します。ワークシートを開き、Worksheet タブの View Column Statistics をクリックします。

  2. 各データのとりうる範囲を確認したら、これらの範囲を少し超えるような調整用データを各列にそれぞれ追加します。この場合は、-5, 5 をそれぞれの列に追加します。


  3. 調整用データを含んだデータを元に、同じ Bin 数 (10) のヒストグラムをそれぞれ作成します。


  4. ワークシートを開くとヒストグラム用データが以下のように生成されています。
    (※調整用データを追加したことで、各 Count の両端に 1 が加算されています)
    調整用データのカウント分を差し引きます。


  5. 調整用データのカウント分を差し引いて、Y 軸を同じにすると、以下のようなプロットを得ることができます。


  6. ヒストグラム用に生成されたデータを使えば、任意のグラフを作成することができます。
    Plot type: Grouped Bar
    Data format: X Many Y
    Plot type: Simple Bar
    Data format: XY Pair
    ※Add Plot で2つの Simple Bar を重ねたもの

 

データ範囲と Bin 数の関係は以下のようになります。