分布の異なる複数のデータセットを同じプロット範囲のヒストグラムで比較したい
質問
ヒストグラムウィザード を使って、分布の異なる2つのデータのヒストグラムを同じ Bin 数で作成しました。作成した2つのヒストグラムを比較するために、X 軸のプロット範囲を同じにしたところ、ヒストグラムの棒の幅が縮尺されてしまいます。同じ幅で比較するにはどうしたらよいですか?
散らばりの異なる2つのヒストグラムを作成して、
X 軸範囲を同じにしたら、棒の幅が変わってしまう
※上記データは、Quick Transform に以下の式を適用して作成たものです。
col(1) = gaussian(100,0/0,0,1)
col(2) = gaussian(105,0/0,0,2) |
回答:
それぞれの元データに、両方の範囲を少し超えるような調整用データを各列にそれぞれ追加して、ヒストグラムを作成します。ヒストグラムができたら、調整用データの値を削除します。
- 2つのデータの Min と Max をそれぞれ確認します。ワークシートを開き、Worksheet タブの View Column Statistics をクリックします。
- 各データのとりうる範囲を確認したら、これらの範囲を少し超えるような調整用データを各列にそれぞれ追加します。この場合は、-5, 5 をそれぞれの列に追加します。

- 調整用データを含んだデータを元に、同じ Bin 数 (10) のヒストグラムをそれぞれ作成します。

- ワークシートを開くとヒストグラム用データが以下のように生成されています。
(※調整用データを追加したことで、各 Count の両端に 1 が加算されています)
調整用データのカウント分を差し引きます。

- 調整用データのカウント分を差し引いて、Y 軸を同じにすると、以下のようなプロットを得ることができます。

- ヒストグラム用に生成されたデータを使えば、任意のグラフを作成することができます。
Plot type: Grouped Bar
Data format: X Many Y
 |
|
Plot type: Simple Bar
Data format: XY Pair
※Add Plot で2つの Simple Bar を重ねたもの
 |
|
データ範囲と Bin 数の関係は以下のようになります。
