更新日: 14/03/31

Grapher 9 でのカーブフィッティングと信頼区間の設定

データをプロットしてみると、値にぶれがあることに気がつきます。普通、そうした値もグラフに表示しますが、フィッティングを行う際には使用しません。そうした値は、信頼区間から外れているからです。Grapher 9 は、フィッティングや信頼区間を求めるためのデータの中で、必要な部分だけを表示させることができます。

 

散布図の作成

まず最初に、ライン/散布図 (line/scatter plot) を作成します。ここではデータポイントをラインで結ばないので、散布図のみが作成されます。以下の手順で行います。

元データの散布図をみると、フィッティング曲線が推測できます。
  1. Graph | 2D XY Graphs | Line/Scatter コマンドをクリックします。
  2. Open ダイアログで、このデータファイルを選択し、開くボタンを押します。ライン (折れ線) グラフが作成されます。
  3. Line/Scatter Plot 1 を選択状態にし、Property ManagerLine タブをクリックします。
  4. Style の隣のライン (デフォルトは Solid) をクリックし、メニューリスト 2番目の空白 (Invisible) を選択します。ポイントを結んでいたラインが消去されます。
  5. Property ManagerSymbol タブをクリックします。
  6. Symbol frequency 隣の 0 を選択し、1 を入力します。入力ボックス右側に付いている上向き矢印をクリックしても結構です。すべてのデータポイントが、デフォルトシンボルでプロットされます。
  7. さらにシンボルのプロパティを設定します。たとえば Size を小さめにし、Fill color Line color を変更します。ここではサイズは 0.10 インチ、Fill color20% Black にしました。

散布図でデータポイントの広がりを見ていると、そのおおよその傾向がつかめます。また、x=1.5 以上でバラツキ方が大きいのが目に付きます。このバラツキの原因としては、サンプリング誤差、計器の読み取り誤差、データ処理の誤りなど、いろいろなことが考えられます。いずれにしても、フィッティング曲線や基本統計データにはこれらのデータを加えたくありません。

 

フィッティング曲線の作成

赤のフィッティング曲線には、X = 1.5 以上の領域で偏りが見られます。

フィッティング曲線の作成手順

  1. Line/Scatter Plot 1 オブジェクトを選択して下さい。
  2. Property ManagerPlot タブをクリックします。
  3. スクロールダウンして下に行き、Fits の隣の <Click here to add/edit fits> をクリックして下さい。
  4. Fits ダイアログで、「Linear, Y = B * X + A」と表示されているボックス右の三角ボタンをクリックします。リストの中から「Power, ln(Y) = B * ln(X) + A」を選択し、Add ボタンを押して下さい。
  5. OK ボタンを押すと、フィッティング曲線がグラフに表示されます。
  6. Property Manager で曲線のプロパティを編集することができます。この曲線がよくわかるように、ラインのカラーを、太さを 0.030 インチに設定しました。

 

信頼区間の設定と編集

緑色で信頼区間を設定。信頼水準を非常に大きくとったため信頼区間が広いのですが、すべてのデータはその中に収まっていません。

信頼区間の設定法

  1. Fit 1: Power をクリックし、フィッティング曲線を選択します。
  2. Property ManagerPlot タブをクリックします。
  3. Confidence の隣の <Click here to add interval> をクリックします。
  4. Confidence 2 をクリックし、信頼区間を選択します。
  5. Property ManagerPlot タブをクリックします。
  6. 信頼区間の幅を広げるため、Level の値を 99.99% にして下さい。変更の仕方は、「95」を選択し「99.99」と入力して、キーボードの ENTER キーを押します。
  7. 最後に信頼区間を塗り潰して、わかりやすくします。Property ManagerFill タブをクリックして下さい。
  8. Pattern の設定ボックスをクリックし、リストの中から黒色 (Solid) を選択します。
  9. Foreground のカラーボックスをクリックし、リストの名から Dull Green などの明るい色を選択して下さい
  10. 最後の下に隠れているポイントデータが見えるように Foreground Opacity50% に変更します。「100」を選択し「50」と入力して ENTER キーを押して下さい。
  11. Arrange | Order Objects | Move to Back コマンドを使用して、信頼区間を他のオブジェクトの下に移動させることも可能です。

 

フィッティング曲線の制約

フィッティングの範囲を修正したら、信頼区間もいくらかよくなっています。

ここまで、フィッティング曲線と信頼区間は全範囲に適用しました。上の方にばらついたデータがあるため、偏りのある結果が出てくることは予想できました。プロットの下の方を見てみると、この影響を受けて、やはりあまりよくデータにフィットしていません。そこで、フィッティング曲線に制約を加えます。

  1. Fit 1: Power オブジェクトをクリックします。
  2. Property ManagerPlot タブをクリックします。
  3. Data limits の頭に付いている + ボタンをクリックして、そのセクションを開きます。
  4. Use curve limits の隣にあるチェックボックスを OFF にします。
  5. Maximum value1.65 に変更します。この値は、フィッティングがよい範囲として 1.52.0 の間で見当をつけたものです。

 

グラフの完成

制約を加えたフィッティング曲線でよい結果が得られましたが、さらに手を加えてフィッティング曲線を完成させます。そのために、データから外れ値を取り除きます。

データにさらに修正を加え、フィッティング曲線と信頼区間を元データにさらによく適合するようにしました。
  1. Tools | Options コマンドをクリックします。
  2. ダイアログ左側セクションにある Plots をクリックします。右側のセクションにある Display value on click チェックボックスと Highlight worksheet チェックボックスを ON にして、OK ボタンを押します。これで、グラフでデータポイントを選択してワークシートの値を編集できるようになります。
  3. Worksheet Manager が非表示になっている場合は、View | Managers | Worksheet Manager を選択して下さい。データポイントを削除したとき、グラフ上のデータポイントとワークシートの値を同時に見ることができます。
  4. Line/Scatter Plot 1 オブジェクトをクリックします。
  5. プロットの左下隅に行き、信頼区間の上に外れている最初のデータポイントをクリックして下さい。Worksheet Manager で、第 5 行目が反転表示されます。
  6. Worksheet Manager の第5行目の「5」をクリックし、キーボードの Delete キーを押します。するとデータポイントは削除され、フィッティング曲線がアップデートされます。
  7. 上記 5 と 6 のステップを他の外れ値に対しても繰り返します。2つのデータポイント (第5行目と 10行目) を削除した結果を右に示します。

 

外れ値を取り除いたり、フィッティング曲線の修正は、きわめて主観的な作業ですので、データが明らかに変だというときに限るべきです。しかしながら、そうした処理をほどこすと、フィッティング曲線や信頼区間の精度が上がり、データの特性をよく表現できます。