HOME > ソフトウェアパッケージ > 統計解析/グラフ作成 > Design-Expert (デザインエキスパート) > Stat-Teaser > Stat- Teaser 2013/09 号
新規購入お見積
アップグレードお見積

Design-Expert (デザインエキスパート)
Stat-Teaser (NEWS レター)

統計的に判断する通勤時間の短縮経路

図1: ハイウェイ 36 号線の信号停止を迂回する州間高速道路 694 号線

私の住む愛する町スティルウォーターは、ミネソタ州東部の州境にある風光明媚な景勝地セントクロワ川沿いの渓谷にあります。毎朝の通勤時間ともなると、私を含む大勢の住民がミネアポリスへ向かう道のりで一緒になります。しかし、西へ進む残り10数マイルの高速道路の入口まで差し掛かると、私たち一人ひとりに大きな決断が迫られます。この先、どっちに進路を取るべきかという問題です。

36号線をそのまま進む特段の理由がない限り、私はいつも 694 号線に乗ることにしています。しかし、次のような疑問が生まれてきました。果たして本当に通勤時間を節約できているのだろうかと。このような理由から、職場に進む経路を選ぶにあたり統計学に基づく決定的な根拠を示すための単純な比較実験を考案してみました。

単純比較のセットアップには、Design-Expert® ソフトウェアの Factorial タブにある General Factorial (一般的な要因配置) を使います。SN 比を 1.5 にして実験規模を決めたので、選択する実験は試行数 16 となります。すなわち、2つのカテゴリ水準 (2つの経路) につき、それぞれ8回行います。

実験を行ったのは、早春 (2013年の第13週~16週) のいずれも平日で、無作為化したランシートで指定された方向に従って、道が分かれる東側のポイントに来たらスマートフォンのストップウォッチアプリを開始します。バイパスの西側の合流点に着いたら時間の計測は終了です。表1に示すのは、選択した経路とそれに掛かった時間をまとめた結果です。

実験 備考 経路 時間 (秒)
1 復活祭週間により交通量少ない MN 36 409
2 同上 MN 36 396
3 同上 (聖金曜日) US 694 450
4 開始時間は推定。実際の地点で記録するのを忘れた。 US 694 449
5   US 694 468
6 MN 36 号線での赤信号の停止は未だなし。 MN 36 424
7   MN 36 406
8   US 694 455
9 赤信号で1回停止。雨天。 MN 36 561
10   US 694 460
11 昨夜からの雪で路面が濡れる。 MN 36 457
12   US 694 467
13 3つ目 (最後) の信号により徐行。 MN 36 428
14   MN 36 425
15   US 694 467

表1:経路の実験結果

 

Design-Expert を利用した結果を検討することにしましょう。まずはじめに、効果の半正規プロットです。これを見たところ、選択経路の違いに統計的に有意な差はありません。正方形の効果 A が反復実験で生じる純誤差をあらわす緑の三角形と共に一直線上にあるからです (図2参照)。

図2:効果の半正規プロット (全データ)

 

しかし、診断プロットを見ると、外れ値が1つ飛び出しているのがわかります。実験9です (図3参照)。

図3:診断プロットにおける外れ値

 

この特殊原因は明らかです。ハイウェイ 36号線で最後の最後に幸運に見放され、赤信号で止められたものです。皮肉なことに、この実験のすぐ後にミネソタ州運輸局 (MnDOT) は、この最後の信号を撤去する道路工事を開始しました。このときの実験を除外すれば、経路の違いは統計的に有意なものになります (図 4、5参照)。

図4:効果の半正規プロット (外れ値を除外)

図5:効果プロット (外れ値を除外)

 

以上から、ハイウェイ 36 号線で行くのがよさそうです。しかし、ちょっとまってください。MnDOT の事業計画では、ハイウェイ36号線の信号全てを撤去するわけではありません。残りの信号は、この道路がフリーウェイとなるまでの数年間は、従来どおり存続します。

こうなると、結論は明らかです。ハイウェイ36号線は工事により閉鎖されるため、選択肢は I694 しかなくなります。工事が一段落し、早朝に進路変更する気力がなければ、私は恐らくハイウェイ36号線を直進し、これまでどおり残りの信号に出会うことになるでしょう。さらに野心が募ってくれば、もっと長期にわたる研究に着手し、青信号に当たる確率を明らかにするつもりです。この実験ができたこと自体は、とても幸運だったと思いますが、結論を出すにはサンプル数が少なすぎました。私は、本当に、信号で停止する機会の割合を見積もれるだけの十分な実験を追跡するつもりです。続く…。

—Mark Anderson, mark@statease.com

 

P.S. この記事について書いたブログもご覧ください。

P.P.S. 記録した内容について言えば、実験期間中、私は、その年の週、平日 (1=Mon, …, 5=Fri)、開始時 (分岐地点の)、天候状況、および、赤信号に出会った回数を丹念に記録していましたので、これらの変数を共変量として使い、より複雑な回帰分析を行いました。しかし、統計学を使って作業するという楽しみ以外は、そこから得られるものは何もありませんでした。

 

インド通貨ルピーの急速な下落 (偶発的事態を回帰分析することの危険性)

Design-Expert ソフトウェア (DX) がインドの地に根付いて2年前が経ちますが、私は、会議への参加と授業の用があってわずかな期間ですがインドに滞在していました。今回その国を訪れようとする8月に、次のような見出しが目に飛び込んできました。「ルピー、米ドルに対して空前の安値」。それは、私と妻クリスティンにとっては、絶好のニュースでした。宿泊施設の格上げはもとより、手持ちの米ドル (USD) で買える商品やサービス、食べ物などがその分増えることになるからです。二人の人生を変えるインドへの旅が遂に実現することに胸を躍らせました。

記事に戻りましょう。過去20年間に経済発展の著しい BRICs (ブラジル、ロシア、インド、中国) として知られている国家の1つであるため、ルピーは比較的強いのではないかと思う方もいるでしょう。しかし、このときの事例は全く別です。

図1:インド通貨ルピーの急落
(グラフは www.XE.com による)

 

なぜ、ルピーは歴史的水準で安くなったのでしょう? (図1参照)。可能性として考えられる要因はたくさんあります。例えば、雇用成長、GNP 成長などの経済指標や、通貨価値などが通常は一緒に検討されます。これらは高度に相関しているからです。しかし、同調して変動する候補として考えられる要因は余りにも多くありますので、ルピーの下落の真の原因が何であるかをはっきりさせるのは困難です。経済記者が金融市場のあらゆる変動を何らかの原因と結びつけるのは仕方がありませんが、彼らが正しいという機会はまずありません。定常状態のプロセスから収集あるいは監視されたに過ぎないこの種のデータは、偶発的データ (happenstance data) として知られています。データの収集に先立つ計画性や入力因子に対する目的のある変更は一切ありません。求めたデータを単に得ただけです。

産業分野の実験者が工場現場のプロセスからデータを集める場合、このような場面にしばしば直面します。製造プロセスにおける最終目的は、製造する部品を常に仕様に合致させることです。このことを実現させるために、統計学的な工程管理図 (process control chart) を使用して、その工程が管理下に置かれているかどうか (そして良い部品が製造されているかどうか) を監視します。工程管理のメカニズムでは、ある入力コントロールと別の入力コントロールを置き換えることができます。経済データと同様、因子間にこの共線性 (collinearity) があると、どちらの因子が真の変化の原因であるかを突き止めることができません。

このことを我々の専門分野である実験計画法 (DOE) と比較してみましょう。DOE では、あらかじめ規定された方法に基づいて、因子間の全ての有効な組み合わせを検定し、その効果を他の因子効果とは独立して見積もることが確実にできるよう、注意深くデータを収集します。これこそ「直交 (orthogonal)」計画の意味するところです。全ての因子効果を独立して計算することができるのです。このような因子が制御下に置かれていれば話は簡単ですが、それでは、経済データや政策についてはどうでしょうか?米ドルに対するルピーの為替レートに影響する全ての因子を制御することができるでしょうか?また、同様に重要なことですが、これらの因子を互いに独立させる (すなわち、共線性を低くする) ことができるでしょうか?答えは、断じて「ノー」です*。もしかすると、高度に相関する因子と同じようにうまくデータセットにあてはまる有望なモデルが幾つもあることを見つけるかも知れません。問題は、そのうちのどれが正しいのかを判断できない点にあります。

このことを説明するために、話題をインド通貨ルピーに関するデータに戻しましょう。経済指標を幾つか調べると、ルピーの価値を予測するにはどの指標が重要であるかの判断を試みることができます。私が調べたのは、米経済とインド経済に関するものをそれぞれ9つずつ、全部で18の経済指標です。収集したデータの期間は、1994-2012 年の19年間分です。

全ての因子に多種多様なモデルの当てはめが可能でしたが、モデルに対する R2adj, R2pred および F values の値を測定するに従って、共通の統計的あてはめに近づいていきました。このことは、中に入れる因子と外に出す別な因子を交換するだけで行うことができます。このことは、多くの因子が相関係数 0.7 以上で相関していたということから理解できます (このことは DX の Graph columns ノードを使って評価できます)。これが、偶発的事態の回帰分析における最初の過ち、すなわち、因子間の高い共線性の説明です。

従って、私は分析を簡素化する別なアプローチをとることにしました。最も重要で分かり易いものになると見込んだ一部の因子のみに焦点を絞ることにしたのです。絞り込んだのは次の4つの因子です:(1) インドの国民1人あたりの国民総所得 (GNI) 、購買力平価 (PPP)、(2) インドの前年比 GDP 成長、(3) インドの前年比インフレ率、(4) インドの貸出金率。私は当初、データセットの全てをひとつのモデルにあてはめていましたが、後になってから、過去に蓄積されたデータ (historic data) にあてはめを行う際になすべき重要なチェックを思い出しました。データの分割 (data splitting) です。これは、モデルをあてはめる際にデータの一部を隠すこと (hold back) を意味します。その後、残りのデータをどれだけ予測できるかをチェックします。これによって、モデルの予測能力が検証されます。従って、まずはじめに、データの 50% にモデルをあてはめました。

最初にあらわれた問題は、私が全てのデータセットで使用したときとは異なるモデルを選択したことでした。次に、DX の予測ノードを使用して、95% 予測区間 (95% PI) で検証実験 (verification runs) を比較しました。この区間には、将来の単一の測定値が 95% の確かさで含まれることになります。私が隠した全ての検証実験は、この区間の外側になりました。つまり、検証をパスしなかったことになります。私は前に戻り、データの 80% にモデルをあてはめましたが、検証実験の半数が依然として基準に達しませんでした。データを十分にお持ちでしたら、モデルが将来のデータを予測できるかどうか、あるいは、過去 (データを収集した時点) に何が起きたかを予測するだけが良いのかを調べるサニティチェック (簡単な検証) として、このデータ分割法を利用できます。

もちろん、元に戻って、過去に蓄積されたデータを更に探し出してモデルに改良を加えることもできたでしょう。しかし、このことが愚かな試みであることを私は承知しています。以下の引用は、過去のデータを用いて将来の経済を予測しようとする試みを総括したものです。

「未来を予測しようとする試みは、自動車の後ろの窓を見ながら夜中にライトも付けずに運転するようなものである。」

オーストリア出身の経営コンサルタント・教育者、ピーター・ドラッカー

 

事故を未然に防ぐには、私ならこう言います。明かりを付けなさい、そして、統計的に計画された実験 (DOE) に進みなさいと。

私は妻とインドの旅を楽しみました。ルピー下落の原因が何であろうと、私たち二人は、新・世界の七不思議のひとつタージマハル (図2) へのトレッキングの体験を経て、インドには特別な購買力があることを肌で感じました。

図2:ブルックスとクリスティン。タージマハルにて。

 

—Brooks Henderson, brooks@statease.com

*実際に、これには厳密な根拠があります。J.W. Longley (1967) は、コンピュータの回帰アルゴリズムを検定するために自身で経済データセットを選び、状態の悪いこのようなデータを使うことで誤解を与えることが生じ得ることを示しました。このデータセットとその落とし穴に関する詳しい情報については、Mark Anderson と Pat Whitcomb による著書『RSM Simplified (chapter 2)』をご覧ください。また、Design-Expert に用意されているチュートリアルでも、これに関する詳しい情報と、ここで紹介した高度に相関したデータセットを分析する (または少なくとも分析を試みる) ことができます。

 

スポットライト:Stat-Ease IT チーム

Stat-Ease から皆さんに我が社自慢の IT チームをご紹介いたします。写真の右から順に、ベン・ニューゲント、ニール・ボーン、ジョー・カリエール、トリグ・ヘルセット、ハンク・アンダーソンです。彼らが担当するのは、Design-Expert および Design-Ease® ソフトウェアのプログラミング、顧客向けのテクニカルサポート、および、Stat-Ease における IT 問題の対応です。

写真: Stat-Ease IT スタッフ. Pictured from left to right are: Ben Nugent, Neal Vaughn, Joe Carriere, Tryg Helseth, Hank Anderson

 

我が社のスタッフは経験豊富です。トリグは、創立者の Pat Whitcomb と共に Design-Ease ソフトウェアを立ち上げた1984年の秋からの勤務です。ニールとハンク (Mark Anderson 社長の息子) は、1990年代後半に Stat-Ease チームと合流しました。ジョーとベンは、数年前に新入社員として入社しました。

素晴らしいユーモアのセンスと持前の明るさに加え、このグループには非常に優れた技術力もあります。次期バージョンの卓越した新機能にぜひご期待ください!

 

記事原文:

 

関連情報: