製品は日本語アプリケーション・英語マニュアルです。

予測能力:

Minitan SPM の TreeNet は、極めて正確なモデルを一貫して生成する能力がある柔軟で、強力なデータマイニング・ツールです。TreeNet の精度レベルは、通常、単一のモデル、またはバギング (bagging) や従来のブースティング (boosting) などのアンサンブルによって到達できません。TreeNet は回帰と分類に対して顕著な性能を示します。アルゴリズムは、一般に、正確なモデルに集中するために、連続したエラー-修正プロセス内に構築された数千の小さい決定木を生成します。TreeNet は Salford Systems 社の各種データマイニング/モデリング大会の受賞の大多数に貢献しました。

優れた精度:

Minitan SPM の TreeNet の頑丈さは、誤ったターゲットラベルにより汚染されたデータまで広がります。このタイプのデータエラーは従来のデータマイニング手法にとって非常に挑戦的であり、従来のブースティングにとって壊滅的なものとなります。一方、TreeNet は、一般に、既存モデルを持つ分散にあまりに多くのトレーニングデータポイントを動的に拒絶するようなエラーの影響を受ける恐れがありません。さらに、TreeNet は、あるレベルの精度の優位性をもっています。これは、通常、単一モデルによって、またはバギングや従来のブースティングのようなアンサンブルによっては到達可能ではないものです。ニューラルネットワークと対比されるように、TreeNet はデータエラーに敏感ではなく、それには、時間がかかるデータ準備、前処理、欠損値の代入が不要です。

高度な機能:

インタラクション検出は、予測モデルにおいて任意の種類のインタラクションが必要であるかを確立し、特に、どのインタラクションが必要であるかを発見する検索エンジンです。インタラクション検出システムは、(時々、劇的に) モデル性能を改善するのに役立つだけではなく、貴重な新しいセグメントおよび以前に認められなかったパターンの発見も支援します。

 

TreeNet ケーススタディ

 

Minitab SPM の中での位置付け

  • Minitab SPM のデータマイニング技術は、3つの柱に基づいています。すなわち CART (2進木分析に基づく明瞭で解釈しやすい層別化)、MARS (回帰およびロジスティックス回帰に基づく明瞭で解釈しやすい予測モデル) 、そして TreeNet (解釈のしやすさよりも正確さが必要な場合の解析ツール) です。解釈のしやすさと透明性が必要で、モデルがルールに基づいて表現できなければならない場合でも、TreeNet はその他のモデルと比較して最大の精度をもたらすことができます。

 

技術情報:Dan Steinberg氏のブログより