9.2 Data Analysis (データ分析)
- Bootstrapping (ブートストラップ法)
ブートストラップ法とは、統計的推定量の信頼性を見積もる手法のひとつです。このモデルでは、ある推定統計量の分布をサンプリングを繰り返し行うことによって求める方法を紹介します。
- Kmeans Clustering (K-平均法)
このモデルでは、Analytica の散布図の事例を紹介します。いくつかのランダムデータに K-平均法 (K-means clustering) アルゴリズム (K はクラスタ数) を適用して、類似する点からなる複数の群 (クラスタ) に分類します。このモデルでは Iterate 関数も使います。
- Moving Average Example (移動平均の事例)
あるデータストリームの移動平均 (moving average) をどのように計算するかを紹介する簡単なモデルです。Moving Average 関数を定義して利用します。
- Multidimensional Scaling (多次元尺度構成法)
このモデルは、 多次元尺度構成法 (multidimensional scaling) を実行します。インプット N (問題の次元) と Distances (距離すなわち非類似性をあらわす NxN の対称行列) を使います。計算結果として、N 個の XY 点 (または、Xcoord と Ycoord の各値) の2次元集合を出力して、インプットの隔たりをもっとも上手くあらわす点の空間配置を求めます。
出典: Multivariate Analysis by K.V. Mardia, J.T. Kent, and J.M. Bibby, Academic Press, London, 1979, Section 14.2.2, page 400. Model supplied by Michael L. Thompson.
- Principle Components (主成分分析)
主成分分析 (PCA: Principal components analysis) は、多次元のデータセットを低次元に縮約して分析するのに使用する手法です。PCA の計算では、データセットの固有値分解 (eigenvalue decomposition) または特異値分解 (singular value decomposition) を計算します。このモデルでは、過去の株価の共分散行列の主成分を計算するために固有値分解を使用して主成分を求める方法を紹介します。
- Regression Examples (回帰分析の各種事例)
このモデルは、一般化線形回帰 (generalized linear regression) の使用を紹介するものです。以下に示す (x, y) の点集合を構成する各種関数の形式からもっとも当てはまりの良い曲線を使います。
- 線形回帰 (Linear regression)
- 2次回帰 (Quadratic regression)
- 多項式回帰 (Polynomial regression)
- 離散型フーリエ級数 (Discrete Fourier series)
- 回帰と冗長基底 (Regression with redundant basis)
- 任意の多数項の集合を使用した回帰 (ある関数を選ぶ有力な根拠がない場合に使用)
- 自己相関の系列 (auto-regressive series)