[PRML] 1. データに潜むパターンを見つけ出す。

パターン認識という学問

計算機アルゴリズムを通じて、データの中の規則性を自動的に見つけ出し、さらにその規則性を使ってデータを異なるカテゴリに分類する、というデータ処理を行う

素直な方法

ただし、こういった方法ではあらかじめ作らなくてはいけないルールの数を爆発的に増やさなくてはならなかったり、例外が起きたときのルールも爆発的に増えてしまいます。

パターン認識での方法

訓練集合(training set) $\{{\mathbf x}_1,\ldots, {\mathbf x}_N\}$ の入力 ${\mathbf x_i}$ により関数のパラメータを更新し、出力(target vector) ${\mathbf t_i}$ となるような関数 ${\mathbf t} = y({\mathbf x})$ を作る
テスト集合(test set)の入力 ${\mathbf x}_j$ に対して出力 ${\mathbf t}_j$ が予測(prediction)できるようになる

処理の手順

パターン認識の扱う問題の種類
大きく分けて

教師あり学習(supervised learning)：訓練データが、入力ベクトル ${\mathbf x}$ と目標ベクトル ${\mathbf t}$ の事例で構成される場合
教師なし学習(unsupervised learning)：訓練データが、入力ベクトル ${\mathbf x}$ のみで構成される(それらに対応する目標ベクトルが存在しない)場合

に分けることができます。
このほかに

などもあります。

教師あり学習
教師あり学習には、大きく分けて2つの場合があり、

教師なし学習
教師なし学習には

などがあります。

パターン認識を学ぶのに必要な知識

は基本として、

の知識が必須です。

(言葉だけだと分かりづらいので、図とかTeXとかで更新予定です)

情報工学とその周辺