パターン認識
入力変数を
、出力変数を
としたとき、学習データセット
から
と
の間に存在する規則性を見つけ出し、新しく観測された
に対応する
を求めることをパターン認識という。なお、出力変数が連続値の場合は
回帰分析と同等である。
機械学習には、大きく分けてパラメトリックなアプローチとノンパラメトリックなアプローチとがある。パラメトリックなアプローチでは、確率分布関数
を一次独立な関数の線型(非線型)結合によって表現し、そのパラメーターを推定する。一方、ノンパラメトリックなアプローチでは、データ集合から直接に目的の確率を計算する。
ある入力
に対して出力
が,
にしたがって決まるとする.このとき,
学習セットの集合から関数を推定することを機械学習と呼ぶ.が有限離散数の場合は,関数
が入力
の分類器の役割を果たすので
パターン認識と呼ばれ,
が有限離散数の場合は回帰と呼ばれる.なお、出力変数が連続値の場合は
回帰分析と同等である。
機械学習
入力変数を、出力変数をとしたとき、学習データセットから条件付き確率分布を推定することを機械学習という。無作為抽出されたサンプル集団から(母集団の)確率分布を推定することになるので、機械学習は
推測統計学と関係が深い。実際、機械学習で使う技法の多くは推測統計学のものである。なお、出力変数が連続値の場合は
回帰分析と同等である。
機械学習には、大きく分けてパラメトリックなアプローチとノンパラメトリックなアプローチとがある。パラメトリックなアプローチでは、確率分布関数
を一次独立な関数の線型(非線型)結合によって表現し、そのパラメーターを推定する。一方、ノンパラメトリックなアプローチでは、データ集合から直接に目的の確率を計算する。
パターン認識と回帰分析
ある入力
に対する出力
が,関数
にしたがって決まるとする.このとき,入力と出力(教師)の組
の集合(学習データセット)
から関数
を推定することを
機械学習とよぶ.
パターン認識の場合は、
が有限離散変数
であり、関数
はクラス分類をおこなう。一方,
回帰分析の場合は、
が連続変数である.
ベイズ推定法
確率的情報処理をパターン認識に適用する.
ベイズ推定法から前述のNN法を導出することもできるため,一般的なパターン認識法の一般的な表現ともいえる??
学習のメカニズムを説明するのにも適している??
最近傍法
NN法
入力ベクトルとプロトタイプベクトル(クラスを代表するベクトル)の距離を測り,もっとも近いプロトタイプの属するクラスを認識結果として出力する方法を最近傍法(NN法)と呼ぶ.
まず,分類するクラスが
個あるとして,それぞれを
で表すとする.
特徴ベクトルが
次元であるとすると,クラス
のプロトタイプ
は以下のように定義される.
このとき,入力ベクトル
とプロトタイプ
との距離は次式によって求められる.
この距離を最小にするプロトタイプの属するクラスが識別器の出力となる.
(余談:2クラス問題のNN法はパーセプトロンと数学的に等価である.《
(参考)フリーソフトでつくる 音声認識システム》)
K-NN法
NN法では,最近傍のプロトタイプベクトルにより,入力ベクトルの識別をおこなった.
k-NN法では,最近傍の
個のプロトタイプベクトルにより,入力ベクトルの識別をおこなう.
最近傍の
個のプロトタイプベクトルを探し,その中で多数を占めたクラスを識別結果とする.
サポートベクトルマシン(SVM)
概要
線型非分離な問題への対策
最終更新:2008年12月20日 23:09