データ分析手法 - 自己組織化マップ

自己組織化マップ

自己組織化マップとはフィンランドの研究者T. Kohonenが開発したクラスタリング手法であり、複雑なデータを理解しやすいように可視化することができます。

手法について

自己組織化マップ(SelfOrganizingMaps)とは、人間の脳の仕組みをモデル化した手法です。
様々なデータを入力し続けることで、徐々に類似性の高い集団ができ、それらの類似度によってマップ上の距離によりデータを配置し、データを視覚的に理解できるようになります。
煩雑で膨大な情報を人間が理解することができるよう傾向や変数間の相関関係を自動で判別できるため、複雑なデータを整理したい際に活用されます。

手順・式

①2次元マップのサイズを決定する
②2次元の各グリッドにニューロンを配置する
③データセットのサンプルごとに最もユークリッド距離の近いニューロンを見つけ、見つけ出したニューロンをサンプルに少し近づける
④見つけ出したニューロンに近いニューロンも、サンプルに少し近づける
⑤ ③と④を繰り返し行う

メリット・デメリット

【メリット】

①高次元のデータを教師なし学習でクラスタリング可能
②サンプルごとの勝者ニューロンを見ることで、二次元マップ上でデータの可視化が可能

【デメリット】

①学習回数を増やしても二次元マップは収束せず、最適な学習回数・学習率を決めなければならない

データ分析手法 ー 自己組織化マップ