Rでクラスター分析(概要偏)

今回はクラスター分析について記載します。
ただ、クラスター分析はいろいろと書きたいことあるので、全三回に分けて記載します。
今回はクラスター分析の概要について記載します。

クラスター分析とは

クラスター分析とは、一言でいうと「似た者同士を集めてグループを作る」分析手法です。
上記だけ見ると簡単そうですが、グループを作るルールには様々な種類があり、分析者の判断で結果が異なる場合もあります。
ちなみにクラスターとは英語で「集団」や「塊」を表します。

クラスター分析の種類

クラスター分析は、「階層的方法」と「非階層的方法」の2つに大別できます。

階層的方法 個々のサンプルを類似性の高いものから順々に結合し、最終的に1つの集団にする方法。 単に対象をいくつかのクラスターに分類するだけでなく、どのようにクラスターが結合されていくかの過程までが見られる。 1つ1つ結合していくため、大規模データの場合計算量が膨大になったり、結果が不安定になりやすい。 アウトプットは樹形図となる
非階層的方法 分析者があらかじめ決めたクラスター数に、サンプルを分類していく方法。 初期値(初期に選択される「核」となるk個のサンプル)によって、結果が変わるという短所がある。 アウトプットは散布図となる



階層的方法のアウトプットイメージ
071


非階層的方法のアウトプットイメージ
072

最後に

今回はクラスター分析の概要についてさらっと記載しました。
次回は階層的方法について記載していこうと思います。


コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA