Rで決定木

今回はRで行う決定木分析を紹介したいと思います。

決定木とは?

決定木とは、下図のように特定の要因で分岐する木構造のことです。この木構造のモデルを導くのが「決定木分析」です。
決定木

Rで決定木分析を行う

Rで決定木分析を行うには「rpart」というパッケージを利用します。
このパッケージだけでも結果を出力することができますが、
見やすく整形するために「partykit」も利用します。
ソースは下記の通りです。

#決定木分析用のパッケージを展開
library(“rpart”)#分析用パッケージ
library(“partykit”)#結果出力用のパッケージ

#分析開始
result <- rpart(Species~., data=iris )
plot(as.party(result))
決定木

出力されたグラフからわかるように、「Petal.Length」、「Petal.Width」の値で、あやめ(iris)の種類を分類できますね。


最後に

決定木分析はアウトプットが直感的にわかる形なので、とても分かりやすいですね。
これならデータにあまり触れていない人に説明するときも、わかりやすく説明できそうです。
次はこの決定木を利用した機械学習(ランダムフォレスト)について書いてみたいと思います。


コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA