散布図

こんにちは。namakemonoです。

本日は「散布図」について記載していきます。

散布図とは?

散布図とは、縦軸、横軸に2項目の量や大きさ等を対応させ、データを点でプロットしたものです。
QC7つ道具の一種ですね。


028

散布図の作成方法

散布図を作成する場合は、「plot」関数を利用します。
横軸に表示させたいものを1つめの引数に、縦軸に表示させたいものを2つ目の引数に入力します。
今回は「women」というサンプルデータを利用します。


029


引数にこのデータをそのまま入れても散布図はかけるのですが、今回はデータを分けて記載したいと思います。
womenデータの1列目(heigth)をheigthという変数に、2列目(weigth)をweigthという関数に代入します。


030


変数「heigth」、「weight」を利用して、plot関数を利用します。


031


結果、このような散布図が生成されます。


028

近似線を表示させるには?

近似線を表示させるには、散布図を記載した後に別の操作が必要です。
近似線は「y = ax + b」という直線で表されます。
yは縦軸の値、xは横軸の値、aは直線の傾き、bは直線の切片(x=0の時の値)を表します。
今回の例ですと、yはweigthを、xはheigthとなります。
近似線を引くためには、a(直線の傾き)と、b(切片)を求める必要があります。


そこで使用するのが「lm」関数です。
lm関数は単回帰分析を行う関数です。(単回帰分析については、別途説明します)
lm(y~x)とすることで、直線の傾きaと切片bを求めることができます。


032


「Intercept」は切片を、「heigth」は直線の傾きを表します。

次に、単回帰分析の結果を近似線として表示させましょう。
近似線を表示させるには「abline」関数を利用します。


033


colは線の色を指定します。今回は赤色です。近似線を引くと、このようになります。


034

最後に

散布図はデータの関連を見るために非常に便利な手法です。
ぜひ使ってみてください。
ではでは


コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA