箱ひげ図

こんにちは。namakemonoです。

本日は「箱ひげ図」について記載します。

箱ひげ図とは?

箱ひげ図とは、ばらつきのあるデータをわかりやすく表現するための統計学的グラフです。

047


図の各パーツは、以下のような意味を持っています。

図のパーツ 説明
箱の上辺 第3四分位数
箱の下辺 第1四分位数
上ひげの先端 第3四分位数 + 1.5 × IQR(四分位数範囲)より小さい値
下ひげの先端 第1四分位数 – 1.5 × IQR(四分位数範囲)より大きい値
ひげの外 上下のひげの範囲よりも外れている値
中央の太線 中央値


Rでの箱ひげ図作成方法

Rで箱ひげ図を作成する場合は、「boxplot」関数を利用します。
今回は「cars」という、自動車の速度と停止距離(ブレーキを踏んでから止まるまでの距離)のサンプルデータを利用します。

048
049


boxplotの引数にcarsデータを投入すると、上記のような箱ひげ図が作成されます。

スピードごとの停止距離を箱ひげ図で表現するには?

箱ひげ図は、2数の関係性を表す場合にも利用できます。
boxplot(y~x)とすると、縦軸をy、横軸をxとして箱ひげ図を作成します。
今回ですと、xが速度、yが停止距離を表します。
050051

最後に

箱ひげ図はデータのばらつきが一目でわかります。
今回のように、スピードと停止距離の関係を確認したい場合も、最大値、最小値などが一目でわかり、大変便利です。
ぜひ活用してみてください。
ではでは。


コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA