クロス集計

こんにちは。namakemonoです。
本日はクロス集計について記載していきます。

クロス集計とは?



クロス集計とは、クロス集計とは、与えられたデータの中から複数個の項目を抽出してデータ分析や集計を行う手法のことです。
クロス集計を利用すると、複数の項目を掛け合わせて集計することにより、収集したデータをさまざまな角度から分析でき、項目相互の関係を明らかにできます。


022


上記の図は、国語と数学の好みをクロス集計しています。
「国語、数学が好きなグループ」、「国語は好きだが数学は嫌いなグループ」、「国語は嫌いだが、数学は好きなグループ」、「国語、数学が嫌いなグループ」で集計していますね。

Rを使ったクロス集計の方法



クロス集計をするには「table」関数を利用します。
まずは、データを定義します。


023


その後、table関数を利用します。
引数が1つの場合は、その引数についてのみ集計します。


024

ちなみに3つの場合はこのようになります。


025

最後に



クロス集計は一見わかりにくいデータから、自分が得たい情報を抽出する際に非常に便利です。
参考値として、「ファイ係数」を求める場合もあります。
ファイ係数についてはこちら

ではでは


コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA