続いて,教科書49ページ。
度数分布表をグラフにしたものを,度数分布といいます。文字通り。
独立変数が質的データ,従属変数が度数の場合には,板書の通り,グラフの棒と棒のあいだを離して描きます。 例えば,都道府県別に度数を示す場合には,質的データの場合ということになります。
独立変数が量的データの場合には,ヒストグラムというグラフを作ります。
ヒストグラムは 別名 柱状図ともいいます。「ヒストグラフ」ではないので注意。
ちょい拡大すると
ヒストグラムの度数は,板書の通り,横軸の幅×柱の高さ であり,面積で度数を示すことになります。量的データを,階級(区分)に分けて度数を作り,それをグラフ化するわけですから,棒グラフの すき間を作らずに棒をくっつけるのが重要です。
階級(間)の幅については,前回の授業でもお話ししましたが,できれば一定の数値の幅であることが望ましいです。
教科書には書いてありませんが……
厳密にいうと,ヒストグラムの棒は,階級の区切りきっかりのところから(タテの)線を出すのではなく,少しズレたところから出すことになっています。
なぜかというと,データとして得られた観測値は,四捨五入された値のため,階級の境目の値の場合,どちらの階級(区分)に属するか,微妙なところがあるからです。
例えば,板書のヒストグラムでは,0以上10未満のデータ,10以上20未満のデータ,20以上30未満のデータを階級(区分)に分けています。
このとき,データの観測値
として20という値があったとき,これは20以上30未満の階級(区分)に含まれ,度数にカウントされるのではありますが……値を四捨五入していると考えると,観測値は実は19.5かもしれない,というわけです。
四捨五入している値の,真に取り得る範囲は,真の下限域~真の上限域の間(上記の例では,19.5~20.4)ということになるために……
ヒストグラムの階級においても,階級(区分)の一番小さい値の真の下限域のところから線を出すことが望ましい,となっているわけです。
さらに,教科書の問題にあるように,オープンエンドの区間については,省略マークをつけるのがきまりごとになっております。
ヒストグラムは,今回の課題を行って,その作り方に慣れましょう。
本日はこれでおしまい。
ありがとうございました(_ _)
<教科書>
稲葉由之 (2012). プレステップ統計学Ⅰ:記述統計学 弘文堂
<文献>
山内光哉 (1998). 心理・教育のための統計法[第2版] サイエンス社