次は教科書37ページから。量的データの集計。
量的データを集計する際には,量的データを質的データに変換する必要がある。
量的データは,そのままだとバラバラな数値のままだから,ある程度まとまりを作って分類・整理する必要があるんだね。
そのまとまりのことを階級 あるいは 区分という。
階級の作り方……全体の階級の数,と,階級の幅,とを決める必要がある。
全体の階級の数は,10個までがよく,最大で20個までが望ましいとされる。
階級の幅は,1,2,3,4,10など区切りのよい数字がよいでしょう。ここで重要なのは,階級の幅は原則として一定にすることだ。
板書の例でいうと,5つのデータがあって,それを階級に区切るとき,200で区切ってみたよ。
階級に変換した後は,質的データの集計と同様に,度数分布表を作る。
このとき注意しなければならないのは,量的データは,質的データと違って,連続的なつながりとして示されている数値だから,階級の度数が0であっても,表には省略せずに見出しを書き,度数0を書くことが必要だ,ということである。
コンピュータのソフトで度数分布表を計算させると,(情報量を節約するきまりごとがコンピュータにはあるために) 度数分布表で度数0のものは省略されて出力されてしまう(されないソフトもあるけど)。これは厳密には量的データの度数分布表として間違い。
板書の例のデータは,極端なものとして出した。
実際には,度数0を作らないように,階級をうまく決定することで,「きれいな」度数分布表を作っていくことができるだろう。
とりあえず ひとくぎり。
<教科書>
稲葉由之 (2012). プレステップ統計学Ⅰ:記述統計学 弘文堂
<文献>
山内光哉 (1998). 心理・教育のための統計法[第2版] サイエンス社