こんにちは(_ _)
心理学統計法1 第8回目です。
今回は散らばりの統計量 教科書第7章です。
計算機の平方根(√)も使っていきます。
データ全体が,平均値という代表値に対して,どの程度散らばっているか,散らばりが大きいのか,散らばりが小さいのか,を数値として計算したい,という話です。
計算には,偏差を使っていきます。偏差は,個々の観測値から平均値を引き算したもので,これによって,データの個数分の偏差が算出できます。個々の観測値が平均より大きければ偏差は正の数,小さければ偏差は負の数になります。
正の数に変換するために,偏差の絶対値を取ることで,平均値から個々の観測値の距離を計算することができます。絶対偏差と呼びます。これをまとめると散らばりになるのですが……いちいち正の数に変換する必要があるために,計算ミスや確認ミスが出てくることもあり……たいへん面倒です。
そこで,偏差を2乗してしまいます。虚数のデータは心理学には存在しませんから,2乗すると必ず正の数になります。これを偏差平方といいます。偏差平方の和を最小にするものが平均値となります。
偏差平方は,平均値からの個々の観測値の距離を2乗したものであります。
偏差平方の和をnで割ると,つまり平均値にすると,分散という散らばりの指標となります。記号・計算式は板書の通りです。
分散の平方根が標準偏差SDです。分散が(平均値からの距離の)面積の平均だとすると,標準偏差はその平方根ですから,個々の観測値の平均値からの距離の平均,ということになります。
分散と標準偏差とがデータの散らばりの指標となります。
次の(2)以降は,実際の計算手順について案内します。
それでは ひとくぎり
<教科書>
稲葉由之 (2012). プレステップ統計学Ⅰ:記述統計学 弘文堂
<文献>
山内光哉 (1998). 心理・教育のための統計法[第2版] サイエンス社