次にいきましょう。
教科書の25ページから
変数 バリアブルは別名で変量ともいいます。言葉で言いあらわしにくいですが,さまざまな値をとる標識,と定義されます。同じ性質をもつ項目(名)のことです。
例として,性別,年齢,身長など,あとで言う,具体的な観測値(単に,値とも)をまとめた名前のことですね。
RPGとかゲーム好きな方ですと,わかりやすいかも。キャラクターの成長状況をステイタス画面で確認できますが,それで,HP:228,MP:85,ちから:235,攻撃魔力:36,運のよさ:428,など……が表示されていたとき,「HP」,「MP」,「ちから」……なんてのが変数ということになります。
一方の観測値は,調査・実験などで得られた,具体的な数値(記号の値)ということになります。
板書の例ですと,性別という変数に対応する「男性」,年齢という変数に対応する「18」,身長という変数に対応する「175」というのが観測値です。
板書が横に広がって……
拡大すると……
変数は,数学的なきまりごとでは,エックス,ワイ等の変数記号で示すことが多いですね。これに対して,観測値を記号で示すと,下部のように,変数記号の右下に添え字というのをつけたものになります。
何人分かのデータを測定した場合,その人に対して,1番,2番……とお互いが区別できるように名義尺度の番号をふっていきます。それで,1番目の人のデータは5,2番目の人のデータは2……というように観測値と観測対象が対応するようにしますよね。
これを一般化して,記号であらわすと,板書でご覧のようになります。さいごのデータはn,途中のデータはiの添え字で示します。
教科書のように,それぞれ別々の測定対象を比較する場合のデータである,横断面データをiの添え字,同じ測定対象を何度も測定した際に得られる,時系列データをtの添え字で示すこともあります。が,ややこしいのでiの添え字だけ覚えればよいです。
横断面データか時系列データかの違いが,棒グラフで表現するのか折れ線グラフで表現するのかの違いです。
グラフを描けるか描けないかの違いは,量的データか質的データかの違いです。
ということで,1回目の課題5.の問題の答え合わせをここでしましょうか。(他のクイズは教科書に答えがあります。)
データ①の性別は名義尺度,横断面データですから「(3)グラフを描けない」
データ②の年齢は比率尺度,横断面データですから「(2)棒グラフを描ける」(描いてもあんまり意味がないグラフだが……)
データ③,レストランの満足度は,順序尺度ですね。横断面データであっても「(3)グラフを描けない」
データ④,サッカーJ1リーグの2008年の順位は順序尺度,横断面データでも「(3)グラフを描けない」です。
データ⑤の個人年間収入は比率尺度,横断面データで「(2)棒グラフを描ける」(年収を個人で棒グラフにして比較するって,イヤなグラフだね……)
データ⑥脈拍(脈拍数/分)は比率尺度,時系列データです。「(1)折れ線グラフを描ける」ですな。
データ⑦今後の生活見通し,順序尺度ですね。横断面データでも「(3)グラフを描けない」
データ⑧気温,間隔尺度ですね。時系列データなので「(1)折れ線グラフを描ける」が答え。
データ⑨サッカーJ1リーグの得点合計は,比率尺度。チーム間比較の横断面データで「(2)棒グラフを描ける」です。
データ⑩世帯年間収入(を区分に分けたもの)は,順序尺度。もともとの年収は比率尺度だけど,区分に分けてしまって,このデータのように等間隔の区分ではない場合,順序のみを示すことになる。横断面データだけど「(3)グラフを描けない」
できた?この答を写しても何の勉強にもならないよ……。
それじゃあここまで。
<教科書>
稲葉由之 (2012). プレステップ統計学Ⅰ:記述統計学 弘文堂
<文献>
山内光哉 (1998). 心理・教育のための統計法[第2版] サイエンス社