「身近な統計」

今さら遅きに失した感じもありますが、現代人らしいこともちょっとは身につけておこうと(?)、統計の勉強をしてみることにしました。ちょうど放送大学に「身近な統計」(BS232ch 金曜9:15~10:00)という科目があったので10月から受講。

さて、この授業ではいろんな統計データの実例が出て来るのですが(世帯貯蓄残高の分布とか、海外旅行先の分布とか、旧スイスフラン紙幣の絵柄の対角線の長さの分布(偽札は真札よりも短い方に分布の山が来てる!)とか)、野球関連のデータが結構出てきます。例えば…

多峰性ヒストグラム(山が複数ある分布)の例として、プロ野球のピッチャーの1シーズン全投球の球速分布がが出て来て、

「分布の山が複数出来る場合は異質なものが混じっていると考えられる。分類基準を探して、山が一つになるようにデータを分ける必要がある(もちろんこの場合はいろんな球種が混じっていることが多峰になっている原因)。」

という説明があるのですが、まず松坂(2005)の例、そしてダル(2010)、大谷(2016)と、これでもか、というように3人分も出してきて、「大谷選手のストレートはずいぶん速いんですよね、他の2人に比べて…」「そうですね」「凄いというのがわかります♪」という担当講師2人のコメント。いやそこは関係ないでしょ先生方(笑)

「この表は1996年、2010年、2016年のプロ野球の打者の打率を5数要約(最小値、25%点、中央値、75%点、最大値の5つの値でデータ全体のばらつきを要約すること)したものです。2016年を見てください」

ポインターで指される小林…ちょっとかわいそう…おまけに、放送授業は4~5年に一度しか撮り直さないので、次回改訂までは半年毎にこれが繰り返し放映されることになるのだ。ちなみにこの年の最大は同じ巨人の坂本、1996年の最大最少はイチローと川相、2010年は青木と山崎(楽天)でした。

とまあ、そんなこんなで、幾分講師の先生の趣味も感じられる内容になっています。私もここで統計スキルを身に着けて、趣味に応用できるようになれたらいいな。