概要
言葉の通り、データの中で最も頻繁に出現する値を最頻値という。言葉が鬼のように出てくる「データの分析」分野における、オアシス。データが例えば
の 個だとすると、最頻値は となる。とても簡単。共通テストもこれくらい簡単であってほしいものだ。
体重のように、値が連続的になっていたりと、どの値も 回ずつしか登場しないようなときは、上のような素朴な方法で最頻値を考える意味は無くなってしまう。
その場合は、以下の例の通り階級値と度数で最頻値を求める。(階級値と度数って「なんだっけ?」という方は「度数分布表」の辞書を確認しよう)
例
例えば、 人の生徒の体重を調べた結果が以下の通りだったとする。
度数分布表を下の通り 刻みで作成すると、
最頻値は と の つになる(度数が一番大きい階級の階級値をとってくる)。
階級は自分で定めるので、その定め方によって、最頻値も変わってくることになる。
補足
- 最頻値が つあるようなデータの特徴を「二峰性」と呼び、最頻値が つよりも多ければ「多峰性」と呼ぶ
- 最頻値は、基本的には平均値や中央値とは一致しない