アプリ「okke」で効率よく学ぶ!

最頻値


概要

言葉の通り、データの中で最も頻繁に出現する値を最頻値という。言葉が鬼のように出てくる「データの分析」分野における、オアシス。データが例えば

個だとすると、最頻値は となる。とても簡単。共通テストもこれくらい簡単であってほしいものだ。

体重のように、値が連続的になっていたりと、どの値も 回ずつしか登場しないようなときは、上のような素朴な方法で最頻値を考える意味は無くなってしまう。

その場合は、以下の例の通り階級値と度数で最頻値を求める。(階級値と度数って「なんだっけ?」という方は「度数分布表」の辞書を確認しよう)

例えば、 人の生徒の体重を調べた結果が以下の通りだったとする。

度数分布表を下の通り 刻みで作成すると、

最頻値は つになる(度数が一番大きい階級の階級値をとってくる)。

階級は自分で定めるので、その定め方によって、最頻値も変わってくることになる。

補足

  • 最頻値が つあるようなデータの特徴を「二峰性」と呼び、最頻値が つよりも多ければ「多峰性」と呼ぶ
  • 最頻値は、基本的には平均値中央値とは一致しない

タグ

# 中央値
# 平均値
# 度数
# 度数分布表
# 最頻値
# 階級値