概要
データを大きさの順に並べた時、 中央の順位にくる数値を、そのデータの中央値(またはメジアン median)と言う。データの特徴を表す代表値の1つ。
データの大きさが偶数の場合は、中央に2つの値が並ぶので、その場合は 2つの数値の平均を中央値とする。
例
例えば、10人の生徒の体重を調べた結果が以下の通りだったとする。
大きさの昇順(ここでは体重が軽い順にする)に並べると、
よって中央値は、生徒 と生徒 の体重の平均値で、
となる。
補足
- 外れ値(極端に大きかったり、極端に小さかったりする値)があるときには、平均値だとその外れ値に影響を受けてしまうので、中央値の方が、データの集まりの特徴をよく表すことができる。詳しくは、例えばぶおとこばってんの「データの分析のまるごと解説」の動画を見てみよう。平均値や最頻値との考え方の違いが学べる
- 外れ値は、英語でいうと「アウトライヤー」で、響きが一気にカッコよくなる
- 基本的に平均値や最頻値とは一致しない