자격증 정복기/ADSP - 데이터분석준전문가

평균과 중앙값 차이? – 데이터를 해석하는 관점의 차이 (통계학 기초, ADSP)

문노베 2025. 3. 27.

평균과 중앙값 차이? – 데이터를 해석하는 관점의 차이 (통계학 기초, ADSP)

“대한민국의 평균 월소득은 380만 원입니다.” 이 말을 들었을 때, 여러분은 어떤 생각이 드시나요? …그런데 이상하죠. 나는 그만큼 못 버는데요?

 

평균과 중앙값 차이? – 데이터를 해석하는 관점의 차이 (통계학 기초, ADSP)

 

안녕하세요, 문노베입니다.

 

통계를 공부하면서 가장 먼저 헷갈렸던 개념이 ‘평균과 중앙값의 차이’였어요. ‘둘 다 대표값 아냐? 그냥 평균이 더 정확한 거 아니야?’라는 생각도 했죠.

 

그런데 실생활에서, 특히 정책이나 마케팅, AI 알고리즘에서 이 둘을 헷갈리면 큰 오판이 생길 수 있다는 걸 뒤늦게 깨달았습니다.

 

이번 글에서는 평균과 중앙값의 개념 차이, 해석이 달라질 수밖에 없는 이유, 그리고 실제 사례와 함께 그 차이가 얼마나 중요한지 함께 알아보려 해요.

평균과 중앙값, 둘 다 대표값인데 뭐가 달라?

대표값이란 말 그대로, 어떤 데이터를 ‘대표’해서 보여주는 값이에요.

 

우리가 흔히 말하는 평균은 모든 값을 더한 뒤 개수로 나눈 값이고, 중앙값은 값들을 크기 순으로 정렬했을 때 딱 가운데 위치한 값이죠.

 

예를 들어 볼게요. 다음은 어떤 회사의 7명 연봉입니다 (단위: 백만 원): 30, 32, 33, 35, 36, 38, 150

  • 📌 평균: (30+32+33+35+36+38+150) ÷ 7 = 약 50.6
  • 📌 중앙값: 가운데 값 = 35

어떤가요? 한 명의 고액 연봉자가 전체 평균을 확 끌어올려버렸죠.

 

이처럼 극단값(outlier)에 평균은 쉽게 휘둘리지만, 중앙값은 그렇지 않다는 점이 가장 큰 차이입니다.

 

평균과 중앙값, 통계학 기초, adsp 3과목

왜곡된 데이터에서는 중앙값이 더 유리하다

통계에서는 이런 데이터를 ‘비대칭 분포(skewed distribution)’라고 부릅니다.

 

대부분의 사람들이 낮은 구간에 몰려 있고, 소수의 고액값이 평균을 끌어올리는 구조죠.

 

대표적인 예가 바로 소득 분포, 부동산 가격, 유튜브 조회수 같은 데이터입니다.

 

이런 분포에서는 평균보다는 중앙값이 현실을 더 잘 반영하는 경우가 많아요.

 

실제로 정부 통계에서도 소득 중위값(median income)을 기준으로 ‘중산층’을 정의하죠.

 

2025.03.27 - [자격증 정복기/ADSP - 데이터분석준전문가] - 왜도와 첨도란? – 데이터가 왜곡되는 이유 (통계학 기초, ADSP)

 

왜도와 첨도란? – 데이터가 왜곡되는 이유 (통계학 기초, ADSP)

왜도와 첨도란? – 데이터가 왜곡되는 이유 (통계학 기초, ADSP)같은 평균인데 왜 이렇게 체감이 다르지? 데이터를 보고도 ‘어딘가 이상한데…’라는 기분이 들었다면, 바로 오늘의 주제인 왜도(

nobe-moon.tistory.com

 

실제 사례: 한국인의 평균 소득 vs 중앙값 소득

📊 통계청 2023년 가계금융복지조사에 따르면,

  • 1인 가구 기준 평균 소득: 약 2,537만 원
  • 1인 가구 기준 중위 소득: 약 2,000만 원

무려 500만 원 이상 차이가 납니다. 정책을 설계할 때 평균 소득만 보면 “생각보다 다들 잘 사네?”라는 오해가 생길 수 있죠.

 

하지만 중앙값을 보면 절반 이상의 국민은 그보다 덜 벌고 있다는 사실이 드러납니다.

 

바로 이 차이 하나로 정책의 방향, 타깃 고객, 콘텐츠 전략이 완전히 달라질 수 있어요.

AI 알고리즘에서 이 차이는 어떻게 반영될까?

GPT 같은 언어 모델은 대량의 데이터를 학습하면서 단어, 문장, 맥락 사이의 확률적 패턴을 이해합니다.

 

이때 학습된 확률분포에서 ‘가장 가능성이 높은 결과’를 예측하는데, 그 기준이 평균(Expectation)에 가까운 경우도 있고, 중앙값(Median)에 가까운 경우도 있어요.

 

예를 들어, AI가 추천 시스템을 만들 때 ‘평균 평점’만을 기준으로 추천하면, 소수의 극단적 고평가에 휘둘릴 수 있어요.

 

반대로 ‘중앙값 기반 추천’을 하면, 대다수 사용자들이 안정적으로 선호한 결과를 보여줄 수 있죠.

 

또한, AI가 생성형 응답을 할 때는 토큰 단위의 확률분포에서 Top-k 샘플링이나 Temperature 조정으로 ‘가장 평균적인 답변’과 ‘조금은 튀는 답변’을 선택하게 되는데,

 

이때도 ‘중앙값에 가까운 분포’를 기반으로 할지, ‘평균 기대값’을 따를지 전략이 달라질 수 있어요.

평균을 쓸까, 중앙값을 쓸까? 상황별 선택법

데이터 분석 실무에서 대표값을 어떤 기준으로 삼을지는 상황에 따라 달라야 해요. 아래는 문노베가 정리한 판단 기준이에요.

상황 대표값 선택 이유
값의 분포가 고르게 퍼진 경우 평균 모든 값의 기여를 고르게 반영
극단값이 있는 경우 중앙값 왜곡 없이 중심을 파악 가능
실제 중간 위치의 대상을 알고 싶을 때 중앙값 정확히 절반을 나누는 기준 제시

연습 문제로 감각 익히기 (문노베 실전 예제)

📘 문제: 다음은 한 소형 스타트업 직원들의 월급(만원)입니다. 180, 190, 195, 200, 205, 210, 900

① 평균은? ② 중앙값은? ③ 이 회사의 '실제 연봉 수준'을 대표하는 값은 무엇일까요?

 

✏️ 풀이 힌트: 극단적인 고액 연봉자가 포함된 상황에서 평균이 얼마나 영향을 받는지 살펴보고, 어떤 대표값이 현실적인지를 생각해 보세요.

 

이런 연습을 통해 단순 수치가 아니라 맥락과 분포를 함께 고려하는 통계 감각을 키울 수 있습니다.

 

저도 처음엔 틀렸지만, 반복하니까 확실히 보이더라고요 😅

자주 묻는 질문 (FAQ)

평균이랑 중앙값, 언제 헷갈리나요?

극단적인 값(예: 고소득자, 매우 높은 집값 등)이 포함된 분포에서는 평균과 중앙값의 차이가 확 벌어지기 때문에, 대표값을 잘못 해석할 수 있습니다.

 

정부나 뉴스에서 평균 소득이란 표현을 쓰면 그게 진짜일까요?

반은 맞고 반은 아닐 수 있어요. 평균 소득은 계산상 간단하지만, 실제 국민 대다수의 생활 수준을 반영하려면 중위 소득(중앙값)을 함께 보는 것이 훨씬 정확합니다.

 

AI 추천 시스템에서는 어떤 값을 더 많이 쓰나요?

데이터 분포에 따라 다르지만, 안정성을 중시하는 경우에는 중앙값, 다양성과 정확도를 동시에 고려할 땐 평균을 쓰기도 합니다. 일부 모델은 평균과 중앙값을 혼합해 사용하기도 해요.

 

시험 점수도 평균보다 중앙값이 더 정확한가요?

극단적인 고득점자 혹은 저득점자가 많을 경우 중앙값이 전체 학생의 성취 수준을 더 잘 보여줄 수 있어요. 하지만 시험의 목적에 따라 평균도 중요한 지표입니다.

 

평균을 쓰면 왜곡되는 사례가 또 있을까요?

예: ‘서울 아파트 평균 매매가 12억’이라는 뉴스. 하지만 강남 1%가 가격을 올려 평균을 왜곡했을 수 있어요. 이럴 땐 중간값이 실거래를 더 현실적으로 반영합니다.

 

ADSP 시험에도 이런 문제 나오나요?

대표값 간 차이를 해석하는 문제는 ADSP 기술통계 파트에서 빈출되는 주제입니다. 평균·중앙값·최빈값의 해석 차이를 이해하는 것이 핵심이에요.

 

 

어느 날 뉴스에서 “국민 평균 소득이 380만 원”이라는 말을 듣고 혼란스러웠던 적이 있어요.

 

‘내가 그 평균 안에 있는 걸까?’, ‘이건 누구의 시선으로 계산된 걸까?’

 

그 질문의 끝에서 통계를 다시 배우게 됐고, 대표값 하나에도 세상을 바라보는 방식이 담겨 있다는 걸 알게 됐습니다.

 

통계를 안다는 건, 숫자를 더 잘 읽는 게 아니라 세상의 맥락을 더 깊이 이해하는 힘이에요.

 

평균이냐, 중앙값이냐—그 차이를 아는 순간, 우리가 보는 데이터는 전혀 다르게 보이기 시작합니다.

 

이제 여러분도, 수치에 속지 않고 스스로 판단할 수 있는 눈을 갖게 되셨기를 바랍니다 😊

 

2025.03.25 - [자격증 정복기/ADSP - 데이터분석준전문가] - 통계학이란? AI와 데이터 분석을 위한 기초 개념 정리

 

통계학이란? AI와 데이터 분석을 위한 기초 개념 정리

통계학이란? AI와 데이터 분석을 위한 기초 개념 정리“통계학은 숫자를 다루는 학문이 아니라, 세상을 이해하는 방식이에요.” ADSP를 공부하던 어느 날, 이 문장이 마음에 꽂혔습니다. 안녕하

nobe-moon.tistory.com

 

반응형

댓글