Copyright © Origin Corp. All Rights Reserved.
v1.0.10
로딩 중입니다
행복에는 덕이면 충분하다안티스테네스

표본추출론에서 첫 번째로, 그리고 가장 꾸준히 출제되는 유형이 확률표본과 비확률표본의 분류입니다.
이 유형이 매 회차 빠지지 않는 이유는 분류 기준을 모르면 층화, 군집, 할당 같은 세부 방법도 전부 흔들리기 때문입니다.
시험에서는 방법 이름 하나만 보고 "이게 확률인가, 비확률인가?"를 즉각 판단해야 하는데, 바로 그 순간 함정이 숨어 있습니다.
[문제] 다음 중 확률표본추출 방법에 해당하지 않는 것은?
① 단순무작위표본추출
② 층화표본추출
③ 군집표본추출
④ 할당표본추출
정답: ④ 할당표본추출
정답인 이유
확률표본추출의 정의는 "모집단의 모든 단위가 표본으로 뽑힐 확률이 사전에 알려져 있고, 그 확률이 0이 아닌 방법"입니다.
①단순무작위, ②층화, ③군집은 모두 이 조건을 충족합니다.
추출 확률을 미리 계산할 수 있다는 점이 핵심입니다.
④ 할당표본추출(quota sampling)이 왜 비확률이냐고 물으면, 많은 분들이 "층화표본이랑 비슷하게 층을 나누지 않나요?"라고 되묻습니다.
맞아요, 할당표본도 성별이나 연령 같은 기준으로 모집단을 범주로 나눕니다.
하지만 결정적인 차이는 이렇습니다. 층화표본은 각 층 안에서 무작위 추출을 하는 반면, 할당표본은 조사원이 숫자를 채우기 위해 임의로 대상을 선택합니다.
조사원의 재량이 개입되는 순간, 각 단위의 추출 확률을 계산할 수 없게 됩니다.
공식 정의를 충족하지 못하니 비확률표본으로 분류되는 겁니다.
오답 분석
①을 비확률로 착각하는 경우는 드물지만, 간혹 "무작위라서 확률을 예측할 수 없는 게 아닌가요?"라고 혼동하는 분이 있습니다.
단순무작위는 모든 단위에 n/N이라는 동일한 추출 확률이 정확히 부여됩니다.
오히려 네 가지 확률표본 방법 중 가장 교과서적인 사례입니다.
③ 군집표본을 두고 "일부 집락만 뽑으니까 나머지 집락의 단위는 추출 확률이 0 아닌가요?"라고 오해하는 케이스도 있습니다.
군집표본은 집락 선택 자체를 무작위로 하므로, 어느 집락이든 선택될 가능성이 0이 아닙니다.
추출 확률이 모두 동일하지 않을 수는 있어도, 0이 아닌 이상 확률표본의 조건을 만족합니다.
그리고 눈덩이표본(snowball sampling)은 시험에서 "확률이냐, 비확률이냐?"를 단독으로 묻기도 합니다.
모집단 명부가 없는 희귀 집단을 조사할 때 사용하고, 추출 확률 계산 자체가 불가능하므로 비확률표본입니다.
이름이 독특해서 확률표본으로 착각하는 수험생이 꽤 있으니 주의하세요.
핵심 암기 포인트
확률표본 4종: 단순무작위, 계통(체계적), 층화, 군집
비확률표본 4종: 편의, 판단, 할당, 눈덩이
이 두 줄을 외워두면, 낯선 문장으로 출제돼도 방법 이름만 보고 즉각 분류할 수 있습니다.

두 방법 모두 모집단을 "묶음"으로 나눈다는 점에서 겉보기에 매우 비슷합니다.
출제자 입장에서는 동질성과 이질성의 방향만 바꿔놓아도 강력한 함정이 만들어지고, 실제로 그 패턴으로 출제되는 빈도가 최상위입니다.
이 한 쌍을 제대로 구분하지 못하면 관련 문항 2~3개를 한꺼번에 틀리게 됩니다.
[문제] 층화표본추출과 군집표본추출의 차이점으로 옳은 것은?
① 층화는 층 내 이질성을, 군집은 집락 내 동질성을 가정한다
② 층화는 모든 층에서 표본을 추출하지만, 군집은 선택된 집락에서만 추출한다
③ 군집표본은 층화표본보다 표본오차가 항상 작다
④ 층화표본은 비확률표본, 군집표본은 확률표본이다
정답: ② 층화는 모든 층에서 표본을 추출하지만, 군집은 선택된 집락에서만 추출한다
정답인 이유
②는 두 방법의 절차 차이를 가장 정확하게 기술합니다.
층화표본은 모집단을 여러 층(strata)으로 나눈 뒤, 모든 층에서 반드시 무작위 표본을 뽑습니다.
군집표본은 모집단을 여러 집락(cluster)으로 나눈 뒤, 일부 집락만 무작위로 선택하고 그 집락 안에서만 조사합니다.
이 절차 차이가 생기는 이유는 각 방법의 전제 가정이 정반대이기 때문입니다.
층화표본은 층 내 동질, 층 간 이질을 가정합니다. 각 층이 서로 다른 특성의 집단이므로, 어느 층 하나라도 빠지면 대표성이 무너집니다.
군집표본은 집락 내 이질, 집락 간 동질을 가정합니다. 집락들끼리 서로 비슷하므로, 일부만 뽑아도 전체를 대표한다는 논리입니다.
오답 분석
①이 가장 많이 선택되는 함정입니다.
"층화는 층 내 이질성을 가정한다"는 서술은 방향이 완전히 반대입니다.
이렇게 생각하면 틀립니다. "층화는 이질적인 것들을 묶는다"고 오해하면, 층 내 동질이라는 핵심을 놓치게 됩니다.
③ "군집표본의 표본오차가 항상 작다"는 현실과 반대되는 서술입니다.
집락 내 단위들이 서로 비슷하기 때문에, 하나의 집락에서 많이 조사해도 새로운 정보를 얻는 양이 제한됩니다.
그래서 일반적으로 군집표본의 표본오차는 층화표본보다 큽니다. "항상 작다"는 표현 자체가 오류입니다.
④는 둘 다 확률표본이라는 사실에서 명백히 틀렸습니다.
층화표본과 군집표본 모두 추출 과정에 무작위성이 포함되어 있어 확률표본입니다.
④를 보는 순간 "층화가 비확률이라고?"라고 즉각 걸러낼 수 있어야 합니다.
핵심 암기 포인트
층화 = 층 내 동질, 층 간 이질, 모든 층에서 추출
군집 = 집락 내 이질, 집락 간 동질, 일부 집락만 추출
두 줄을 반드시 대조 구도로 외우세요.
한 줄만 외우면 시험장에서 나머지 줄이 헷갈려서 ①처럼 뒤집힌 보기에 속습니다.
표본오차와 표본크기의 관계는 숫자가 나오는 순간 패닉에 빠지는 수험생이 많은 영역입니다.
하지만 이 유형에서 시험이 실제로 묻는 건 공식 전체를 계산하는 능력이 아니라, "관계의 방향과 비율"을 이해하는 것입니다.
이 원리를 한 번 제대로 이해하면, 숫자가 달라지거나 표현이 바뀌어도 같은 로직으로 풀 수 있습니다.
[문제] 신뢰수준과 모비율이 동일할 때, 표본오차를 절반으로 줄이려면 표본크기를 어떻게 조정해야 하는가?
① 2배로 늘린다
② 4배로 늘린다
③ 1/2로 줄인다
④ 1/4로 줄인다
정답: ② 4배로 늘린다
정답인 이유
이 문제에서 핵심은 표본오차와 표본크기 사이의 제곱근 반비례 관계입니다.
표본오차 E는 다음 비례 관계를 가집니다.
E ∝ 1/√n
√n이 분모에 있다는 것이 전부입니다.
표본오차를 1/2로 만들려면 분모인 √n이 2배가 되어야 하고, √n이 2배가 되려면 n 자체는 2² = 4배가 되어야 합니다.
단계별로 다시 확인해봅시다.
현재 표본오차를 E, 표본크기를 n이라 하면, 목표는 새로운 표본오차를 E/2로 만드는 것입니다.
E/2 ∝ 1/√(새 n)이 되려면, √(새 n) = 2·√n이어야 하고, 양변을 제곱하면 새 n = 4n입니다.
오답 분석
①이 가장 많이 선택되는 오답입니다.
"표본오차를 절반으로 줄이려면 표본을 2배 늘리면 되겠지"라는 직관에서 비롯된 실수입니다.
이렇게 생각하면 틀립니다. E ∝ 1/n이라는 선형 관계로 착각한 것인데, 실제는 1/√n이라는 제곱근 관계입니다.
③과 ④는 방향 자체를 거꾸로 이해한 케이스입니다.
n이 줄어들면 √n도 줄어들고, 1/√n은 오히려 커지므로 표본오차는 증가합니다.
③이나 ④를 선택하셨다면, 표본크기와 표본오차가 반비례한다는 가장 기본적인 방향 자체를 다시 확인해야 합니다.
추가로 자주 틀리는 관련 함정을 하나 더 짚겠습니다.
"모집단이 클수록 표본도 더 커야 한다"는 생각은 틀렸습니다.
표본크기 결정 공식 n = Z²·p·q / E²를 보면, 분자와 분모 어디에도 모집단 크기 N이 없습니다.
모집단이 100만이든 10억이든 필요한 표본 크기는 거의 달라지지 않는다는 점을 꼭 기억하세요.
핵심 암기 포인트
E ∝ 1/√n, 표본오차를 1/k로 줄이려면 표본크기는 k²배
"표본 2배면 오차 절반"이 아니라 "표본 4배여야 오차 절반"입니다.
이 수치 하나를 확실히 각인해두면, 숫자가 달라진 변형 문제도 같은 공식으로 즉시 계산할 수 있습니다.
TTS 음성이 없어요.
아래 버튼으로 나레이션을 생성할 수 있습니다.
2
개