[Crux] 수치 데이터를 이용한 표본분석 : 이론
게시글 주소: https://a.orbi.kr/00065547224
크럭스(CRUX) 컨설팅
크럭스 컨설팅 12월 11일(월) 올해 마지막 정시예약 : 여기 클릭하시면 됩니다.
<수치 데이터를 이용한 표본분석 이론>
안녕하세요. CRUX 김희범입니다.
(글 읽으시기 전에 ‘좋아요’와 ‘팔로우’ 부탁드립니다)
표본분석이란 무엇일까요? 표본분석은 왜 하는 것일까요?
이 질문에 대한 답변은 표본분석을 시도하는 이유와 이용하는 방법에 따라 크게 달라질 수 있습니다.
전통적인 표본분석은 내 위에 있는 모든 사람들을 조사하고 기록하고 관찰하는 것입니다. 지원권이 한정된 폐쇄된 구간에서 흔히 ‘카운팅’이라고 불리는 방법으로 허수, 추합 등 빠져나갈 인원을 한 명씩 걸러냅니다. 경쟁자들의 점수, 타 지원 학과를 하나씩 찾고 별명을 붙이거나 특이사항을 메모할 수도 있습니다. 이러한 추적은 잘못하면 끝이 없는데, 경쟁자들이 지원한 학과의 표본을 열어보지 않으면, 결국 의미가 없기 때문입니다. 따라서 매우 제한적으로만 사용할 수도 있고, 개인이 사용할 수 있는 대상 범위는 넓게 잡아도 이과는 인설의, 문과는 과거 서울대 지원권 정도입니다. 이러한 방법의 목적은 닫힌 구간 내 미시적인 한두 자리 싸움에서 승리하는 것입니다.
그보다 넓은 구간에서도 내 위 경쟁자들의 점수를 하나씩 기록할 수는 있습니다. 하지만 추합을 따지거나 경쟁자의 이동을 찾자니 끝이 없습니다. 요즘 계열제 모집단위나 대형과는 모집인원만도 100명이 넘어가는데, 이들을 모두 기록하고 있을 수는 없는 노릇입니다. 오히려 간소하게 각 ‘표본’이 아니라 ‘수치’를 다루기도 합니다. 나의 등수가 몇 등인지, 예상 컷부터 나까지 몇 명이나 있는지 등입니다. 그런데 이런 데이터는 모아 놓아도 제대로 읽기가 어렵습니다. 각 수치들이 어떤 의미를 내포하고 어떻게 연결되는지 잘 모르기 때문입니다. 그리고 분석서비스들이 제공하는 수치 지표들은 결국 분석서비스가 제공하는 결론으로 귀결됩니다. 그렇다 보면 숫자들에서 유의미한 정보를 뽑아내지 못하고 ‘칸수’에 매몰됩니다.
수치를 다루는 표본분석의 목적은 무엇일까요? 수치를 이용한 표본분석의 목적은 거시적인 측면에서 ‘흐름’을 읽는 것입니다. 한두자리 싸움에 집중하는 것이 아니라, 내가 속한 게임판의 상황을 읽는 용도입니다.
입시에 임하는 개인이 ‘흐름’을 읽는 것은 매우 어렵고 한정적입니다. 아래는 ‘개인’이 조금이나마 흐름을 느낄 수 있도록 하는 의도에서, 최대로 간략화한 데이터 정리 시트 양식입니다. (저희 '컨설턴트'들은 훨씬 더 종합적인 다른 방식을 사용합니다. 기본적으로 제 노하우를 바탕으로 하되, '개인'도 시도해볼 수 있도록 계량했습니다.)
오늘은 바로 이 수치 데이터를 이용한 표본분석에 대해서 소개해 보려 합니다.
엄밀히 말하면 표본분석이라기보다는 나만의 입시 리포트, 혹은 입시 포트폴리오라고 생각할 수 있을 것 같습니다. 필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 수치를 모으고 계산하면 됩니다. 오늘은 양식에 대한 설명이고, 다음 글이 보다 실전적일 예정입니다.
먼저 상단은 과거 데이터와 올해 나의 정보를 기입하는 부분입니다.
왼쪽 위에는 관찰하고자 하는 학과 정보(학교, 군, 학과)를 적습니다.
상단 중앙 부분에는 과거 데이터를 입력합니다. 당시의 모집정원과 추가합격인원, 지원자수를 기입하면, 엑셀을 이용하여 자동으로 합격총원, 추합율, 최종경쟁률을 구할 수 있습니다.
이렇게 정보를 기입해 놓으면, 어느 정도 규모의 과인지, 어느 정도 추합이 도는지, 경쟁률은 어느 정도 되는지를 확인할 수 있습니다. 다만 주의할 점은 학과 신설, 통폐합, 군 변동, 입시 정책 변화(교차지원 도입) 등에 따라 데이터가 크게 바뀔 수 있습니다. 올해가 바로 그 변화의 해일 수도 있고요. 이러한 히스토리와 특이사항을 가장 오른쪽 메모란에 기록해 놓으면 됩니다.
과거 누백도 기록합니다. 컨설턴트들은 조금 더 체계적인 방법을 사용하지만, 개인이시라면 많이들 이용하는 누백 데이터를 쓰셔도 무방합니다. 70% 누백은 공시되는 정보를 바탕으로 하는데, 과거 합격인원의 허리하단부 누백을 확인할 수 있게 해주어 안정 지원 범위를 확인시켜줍니다. 100% 누백은 점공 등을 통해 확인하거나 자체적으로 예측한 추정치에 바탕으로 둡니다. 인터넷에 돌아다니는 누백은 틀린 정보가 많지만, 일반적으로 폭빵을 확인할 수는 있습니다. 3~4개년치 데이터에서 툭 튀는 누백값이 보이면 폭이나 빵으로 보시면 됩니다. 이러한 내용도 해석해서 오른쪽 메모란에 적어놓으면 좋습니다.
그리고 과거 누백들 바로 밑에 올해 나의 누백을 기록하시면 됩니다. 과거의 70%컷, 100%컷과 비교해서 매우 대략적으로 자신의 위치를 가늠할 수 있습니다. 사실 각 해의 누백은 서로 독립적인 것이어서 이렇게 묶어보는 것이 엄밀한 방법은 아닙니다. 주의하여 사용하시기 바랍니다. 분석기도 입시철에 계속 최신판이 나오는데, 최신 누백을 기록하고 싶으시다면, 그냥 기존 나의 누백을 지우고 새로운 나의 누백을 기록하면 됩니다. 이전 누백도 남기고 싶으시면, 메모란에 히스토리를 남겨놓으면 됩니다. (사실 누백은 라인 잡는 시기 이후로는 무용한 편이어서 굳이 세세하게 최신화하지 않아도 됩니다. 다만, 분석기를 철썩 같이 믿는 지원자들도 있어서, 하나의 변인으로 인정하고자 기록할 수 있는 공간을 마련한 것입니다.)
왼쪽 아래에는 나의 산출점수를 기록합니다. 변환표준점수 공개 이후 점수가 달라질 수 있는데, 이 경우는 위 누백과 달리, 반드시 새롭게 바뀐 자기 점수를 업데이트하시길 바랍니다.
내 점수 오른쪽에는 올해 모집인원을 기록합니다. 이 부분도 데이터가 최신화될 수 있습니다. 수시 이월 전에는 최초 모집인원이나 예측 모집인원을 사용하다가, 최종모집인원이 공개되면 수치를 바꿔주면 됩니다. 이러한 변동도 메모란에 변동일과 함께 기록해주시면 좋습니다.
모집인원을 기록하면, 과거데이터를 바탕으로 기대 추합인원, 기대 합격인원, 평균추합율, 기대지원자수, 평균경쟁률을 확인할 수 있습니다.
이 수치들을 설명하자면,
평균추합율은 그 위에 기입했던 ‘과거 추합율의 평균치’입니다.
‘기대 추합인원 = 최종모집인원 x 평균추합율’로 과거 정보를 바탕으로 올해 기대되는 추합인원을 구할 수 있습니다.
‘기대 합격총원 = 최종모집인원 + 기대 추합인원‘ 입니다.
평균경쟁률은 그 위에 기입했던 ‘과거 경쟁률의 평균치’입니다.
‘기대 지원자수 = 최종모집인원 x 평균경쟁률’이며, 과거 경쟁률을 바탕으로 올해 기대되는 지원자수를 구할 수 있습니다.
주의할 점은, 튀는 값이나 더 이상 유의미하지 않은 값이 존재할 수 있다는 점입니다. 모집 인원 변화, 군 이동, 학과 통폐합, 입시 제도 및 방식 변화, 폭빵, 마감 직전 절대적으로 낮았던 경쟁률 등등이 원인입니다. 이러한 히스토리를 알고 있느냐, 아웃라이어 등을 어떻게 처리할 것이냐가 ‘개인’의 실력이라고 할 수 있습니다.
다음은 본격적으로 수치들을 기록하는 부분입니다.
왼쪽에는 날짜를 기록합니다. 저는 12/30~1/5으로 7일간 한 번씩으로 예시 시트를 만들어드렸지만, 개인의 상황에 따라 날짜나 시간대를 더하거나 빼거나 하시면 됩니다. 그래도 마지막 3일간은 하루에 한 번씩은 기록하기를 권합니다.
입력해야 하는 정보는 예측 지표, 예측컷, 최초합격 가능 인원, 추가합격 가능 인원, 실제지원한 분석대상자수와 나의 등수, 나보다 하나 높은 칸까지의 인원수 내 칸의 꼴지의 순위, 나의 실제지원 등수 변화, 전체 모의지원자수와 그중 나의 전체 등수, 예측 지원자수, 적정 누백(점수)과 예상 누백(점수)입니다.
하나씩 설명드리면,
예측지표는 각자 자신이 보고 있는 지표를 입력하면 됩니다. 색깔일 수도 있고, 확률일 수도 있고, 0부터 9까지 숫자일 수도 있습니다. 모두가 보기 때문에 기록합니다.
예상점수는 예측컷입니다. 문을 닫을 것으로 예측되는 표본 인원의 점수일 것입니다.
최초합격 가능 인원은 지원 표본에서 최초합격으로 판단되는 인원수를 의미합니다.
추가합격 가능 인원은 지원 표본에서 추가합격으로 판단되는 인원수를 의미합니다. (합격 가능 인원 – 최초합 가능 인원)으로 구할 수도 있고, 편한 방식대로 기록하고 수식을 걸어주면 됩니다.
‘합격가능인원 = 최초합격 가능 인원 + 추가 합격 가능 인원’입니다.
나의 등수와 분석대상자수는 실지원이 예상되는 집계된 모의지원자수와 그 중 나의 순위입니다.
나의 위치는 '나의 등수 / 합격가능인원'을 백분위(%)로 표시하여 나타냅니다. 컷으로부터 나의 상대적인 위치를 가늠할 수 있습니다. 일반적으로 70%를 안정으로 봅니다. 보수적으로는 60%까지 잡을 때도 있습니다. 하지만 때로는 110%도 안정일 수 있습니다. 거시적으로 흐름을 읽는 것이 중요하고, 이 수치의 고평가와 저평가를 읽어내는 것이 실력입니다. 저희 노하우이기도 하고요. '개인'이 제일 어려움을 겪는 분야입니다.
나의 등수 변화는 그 이전에 기록한 ‘나의 등수’와 방금 기록한 '나의 등수'의 차이를 적는 것입니다. 등수가 앞으로 갔을 때 양수로 할 지, 음수로 할 지 등은 편한 방식대로 하시면 됩니다.
컷까지 인원은 나로부터 문 닫을 것으로 예상되는 사람까지 몇 명이 있는지입니다. 합격가능인원에서 나의 등수를 빼서 구합니다. 내 위로 몇 명이 들어오면 자신이 문을 닫게 되는지, 내 앞으로 몇명이 빠져야 내가 문을 닫을 것으로 예측되는지 확인할 수 있습니다.
오른쪽 아래에 윗지표 누적 인원과 내 지표 누적 인원은 표본 상에서 나보다 하나 높은 지표를 받은 꼴지의 순위와 나와 같은 지표를 받은 꼴지의 순위입니다. (본인이 보는 '예측지표'와 같은 지표를 의미합니다) 나의 등수와 비교하여 보면 나의 위치를 조금 더 잘 가늠할 수 있습니다.
전체등수와 전체지원자수는 그 학과를 모의지원한 모든 경쟁자들의 수와 자신의 순위입니다.
예측 지원자수는 예측되는 올해 지원자수입니다.
예측 지원자수를 기입하였다면, 상단에 기록했던 최종모집인원으로 나누어 예측 경쟁률을 구합니다.
적정 누백과 예상 누백은 많이들 보는 누백의 적정 누백(혹은 점수)과 예상 누백(혹은 점수)을 기록하면 됩니다. 적정 대신 소신을 이용하셔도 됩니다. 매번 기록할 정도로 중요도를 갖는 수치는 아닙니다. 굳이 안 보셔도 되고, 앞서 말했듯 누군가는 보기 때문에 같이 확인합니다.
마지막으로,
‘예측 표집비율 = 분석대상자수 / 예측지원자수’,
‘기대 표집비율 = 분석대상자수 / 기대지원자수’로 구합니다.
예측 표집비율과 기대 표집비율은 예측 혹은 기대치 대비 얼마만큼 표본에 경쟁자들이 확인되고 있는지를 확인시켜줍니다. 이 수치가 높다면, 이 학과에 대해 표본의 현실성이 높거나, 실제 표본이 외적·시스템적으로 ‘가정’된 정도를 넘어서고 있거나, 실제지원자들이 많이 들르고 있다는 뜻입니다.
수치들에 대해 설명했으니, 어떻게 보면 좋을지 간략히 다루겠습니다. 설명드렸듯, 수치는 거시적인 흐름이나 가정을 확인하기 위해 관찰하는 것입니다.
1. ‘과거를 바탕으로 기대되는 수치’와 ‘올해 보여지고 있는 수치’를 비교합니다. (통시적)
2. 어떤 정보가 실제 데이터가 아닌 추정에 의해 가정되고 있는지를 살핍니다. (가정)
3. ‘올해 보여지고 있는 수치’의 변화를 관찰합니다. (추이)
4. 하나의 학과가 아닌, 목표 지점의 좌우와 상하의 데이터를 같이 모아서 비교하며 살핍니다. (공시적)
5. 이를 통해, ‘나의 위치’를 ①구조적으로 ②상대적으로 확인하고, 내 경쟁자들이 무엇을 보고 있고, 어떤 판단, 행동, 추이를 보여주고 있는지 / 보일 것인지 잡아냅니다. (가설/시나리오 설정)
필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 하시면 됩니다. 부족하다고 생각되면 더 정보를 수집하면 되고, 과하게 느껴지면 덜어내면 됩니다.
커트라인 형성과 폭빵의 원리는 단순하지만, 현실에서 드러나는 양상과 시그널은 꽤나 다변적입니다. 지금까지 말씀드린 방법은 ‘개인’이 여러 상황에서 판을 읽고 능동적으로 판단하기 위해, 최소한으로 확인하면 좋을 ‘수치’들을 모으고 확인하는 방법이었습니다. 열심히 한다고 좋은 결과가 따라오는 것은 아니지만, 열심히 하면 최소한 손해보지는 않는 것이 입시입니다. 저의 이전 글들과 이어질 글을 읽으시면 조금 더 이해가 될 것입니다.
다음 글에서는 위 방법을 통해 실제 사례를 분석해보겠습니다. 감사합니다.
취소분 등의 올해 마지막 정시상담 예약 : 12월 11일 월요일
크럭스상담 우선권을 부여하는 예약신청서 작성 : https://zrr.kr/nERp
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
하 내후년 어케 살지
-
마스터 계정으로 전환하기
-
사설중에는 ㅇㅇ
-
스펙평가좀 7
180 14 70 고백 5번 받아봄 연세대 경제 재학중
-
나는 왜 환각만 보임? ㅅㅂ 그래도 열심히 분석할게요.......
-
내년에 필요함
-
8시간 큐브하면 2
얼마정도 벌려요?
-
그린의 정리 이름 존나 웃기네 ㅋㅋㅋㅋㅋ 초록색 정리
-
하루에 한번은 꼭 들어가서 덜덜 떨게되네 ㅋㅋ
-
영어 1,2차이 1
연대가 미적 기준 4점차임? 고대는 3점?
-
여권만들려는데 9
여권 신청하고 언제 받을 수 있나요? 3주넘게 걸리나요
-
강원도, 전라북도 <= 여기는 얼마나 꿀인거냐..
-
버리긴 아까운데
-
월화수목동안 한끼도 못먹고 아이스아메리카노 게맛살 초코바1개 맥주2캔 일케만먹엇음...
-
강대K 31•32회차 선물해 주신 오르비언 분 감사합니다! :) 7
살다살다 강대K 정품의 향을 느껴볼 줄야.. 선물해주셔서 감사합니다! @ㅅㅁㅇ...
-
육군은 바람잘날이없다
-
ㅋㅋㅋㅋㅋㅋ 괜히 딴사람들 괴롭히지말고 나랑 붙자 이 씹 듣보년아
-
지금처럼 덜덜 안떨고 있었겠지… 20번을 내가 왜틀렸을까…
-
전글에 올린거 관련해서 궁금해요 기출에 적응해야될 시기라 그런가요?
-
제 첫사랑입니다..
-
여친과 숨바꼭질 9
-
메디컬도 그냥 과탐하는게 맞을까요
-
그래도 괜찮게 올린 편인가요? 더 해볼 생각이 아직은 없긴 한데 보시기에 어떤가요
-
이건 진짜 아닌것같음
-
특정완료하면 밥사줌 14
나잡아봐라
-
입소 3일 된 육군 훈련병 뜀걸음 중 의식 잃고 숨져 5
(함안=연합뉴스) 김동민 기자 = 육군 훈련병이 입대 3일만에 뜀걸음 중 의식을...
-
D-357 공부 0
-
님들이라면 2
.
-
이거 등비급수 쪽에서 나오는거 맞나요 무등비 삼도극 어쩌구 할때마다 뭔 얘긴지 몰랐는데
-
고속 돌려봤을 때 덕성은 확신의안정~하향이고 가천대는 안정이라 덕성 논술 갈지...
-
대학원생 아저씨입니다. 재작년 쯤부터 입시철마다 물리학과/자연대/공대 진학 관련...
-
국어 영어 실모 질문 12
둘다 기출 다 돌리진 않은 상태이긴 한데 시간관리나 실전감각 용으로 1월부터...
-
성대 영어 감점 3
작년은 딴 과목에서 충분히 변별이 됐는데 올해는 변별이 크게 나지 않았고 엔수생...
-
지역별 비례선발제 도입에 대한 설문조사, 소중한 의견을 들려주세요! 4
? 설문조사 참여 부탁드립니다! 서울대학교 사범대학 학술에세이 작성을 위해 입시정책...
-
백분위 80 95 3 70 70 정도 나올거 같은데 진짜 과 상관없이 어디까지...
-
ㄷㄷ..
-
오답을 한 무더기로 싸고 쓰러졌다
-
뻥임뇨
-
와 나 영어 6
흐름과 관계옶는 문장 찾기 틀렸네 ㅋㅋㅋㅋ
-
머플러살말고민 10
md로나온것인데좀심플하게나왔으면더좋았을것같긴하네요…안그래도머플러랑장갑새로하나장만할까싶...
-
현우진 시발점 0
시발점이 2015 교육과정이 있고 2025 바뀌는 공통수학 강의가 새로 올라왔던데...
-
내려가면 몇칸이나 내려가나요?? 건동홍->국숭세단 정도로 내려가나요?
-
?
-
캬 아 그리고 토요일 포공 면접도 보러갑니다 응원받음..
-
공부에 나름 관심이 있구 수학에 관심이 있는 애들이 들어오는거니까ㅠ 인싸 아니여도...
-
대성패스 살까요 0
물리만 하려고 사는 건 손해일까요 원투 다 들으려 하는데.. 살 거면 수학도 같이 들을까요..
-
ㅜㅜㅜㅜ
-
자기도 왜 잘하는지 모름뇨 국어에 대해 진지하게 토론하는데 딱히 별 생각이 없음뇨...
-
나 18일 뒤에 입대라고.. 그래도 대부분 사단신교대인거 같던데 논산으로 하길 잘했다?
좋은글감사합니다
ㄹㅇ 좋은글.
110%는 10%의 오타인가요?
아닙니다. 해당 수치는 확률이 아니라 누적 등수 개념입니다.
40명 합격 가능할 때 44등이면 110%입니다. 구간 자체가 고평가되어 있으면 110%여도 안정~적정 카드일 수 있습니다. 그런곳을 잘 찾는것이 저희의 강점 중 하나입니다.
글 감사합니다
그런데 예측지원수는 마음대로 정하는 건가요?
많이들 보는 곳의 예측치입니다. 보조도구로써 역이용합니다. 이 예측치가 자꾸 틀려서그런지 작년부터 잘 공개하지 않습니다. 쪽지 주시면 보다 자세히 답변드리겠습니다!