Cogito Ergo Sum [1105120] · MS 2021 (수정됨) · 쪽지

2024-12-20 21:45:31
조회수 5,409

[칼럼] 세부 표본 분석 - 확률적 분석

게시글 주소: https://a.orbi.kr/00070726065

*작년에 올렸던 네 번째 글입니다.


지난 글에서 미시분석은 어떻게 하냐는 질문이 꽤 되었었는데, 이 글을 읽어보시면 표분 분석이라는 말이 무슨 의미인지 이해하실 수 있을 듯합니다.


이하는 제가 작년에 올린 글입니다.


--------------

안녕하세요.

피오르에듀 수석 팀장 Cogito Ergo Sum입니다.


오늘은 지난 거시 분석 글 세 편과는 달리 조금은 미시 관점의 이야기를 해보려 합니다.

(글이 검색이 안 되어 자꾸 묻히다 보니 업로드가 뜸하네요)


아마 이번 글은 웬만하면 이해가 되는 내용으로 이루어져 있을 것 같습니다.

뜬구름 잡는 이야기보다는 실전에 좀 더 가까운 이야기인 거 같기도 합니다.

바로 본론으로 가겠습니다.



표본 분석은 어떻게 하는가?

많은 사람들이 표본 분석이라고 말은 하지만, 수험생 때 제 기억에 비추어 봤을 때 확실하게 정리되어 있던 글을 본 적은 없습니다. 다들 분석을 해야 하는 건 아는데 "어떻게?"라는 생각이 드실 겁니다.


대전제는, "입시에 100%는 존재하지 않는다" 입니다. 

예를 들어 설명해보겠습니다.


가군에 연세대 경영(추합 안정), 나군에 서울대 인문계열(불합), 다군에 중앙대 경영(최초합)

이 뜨는 서울대 인문 4칸 불합격 표본이 J사에 있다고 해보겠습니다.


이 표본을 보니, 일단 문과 응시자이고 서울대 사범대 적정 점수가 되는 표본입니다.

그럼 이 표본은 서울대 인문계열에서 빠질까요? 아니면 빠지지 않을까요?


솔직하게 말해 문과는 간판이다라는 말이 있는 만큼, 거의 빠질 것 같습니다. 안 그래도 연대 경영이 안정인데, 서울대 간판을 위해 과를 포기하고 인문계열보다 낮게 지원할 가능성이 높죠.


그런데 만약 "나는 죽어도 사범대는 절대 안 가"라고 생각한다면 어떨까요?


그럴 일 없다고 생각하시는 분도 계실 텐데, 저 이야기 자체가 제 얘기를 살짝 바꾼 것뿐입니다. 

저는 모든 서울대 사범대 프리패스 점수였는데, 사범대를 쓰지 않고 과를 높여서 지원했죠. 인문은 안 될 게 뻔히 보여서 안 썼다 뿐이지, 저도 뭘 몰랐다면 인문 계열을 썼을 수도 있을 겁니다.


즉, 이 표본은 지원한다 안한다 가 정해지지 않았습니다. 일반적인 문과라면 그래도 간판을 위해 내려가겠지만, 그러지 않고 잔류할 수도 있는 거죠. 그런데 이 표본이 남을 확률이 높을까요? 아니면 도망갈 확률이 높을까요? 제 생각에는 그래도 70% 정도의 확률로 도망갈 것 같습니다.


방금 말에 오늘 글의 핵심이 있습니다. 각 라인(안정, 적정, 소신, 상향)별로 얼마나 빠질지, 남을지를 파악하는 게 표본 분석의 핵심일 텐데, 그걸 파악할 때 확률적으로 접근하는 겁니다.


예를 들고 와서 각 라인별로 설명해보겠습니다.

고려대에 A학과가 있고, 커트라인은 670점이라고 가정해봅시다.




안정 라인(7칸 이상) 분석

여기는 솔직히 볼 게 크게 많지 않습니다.


다만 안정인데 굳이..? 싶은, 선을 넘는 점수의 표본만 잘 걸러주면 됩니다. 

예컨대 올해 기준으로 430점인 학생이 서울대 인문계열에 있다면, 실제로 이 곳을 쓸까요? 서울대 경영도 수석으로 붙을 거 같은데 굳이 왜? "아니 애초에 J사를 구매할 필요가 있긴 한가?"라는 생각이 당연히 드실 겁니다. 이 표본은 경영으로 올라갈 확률이 높고, 아니면 아예 가짜일 수도 있겠죠. 뭐가 됐든 여기 남을 가능성은 거의 없다 쪽에 걸어봐도 될 듯하네요.


이런 느낌으로 안정 지원이야 할 수 있다지만 이건 너무 선을 넘는 느낌인 것을 가려내는 거죠


예시에서 보자면 



저런 느낌인데, 저 표본들의 경우 굳이 지원할 이유가 있을까요? 만약 A학과가 경영이라 더 높일 곳이 없는 문과 학생 입장에서는 쓸 데가 여기밖에 없으니 분석이 조금 달라지겠지만, 그렇지 않다면 다른 학과를 쓸 가능성이 있겠죠. (마니아 학과의 진정한 '소신' 지원 제외)


간혹 그럼 그 아래 다른 안정 지원자도 빠질 수 있는 것 아니냐, 애초에 안정 칸수 자체가 점수 많이 남는 지원자에게 부여되는 것이지 않느냐 하실 수도 있는데, 맞는 말입니다.


다만 그걸 맞히는 건 진짜 신의 영역입니다. 왜냐하면 일반적으로 학생들이 참고할 수 있는 게 J사, GS 등밖에 없어서 7~8칸임에도 그냥 지원하는 학생도 굉장히 많기 때문입니다.


적정 라인(5~6칸) 분석

여기는 안정 라인보다도 더 쉽습니다. 거의 다들 쓴다고 봐야겠죠. 이 부분에서는 빠지냐 안 빠지냐를 정량적으로 판단하기가 상당히 어렵습니다. 왜냐하면 고려대 심리학과가 안정인 학생이 행정학과도 안정이 뜬다면 어떻게 쓸지 우리가 알 길은 없기 때문입니다..


하나만 보고는 알 수 없다는 말이 정답입니다. 



이 라인에서는 거시 관점 - 표본의 이동 방향을 파악하는 게 조금 더 효율적이라고 생각합니다. 그리고 확률적 접근의 필요성이 특히 강한 라인이죠. 어차피 이 정도 선에 위치한 표본은 빠지든 안 빠지든 운의 영역이기 때문에, 본인이 안정 지원을 할 거라면 거의 안 빠진다 로 잡고, 상향 지원을 할 거라면 좀 많이 빠진다 로 잡고 보면 되겠네요. 저 같은 경우 전자는 10~30% 빠진다고 보았고, 후자에서는 50% 정도 빠진다고 보았습니다.


아무리 희망회로를 돌려도 적정라인이 70% 빠진다고 생각하기는 어려울 듯합니다.


소신 라인(4~5칸) 분석

보통 이 라인부터 커트라인을 결정하는 분석이 이루어진다고 보시면 됩니다.

여기서는 맨 처음에 설명했던 대로, 해당 표본이 다른 학과에서 적정 지원으로 잡힐 만한지 (그럼 빠져줄 가능성이 높겠죠), 아랫 급간의 학교에서 붙을 만한 카드가 있는지를 바탕으로 분석해주시면 됩니다. 



a. 확실히 빠질 것 같은 표본, b. 잘 모르겠지만 지원할 것 같은 표본, c. 잘 모르겠지만 지원하지 않을 것 같은 표본 이 정도로 분석해서 분류합니다. 그 다음에 b, c 집단을 두고 확률을 조정하면 되겠죠. 내가 상향 지원을 하는 입장이라면 b에서 50% 빠지고 c에서 70% 빠지고.. 이런 식으로요. 적당히 붙을지 말지 알고 싶은 상황(ex. 내 점수가 4칸 시작점인데 붙을 만할지 알고 싶은 상황)이라면 조금 더 냉정하게 b에서 20~30%, c에서 50% 정도 빠진다고 봐도 좋겠네요.



상향 라인(4칸 이하) 분석

눈치 채셨겠지만, 이러한 분석은 본인의 상대적 위치에 따라 달라집니다. 이번에는 상향 지원을 하는 입장에서, 불합격 라인의 표본까지 분석을 해야 하는 상황입니다.



달라질 건 없습니다. 위에서 상술한 a, b, c집단을 가려내는 것은 동일하고

다만 b, c 집단의 비율을 좀 더 널널하게 봐도 될 것입니다. 왜냐하면 다른 곳에 내려갈 데가 있든 없든 불합격 라인은 실제로는 지원을 못할 가능성이 조금 더 높거든요. 물론 여기서도 표본의 이동 방향을 생각해주는 게 좋습니다. 역시 100%는 없기에 그냥 이 학과에 상향을 질러버릴 수도 있는 거니까요.



우리가 흔히 말하는 꼬리가 털리는 양상은 이렇게 폭이 넓은 곳에서 일어날 수 있겠죠.

어차피 그 앞 표본들은 모두 불합격이기 때문에..


저는 이러한 방식을 30% 50% 70% 분석법이라고 불렀는데, 특정 구간에서 빠지는 인원을 30%로 두든 50%로 두든 결과에 변함이 없다면 신뢰도는 올라갑니다. 쉽게 얘기해 50%가 빠져주면 합격이 가능할 거 같은데, 30%만 빠진다고 가정해도 합격이 가능하다면 어느 정도 믿을 만한 분석이라는 거겠죠. 이는 50%와 70%의 결과가 겹칠 때도 마찬가지일 겁니다. 물론 이때는 30%만 빠지는 결과가 나오면 불합격하겠지만요.



그럼 이런 방식을 언제부터 활용해야 하느냐가 남는데, 개인이 분석하는 입장이라면 지금 시기에는 연습 삼아 한 번씩 해보고, 오히려 거시 흐름에 익숙해지는 것이 좋습니다.


이렇게 세밀한 분석은 여유롭게 봐도 일주일 전부터 하셔도 무방합니다.

물론 팀에서는 한 지원자만 따지는 게 아니니까 훨씬 전부터 해야 하지만요.

일이 너무 많아요


여기까지가 J사만 구입한 개인이 할 수 있는 미시 분석입니다. 생각보다 분류하고 빠질 인원 계산하는 게 크게 어렵지 않을 겁니다.


실제로 정리가 되면 다음과 같은 식으로 나타낼 수 있겠죠. 작년에 썼던 엑셀입니다.

(날짜가 30일이기도 하고 교육용으로 대략 만든 거라 형식만 보시면 될 듯합니다.)




이 정도만 하셔도 본인이 목표로 하는 한 급간의 특정 학과는 충분히 분석 가능하실 겁니다. 사실 거듭 말씀드리지만 이런 세부 표본 분석보다 거시 흐름을 이해하는 것이 훨씬 중요합니다. 이 부분은 대부분의 컨설턴트 분들도 동의하실 것 같습니다.


세 줄 요약

1. 세부 표본 분석은 일정한 구간에 있는 표본에 가중치를 조정하며 지원 여부를 판단하는 것이 핵심이다.

2. 이런 가중치 분배는 그 구간이 어디냐에 따라 달라질 수 있다. (냉정하게 보고 싶으면 확률을 촘촘하게, 상향 지원을 하고 싶다면 확률을 널널하게)

3. 세부 표본 분석은 시간이 있으면 웬만하면 할 수 있다. 제일 중요한 건 거시 흐름 파악이다.




좋아요 + 팔로우해두시면 

원서 접수 전까지 주기적으로 칼럼을 받아보실 수 있습니다.

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.