원서영역 도구(chapter2: 표본분석법)
앞선 글들을 읽고 오시길 권장합니다!
저번 글에서 객관성, 일반성에 대한 피드백을 받았습니다. 경험과 추론을 이용한 것이 아닌, 논리적으로 생각하여 최대한 모두가 공감할 수 있는 내용만을 전해드리도록 노력해보겠습니다.
이번 글은 표본분석법에 대한 글입니다. 표본 하나하나에 대한 판단부터 전체적 분포에 대한 내용으로 확대해 나가며 진행하겠습니다.
---------------------------------------------------------------------------------------------------------------------
표본분석법
1.표본분석의 한계
표본분석을 하는 것은 상향지원 할 학과의 합격확률을 조금이라도 더 높이고, 안정지원 할 학과의 확실함을 조금이라도 더 보증하기 위해서 입니다. 표본분석은 만능이 아닙니다.
철저한 분석을 통해 확신을 가지고 상향지원한 학과에 모의지원 사이트 상 단 한번도 찾아볼 수 없었던 표본이 실제지원에 몇 명만 등장해도 노력은 물거품이 됩니다.
애초에 모집인원이 100명이 넘어가는 대형과는 하루에도 자신 앞에 수십명의 표본이 들락날락 할 수 있습니다. 그런 학과의 표본을 하나하나 판단하고 매일 상태를 체크하는 것은 불가능합니다.
저는 당연히 표본분석 방법에 관련된 모든 정보와 진리를 전달해 드릴 수는 없습니다. 불충분한 정보들을 차곡차곡 쌓아 완벽하게 해나갈 자신이 없다면 컨설팅 팀에 맡기거나 타임머신, 페잇등을 이용하는 것이 훨씬 나을 수 있습니다.
그럼에도 고된 수험생활 끝의 휴식이라고 할 만한 12월을 표본분석에 갈아 넣을 준비가 된 수험생은, 1%라도 합격확률을 높이기 위한 그 희생이 가치가 있다고 판단한 것 이겠지요!
2.모의지원 사이트의 예상합격자 산출방식
저번 글에서 말씀드렸듯이 자세한 수식이나 산출법은 각 회사의 기밀인 것으로 압니다. 하지만 관찰에 따라 대강 다음과 같은 방식을 따르는 것을 알 수 있습니다.
지난 경쟁률 등으로 예상경쟁률 산출 - 예상지원자 수와 모의지원자 수의 비율로 예상최초합격자 수 계산 – 각 표본의 가,나,다군 우선순위에 따라 추가합격자 수 계산
예를 들어 봅시다. (당연히 실제 수치와 다릅니다)
모집인원이 8명인 학과가 있습니다. 모의지원 사이트는 예상경쟁률을 3.3:1로 잡았고, 모의지원자 수는 20명입니다. 모의지원 프로그램은 그들의 비밀 공식을 이용해 모의지원자들 중 6명을 최초합격자로 예상했습니다.
6명의 최초합격자 중 3명의 표본이 다른 군에 지원한 학과를 우선순위로 입력했고, 그 중 2명의 표본이 우선순위 학과에 합격이 예상됩니다.
이에따라 모의지원 사이트는 2명의 1차 추가합격자를 예상할 것이고, 추가합격자들의 지원상황에 따라 2차 추가합격자가 같은 방식으로 계산될 것입니다.
복잡한 메커니즘이 있겠지만 그 방식을 대강이라도 알고 있는 것이 좋을 것 같습니다. (자세히 알기가 힘들기 때문입니다 ㅜㅜ)
저번 글에도 말씀드렸듯, 각 합격예측 프로그램의 원리를 알면 알수록 그들을 남들보다 잘 이용할 수 있습니다!
3. 허수 거르기
표본들 중에는 가짜표본이 있습니다. 실제 수능 응시자가 아닌데 재미로 넣어 보거나, 점수를 허위로 입력하거나, 어쩌면 다른 수험생들을 교란하기 위해 누군가 만들어낸 표본이 있을 수도 있습니다.
우선 각 모의지원 사이트는 자체적으로 어떤 알고리즘을 이용하여 허수들을 걸러냅니다. 이번 오르비 모의지원에는 인공지능이 사용된다고 들은 것 같습니다.
작년 가장 큰 모의지원 사이트에서 제거된 허수는 2만건에 육박했던 것으로 기억합니다. 하지만 이와 같은 노력에도 허수표본들은 완전히 제거되지 못합니다.
저번 글에 말씀드렸듯이 저는 개인 수험생이 자신만의 생각으로 표본들의 허수 여부를 마구 판단하는 것은 좋지 않다고 생각합니다. 다만 여러가지 조건을 통해 어떤 표본이 허수일 ‘확률’이 높을지 생각하는 것은 유의미하다고 생각합니다.
여태 오르비에 표본분석에 대한 글을 남겨 주신 분들은 허수의 판단에 쓰일 수 있는 몇 가지 주된 요소를 언급하셨습니다. 주로 다음과 같습니다.
-전혀 상관없는 학과들의 조합
-더 높은 대학/학과를 쓸 수 있음에도 굳이 낮춰 쓴 듯한 표본
-움직이지 않는 표본
-지원할 만한 대학이 있음에도 특정 군에 지원하지 않은 표본
이 요소들에 해당되더라도 그 표본이 허수라는 확신을 할 수 없습니다. 하지만 한가지가 아닌 여러가지 요소를 가지고 있는 표본이라면, 허수일 확률이 비교적 높아진다고 할 수 있겠지요.
특히나 움직이지 않는 표본은 확률이 높다고 생각합니다. 취향이 확고한 수험생이라도 12월초부터 원서접수 직전까지 단 한번도 다른 학교, 다른 학과에 모의지원조차 안해보는 수험생은 굉장히 적을 것입니다.
반면 상관없는 학과들의 조합은 그닥 허수의 조건이 아니라고 생각합니다. 실제지원자 중에 상관없는 학과의 조합으로 지원하는 학생이 오히려 더 많은 것 같습니다.
이는 본인의 판단에 맡깁니다.
제가 지원 했었던 학과의 실제 있었던 허수 표본을 예로 들겠습니다.
Ex)
가군 해당 학과 (1순위)-사이버 국방과 전혀 연관성 x
나군 고려대 사이버국방학과(2순위)
다군 지원x
해당 표본의 성적은 고대식 누백 0프로 중반으로 기억합니다.
전혀 상관없는 학과의 조합 에다가, 성적이 남는 학과를 1순위로 하였고, 다군을 지원하지 않았으며 무엇보다 전혀 움직임이 없었습니다.
실제로 차후 허수였던 것으로 확인했습니다.
그럼에도 다시 말씀드리지만, 100%는 없습니다.
4.표본 카테고리화, 추적
허수일 확률이 있는 표본들을 분리하고 나면, 실제표본들이 남습니다. 이제 앞으로의 판단을 위해이 표본들을 종류에 따라 대충 나눌 필요가 있겠습니다.
어떻게 나눠서 생각해볼지는 개인의 판단입니다. 저는 대강 다음과 같이 나눴습니다.
-해당 군에는 이 학과를 쓰는 것으로 확고한 표본
-고민하는 표본
-밀려 내려오는 표본
이를 위해서는 표본을 추적해볼 필요가 있습니다. 먼저 표본들의 점수와 각 군의 희망학과를 메모 해 둡시다. 가군의 학과에서 어떤 표본이 사라졌다 나타났다 한다면, 나,다군에 그 표본이 썼던 학과에 모의지원을 하여 그 표본을 찾아 볼 수 있습니다. 어떤 학과를 두고 고민하고 있는지 알 수 있는 방법입니다.
이는 최상위권에서 강력한 방법입니다.
하지만 성적대가 내려갈수록, 스쳐 지나가는 표본이 많아지고 나중에는 전체적으로 칸수가 떨어지며 더 안정적인 학과로 엄청나게 밀려 내려오는 표본들 때문에 미리 해 뒀던 표본분석 자료들의 표본들은 온데간데 없어질 수도 있습니다.
5.유동성
이제 개개의 표본에 집중하기보다 좀더 멀리서 바라보도록 합시다.
매일매일 지원예정 학과들 에서의 자신의 등수와 상위표본의 출입을 지켜보며 기록하다 보면 차이점을 발견할 때가 있습니다.
어떤 학과에서는 자신의 등수가 14~16등 사이를 진동하는데, 어떤 학과에서는 10~20등 사이를 오르내립니다.
그 학과에 지원하는 것을 망설이고 고민하는 표본이 많다면, 실제지원에서 모의지원과 결과가 달라질 확률이 그렇지 않은 학과보다 조금이라도 높은 것은 공감하실 수 있을 것입니다.
이는 합격선이 예상보다 낮아질 확률도,높아질 확률도 높인다고 할 수 있습니다.
하지만 반복해 말했듯 단지 조금이라도 확률을 높이기 위한 일들입니다. 유동성이 적었던 과가 오히려 크게 폭발하거나 빵구날 수도 있습니다.
그저 최선의 선택을 하기위해 참고할 만한 이야기입니다.
6.도미노
상향지원을 위해 표본분석을 하는 분들을 위한 내용입니다. 이는 모의지원 사이트의 예상합격인원 산출법과 관련이 있습니다.
2번에서 말했던 예시를 그대로 가져와 봅시다.
(모집인원이 8명인 학과가 있습니다. 모의지원 사이트는 예상경쟁률을 3.3:1로 잡았고, 모의지원자 수는 20명입니다. 모의지원 프로그램은 그들의 비밀 공식을 이용해 모의지원자들 중 6명을 최초합격자로 예상했습니다.
6명의 최초합격자 중 3명의 표본이 다른 군에 지원한 학과를 우선순위로 입력했고, 그 중 2명의 표본이 우선순위 학과에 합격이 예상됩니다.
이에따라 모의지원 사이트는 2명의 1차 추가합격자를 예상할 것입니다.)
이때 1차 예상 추가합격자 2명 모두 해당학과를 1순위로 설정해 놓았다고 합시다. 모의지원 프로그램은 여기서 예상 합격자를 마감할 것입니다.
하지만 그 뒤 표본들의 우선순위와 다른 군의 예상합격 현황이 변수가 될 수 있습니다.
최종추가합격자와 나 사이에 5명의 불합격자 표본이 있다고 합시다.
만약 5명 모두 해당 학과의 우선순위가 낮고 우선순위가 높은 다른 학과에 합격할 것으로 예상된다면, 모의지원 프로그램이 모의지원자들 중 합격예상 인원을 한명만 더 잡아도 추가합격자가 도미노 쓰러지듯 늘어나 자신까지 합격할 수 있게 됩니다.
이런 조건을 찾는 것 또한 상향지원의 합격확률을 조금이라도 높일 방법이 될 것입니다.
7. 점수절벽
6번과 관련하여 추가적인 내용입니다.
보통 지원자들의 분포는 x축을 성적, y축을 학생수로 했을 때 정규분포를 그리게 됩니다.
이를 모의지원사이트에서 볼 수 있는 흔히 y축을 성적, x축을 등수로 하여 표본들을 점으로 표현해 놓는 그래프로 보면 ‘~’자를 좌우반전 후 시계방향으로 약간 돌려놓은 모양새가 됩니다. (마땅히 표현할 방법이 없네요,,)
통계학적인 이유에 따라 지원자가 많은 대형과들의 경우 특히 크게 벗어나는 일이 없겠지만,
지원자도 적고 모집인원도 적은 작은 모집단위 에서는 이 모양을 벗어나곤 합니다.
이때 ~표 모양의 허리가 끊어져 중간에 표본의 점수가 뚝 떨어진다거나 하는 현상이 있고,
그것이 6번의 도미노 구간에 걸쳐 있다면
해당학과의 입결이 소위 말하는 ‘배치표’상의 점수보다 많이 떨어질 가능성이 있는 것이겠지요!
8.정리
표본 분석법에 대한 글은 이미 오르비에 꽤 많은 걸로 압니다.
이 글 말고도 다양한 내용과 근거들을 조합하여 2번에 대입해보고 생각해 봅시다. 자신이 판단한 예상합격 표본 수를 산출할 수 있을 것입니다. 거기에 추가적으로 비 모의지원자까지 고려해서 생각해 본다면 예상되는 최종합격 예비번호 등을 계산해 낼 수 있을 것입니다!
절대적으로 맞출 수 있는게 아닌, 확률을 높이는 시도일 뿐이라는 것을 마지막으로 다시 강조해서 말씀드립니다.
---------------------------------------------------------------------------------------------------------
글이 길어져서 정리한다고 힘들었네요 ㅜㅜ
글 중간중간에도 언급했지만 절대적인 내용이 아니기에 수험생 여러분들이 각자 판단하시고 객관성과 일반성이 부족하다고 생각되는 부분은 스스로 생각해 주시고,
부족한 내용, 틀린 부분 있다면 피드백 해주시면 감사하겠습니다!
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
팔로잉 1009명 기준 471개의 글이 쓰였군요. 재밌게들 노셨네
-
77ㅓ억
-
이러면 대부분 어떰...? 빵날 가능성 높음?
-
얼버기 0
추워
-
현재 조정식 천일문 기본 - 괜찮아 - 워마 이천 끝냄 믿ㅇㅓ봐 절반정도 햇는데...
-
인서울 영문과 가고싶은 학생입니다 농어촌 안되는 시골 일반고입니다. 내신따기 쉬운...
-
슈냥님방송 이제 못보겠군
-
도파민 디톡스 해보자
-
삼반수 0
부산대 전자에서 어느정도 해야 대기업 입사가능할까요 ? 삼반수해서 계약학과 목표로...
-
그냥 매일 취침시간이 1시간씩미뤄지는중임 어쩌다가 하루가 24시간인 이 행성에 잘못태어난건지
-
얼버기 3
라고하면 믿어줄래...?
-
또 비염이야 0
-
분명 점수 보면 더 높게 될 것 같은데 최초합 되는 학교만 3개 박아놓은 이 사람은...
-
얼버기 1
-
춤을 추지 않으면 우린 잠에 들 거에요 여래여래 못 말라리아 보살님
-
관리자님 3
차단한 사람이 보낸 쪽지 알림좀 없애주세요
-
새벽 얼굴 ㅇㅈ 1
-
ㅇㅂㄱ 1
-
수면브금 0
잘거에요
-
미디어학과에서 유튜브나 개인방송 관련된 것도 배우나여? 0
아니면 무적권 오리지날하게 지상파방송,PD,아나운서,기자 이쪽 분야만 배우나여?
-
조심해야겠
-
왜냐고? 공대를 열어둬도 사탐 잘봐서 대박나면 문과쪽으로 써서 대학 급을...
-
에휴다노
-
ㄹㅇㅋㅋ
-
결과 보는 낙으로 살았는데
-
몸 이완되는 느낌은 잇어도 잠은 죽어도 안 오던데
-
별차이는없네요
-
ㄹㅇ 찐 웩슬러 해보고 싶긴함 근데 돈이없음
-
처리속도 4
144~145계속나오네 억빠뭐지
-
한양대 전과 0
전과를 하려면 전과하는 학과의 선이수 과목을 수강해야하는 걸로 알고있습니다. 혹시...
-
https://cognitivemetrics.co/test/CAIT_DS 요거는...
-
두번 해봤는데 첫판 96 두번째판 128나옴 ㄷㄷ
-
저능아 틀딱은 자러감.. 삔또상함
-
이건 왤케 높게나오지...
-
https://cognitivemetrics.co/test/CAIT 병원에서 웩슬러 한거랑 똑같음
-
백분위 기준 확통 99 영어 1 한지 97 세지 98 일때, 대구한 문 닫고 갈...
-
진도 잘 나가네
-
유빈이 결국 잡혔네.. 15
유빈아카이브에서 다운 받고 나서 pdf나 한글로 저장한 후 인쇄하면 항상 엄청...
-
프세카 4일차 3
오늘 생애 첫 풀콤을 기록했다 엑스퍼트를 도전했지만 너무 어려워서 하드를 더...
-
백분위 100 원점수 98 (문학 고전소설 틀림) 아무거나 질문 받습니다~
-
밤새고 차에서 자기
-
잘자요 4
내유일한친구 오뿌이들 잘자요 좋은꿈꿔요
-
전년도 경쟁률이런것만 보이고 진학사에 지원한 수는 안보이는디 원래이런가요
-
https://cognitivemetrics.co/test/CAIT_SS...
-
ㅂㅂㅂㅂ ㅈㄴ 졸림
-
잘자요 8
모두 좋은 꿈 꾸세요
-
ㅈㄴ잘빠졌는데 3만원? 바로 산다
-
노력하자 4
열심히하자 언젠가는 되겠지 잘풀리겠지
-
난 요즘 다 쓰고 남은 장작더미같음
선추
닥추
사실 허수인걸 거르는과정이
허수임이 확실하다는 걸러지는 허수 10개중 1개 정도고
나머지 9개는 '허수였으면 좋겠다 ㅎㅎ' 라는 심정으로 거르는거.. ㅋㅋㅋ
ㅜㅠ 수험생의 마음이 그렇지요
너네들이 찾는건 허수
이글을 읽는 나는 하수
yo
비 모의지원자는 몇%정도 있겠다고 잡는게 좋을까요?
쪽지 드리겠습니다 ㅎㅎ
저도 궁금합니다!
저도 쪽지 부탁드려봐요ㅠㅠ
쪽지 드렸습니다 ㅎㅎ
로켓님 제가 가입한지 10일이 안되서 못보내나봐요ㅠㅠ 어떻게하죠?
저도 궁금하네요.. 조심스럽게 쪽지 부탁드려도 될까요ㅎㅎ
저도 부탁드려도 될까요ㅠㅠ
쪽지 보내주실 수 있나요?ㅠ
저도 쪽지 주시면 감사하겠습니다아아!!
저도 궁금합니다
저도 부탁드립니다!^^ 항상 감사해요
저도 쪽지부탁드려도될까요?ㅜㅜ
저도 부탁드려요 ㅠㅠ
국숭세단라인 성적대에서 표본분석을 통해 유의미한 원서영역 성공을 거두려면 어떤식으로 해야할까요?
수능때 대학 급간이 너무 떨어져서 ㅠㅠ
쪽지 드리겠습니다 ㅎㅎ
저도 쪽지 부탁드립니다
저도 같은 질문으로 쪽지 부탁드립니다!! ㅎㅎ
저도 쪽지 부탁드립니다
저도 부탁드려요ㅠㅠ
쪽지 부탁드립니다!!
저도 쪽지 부탁드려요!
저도 쪽지 부탁드려요ㅠㅜ
저도 쪽지 부탁드려요 퓨ㅠㅠ 감사합니당
글 잘 읽었습니다. 1년 전 글이지만 혹시 댓글을 보신다면 저도 쪽지 부탁드려도 될까요? 비모의지원자는 몇퍼센트로 잡아야 하는지, 모의지원사이트가 예측한 합격인원에 맞춰서 해도 되는지, 지거국 상위라인과 교대 지원에서 표본분석으로 유의미한 결과를 얻으려면 어떻게 하면 좋을지 조언 부탁드립니다. 메리크리스마스!
너무잘읽었어요 ㅎㅎㅎ
쪽지 봐 주시겠어요??
적절한 분석 시기가 언제부터인가요?
빨리 시작하신다면..성적표가 나오고 나서 몇일 후가 좋지 않을까 합니다 ㅎㅎ
감사합니당
감사합니다!
사람이 많아서 헷갈리네요 ㅜㅜ
개인적 질문 있으신 분들은 내용을 쪽지로 보내주시기 부탁드립니다!
좋은 글 감사합니다~
어렵다...
표본은 어떤 식으로 얻는건가요? 건동홍~국숭세단같이 중위권 학교들은 어떤 식으로 해아 하는지도 궁금해요!
저도 이게 궁금하네요 ㅠㅜ
글 감사히 잘 읽었습니다. 많은 도움이 됐어요 ~ ^^
이런 방법이 인서울 하위권 (국숭세단 이하)에서도 도움이 되는 방법일까요? 상위권은 몰라도... 이 구간은 약간 표본에 변수가 많은 걸로 알거든요 ㅠㅠ 어떻게 하면 좋을까요?