대학 순위 산출 방식
DeepColleges는 4차원 Decision Score 프레임워크를 사용합니다. 평판 설문에 의존하는 기존 순위와 달리, 모든 항목은 검증 가능한 연방 데이터를 기반으로 공개 공식을 통해 산출됩니다. 이 페이지의 모든 수치를 직접 확인할 수 있으며, 가중치에 동의하지 않는다면 어디가 왜 문제인지 정확히 지적할 수 있습니다.
Decision Score: 네 가지 차원
모든 대학은 각각 0에서 100까지의 네 가지 점수를 받습니다. 이 점수들은 기본적으로 하나의 숫자로 합산되지 않습니다 — "최고의" 대학은 여러분이 무엇을 중시하느냐에 따라 달라지기 때문입니다. 순위 페이지에서는 종합 적합도(Overall Fit) 순으로 정렬하지만, 모든 대학에 대해 네 가지 점수를 모두 표시합니다.
종합 적합도 (Overall Fit) (0–100)
학업 수준, 학생 성공률, 가성비를 종합한 지표. 대학이 약속한 바를 실제로 이행하는지를 가장 폭넓게 측정합니다.
ROI 점수 (0–100)
졸업생이 비용을 정당화할 만큼 충분히 벌 수 있는지를 평가합니다. 순수한 투자 대비 수익률입니다.
편입 점수 (Transfer Score) (0–100)
편입생에게 이 대학은 얼마나 접근 가능한가? 편입 합격률과 신입생 합격률 데이터를 기반으로 산출합니다.
AP 영향력 (AP Impact) (0–100)
이 대학에서 AP 과목이 실제로 얼마나 중요한가? Common Data Set 입학 요소 가중치를 기반으로 산출합니다.
종합 적합도 (Overall Fit) — 공식
종합 적합도(Overall Fit)는 네 가지 측정 가능한 요소의 가중 합산입니다. 모든 대학은 기본 점수 50에서 시작합니다.
| 항목 | 배점 | 데이터 출처 | 산출 방식 |
|---|---|---|---|
| 졸업률 | 0–25 | IPEDS | 6년 졸업률을 선형으로 매핑. 졸업률 100% = 25점. |
| 소득 잠재력 | 0–25 | College Scorecard | 등록 후 10년 시점의 중위 소득. 척도: $30K = 0점, $80K = 12.5점, $120K 이상 = 25점. |
| 가치 (부채 대비 소득) | 0–25 | Scorecard + IPEDS | 중위 부채를 6년 중위 소득으로 나눈 비율. 비율이 낮을수록 높은 점수. 비율 < 0.2 = 25점, > 0.8 = 0점. |
| 선발도 보너스 | 0–10 | IPEDS | 합격률 20% 미만인 대학에만 적용. 선발도가 높을수록 보너스가 크며, 합격률이 0%에 가까울수록 최대 10점. |
범위: 50–135, 0–100으로 제한
ROI 점수 — 공식
ROI는 학위가 투자 비용을 회수할 수 있는지를 측정합니다. 총비용과 총소득을 비교하여 10년 투자 수익률을 계산합니다.
| 입력값 | 출처 | 설명 |
|---|---|---|
| 연간 순비용 | College Scorecard | 중간 소득 가정 기준 순비용 ($48K–$75K 또는 $75K–$110K 구간) |
| 총비용 | 산출값 | 연간 순비용 × 4년 |
| 10년 소득 | College Scorecard | 등록 후 10년 시점 중위 소득 × 10 |
점수 산출: ROI ≤ 0% → 10점 | 0–500% → 20 + ROI×8 | 500–1000% → 60 + (ROI−5)×4 | 1000–2000% → 80 + (ROI−10)×1.5 | 2000%+ → 95
순비용 데이터가 없는 경우 기본 점수 50을 부여합니다.
편입 친화도 — 공식
이 점수는 편입생에게 대학이 얼마나 접근 가능한지를 측정합니다 — 중요하지만 종종 간과되는 지표입니다.
| 시나리오 | 공식 |
|---|---|
| 편입률 데이터 있음 (IPEDS) | Score = 10 + transfer_rate × 90. 직접 선형 매핑. |
| 편입 데이터 없음 | 전체 합격률로 추정: Score = admission_rate × 1.5 + 20. 편입은 일반적으로 신입학보다 용이합니다. |
| 데이터 전무 | 기본값: 50 |
AP 영향력 — 공식
이 점수는 각 대학의 입학 전형과 학점 인정에서 AP 과목이 실제로 얼마나 중요한지를 알려줍니다. Common Data Set Section C7에서 대학이 자체 보고한 입학 요소 가중치를 기반으로 산출됩니다.
| CDS 가중치 | 배점 |
|---|---|
| 매우 중요 (Very Important) | 3 |
| 중요 (Important) | 2 |
| 고려 (Considered) | 1 |
| 미고려 (Not Considered) | 0 |
입력값: CDS 항목 "AP/IB/Dual Enrollment courses" 가중치 및 "Academic GPA" 가중치
CDS 데이터가 없는 경우 선발도로 추정합니다: 합격률 < 10% → 80, < 25% → 65, < 50% → 50, 50% 이상 → 35.
도전 / 적합 / 안전 분류
각 대학 페이지에서 다양한 학업 프로필에 대해 해당 대학을 도전(Reach), 적합(Match), 안전(Safety)으로 분류합니다. 이는 다음을 기반으로 합니다:
- 합격률 — 합격 확률을 가장 잘 예측하는 단일 지표
- SAT/ACT 점수 범위 — IPEDS의 25번째 및 75번째 백분위수
- CDS 입학 요소 가중치 — 대학이 실제로 중시한다고 밝힌 요소 (GPA 엄격도, 시험 점수, 에세이, 과외 활동)
CDS 가중치란 무엇인가 (그리고 왜 중요한가)
Common Data Set (CDS)는 대부분의 미국 대학이 발표하는 자발적 설문조사입니다. Section C7에서 대학은 14개 입학 요소를 4단계 척도(매우 중요, 중요, 고려, 미고려)로 평가하도록 요청받습니다.
이 14개 요소에는 학업 GPA, 고등학교 교과과정 엄격도, 석차, 표준화 시험 점수, 지원 에세이, 추천서, 과외 활동, 재능/능력, 인성/개인적 자질, 1세대 대학생 여부, 동문 관계, 면접, 직업 경험, 봉사활동이 포함됩니다.
우리가 모든 대학 페이지에서 이 가중치를 파싱하여 표시하는 이유는, 입학처가 실제로 중시하는 것이 무엇인지를 드러내기 때문입니다 — 마케팅 문구가 아니라요. 예를 들어, 일부 아이비리그 대학은 동문 관계를 "미고려"로 표시하는 반면 다른 대학은 "고려"로 표시합니다. 레거시 지원자에게는 이것이 실질적인 차이입니다.
데이터 출처
| 출처 | 수집 항목 | 업데이트 주기 | 접근 방식 |
|---|---|---|---|
| College Scorecard | 입학, 소득 구간별 순비용, 중위 소득 (6년 + 10년), 졸업률, 대출 연체율, Pell Grant 수혜율 | 연간 | api.data.gov REST API |
| IPEDS | 등록 현황, 편입률, 인구통계, 기숙사 수용 인원, 기숙사비, 프로그램별 데이터, SAT/ACT 범위 | 연간 | NCES 대량 CSV 다운로드 |
| Common Data Set | Section C7 입학 요소 가중치 (14개 요소 × 4단계 중요도 척도) | 연간 (대학별) | 대학 웹사이트에서 PDF 파싱 |
데이터 파이프라인
- 수집 — Python 스크립트가 College Scorecard API (api.data.gov)와 IPEDS 대량 다운로드에서 원시 데이터를 가져옵니다. CDS 보고서는 개별 대학 웹사이트에서 파싱합니다.
- 보강 — 연방 데이터를 CDS 가중치와 병합합니다. 위의 공식을 사용하여 Decision Score를 계산합니다. 구조화된 데이터로부터 서술형 텍스트를 생성합니다.
- 검증 — 자동화된 검사가 이상 항목을 표시합니다: 누락 필드, 이상치 점수, 데이터 최신성 문제. 표시된 항목은 수동 검토합니다.
- 생성 — 11ty 정적 사이트 생성기가 구조화된 JSON으로부터 400개 이상의 영문 페이지를 생성합니다. i18n 파이프라인이 5개 언어로 2,000개 이상의 추가 페이지를 생성합니다.
- 배포 — 빌드된 페이지가 Cloudflare 엣지 네트워크(300개 이상 도시)에 배포됩니다. 전체 재빌드 및 배포는 60초 이내에 완료됩니다.
한계점
어떤 순위 시스템도 모든 것을 담을 수는 없습니다. 우리 시스템이 반영하지 못하는 부분은 다음과 같습니다:
- 캠퍼스 문화와 사회적 적합성 — 그곳에서의 4년을 즐길 수 있을지 여부. 이를 측정하는 데이터셋은 없습니다.
- 특정 학과의 수준 — 대학의 종합 점수가 개별 학과의 수준을 반영하지 못할 수 있습니다. MIT의 공학 프로그램과 MIT의 정치학 프로그램은 같지 않습니다.
- 위치 선호도 — 도심 캠퍼스를 원하는 학생도, 시골을 원하는 학생도 있습니다. 위치 정보는 표시하지만 가중치에는 반영하지 않습니다.
- 과외 활동 및 연구 기회 — 연구실 접근성, 스타트업 생태계, 운동 프로그램 — 많은 학생에게 중요하지만 우리 공식에는 포함되지 않습니다.
- 코로나 이후 데이터 지연 — 연방 데이터는 1~2년의 보고 지연이 있습니다. 소득 데이터는 수년 전 졸업생을 반영하며, 오늘날의 취업 시장이 아닙니다.
- 소득 ≠ 삶의 만족 — ROI 점수는 재무적 수익률을 측정합니다. 교육이나 사회복지 분야의 낮은 연봉이 여러분에게 올바른 선택일 수 있습니다. 우리는 숫자를 보여주고, 결정은 여러분이 합니다.
학생들이 우리의 데이터를 대학 결정의 하나의 참고 자료로 — 유일한 자료가 아닌 — 활용하기를 권장합니다. 캠퍼스를 방문하세요. 재학생과 대화하세요. CDS를 직접 읽어보세요. 그런 다음 여기로 돌아와 숫자를 확인하세요.
버전 이력
| 버전 | 날짜 | 변경 사항 |
|---|---|---|
| v3.3 | 2026년 4월 | 현재 버전. 50개에서 100개 대학으로 확대. 모든 신규 대학에 순위, CDS 가중치, 마감일 추가. |
| v3.2 | 2026년 4월 | 100개 대학 전체에 CDS Section C7 가중치 파싱 추가. 2023년 IPEDS 데이터로 업데이트. |
| v3.1 | 2026년 3월 | 편입 친화도 점수 추가. 30개에서 50개 대학으로 확대. i18n 지원 (6개 언어). |
| v3.0 | 2026년 2월 | 11ty + Cloudflare Pages로 완전 재구축. Decision Score 프레임워크 도입. |