1. 프로젝트 개요
- 핵심 주제: 은행 고객 행동/계정 정보를 기반으로 고객 이탈(churn) 예측
- 핵심 가치: 단순히 “맞췄다/틀렸다”가 아니라, **어떤 요인이 이탈 확률을 끌어올렸는지(XAI)**까지 해석해서 실행 가능한 비즈니스 액션으로 연결
2. 활용 데이터셋
Bank Customer Churn Prediction.csv
- 데이터 출처: Bank Customer Churn Prediction.csv
- 데이터 규모: 10,000명 고객, 12개 컬럼
- 타겟 변수:
churn (0 = 유지, 1 = 이탈)
주요 변수(컬럼 의미)
- 고객 식별:
customer_id (모델 학습에서는 보통 제거)
- 고객/리스크:
credit_score, age
- 지역/속성:
country, gender
- 관계/활동:
tenure(이용기간), active_member(활동 고객 여부)
- 자산/가치:
balance(잔액), estimated_salary(추정 연봉)
- 상품/보유:
products_number(이용 상품 수), credit_card(카드 보유 여부)
강점
- 정형 데이터로 이탈 예측의 교과서 구조(범주형+수치형 혼합, 타겟 라벨 존재)
- EDA/전처리/모델링/해석 가능