음악 구독 사용자 데이터

① 기본 정보

② 구독 및 결제 정보

③ 고객 행동 데이터 (핵심)

④ 타겟 변수

미국 Census 인구/사회 데이터

사용 변수

→ 결측치(주별 중앙값으로) 채우기 + 주별 평균 소득 도출

컬럼에 붙이는 건 평균값으로

파생 가능 변수 (해석용)


평균 세션 시간 단위 → hour로 통일

주간 재생 곡 수 < 주간 고유곡 수 → 고유곡 수가 더 크면 재생곡 수로 대체

원핫인코딩 수정 → 해당 코드 빼기

catboost 용 인코딩 전 컬럼 살리기