1. RFM 기반 데이터 가공

컬럼명 사용 컬럼 의미
activity_score notifications_clicked 사용자의 알림 클릭 횟수를 기반으로 한 최근 활동 수준 지표.
adjusted_frequency weekly_songs_played * (1 - song_skip_rate) 노래 재생 횟수에 스킵 비율을 반영한 실제 콘텐츠 소비 빈도 지표.
Monetary weekly_hours 주간 청취 시간을 기반으로 한 서비스 이용 가치 지표.
Engagement num_playlists_created + num_platform_friends + num_shared_friends 플레이리스트 생성, 친구 추가, 공유 활동을 합산한 플랫폼 참여도 지표.
subscription_risk num_subscription_pauses 구독 일시정지 횟수를 기반으로 한 사용자 이탈 위험 신호 지표.
support_pressure customer_service_inquiries 고객센터 문의 횟수를 기반으로 한 서비스 불만 또는 문제 경험 지표.

2. Kmeans를 활용한 clustering

2.1. 적절한 k값 구하기

2.1.1. elbow method 활용

image.png

2.1.2. silhouette score

image.png

image.png

2.1.3. k값 결정

2.2. 클러스터링 후 간단한 분석

2.2.1. 각 군집 별 고객 수 도출

image.png