https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce
https://archive.ics.uci.edu/dataset/502/online+retail+ii
본 프로젝트는 이커머스 거래 로그를 고객 단위로 재구성하고, 일정 기간 내 재구매 여부를 기준으로 휴면/이탈 고객을 정의한 뒤, 고객 행동 특성을 활용해 이탈 가능성을 예측하는 비교형 머신러닝 프로젝트이다. Olist와 Online Retail II 거래 로그 데이터를 활용하여 고객별 구매 패턴, 결제, 리뷰 및 거래 행동 특성을 추출하고, 향후 일정 기간 동안 재구매하지 않을 휴면/이탈 고객을 예측하는 머신러닝 모델을 구축하고자 한다. 또한 두 데이터셋에 동일한 분석 프레임을 적용하여 공통적인 이탈 요인과 데이터셋별 차이를 비교 분석한다.
거래 로그 기반 마켓플레이스 가입 고객의 휴면/이탈 예측: Olist와 Online Retail II 비교 분석
이커머스 산업에서는 신규 고객 확보 비용이 높기 때문에, 기존 가입 고객의 이탈을 조기에 예측하고 사전에 유지 전략을 수립하는 것이 매우 중요하다. 특히 고객 이탈은 단순히 서비스 해지뿐 아니라, 일정 기간 재구매가 중단되는 휴면 상태로도 나타날 수 있다. 따라서 고객의 과거 구매 이력, 결제 패턴, 상품 구매 다양성, 리뷰 및 거래 행동을 바탕으로 향후 재구매 여부를 예측하는 것은 실무적으로 높은 의미를 가진다.
본 프로젝트는 이커머스 거래 로그 데이터에서 고객별 행동 특징을 추출하고, 이를 바탕으로 휴면/이탈 가능성이 높은 고객을 예측하는 머신러닝 모델을 구축하는 것을 목표로 한다. 또한 서로 다른 성격의 두 이커머스 데이터셋에 동일한 분석 프레임을 적용하여, 고객 이탈 예측 모델의 일반화 가능성과 공통적인 이탈 요인을 비교하고자 한다.
본 프로젝트의 목적은 다음과 같다.