RFM 모형의 가중치 선택에 관한 연구
- Alternative Title
- Data driven selection methods of weights in RFM Model
- Abstract
- 본격적인 4차 산업혁명 시대를 맞이하면서 전반적인 분야에서 데이터를 활용한 다양한 전략들이 제시되고 있다. 이는 기업의 전략적인 의사결정을 통해 물질적, 시간적 비용을 절감할 수 있고 기업 이윤을 극대화할 수 있는 새로운 마케팅 방법론을 고안할 수 있게 되었다.
급변하는 생활 패턴 속에서 고객은 다양한 욕구를 표현하고 있으며 기업은 이러한 고객의 기대에 부응하기 위해 고객의 구매 데이터를 정제하고 분석하여 고객 구매 패턴을 예측하고 기존 고객을 유지하면서 신규 고객을 모집 할 수 있는 방안을 제시하고 있다. 이러한 방법 중 대표적으로 널리 사용되고 있는 고객관계관리(CRM, Customer Relationship Management)는 오늘날 대량의 데이터가 축적되면서 데이터마이닝 기법과 연계하여 다양한 방법으로 분석할 수 있다. RFM(Recency, Frequency, Monetary)모형은 전통적인 고객관계관리 기법 중 하나로 간단하고 편리한 모델링 방법이며 그 예측력이 뛰어나 현재까지 많이 사용되고 있다. 그러나 RFM 모형 설계에서 가장 중요한 것은 각 변수에 가중치를 부여하는 것인데 현재까지 명확한 가중치의 기준은 제시된 것이 없는 상태다.
본 논문에서는 RFM모형을 보다 효율적으로 설계할 수 있는 가중치 선택 방안을 제시하고자 한다. 빅데이터 분석기술 중 하나인 군집분석에서 대표되는 K-Means 알고리즘을 활용하여 데이터를 군집화하고 각 군집의 Recency, Frequency, Monetary 세 가지 요소의 CV(Coefficient of Variation, 변동계수)값을 활용하여 RFM 모형의 가중치로 선택한다. 최종적으로 설계된 RFM 모형에서 RFM 점수를 산출하여 각 고객들에게 부여하고 전체 고객을 5개의 등급화된 집단으로 세분화하는데 목적이 있다.
본 연구에는 총 3개의 데이터셋이 활용되었으며 각 데이터셋은 6,116건, 549,019건, 6,919건의 고객 구매데이터로 이루어져 있고 인구통계학적 변수를 포함한 고객 정보와 더불어 RFM 분석에 필요한 세 가지 요소인 구매시기(Recency), 구매빈도(Frequency), 구매금액(Monetary)를 포함한다.
Python의 기계학습 라이브러리를 활용하여 Elbow method를 통해 얻어낸 최적의 K값을 각 데이터셋에 적용하고 K개로 나눠진 각 집단의 R, F, M 변수의 통계량을 통해 가중치를 선택하여 최종 RFM 모형을 설계하고 전체 고객들에게 점수를 부여하여 최종 5개의 집단으로 분류하였다.
이를 통해 목표변수가 없는 구매데이터 특성의 한계를 극복할 수 있었으며 K-Means Clustering을 통해 군집화된 집단별 변수의 특성이 반영된 객관적인 방법으로 가중치를 선택한 RFM 모형을 설계할 수 있었고 이를 통해 보다 나은 고객 세분화가 가능하였다.
As we enter the era of the 4th industrial revolution in earnest, various strategiesusing data are being proposed in the overall field. This made it possible to devise anew marketing methodology that can reduce material and time costs and maximizecorporate profits through strategic decision-making.In a rapidly changing lifestyle, customers express various desires, and in order tomeet these customer expectations, companies can refine and analyze customerpurchasing data to predict customer purchasing patterns and retain existing customerswhile recruiting new customers suggesting a way out. Among these methods,customer relationship management (CRM), which is widely used representatively, canbe analyzed in various ways in connection with data mining techniques as a largeamount of data is accumulated today. The RFM (Recency, Frequency, Monetary)model is a simple and convenient modeling method as one of the traditionalcustomer relationship management techniques. However, the most important thing inRFM model design is to assign weights to each variable, and there is no clearstandard for weighting so far.In this paper, we propose a weight selection method that can design the RFM modelmore efficiently. One of the big data analysis techniques, the K-Means algorithmrepresented by clustering, is clustered and selected as the weight of the RFM modelby utilizing the Coefficient of Variation (CV) values of the three components of eachcluster: Recency, Frequency, and Monetary. The purpose is to calculate the RFM score from the finally designed RFM model, assign it to each customer, andsubdivide the entire customer into five graded groups.A total of three datasets were used in this study, and each dataset consists of 6,116,549,019, and 6,919 customer purchase date(Recency), purchase frequency(Frequency),and purchase amount (Monetary) are included.Using Python's machine learning library, the optimal K value obtained through theElbow method is applied to each dataset, and the final RFM model is designed byselecting weights through the statistics of R, F, and M variables of each groupdivided into K groups. Scores were given to all customers and classified into fivegroups.This allowed us to overcome the limitations of purchase data characteristics withouttarget variables, and K-Means Clustering allowed us to design RFM models withweights selected in an objective way that reflected the characteristics of clusteredgroup variables, which enabled better customer segmentation.
- Author(s)
- 김동석
- Issued Date
- 2021
- Awarded Date
- 2021. 8
- Type
- Dissertation
- URI
- https://dcoll.jejunu.ac.kr/common/orgView/000000010237
- Alternative Author(s)
- Kim, Dong Seok
- Affiliation
- 제주대학교 대학원
- Department
- 대학원 전산통계학과
- Advisor
- 김철수
- Table Of Contents
- 제 1 장 서론 1
제 1 절 연구 배경 1
제 2 절 연구 목적 3
제 3 절 연구 방법 및 범위 4
제 4 절 연구 구성 5
제 2 장 이론적 배경 7
제 1 절 고객 세분화 7
제 2 절 K-Means Clustering 8
제 3 절 RFM 분석 11
1. RFM 분석의 개념 11
2. RFM 모형 설계 12
3. RFM 모형의 가중치 선택에 관한 선행연구 14
1) 파레토 법칙에 의한 결정 15
2) 로지스틱 회귀분석에 의한 결정 17
3) 직관에 의한 결정 17
제 3 장 연구 방법 21
제 1 절 조사 설계 21
1. 분석 대상 21
2. 데이터 전처리 24
3. 분석 방법 25
제 2 절 RFM 모형 설계 25
1. R값 설정 25
2. F값 설정 27
3. M값 설정 28
제 3 절 데이터 군집화 30
제 4 절 RFM 모형의 가중치 산출 35
제 4 장 연구 결과 38
제 1 절 고객 세분화 38
1. RFM 점수 부여 38
2. 5개 등급 구분 41
3. 5개 등급 비교 44
제 2 절 RFM 모형 비교 46
1. 비교 모형 설계 46
2. 모형 비교 48
제 5 장 결론 52
제 1 절 연구의 요약 52
제 2 절 연구의 한계점 53
제 3 절 향후 연구 방안 54
참고문헌 55
국문 초록 61
- Degree
- Master
- Publisher
- 제주대학교 대학원
- Citation
- 김동석. (2021). RFM 모형의 가중치 선택에 관한 연구
-
Appears in Collections:
- General Graduate School > Computer Science and Statistics
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.