강사칼럼

RFM 분석으로 고가치 고객 식별하기: 누가 우리 브랜드를 지탱하는 고객인가?

Donghyuk_Park

May 25, 20251y ago

카테고리

Empty

"우리 고객 중 진짜 VIP는 누구일까?" 모든 마케터와 사업 담당자가 한 번쯤 품어봤을 질문입니다. 전체 매출의 상당 부분이 소수의 핵심 고객으로부터 나온다는 파레토 법칙(80/20 법칙)은 마케팅에서도 흔히 관찰되는 현상이죠. 하지만 이 '소수의 핵심 고객'을 감이 아닌 데이터로 명확히 식별하고, 그들에게 맞는 전략을 펼치기란 생각보다 쉽지 않습니다.

오늘은 바로 이 질문에 답을 줄 수 있는 강력하고도 클래식한 고객 분석 방법론, RFM 분석을 소개하고, 실무에서 어떻게 적용하여 우리 브랜드를 지탱하는 '고가치 고객'을 찾아낼 수 있는지 구체적인 방법과 함께 살펴보겠습니다. 이 분석을 통해 여러분은 한정된 마케팅 리소스를 어디에 집중해야 할지, 어떤 고객을 더 세심하게 관리해야 할지에 대한 명확한 단서를 얻게 될 것입니다.

RFM 분석이란 무엇인가? 핵심은 세 가지!

RFM은 고객의 가치를 판단하는 세 가지 핵심 지표의 약자입니다.

Recency (최신성): 고객이 얼마나 최근에 구매했는가?

•

가장 최근에 구매한 고객일수록 현재 우리 브랜드에 대한 관심도가 높고, 재구매 가능성도 크다고 판단합니다. 오랫동안 구매가 없는 고객은 이탈했을 가능성이 높죠.

Frequency (빈도): 고객이 얼마나 자주 구매했는가?

•

구매 빈도가 높은 고객일수록 우리 브랜드에 대한 충성도가 높다고 해석할 수 있습니다. 일회성 구매 고객보다 꾸준히 찾는 고객이 더 가치 있겠죠.

Monetary (구매 금액): 고객이 얼마나 많은 금액을 지출했는가?

•

총 구매 금액이 큰 고객일수록 우리 브랜드의 매출에 크게 기여하는 고객입니다. 객단가가 높은 고객, 또는 여러 번 구매하여 누적 금액이 큰 고객 등이 해당됩니다.

RFM 분석은 이 세 가지 기준을 바탕으로 각 고객에게 점수를 매기고, 이를 조합하여 고객을 여러 그룹으로 분류(세분화)합니다. 이를 통해 "최근에, 자주, 많이 구매한 고객" 즉, 우리의 '진짜 VIP'를 객관적인 데이터로 찾아낼 수 있습니다.

왜 RFM 분석이 중요한가? : 선택과 집중의 시작

RFM 분석을 통해 얻을 수 있는 실질적인 이점은 다음과 같습니다.

고객 세분화 및 타겟 마케팅: 모든 고객에게 동일한 메시지를 보내는 것은 비효율적입니다. RFM 점수에 따라 고객 그룹(예: VIP 고객, 충성 고객, 이탈 우려 고객, 신규 고객 등)을 나누고, 각 그룹의 특성에 맞는 맞춤형 마케팅 전략을 수립하여 캠페인 효과를 극대화할 수 있습니다. (사실: 세분화된 타겟 마케팅은 일반적인 매스 마케팅보다 전환율과 ROI가 훨씬 높습니다.)

고객 생애 가치(LTV) 증대: 고가치 고객을 식별하여 이들의 만족도를 높이고 유지함으로써 장기적인 관계를 구축하고 LTV를 극대화할 수 있습니다.

이탈 고객 예측 및 방지: 최근 구매일이 멀어지거나(Recency 낮음), 과거에는 자주 구매했지만(Frequency 높음) 최근 활동이 뜸한 고객을 '이탈 위험군'으로 분류하고, 선제적인 재활성화 캠페인(예: 특별 할인, 신제품 안내)을 통해 이탈을 방지할 수 있습니다.

마케팅 예산 효율화: 가장 가치 있는 고객에게 마케팅 리소스를 집중함으로써 불필요한 비용 낭비를 줄이고 ROI를 개선할 수 있습니다.

실전! RFM 분석 따라하기: 단계별 가이드

자, 이제 RFM 분석을 직접 수행하는 과정을 단계별로 살펴보겠습니다. Python이나 R, SQL을 사용하면 더 정교하고 자동화된 분석이 가능하지만, 여기서는 개념 이해를 돕기 위해 엑셀로도 충분히 따라 할 수 있는 기본 원리를 설명하겠습니다.

준비물: 고객별 구매 이력 데이터 (최소한 아래 정보 포함)

•

CustomerID (고객 ID)

•

OrderID (주문 ID)

•

OrderDate (주문 날짜)

•

OrderAmount (주문 금액)

1단계: RFM 지표 계산을 위한 기준일 설정

•

데이터 전체의 마지막 주문일 다음 날, 또는 분석을 수행하는 오늘 날짜를 기준으로 설정합니다. 예를 들어, 데이터의 마지막 주문일이 2023년 10월 31일이라면, 기준일은 2023년 11월 1일로 설정합니다.

2단계: 고객별 R, F, M 값 계산

고객 ID별로 각 RFM 값을 계산합니다.

•

Recency (R) 계산:

◦

기준일 - 고객별 마지막 주문일 (일 단위 차이)

◦

이 값이 작을수록 R 점수가 높습니다. (최근 구매)

•

Frequency (F) 계산:

◦

고객별 총 주문 횟수 (COUNT DISTINCT OrderID per CustomerID)

◦

이 값이 클수록 F 점수가 높습니다. (자주 구매)

•

Monetary (M) 계산:

◦

고객별 총 주문 금액 (SUM OrderAmount per CustomerID)

◦

이 값이 클수록 M 점수가 높습니다. (많이 구매)

예시 (엑셀 함수 활용):

CustomerID	LastOrderDate	R (기준일:2023-11-01)	OrderCount	F	TotalAmount	M
C001	2023-10-28	4 (DAYS("2023-11-01", "2023-10-28"))	5	5	500000	500000
C002	2023-08-15	78	2	2	100000	100000
C003	2023-10-01	31	10	10	1200000	1200000

(위 표는 R,F,M 값 자체를 보여주며, 아직 점수화 전입니다.)

3단계: 각 RFM 지표에 대한 점수 부여 (Scoring)

계산된 R, F, M 값을 기준으로 각 고객에게 점수를 매깁니다. 일반적으로 5등급(1~5점)을 많이 사용합니다.

•

Recency 점수:

◦

R 값이 가장 작은 고객(가장 최근 구매)에게 5점, 가장 큰 고객(가장 오래전 구매)에게 1점을 부여합니다. (오름차순 정렬 후 분위수 활용)

•

Frequency 점수:

◦

F 값이 가장 큰 고객(가장 자주 구매)에게 5점, 가장 작은 고객에게 1점을 부여합니다. (내림차순 정렬 후 분위수 활용)

•

Monetary 점수:

◦

M 값이 가장 큰 고객(가장 많이 구매)에게 5점, 가장 작은 고객에게 1점을 부여합니다. (내림차순 정렬 후 분위수 활용)

점수 부여 방법 (예: 분위수 사용 - Quintiles):
고객들을 각 지표(R, F, M)별로 정렬한 후, 상위 20%에게 5점, 다음 20%에게 4점, ... 하위 20%에게 1점을 부여합니다.
엑셀에서는 PERCENTILE 또는 QUARTILE 함수와 IF 함수를 조합하여 구현할 수 있습니다. Python pandas.qcut을 사용하면 더 편리합니다.

4단계: RFM 점수 조합 및 고객 세그먼트 정의

각 고객에게 부여된 R, F, M 점수를 조합하여 최종 RFM 점수(또는 등급)를 만듭니다.
예를 들어, R 점수 5, F 점수 5, M 점수 5인 고객은 '555'로 표현할 수 있습니다.

이 조합된 점수를 기반으로 의미 있는 고객 세그먼트를 정의합니다. 일반적인 세그먼트 예시는 다음과 같습니다.

RFM 스코어 (예시)	고객 세그먼트	특징	마케팅 전략 제안
555	챔피언 (Champions)	최근에, 자주, 많이 구매하는 최고의 고객	VIP 프로그램, 신제품 우선 체험, 로열티 보상, 추천 유도
X5X (예: 454, 355)	충성 고객 (Loyal Customers)	꾸준히 자주 구매	맞춤형 상품 추천, 멤버십 혜택 강화, 후기 요청
5XX (예: 511, 522)	신규 고객 (New Customers)	최근에 구매했지만 아직 빈도/금액은 낮음	환영 메시지, 첫 구매 감사 쿠폰, 재구매 유도 프로그램
1XX (예: 155, 144)	이탈 우려 고객 (At Risk)	과거에는 자주/많이 구매했으나 최근 구매가 없음	할인 쿠폰, 특별 프로모션, 설문조사를 통한 불만 파악
111, 121 등	이탈 고객 (Lost Customers)	오랫동안 구매가 없고, 빈도/금액도 낮음	마지막 구매 상기, 파격적인 재활성화 오퍼 (필요시 포기)
34X, 43X 등	잠재 충성 고객 (Potential Loyalists)	최근 구매, 구매 빈도/금액 성장 가능성 높음	포인트 제도 안내, 멤버십 가입 유도, 관련 상품 추천
XX1 (예: 441, 331)	저가치 고객 (Low Spenders)	구매 빈도는 있으나 구매 금액이 작음	객단가 상승 유도 (묶음 상품, 추가 구매 혜택)

(X는 해당 점수가 다양할 수 있음을 의미합니다. 실제로는 R, F, M 점수 범위를 기준으로 세그먼트를 정의합니다.)

5단계: 세그먼트별 전략 수립 및 실행

정의된 각 고객 세그먼트의 특성을 분석하고, 그에 맞는 차별화된 마케팅 액션을 실행합니다. 중요한 것은 모든 고객에게 동일한 메시지를 보내는 것이 아니라, 각 그룹이 가장 반응할 만한 방식으로 소통하는 것입니다.

RFM 분석을 위한 도구

•

Excel/Google Sheets: 소규모 데이터나 RFM 개념 학습에는 유용하지만, 데이터 양이 많아지면 수동 작업과 성능에 한계가 있습니다.

•

SQL: 데이터베이스에서 직접 R, F, M 값을 계산하고 고객을 그룹핑하는 데 매우 효과적입니다. 대용량 데이터를 다루기에 적합합니다.

•

Python (Pandas, Scikit-learn) / R (dplyr): 데이터 처리, 통계 분석, 자동화에 강력합니다. 복잡한 로직이나 대규모 데이터 분석, 시각화에 유리합니다. 아래는 Python Pandas를 사용한 간단한 개념 코드입니다.

import pandas as pd
from datetime import datetime

# 예시 데이터 로드 (실제로는 DB나 CSV에서 로드)
data = {'CustomerID': ['C001', 'C001', 'C002', 'C003', 'C003', 'C001'],
        'OrderDate': ['2023-10-01', '2023-10-28', '2023-08-15', '2023-09-10', '2023-10-01', '2023-07-05'],
        'OrderAmount': [100000, 50000, 100000, 70000, 80000, 150000]}
df = pd.DataFrame(data)
df['OrderDate'] = pd.to_datetime(df['OrderDate'])

# 기준일 설정
analysis_date = datetime(2023, 11, 1)

# RFM 계산
rfm_df = df.groupby('CustomerID').agg(
    Recency_Value=('OrderDate', lambda x: (analysis_date - x.max()).days),
    Frequency_Value=('OrderDate', 'count'),
    Monetary_Value=('OrderAmount', 'sum')
).reset_index()

# RFM 스코어링 (qcut 활용 - 분위수 기반)
# Recency는 낮을수록 좋으므로, 점수를 반대로 매기거나 별도 처리 필요.
# 여기서는 간단히 qcut 후 레이블 순서를 조정하는 방식으로 처리 가능 (또는 rank 사용)
# labels=[5,4,3,2,1] for recency, labels=[1,2,3,4,5] for frequency/monetary

# Recency 점수 (값이 작을수록 높은 점수)
rfm_df['R_Score'] = pd.qcut(rfm_df['Recency_Value'], 5, labels=[5, 4, 3, 2, 1], duplicates='drop')
# Frequency 점수 (값이 클수록 높은 점수)
rfm_df['F_Score'] = pd.qcut(rfm_df['Frequency_Value'].rank(method='first'), 5, labels=[1, 2, 3, 4, 5], duplicates='drop')
# Monetary 점수 (값이 클수록 높은 점수)
rfm_df['M_Score'] = pd.qcut(rfm_df['Monetary_Value'].rank(method='first'), 5, labels=[1, 2, 3, 4, 5], duplicates='drop')


rfm_df['RFM_Score_Concat'] = rfm_df['R_Score'].astype(str) + rfm_df['F_Score'].astype(str) + rfm_df['M_Score'].astype(str)

print(rfm_df.head())

# 이후 RFM_Score_Concat 또는 개별 점수 조합으로 세그먼트 정의
# 예: champions = rfm_df[rfm_df['RFM_Score_Concat'] == '555']

(위 코드는 개념 설명용이며, 실제 데이터와 환경에 맞게 수정이 필요합니다. 특히 duplicates='drop' 옵션은 데이터 분포에 따라 주의해서 사용해야 합니다.)

RFM 분석의 한계와 보완점

RFM 분석은 매우 유용하지만 몇 가지 한계도 가지고 있습니다.

•

구매 데이터에만 의존: 고객의 웹사이트 방문 기록, 앱 사용 패턴, 고객 서비스 문의 내역 등 비구매 행동 데이터는 반영하지 못합니다.

•

상품 특성 미반영: 어떤 상품을 구매했는지, 반품 이력 등은 고려되지 않습니다.

•

시간의 흐름에 따른 변화: 고객의 RFM 등급은 고정된 것이 아니라 시간이 지남에 따라 변합니다. 주기적인 분석과 업데이트가 필요합니다.

이러한 한계를 보완하기 위해 RFM에 다른 변수(예: 구매 상품 카테고리, 인구 통계학적 정보, 행동 데이터 등)를 추가한 RFM-X 모델을 사용하거나, LTV(고객 생애 가치) 예측 모델, 클러스터링 분석 등 더 정교한 방법론과 함께 활용할 수 있습니다.

결론: 고객 이해의 첫걸음, RFM으로 시작하세요

RFM 분석은 복잡한 통계 모델이나 AI 없이도 고객 데이터를 의미 있게 활용하여 '누가 우리 브랜드를 지탱하는 고객인가?'라는 질문에 명쾌한 답을 줄 수 있는 강력한 방법론입니다. 오늘 당장 여러분 회사의 고객 데이터를 꺼내어 RFM 분석을 시도해 보세요. 어떤 고객 그룹이 가장 중요한지, 어떤 고객에게 더 많은 관심과 노력을 기울여야 하는지 발견하는 순간, 마케팅 전략은 더욱 날카로워지고 비즈니스는 한 단계 더 성장할 수 있을 것입니다. 고객을 아는 것에서부터 모든 마케팅은 시작됩니다!

Subscribe to 'CareerCraft.kr'

Subscribe to my site to be the first to receive notifications and emails about the latest updates, including new posts.
Join Slashpage and subscribe to 'CareerCraft.kr'!