마케팅을 위한 데이터 분석 방법 1- RFM 분석법, 고객생애가치 계산법, 회귀분석

2020년 10월 5일 업데이트됨

데이터 분석을 위한 간단하면서 유용한 방법


처음에 데이터를 접하게 된다면 이 데이터를 어떻게 쓰면 좋을지 고민하는 경우가 많을 겁니다.

직관적으로 데이터가 지시하는 바를 알아차리기 어려운 부분도 있을 것이고, 한편으로는 무엇을 말하고

싶은지는 알겠지만 어떤 식으로 해석하면 좋을지 고민하는 부분도 있을 거라고 생각합니다.


따라서 방대한 데이터 속에서 유의미한 정보만을 취사 선택해 가중치를 부여하고 이 정보를 중심으로

데이터를 분석하는 일은 그 무엇보다 중요할 것입니다. 이러한 점에서 데이터 분석 방법은 개인, 기업,

그리고 마케팅 과목을 수강하는 학생 혹은 단순히 마케팅에 관심있는 모두에게 ‘정량적으로 이해하고

해석하기’라는 분석의 틀을 제공해줍니다.


본 편에서는 데이터 분석을 위한 방법들에 대하여 이야기해 볼 예정입니다.

이번 편을 포함한 두 편에 걸쳐서 공유할 예정이며, 본 편에서는 RFM 분석법, 고객생애가치 계산법,

회귀분석에 대해 다뤄보도록 하겠습니다.



RFM (Recency, Frequency, Monetary)


먼저 RFM 분석법에 대해서 알아보겠습니다.


RFM은 말 그대로 Recency (최근성), Frequency (구매 빈도), Monetary (구매 금액)을 의미합니다.

즉, 고객이 얼마나 최근에 제품을 구매했는지, 얼마나 자주 구매하는지, 얼마나 많은 금액을 지출했는지를 중심으로 가치 있는 고객을 분류하고 관리하는 것입니다.


먼저, Recency, Frequency, Monetary 세 가지를 기준으로 고객에게 행위 점수를 부여합니다.

그 다음에, 총 점수를 계산하고, 동일한 점수대의 고객을 같은 그룹으로 분류합니다.


예를 들어, A 고객이 가장 최근에 쇼핑몰을 방문하였고, 1개월 동안 매일 같이 방문하여 제품을

구매하였으며, 제품 단가가 3만원인 쇼핑몰에 매번 6만원어치의 제품을 구매했다면,

이 A 고객은 각 항목별로 최고의 점수를 받아 브랜드 충성 고객 그룹에 속하게 됩니다.


이런 식으로 점수를 부여하고 고객을 분류하는 행위는, 그 점수 부여의 기준과 분류의 기준이 회사마다 다를지라도 상대적으로 간편한 고객 관리의 틀을 제공해 줍니다.


고객생애가치 계산법


고객생애가치(Customer Lifetime Value)는 기업 입장에서 고객 한 명이 가지고 있는 가치를 의미합니다.


즉, 고객 한 명으로부터 얼마만큼의 매출을 기대할 수 있는지를 말합니다.


고객생애가치는 평균고객가치(Customer Value)와 평균고객수명


(Average Customer Lifespan)을 구한 뒤에 계산할 수 있습니다.


먼저, 평균고객가치를 계산하는 방법은 다음과 같습니다.

전체 고객이 평균적으로 얼마만큼의 비용을 지불하는지(Average Purchase Value)를 얼마만큼 자주 구매하는지(Average Purchase Frequency Rate)로 나눠 줍니다.


그 다음 평균고객수명을 계산해야 하는데, 평균고객수명은 고객 전체의 서비스 이용 기간

(Sum of Customer Lifespans)를 전체 고객 수(Number of Customers)로 나눠서 구할 수 있습니다.


마지막으로, 평균고객가치와 평균고객수명을 도출했다면 이제 이 둘을 곱하여 고객생애가치를 구할 수

있습니다. 여기에 다르는 과정을 도식으로 간단히 정리하면 다음과 같습니다:

CV= Average Purchase Value/Average 

ACL = Sum of Customer Lifespans/Number of Customers

CLTV = Customer Value x Average Customer Lifespan

고객생애가치를 산출하고 개개인의 고객이 지니는 일종의 ‘가치’를 계산하고 나면, 마케터들은 그 수치를

기반으로 고객 가치를 향상시키기 위한 다양한 방법들을 고민해 볼 수 있게 됩니다. 이 값이 기업이 바라던 수치와 가깝다면 마케터들은 안도의 숨을 내쉴 수 있겠지만, 이 값이 현저히 낮다면 고객 유지와 고객

만족도 개선을 위한 다양한 방법을 고안해야 할 것입니다.



회귀분석


데이터 독해력을 위한 기본 중의 기본으로 흔히 회귀분석이 언급되고는 합니다.

X와 Y, 두 변수 사이의 상관관계를 넘어 인과관계를 분석하는 일에 있어서 회귀분석 만큼

명료하면서 직관적인 방법론도 사실 많지 않기 때문입니다.


단순히 ‘TV를 시청하는 시간(X)이 늘수록 인지능력(Y)이 저하된다’는 사실을 파헤치는 일이 상관관계

분석이라면, ‘TV를 6시간 시청하면 인지능력이 몇 단위만큼 저하될까’에 대한 결과를 제시해주는 것이 바로 회귀분석입니다.


여기서, TV 시청 시간은 인지능력에 영향을 주는 원인변수이고, 인지능력은 TV 시청 시간에 영향을 받는

결과변수라고 할 수 있습니다.


회귀분석은 크게 단순선형회귀모델, 다중선형회귀모델, 로지스틱 회귀분석, Cox 비례회귀분석으로

4가지의 종류가 존재하는데, 앞에 두 가지의 모델만 인지하고 있어도, 마케팅 측면에서 유의미한 결과를

도출해 내는 일에 무리는 없습니다.


단순선형회귀모델과 다중선형회귀모델은 각각 2개의 모델로 표현할 수 있는데, 단순선형회귀모델은

단변량 단순선형회귀모델과 다변량 단순선형회귀모델로 나눌 수 있습니다.


단변량은 독립 변수와 종속 변수가 각각 1개씩이고, 다변량은 독립 변수가 1개이고 종속 변수가 2개

이상입니다. 다중선형회귀모델의 경우도 단변량과 다변량으로 나뉘는데, 단변량의 경우는 독립 변수가

2개 이상이고 종속 변수가 1개이고, 다변량의 경우는 독립 변수가 2개 이상이고 종속 변수 또한 2개

이상입니다.

단변량 단순선형회귀모델을 가지고 좀 더 자세한 설명을 해보도록 하겠습니다. 이를 수식으로 표현한다면 다음과 같습니다.



Y=b0+b1X

Y=β0+β1X

b0: 절편 

b1: 기울기 혹은 계수 

Y: X의 값에 따라 달라지는 종속 변수 

X: 독립변수 


각각의 데이터 값이 그대로 사분면의 그래프 위에 그려지게 된다면, 단순한 점에 불과하지만 회귀분석을

통해 최적의 직선값을 구한다면 상관관계를 넘어서 효과적으로 X와 Y 사이의 인과관계를 표현할 수

있게 됩니다.


마케터들 또한 Instagram의 좋아요 개수와 물건 판매 개수 사이의 인과관계가 궁금할 때,

혹은 온도에 따른 아이스 커피 구매량의 변화가 궁금할 때 회귀분석을 사용한다면 효과적으로

마케팅 전략을 수립할 수 있으리라 생각합니다.


마무리


그 전에 올린 글들은 정량적인 방법론의 직접적인 제시보다는 데이터 기반 마케팅의 전반적인 흐름을 뒤쫓는 취지에 맞는 글을 올렸지만,


본 편에서는 상세하게는 아닐지라도

개략적으로 데이터 분석 방법이 이렇고

저런 것들이 있다는 의미에서 글을 작성해 보았습니다.


데이터가 쉴 새없이 흐르는 삶 속에서 그 의미를 발견하는 일이 결코 쉬운 작업은 아니지만, 기업의 손끝과 고객의 마음이 닿는다는 의미에서 그 고된 노동의 끝은 그 자체만으로도 가치있는 일일 것입니다.



참조:


-고객 생애 가치를 계산해 봅시다, https://www.hellodigital.kr/blog/dmkt-general-customer-lifetime-value/ (Hellodigital)

-‘데이터가 서 말이라도 꿰어야 보배,’ 분위 회귀분석을 솔루션을 찾아라, https://dbr.donga.com/article/view/1203/article_no/8259, (Donga Business Review)

-데이터 분석 – 3. 회귀분석 (part1), Datamarket, 

-마케팅 분석 실전편: 통계 활용하기 2, http://www.bloter.net/archives/310205, Bloter (블로터)