데이터 기반 개인화 추천 (1/3): 트렌드와 기술편

안녕하세요 뷰저블입니다. 개인화 추천 서비스라는 단어를 들어보신 적이 있으신가요? 아마 큐레이션(Curation) 서비스라고 하면 좀 더 익숙하실 것입니다. 원래 큐레이션이란 미술관이나 박물관에서 큐레이터라 불리우는 전시기획자들이 우수한 작품들을 선별하여 주제를 정하여 전시를 하는 행위를 의미하였습니다. 지금은 모든 분야에서 콘텐츠를 선별하고 조합하여 의미를 부여하고, 새로운 가치를 창출하는 행위를 말합니다.

한걸음 더 나아가 인터넷 서비스 상에서의 ‘개인화 추천(=큐레이션)’은, 넘쳐나는 정보의 홍수 속에서 고객의 관심사에 맞게 정보를 맞춤형으로 편집하여 제공하는 것을 의미합니다. 정보의 양이 증가하는 속도가 엄청나게 빨라졌으며 PC에서 모바일로 디바이스가 작아지며 큐레이션은 ‘중요한 것’을 넘어 ‘필수적인 것’이 되었습니다.



뷰저블은 e-커머스 서비스의 ‘개인화 추천’에 대해 크게 마케팅과 UX적인 관점으로 나누어 살펴보려고 합니다. 어떻게 사용자 경험을 큐레이션하고 개인화하였을까요? 마케팅 메시지를 또한 어떻게 개인화하여 소구할까요? 이번 공유드리는 글은 단순히 e-커머스에만 통용되지는 않으며 다양한 도메인에도 적용해볼 수 있을 것입니다.


타깃 세그먼트 기반 큐레이션 서비스가 제공되었던 초기단계


서비스가 성공하기 위해서는, 여타 기사에 종종 언급되는 전시들이 그러하였듯 기획자의 역량이 가장 중요했습니다. 똑똑한 기획자가 양질의 콘텐츠를 엄선하여 모든 사람들에게 제공하였죠. 헌데 시간이 지나며 ‘고객 중심 마인드’가 자리잡았고 자연스럽게 콘텐츠들이 고객 중심으로 ‘구분(=세그먼트화)’되기 시작하였습니다. 그 결과는 어떠했을까요?

뉴스를 예로 들어보겠습니다. 이전에는 포탈 뉴스를 에디터라 불리우는 전문가가 중요 보도자료를 선별한 뒤 메인에 노출시키는 프로세스로 구성되었습니다. 에디터의 권력이 매우 막강하였죠. 포탈이 메인에 언론사들의 뉴스를 노출시켜주지 않으면 아무리 훌륭하고 공들인 기사라 할지라도 큰 관심을 받을 수 없었습니다.


사용자의 관심사에 따라 다르게 제공되는 콘텐츠 노출
[사용자의 관심사에 따라 다르게 제공되는 콘텐츠 노출]

이런 서비스가 고객 중심이라는 흐름을 타고, 고객이 직접 선택한 관심사별, 언론사별로 우선 노출하는 방식으로 변화합니다. 제가 A라는 신문사의 ‘스포츠’, ‘경제’를 선택하였다면 두 카테고리 관련 기사가 메인에 가장 먼저 노출될 것입니다. 사용자의 관심사에 따라 같은 콘텐츠라도 다르게 보여지는 것이죠. 유투브 같은 동영상 서비스라면요? 내가 ‘동물’ 카테고리를 선택하였다면 당연히 동물 관련 동영상 콘텐츠가 상위 노출될 것입니다.

고객이 직접 선택하는 데이터에 기반하여 큐레이션하는 형태 외에도 CRM 차원에서 보통 회원가입 단계에서 성별이나 결혼 유무, 생일 등의 추가 개인 정보를 받아 세그먼트를 구분하기도 합니다. 이러한 데이터에 기반하여 e-커머스 서비스들은 20대의 미혼 여성에게 화장품이나 의류 상품을 메인에 노출한다면, 20대 남성에게는 면도기와 남성용 향수를 노출하였죠. 반려동물 카테고리를 보유한 서비스라면 고양이를 키우는지 새를 키우는지를 선택하게 하고 관련 상품들을 추천하였습니다.



세그먼트를 넘어 ‘초개인화 큐레이션 시대’가 도래한 현재


현재는 어떠한가요? 넷플릭스나 유투브를 떠올려보세요. 나도 모르게 내가 원하는 콘텐츠를 추천받아 무심코 재생을 해본 적 있지 않으신가요? 동물의 귀여운 모습을 좋아하는 저에게는, 똑똑한 유투브가 종종 놀랍게도 ‘귀여운 동물 모음’ 영상들을 추천해주곤 합니다.

e-커머스 사이트에서 내가 계획하지 않았던 물건을 사보신 경험 없으신가요? 저는 너무나 많습니다. 편안한 러닝화를 즐겨 신는 저에게 무심코 나이키 러닝화가 추천 상품으로 노출되어 클릭한 경험도 있습니다. 몇 일 뒤에는 구매까지 하였습니다. 위에서 언급한 것처럼, 이전에는 특정 세그먼트별로 나누어 고객에게 해당 타깃 세그먼트에 맞는 서비스나 제품을 제안하는 경우가 많았습니다. 허나 지금은 개인의 구매 이력과 취향에 기반하여 엄선된 제품을 제안하고 ‘초(趠)고객 경험’을 실현중입니다.


고객 개인의 취향과 선호에 기반하여 영상 콘텐츠를 제공하는 넷플릭스
[고객 개인의 취향과 선호에 기반하여 영상 콘텐츠를 제공하는 넷플릭스]


e-커머스 서비스에서 제공하는 기본적인 상품 추천 기술


e-커머스 서비스들은 어떻게 이렇게 초개인화 서비스를 제공할 수 있는 것일까요? 고객의 행동 이력이나 고객과 고객간의 관계, 상품과 상품간의 유사도, 고객의 콘텍스트(Context)에 기반하여 고객의 관심 상품을 자동으로 예측하고 제공하는 추천 알고리즘을 활용합니다.

개인화 추천 알고리즘에 앞서, 개인화되지 않은 추천 방식 또한 존재합니다. 개인화되지 않은 추천 방식(Non-Personalized Recommender)의 대표적인 예로는 ‘현재 많이 구매되는 상품’이 있습니다. 개인화 추천 모델링을 위한 데이터가 부족할 때 가장 기본적으로 활용할 수 있습니다.



1) 나와 비슷한 성향의 사용자가 좋아하는 상품을 나에게도 추천해주는 협업 필터링


협업 필터링(CF, Collaborative Filtering)이란 대규모 고객 행동 데이터를 분석하여 나와 비슷한 성향을 지닌 고객들이 선호하는 상품 또는 콘텐츠를 추천해주는 기술입니다. 일반적으로 ‘이 상품을 구매한 사용자가 구매했던 상품들’을 제안하는 추천 서비스를 떠올릴 수 있습니다. ‘불닭볶음면’을 구입한 고객이 ‘스트링 치즈’를 구매한 경우가 많았다면, 다른 ‘불닭볶음면’을 구입하려는 고객에게 ‘스트링 치즈’를 함께 추천할 수 있습니다. 이렇게 상품과 상품간의 관계 외에도 고객과 고객간의 관계, 고객과 아이템간의 유사도에 기반하여서도 추천할 수 있습니다.


2) 콘텐츠의 특성과 고객 프로파일 비교를 통해 선호 콘텐츠를 제공하는, 콘텐츠 기반 필터링


콘텐츠 기반 필터링(Content Based Filtering)이란, 위에서 말한 협업 필터링보다 좀 더 진보적인 기술로써 콘텐츠를 추천하기 위해 해당 콘텐츠 자체를 분석하여 유사한 콘텐츠를 추천합니다. 콘텐츠 기반 필터링을 실현하기 위해서는 콘텐츠 자체를 분석한 프로파일과 고객의 선호도를 추출한 프로파일 두 정보간의 유사성을 분석해야 합니다.


해리포터와 신비한동물사전 영화 이미지. 출처: https://nghood1.tistory.com/245
[해리포터와 신비한동물사전 영화 이미지. 출처: https://nghood1.tistory.com/245]

평소 해리포터 시리즈를 좋아하는 저는 제가 자주가는 동영상 서비스에서 해리포터 관련 영상에 자주 Like를 누르고 구매 이력 또한 많습니다. 해리포터라는 영화가 판타지, 역사, 영국이라는 특징을 보유하고 있다면 서비스는 저에게 같은 특징을 보유하고 있는 ‘신비한 동물사전’이나 ‘나니아연대기’ 등을 추천할 수 있습니다. 보통 멜론 같은 음악 서비스에서 이런 개인화 추천 방식을 활용하여 음악의 비트, 장르 등을 분석하고 추천 기능을 제공합니다.


3) 고객 행동에 기반하여 점수를 메기는 단순 룰 베이스 방식의 추천


고객이 본 상품 상세 페이지, 장바구니에 담았던 상품들의 이력을 추천하여 단순히 1점씩 매기고 점수가 높은 순으로 추천을 하는 룰 베이스 방식의 추천 기법도 있습니다. 과거 1~2개월 데이터를 분석하고 점수화하면 추천할만한 상품들을 발굴할 수 있을 것입니다. 예를 들어볼까요?


고객A가 과거 2개월 동안 e-커머스 서비스 안에서 취한 행동

수박 : 상세 페이지 클릭 10번, 장바구니 담기 2회 – 총 12점
딸기 : 상세 페이지 클릭 9번, 장바구니 담기 4회 – 총 13점
연어 : 상세 페이지 클릭 3번, 장바구니 담기 5번 – 총 8점
팽이버섯 : 상세 페이지 클릭 2번, 장바구니 담기 7번 – 총 9점  


[딸기 – 수박 – 팽이버섯 – 연어] 순으로 점수가 높습니다. 이러한 상품들이 한 고객당 수십 개가 된다면 점수가 가장 높은 3개 정도의 상품들을 메인, 자주구매 GNB, 장바구니 등 다양한 곳에서 추천할 수 있을 것입니다. 이 외에도 협력 필터링, 상품명간의 유사도를 분석하여 추천하는 등 다양한 추천 알고리즘들이 존재하지만 오늘은 짧게 위 3가지만을 설명드리겠습니다. 


[Tip] 개인화 추천 서비스가 얼마나 잘 개인화 되었는지는 어떻게 평가할까요? 추천 결과를 평가하는 방법은 알고리즘 자체의 성능을 평가하는 방식과 고객의 반응을 체류시간이나 상품 자체의 장바구니 추가 수, 상세 보기 클릭 수 등으로 측정하는 방식들이 있습니다. 일반적인 머신러닝에서 Accuracy, Precision, Recall, F1-score 등을 활용하고 있습니다. 



초개인화 속에서 기획자가 놓치지 말아야 할 가장 중요한 자세, ‘제공 정보의 균형’


위에서 말한 다양한 추천 알고리즘들은 현존하는 대다수 온라인 서비스들에게 적용되고 있습니다. 허나 말 그대로 필터링하여 보여주기 때문에 내 관심사가 아닌 정보라면 놓치곤 합니다. 만약 제가 A커머스에서 화장품만 구매한다면, 계속해서 알고리즘은 저에게 화장품만을 추천해주겠죠. A커머스에서 양질의 도서 상품이나 의류를 판매하더라도 저는 그러한 상품 정보들을 접할 기회가 적을 것입니다.

이렇게 정보가 양극화되는 현상, 고객의 입맛 외의 정보가 숨겨지는 현상을 필터 버블(Filter Bubble)이라 합니다. 이렇게 정보가 양극화되지 않도록 기획자는 어떤 콘텍스트에서 추천 알고리즘을 활용할 것인지, 강도를 얼마나 조정할 것인지 고민할 수 있어야 합니다. 고객의 생활과 정서를 좌우하는 막중한 책임이 있기 때문이죠.



오늘은 e-커머스 서비스들의 개인화 추천 서비스 트렌드와 기본적인 알고리즘에 대해 다루었습니다. 다음 글은 ‘마케팅’ 관점에서 어떻게 개인화 추천 서비스들이 이뤄지고 있는지를 공유드릴 예정인데요, 여러분이 기다리시는 뷰저블의 다양한 데이터를 예제로 들어 설명드리겠습니다. 다음 글도 기대해 주세요. 뷰저블이었습니다!

참고 자료: https://www.samsungsemiconstory.com/2265, http://www.kocca.kr/insight/vol05/vol05_04.pdf


Print Friendly, PDF & Email

Share This Post

Share on facebook
Share on linkedin
Share on twitter
Share on email

Related