검색은 고객의 방문목적을 의미하는 가장 좋은 데이터입니다.
고객은 도대체 왜 우리 사이트에 온 것일까요?
내부 검색어를 살펴보면 고객이 우리 사이트를 왜 방문하였는지 그 목적을 단번에 캐치할 수 있는데요, 마스크를 구매하러 온 것인지 유발하라리의 책을 찾아보러 온 것인지, 지난달 개봉한 영화 티켓을 예매하러 온 것인지 등 ‘탐색목적’을 바로 알 수 있습니다. 또 사이트의 방문 목적이 뚜렷한 고객이기 때문에 ‘전환’으로 이어질 확률도 매우 높습니다.
검색은 외부 검색과 내부 검색으로 구분됩니다. 외부검색이라고 하면 구글이나 네이버 같은 포탈에서 검색하여 색인된 페이지로 유입하는 경우를 의미하고, 내부 검색이라하면 자사 사이트 내 검색엔진에서 고객이 FAQ, 상품, 콘텐츠 등을 검색하는 것을 의미합니다.
오늘 뷰저블이 다룰 이야기는 ‘내부 검색엔진’ 데이터 분석법입니다.
내부 인기 검색어로 ‘마약떡’이 급상승 검색어로 올라왔다면 검색에 맞게 메인 페이지나 고객의 도달이 높은 영역에 해당 상품이 잘 노출될 수 있도록 운영해야하고, ‘토트넘 대 맨유’가 인기 검색어로 올라왔다면 해드라인 기사를 ‘토트넘 대 맨유’ 경기 결과로 장식해야겠죠.
검색엔진의 정확도를 높이고 기능을 지속적으로 고도화해나가야 합니다.
이렇게 사업적으로 검색 데이터의 조회수에 따라 상품 노출을 강화하거나 재고 관리, 콘텐츠 운영을 하는 것 외에도 ‘검색 기능’ 그 자체에 대한 질을 높여나가는 것이 중요합니다. 사람의 니즈나 행태는 지속해서 변화하기 때문에 상시적으로 개선해주어야 합니다. ‘검색 기능’을 개선할 수 있는 방법으로는 크게 아래 3가지가 있습니다.
- 검색어의 정확성을 높일 수 있도록 ‘동의어 사전’ 관리하기
- 검색어를 검색엔진이 이해할 수 있도록 ‘사용자 사전’ 관리하기
- 검색어 가중치를 설정하여 고객 화면단의 검색결과 정렬 순서 조정하기
1. 검색어의 정확성을 높일 수 있도록 ‘동의어 사전’ 관리하기
고객이 상품을 ‘항상 올바르게 입력’한다고 결코 보장할 수 없습니다. ‘단마토’라는 상품이라면 ‘설탕 토마토, 스테이바 토마토, 단토마, 단토마토’ 등 약어나 다른 별도 용어로 검색하는 경우도 많습니다. 영어에서 출발한 검색어라면 알파벳으로 검색하거나 ‘모짜렐라’, ‘모차렐라’ 등 영단어를 어떻게 한국어로 표기하는가에 따라서도 검색 결과에 노출되지 않을 수 있습니다.‘비트’는 ‘비트무’, ‘빗트’ 등으로도 검색돼죠.
바로 이러한 경우를 위해 검색어 동의어 사전을 관리해야 합니다. 검색어 사전은 소기업에선 보통 전담 운영자가 있어 사람이 관리합니다. 하지만 담당자의 실수 하나로 전체 시스템이 무너질 수 있어 보통 어느정도 규모있는 기업에선 자동화 처리하고 있습니다. 검색팀이나 데이터분석팀, 검색기획팀 등 다양한 조직에서 관리하고 있으며, 솔트룩스, 코난테크놀로지스, 와이즈넛같은 검색엔진 업체의 서비스를 사용하면 쉽게 관리할 수 있습니다.
2. 검색어를 검색엔진이 이해할 수 있도록 ‘형태소 분리사전’ 관리하기
‘모짜렐라치즈’를 검색하는 사용자가 ‘치즈’만 검색하도라도 ‘모짜렐라 관련 상품’들이 나오게 하기 위해서는 ‘모짜렐라치즈’라는 검색어 내 ‘모짜렐라’와 ‘치즈’가 형태소 분리되어 있어야 하고, 모짜렐라의 동의어로 치즈가 포함되어야 합니다. 이것도 위 동의어 사전과 함께 사람이 관리해줘야 하고 문헌정보학이나 국문학과 같은 지식이 필요합니다. 전문 지식이 없는 사람이 잘못 등록해버리면 예를 들어 스키용품을 검색했는데 ‘위스키’나 ‘스키니진’같은 상품들이 나올 수 있어 명확한 가이드 하에 등록할 수 있도록 주의해야 합니다.
3. 검색어 가중치 조정을 통해 고객 화면단의 검색결과 정렬 순서 조정하기
상품의 판매량, 콘텐츠 클릭 수, 해당 콘텐츠(문서)에 검색어가 출현하는 빈도 수 등 다양한 기준에 따라 검색결과의 가중치를 조정하고 정렬 순서를 변경할 수 있습니다. 커머스나 출판사라면 내부에서 선정된 광고 금액에 따라서 광고 금액을 많이 낸 업체의 상품을 상단으로 노출시켜줄 수도 있습니다.
네이버 쇼핑 같은 커머스 포탈의 검색 가중치는 어떻게 설정할까요? 정확한 알고리즘은 알 수 없으나 추측한다면, 판매량이나 상품 구매, 클릭 수를 먼저 볼 수 있을 것이고 이 외에도 업체별 ‘서비스 지수’라고 불리는 것들을 추적하여 가중치를 설정할 확률이 높습니다. 고객문의에 대해 빠르게 응대하고 있는지, 반품 요청이 들어왔을 때 적극적으로 대응하는지를 예로 들 수 있습니다.
또 ‘활동지수’라는 것도 있는데요, 얼마나 업체가 액티비티하게 적극적으로 고객에게 다양한 베너핏을 제공하는지, 포탈 서비스 활성화를 위해 얼마나 많은 기여를 하고 있는지에 대한 척도라고 보면 됩니다. 방문자수나 단골 고객 수, 적립 금액 등을 예로 들 수 있습니다.
검색결과가 문서라면 어떨까요? 네이버 블로그나 카페 검색 등을 예로 들 수 있겠죠.
이 경우에는, ‘문서 안에서 키워드의 출현 빈도’순으로도 설정할 수 있습니다. 키워드가 문서안에 많이 있다면 해당 문서는 키워드와 관련될 확률이 높으므로 가중치가 높아지는 개념입니다.
문서 길이에 따라 색인어 수가 얼마나 들어있는지를 판별하여 가중치를 조정할 수도 있는데요, 키워드가 포함될 확률이 낮으면서(문서의 길이가 짧으면서도) 포함이 되었다는 것은, 그 키워드가 문서 안에서 상당히 중요한 의미를 가질 확률이 높아 가중치를 더 크게 부여할 수 있는 개념입니다.
검색어 데이터 분석을 통해 사업적 역량 강화하기
검색결과가 0인 비율 분석하기
검색 총 조회수에서 0으로 리턴하는 검색 결과의 비율을 산정하여 우리 사이트의 콘텐츠와 검색엔진의 기능이 고객의 니즈를 따라가는지를 살펴볼 수 있습니다.
전체 검색결과 0 비율과 함께 특정 검색어에 대한 비율도 함께 살펴보는 것이 중요한데요, 동의어 사전이나 형태소 분리등록을 해야하는 검색어가 있지는 않은지, 콘텐츠가 부족하지 않은지를 의사결정하는 중요 자료로 활용할 수 있습니다.
검색 결과가 0인 수 / 검색 총 조회 수 = 검색결과가 0인 비율
재검색 비율과 검색어 분석하기
검색결과에 만족하지 못한 고객은 새로운 검색어로 재검색을 시도합니다. 이는 어떻게 검색을 개선하면 좋을지를 판단하는 좋은 지표가 되는데요, 여러 번 검색을 실행하며 입력했던 검색 키워드를 함께 비교하면, 고객이 원했던 것이 정확히 무엇이었는지를 알 수 있습니다. ‘펜 – 검정펜 – 검정 유성펜 – 얇은 검정 유성펜’ 등으로 보통 검색이 세분화되며 좁혀져가기 때문이죠.
재검색 비율은 고객이 검색결과에 노출되는 결과와 상관없이 어떤 콘텐츠도 클릭하지 않고 새로 검색을 실행한 비율을 의미합니다.
‘킹스맨2’ 영화를 아시나요? 실제 정확한 영화 제목은 ‘킹스맨: 골든서클’이지만, 사람들은 대부분 킹스맨2라고 부릅니다. 동의어 사전을 설정해두지 않으면 킹스맨2라고 검색하더라도 골든서클이 노출되지 않을 것입니다.
재검색을 시도하는 고객도 있겠지만 대다수 중단하고 이탈을 해버리죠. 사람들이 어떤 검색어로 재검색을 시도하는지를 살펴보고, 동의어 사전에 반영하거나 콘텐츠를 보완해야 합니다.
검색 이탈비율과 검색어 분석하기
검색 결과가 출력된 후 고객이 어떠한 액션도 취하지 않고 이탈한 경우를 ‘검색 이탈 비율’로 산정할 수 있습니다. 특정 검색어에 대해 이탈비율이 높다면 원하는 상품이 상위에 노출되지 않을 수도 있고, 동의어 사전이 미비해서 원하는 검색 결과를 얻지 못한 경우가 있습니다. 다양한 방법으로 원인을 찾아 개선해봅시다.
뷰저블을 통해 구글과 네이버 등의 외부 검색엔진을 통해 유입된
고객의 행동 데이터를 분석하여 ‘방문목적’을 파악할 수 있습니다.
그렇다면 외부 검색엔진을 통해 방문한 고객 행동 데이터는 어떻게 분석할 수 있을까요?
뷰저블의 유입경로 세그먼트 기능을 통해, 구글이나 네이버 등의 검색 엔진을 통해 방문한 고객들의 행태 데이터를 히트맵으로 분석할 수 있습니다.
왜 우리 사이트에 방문하였고 어떤 콘텐츠를 흥미있어 하는지, 어떤 콘텐츠로 최종적으로 전환하였는지를 알 수 있을뿐만 아니라 ‘어떤 검색엔진을 통해 유입된 고객’이 우리의 타겟에 더욱 부합하는지까지 알 수 있습니다.
구글을 통해 방문한 고객(좌측)과 네이버 검색(우측) 통해 방문한 고객의 유입경로를 Comfaring Referrers 기능으로 살펴보았습니다.
위 이미지를 주목해주세요! 구글 유입 고객은 전체 방문 중 9.1%이고, 네이버는 2.0%로 구글보다 비중이 매우 적습니다. 하지만 히트맵을 살펴보았더니 유입 비중과 정 반대의 결과를 알 수 있었습니다. 어텐션 그래프라 불리는 선그래프는 영역별 체류시간을 의미합니다. 전반적으로 스크롤 도달율은 비슷하지만 오른쪽 네이버 방문 고객의 숙독율이 훨씬 높은 것을 알 수 있습니다.
실제 Path 그래프를 살펴보면 네이버 방문 고객의 Path가 훨씬 범위가 넓은 것을 볼 수 있죠.
간단히 스크롤 히트맵과 Path 그래프를 살펴본 결과, 유입 비중은 구글이 더 높지만 2%만이 방문한 네이버 고객의 활동 범위와 콘텐츠 소비에 대한 적극성이 더 높다고 해석됩니다. 실제 CTA 버튼의 클릭 수를 비교해본 결과 네이버가 더 높은 Click PV Rate을 보였습니다. 전환 비율도 훨씬 높기 때문에 광고와 SEO 타겟 대상을 구글이 아닌 네이버로 삼고 캠페인을 집행해야 한다는 사실을 알 수 있었죠.
검색 데이터는 고객의 방문, 탐색 목적과 같은 내면의 심리를 파악하는 가장 핵심적인 데이터 중 하나입니다. 뷰저블로는 히트맵의 유입경로 세그먼트 기능을 통해 외부 유입 고객에 대한 ‘행동’ 데이터를 파악할 수 있습니다. 검색어로는 알 수 없는 결과 이면의 것들을 파악하고 서비스 개선의 힌트를 얻어보세요!