안녕하세요 뷰저블 연구원입니다. 오늘은 데이터 분석 시, 가설 구축을 위해 해야 하는 2가지 질문에 대해 이야기 나누고자 합니다. 왜 가설 구축이 중요한지 그리고 올바르게 가설을 구축하기 위해서는 어떤 질문을 던져야 하는지를 공유합니다.
데이터 분석 툴의 진화, 그러나 사람이 반드시 해야 하는 일은 여전히 존재합니다.
최근 다양한 분석 툴이 도입됨에 따라 실무자 누구나 어느 정도 데이터 분석 업무를 더욱 정확하고 빠르게 수행할 수 있게 되었습니다. 이는 기본적인 작업, 예를 들어 데이터 정렬이나 시각화 등의 작업 또는 간단한 데이터 해석 작업을 더 이상 사람의 손을 빌리지 않아도 되는 것을 의미합니다.
지난 2016년 구글 애널리틱스 모바일 웹에서 ‘애널리틱스 어시스턴트’라는 이름으로 간단한 분석 업무를 도와주는 자동 통계 보고서 기능이 출시된 바 있습니다. 원하는 정보를 바로 질문하여 알 수 있어 마케터나 분석 담당자가 정보를 탐색하는 시간을 대폭 절약할 수 있었습니다. 또한 머신러닝을 활용하여 사용자 행동을 모니터링하고, 특이점이 발견되면 알림으로 주는 기능이었습니다.
참고자료 : https://www.morevisibility.com/blogs/analytics/new-feature-release-analytics-assistant.html
하지만 아무리 이렇게 뛰어난 분석 툴이 나오더라도 ‘사람이 해야 하는 일’이 존재합니다.
1. 과제 설정 : 어떤 데이터가 필요한가?
2. 목표 설정 : 해당 데이터를 통해 조직의 어떤 목표를 달성할 것인가?
3. 가설 수립 : 해당 목표를 어떤 방향으로 달성할 것인가?
바로 위 세 가지, 과제와 목표를 설정하고 가설을 구축하는 부분입니다. 우리가 왜 데이터를 분석해야 하며 해당 이슈를 파악하기 위해서는 어떤 데이터가 필요한지, 목표를 달성하기 위해서는 어떤 가설을 수립하여야 하는지는 결코 툴이 해주지 않으며 사람이 직접 고민해야 합니다. 이중에서도 특히 가설 수립은 데이터 분석에서 가장 중요한 부분임에도 불구하고 간과하기 쉬우며, 실무자들이 가장 어렵다고 느끼는 부분이기도 합니다.
가설은 조직의 길라잡이이자 사고의 보조자
그렇다면 올바른 가설 수립은 왜 중요할까요? 먼저 가설이 올바르게 수립되지 못한다면 ‘문제 해결을 위해 상당한 물적, 인적 자원을 낭비’하게 됩니다. 올바른 가설 수립은 불필요한 데이터 수집과 분석을 예방하여 공수를 효율적으로 활용할 수 있게 하는 것입니다. 또한 가설은 조직이 ‘Action’을 할 수 있는 길라잡이가 되어주며 프로젝트 기간 내내 지속적인 사고(思考)를 이끄는 보조자 역할을 합니다.
가설 수립은 문제가 무엇인지를 명확하게 이해하는 것으로부터 시작됩니다. 실제 많은 컨설팅 펌에서는 ‘문제’ 파악에만 오랜 기간을 투자합니다. 보통 클라이언트 또는 조직이 문제를 알고 있을 것 같으나 실제로는 본인들의 문제점이 무엇인지 모르는 경우가 많기 때문입니다. 하나 많은 실무자들이 ‘문제’를 적확히 파악하고 분석, 고민하기보다 그저 ‘주어진 데이터’만 보고 가설을 수립해버리곤 합니다.
풀어 설명하자면, 분석 툴을 둘러보았더니 해당 분석 툴에서 제공하는 A 데이터에 특이점이 발견되었습니다. A 데이터에서 결론을 얻은 후 결론에 기반하여 B데이터를 살펴보고, B데이터에서 다시 결론을 얻어 C데이터를 살펴봅니다. 실무자는 이 A~C 데이터라는 3가지 범위의 데이터를 통해 아마 ‘논리적으로 가설과 결론을 수립’하였다고 생각할 수 있습니다. 가설을 수립하는 것입니다. 하지만 이러한 가설 수립 접근법은 올바르지 못합니다. 다른 데이터를 더 많이 보았더라면 더 나은 가설이 도출될 수 있었을 것이고, 더 나은 문제 해결 방안 또한 나왔을지도 모릅니다. 또한 문제에 대한 ‘목표’가 먼저 설정되지 않았기 때문에 ‘의미 없는 분석’이 되어버리고 말았습니다.
올바른 가설 수립은 올바른 질문으로부터 시작된다.
A에서 이상치를 발견하여 B데이터를 보고, B에서 다시 C데이터를 보기 이전에 우리는 가장 먼저 ‘왜 데이터를 분석해야 하는가?’에 대한 ‘문제’ 파악이 필요합니다. 그 이후 해당 문제 해결을 위해서는 어떤 범위 내의 데이터가 필요한지, 해당 데이터를 어떻게 분석해나갈 것인지 등을 검토하게 되는 것이지요.
아래 3가지 질문이 필요합니다.
1. 우리 조직 또는 서비스가 당면한 문제가 무엇인가?
2. 문제를 해결하려면 어떤 데이터가 필요한가? 또한 어떤 범위 내의 데이터를 살펴보아야 하는가?
3. 해당 데이터를 누가, 어느 기한 내로, 어떻게 분석할 것인가?
1. 우리 조직 또는 서비스가 당면한 문제가 무엇인가?
가장 먼저 질문해야 하는 점이 바로 ‘문제’입니다. 우리가 처한 문제가 무엇인지 모르면 결코 분석은 시작할 수 없습니다. 우리는 왜 데이터를 분석해야 하는가?를 알 수 있는 ‘문제 파악’에 긴 시간을 투자해야 합니다.
2. 문제를 해결하려면 어떤 데이터가 필요한가?
문제를 파악하였다면 다음으로는 어떤 데이터가 필요한지를 리스트업 할 차례입니다. 스프레드시트 또는 액셀 등을 활용하여 해당 문제를 해결하기 위해서는 어떤 데이터를 살펴보아야 하는지를 정리합시다. 또 이 데이터에 우선순위, 활용할 수 있는 분석 툴 등이 있는지를 적어둡시다. 분석해야 하는 데이터 범위는 넓으면 넓을수록 좋습니다. 분석가의 업무가 당연히 늘어나겠지만, 가설에 대한 리스크가 줄어들어 최적의 해결 방안을 찾도록 도와줄 것입니다. 단순히 뷰저블에서만 데이터를 보는 것이 아니라 매출 같은 사내 데이터, 구글 애널리틱스 같은 다른 툴의 데이터도 함께 살펴보는 것이 좋습니다.
3. 해당 데이터를 누가 어떻게 분석할 것인가?
마지막으로는 해당 데이터를 누가, 어떻게 분석할 것인지 분석에 대한 계획(액션 방안)을 세웁니다.
뷰저블에서는 아래와 같이 분석을 시작하기 전, 스프레드시트에 분석 목적과 현황, 분석 방법, 이슈 등을 정리하여 우선순위를 메기고 이에 따라 분석을 진행합니다.
아무리 비싼 툴을 도입하더라도 결국 가설은 분석가가 수립해야 합니다. 하나 가설을 수립하는 방법에는 정답이 없으며 개인의 경험치와 창의력, 시행착오를 기반으로 노하우가 생겨나는 것도 사실입니다. 얼마든지 분석가에 따라 더 좋은 가설이 수립될 수 있기 때문입니다. 그렇기 때문에 여러분들이 하셔야 하는 것은 될 수 있는 한 더 많은 데이터를 살펴보고, 더 많은 가설을 직접 수립해보는 것입니다.