TIL

[12/30] TIL (데이터 리터러시)

pys6341 2024. 12. 30. 20:45

1. 데이터 리터러시

 

데이터 리터러시란?

데이터를 수집하고, 원천을 이해하며, 데이터를 활용하는 방법과 핵심 지표를 이해하는 능력

이를 통해 올바른 질문을 던지고, 데이터를 효과적으로 활용할 수 있게 됨

 

 

데이터 해석 오류 사례

  • 심슨의 역설

부분에서 성립한 대소 관계가 종합한 전체에서는 성립하지 않는 모순적인 경우

  • 시각화를 활용한 왜곡

자료의 표현 방법에 따라 해석의 오류 여지가 존재

  • 샘플링 편향

전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류 발생

  • 상관관계와 인과관계

상관관계: 두 변수가 얼마나 상호 의존적인지를 파악하는 것을 의미

인과관계: 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태를 의미

 

 

데이터 분석 접근법

  • 문제 및 가설정의
  • 데이터 분석
  • 결과 해석 및 액션 도출

 

2. 문제 정의

 

문제 정의란?

  • 데이터 분석 프로젝트의 성공을 위한 초석
  • 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
  • 프로젝트의 목표를 설정하고 분석 방향을 설정

 

문제 정의 방법론

 

1. MECE

  • 문제 해결과 분석에서 널리 사용되는 접근 방식
  • 문제를 상호 배타적이면서, 전체적으로 포괄적인 구성요소로 나누는 것
  • MECE를 통해 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음

 

2. 로직 트리

  • MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
  • 상위 문제로부터 시작하여 하위 문제로 계층적 접근
  • 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음

 

3. 데이터의 유형

 

[정성적 데이터]

- 비수치적인 정보로 사람의 경험, 관점, 태도와 같은 주관적인 요소를 포함

- 대부분 텍스트, 비디오, 오디오 형태로 존재

- 정형되지않고 구조화 되어있지 않음

- 새로운 현상이나 개념에 대한 이해를 심화하는데 사용

 

[정량적 데이터]

- 수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있음

- 데이터가 숫자 형태로 존재하기 때문에 통계적으로 분석하기 쉬움

- 설문조사, 실험, 인구 통계, 지표 분석 등에 활용

 

 

 

정량적 데이터의 사례

인구 통계 데이터, 수치형 설문조사 데이터, 비즈니스 성과 데이터, 마케팅 데이터 등

 

 

 

정량적 데이터의 활용

  • 객관적이고 측정가능한 지표를 만들기에 적합
  • 서비스의 건강 상태를 나타내는 중요한 지표들을 확인 가능

통계적 분석 적용

  • 분포, 평균, 중앙값 등을 계산해서 데이터의 경향성과 패턴을 파악할 수 있음

다양한 데이터 분석 방법 적용

  • 비즈니스 분석, 예측 모델링, 추세 분석을 포함한 머신러닝과 같은 현대적 데이터 분석 기법에 활용 가능
  • 이를 통해 미래 예측, 효율적 자원 배분, 시장 변화에 대한 적응이 가능해짐

 

4. 지표 설정

지표란? 

  • 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
  • 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
  • 정의한 문제에 대해 정확하게 파악하기 위해서 필요

 

문제 정의  VS 지표 설정

 

문제 정의를 통해서 어떤 문제를 풀고자 하는가를 정의했다면 지표는 어떤 결과를 기대하는가에 대한 정량화된 기준

 

 

 

 

주요 지표 이해하기

 

Active User (활성 유저)

  • 서비스에 들어오는 모든 유저는 아님
  • Active User에 대한 정의에 따라 전략과 방향이 달라짐
  • Active User에 대한 정의로 ‘이탈 유저’가 정의됨
  • 투자를 위한 서비스 지표에 중요한 역할을 하게 됨

 

주요 지표 정리

 

 

Retention Ratio의 역할

  • 정의 : 서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %
  • 리텐션이란 한번 획득한 유저가 서비스로 다시 돌아왔는가에 대한 지표
  • 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
  • 리텐션은 서비스 성장에 있어서 매우 중요한 지표

 

측정 방법

 

1) N-Day 리텐션

  • 최초 사용일로부터 N일 후에 재방문한 Active User의 비율
  • 일반적으로 사용하는 리텐션 지표는 N-Day 리텐션
  • 게임, 소셜 등 습관적으로 사용하거나 반복적으로 행동을 유도하는 제품에 적합
  • 유저가 Active User로 집계된 최초 날을 Day 0으로 설정
  • Day 0에 액티브 상태가 된 모든 유저들의 N일차 리텐션을 계산
  • N-Week, N-Month도 가능

2) Unbounded 리텐션

  • 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율
  • 특정일을 포함하여 그 이후에 한 번이라도 재방문한 유저의 비율
  • 유저가 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합
  • Unbounded 리텐션은 이탈률의 반대 개념

3) Bracket 리텐션

  • 설정한 특정 기간을 기반으로 재방문율을 측정
  • Bracket 리텐션은 N-Day 리텐션을 확장한 개념 > 일/주/월 단위가 아닌 지정한 구간으로 나눔
  • 활성유저가 특정한 활동을 위해 각 Bracket 내 서비스에 재방문시 잔존 유저로 해석

 

 

Funnel(퍼널)

  • 유저들이 어디서 이탈하는가?를 확인하기 위한 구조화
  • 퍼널은 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
  • 모든 서비스와 비즈니스는 각 단계로 갈수록 이용자 수가 줄어들게 됨
  • 각 단계의 전환율 (or 첫 유입 대비 전환율)을 측정

 

AARRR

  • 디지털 마케팅시 퍼널을 활용하는 프레임워크
  • 단계별 전환율을 지표화 하여 서비스 보완 지점을 찾음
    • Acquisition: 유입
    • Activation: 활성화
    • Retention: 재방문(재구매)
    • Revenue: 수익
    • Referral: 추천

 

LTV의 역할

  • LTV는 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
  • LTV는 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
  • LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것

 

>> LTV를 산출하는 방법은 서비스, 관점마다 다르기때문에 다각도로 고민 필요

 

 

 


 

북극성 지표

  • 제품이나 서비스의 성공을 정의하고, 유저에게 주는 핵심 가치를 가장 잘 나타내는 지표
  • 장기 성장을 위해 필수적으로 모니터링 해야 할 지표

 

좋지 않은 북극성 지표 예시

  • 외부 요인의 영향을 많이 받는 지표
  • 유저/고객의 전체 여정을 반영하지 않는 지표
  • 유저/고객이 직접 가치를 느낄 수 없는 지표
  • 측정 불가하거나, 기간 설정이 안되는 지표

 

북극성 지표가 중요한 이유

  • 방향성 : 제품/사업 조직이 무엇에 최적화되어야 하고, 무엇을 포기해도 되는 지에 대한 방향 제시
  • 효율 증대 : 전 직원을 하나의 목표에 집중시킴

 

 

5. 결론 도출

결과와 결론의 차이점

 

결과

  • 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
  • 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
  • 계산과 분석을 해서 나온 결과물

결론

  • 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
  • 데이터에 기반한 해석, 추론 또는 권고 사항을 포함
  • 목적에 대해 어떤 의미가 있는지 설명하는 것

>> 필요한 것은 결론인데 보통 결과를 이야기함

 

 

결론 도출 시 주의사항

스토리텔링이 필요하지만 필요이상으로 자신의 해석을 융합해서는 안 됨

 

 

결론을 잘 정리하는 법

  • 단순하고 쉽게 전달
  • 흥미 유발
  • 대상자 관점에서의 접근
  • 시각화
  • 결론 보고서에 쓰면 좋은 플로우( 예: 전체 내용을 한문장으로 정리하는 요약, 메인 주제 등)

 

 

 


 

데이터 리터러시란?

  • 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의하는 것
  • 그 목적을 달성하는데 필요한 데이터와 지표를 설정하는 것
  • 데이터를 어떻게 봐야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것
  • 단순히 데이터를 보는 방식이나 분석 방법론, 통계지식에 매몰되지 않는 것
  • 왜?를 항상 생각하기