TIL

TIL - 태블로 (3,4주차)

pys6341 2025. 2. 17. 10:48

[3주차]

1. 선그래프

  • 간단하고 사용하기 쉬움
  • 시계열 데이터(시간에 따른 추이)를 시각화할 경우, 변화량과 트렌드를 한눈에 보기에 용이
  • 연속적인 데이터에 사용하기 적합 (연속형 데이터는 온도, 시간을 말함)

2. 막대 그래프

  • 간단하고 사용하기 쉬움
  • 범주 간의 차이나 분포를 시각적으로 이해하기 쉬움
  • 범주형 데이터(성별, 혈액형, 이름 등)에 사용하기 적합

3. 맵 차트

  • 지도를 활용해서 지리적 위치를 살펴볼 수 있음
  • 각 지역별 데이터의 분포 및 비중을 한눈에 확인할때 주로 사용

4. 파이 차트

  • 각 부분의 크기가 상대적인 비율이기 때문에 각 부분이 전체에서 차지하는 비중을 쉽게 이해할 수 있음
  • 데이터의 구성 비율과 분포를 한눈에 파악할 수 있음
  • 변수가 적을 때 직관적으로 사용하기 용이

5. 트리맵 차트

  • 데이터를 계층적으로 표현하는데 사용
  • 카테고리별로 특정 데이터 집합이 전체 데이터에서 차지하는 비율을 면적으로 표현하여 카테고리별 구성 요소를 한눈에 파악할 수 있음

6. 도넛 차트

  • 파이 차트와 비슷한 형태로 가운데 구멍이 뚫린 경우를 말함
  • 각 부분의 크기가 상대적인 비율이기 때문에 각 부분이 전체에서 차지하는 비중을 쉽게 이해 가능
  • 태블로에서는 대시보드의 KPI 카드로 많이 활용됨

7. 히트맵 차트

  • 색상을 활용해서 데이터 값을 시각적으로 강조할 수 있음
  • 색상의 그라데이션을 통해 측정값들을 한눈에 비교 가능
  • 태블로에서 하이라이트 테이블이라고도 불림

8. 영역 차트

  • 선 아래 영역을 색으로 채워서 데이터의 영역 크기를 파악할 수 있음
  • 데이터의 변화 및 흐름을 쉽게 파악할 수 있음

9. 스택 플랏

  • 상대적인 비율을 직관적으로 시각화 할 수 있음
  • 시간에 따라 데이터가 어떻게 변하는지 시각적으로 알 수 있음
  • 단순 누적 그래프는 기준선이 일정하지 않기 때문에 비교하기가 어려움
  • 100% 누적 그래프를 활용하면 기준을 비교하기 쉬움

 

 

 

이중축

  • 이중 축 차트를 사용하면 두 가지 서로 다른 데이터 집합을 한번에 비교할 수 있음
  • 축에 서로 다른 단위나 기준을 가지고 있는 경우, 그래프를 볼때 한눈에 알아보기 어려움

 

평균선/참조선

  • 분석 패널에서 평균선 라인/상수 라인/참조선을 추가해서 의사결정을 빠르게 할 수 있음

 

 

 

박스 플랏

  • 데이터의 분포와 이상치를 시각적으로 파악할때 사용하는 그래프

파레토 차트

  • 전체 결과의 80%가 전체 원인의 20%에서 일어난다는 마케팅 기법

 

 

 

[4주차]

데이터 형태

1)  wide format table

- 하나의 열에 여러 개의 데이터를 나란히 나열하는 형태

- 상관 관계를 분석하거나 각 변수의 분포를 비교할 때 적합

2) long format table

- 한 개의 특성을 나타내는 열을 가진 여러 개의 행이 있음

- 시간에 따른 변화와 카테고리 간 비교를 시각화하기에 적합

 

3) 총계 

- [분석탭]에서 열과 행의 총 합계 및 소계를 표시할 수 있음

 

 

 

태블로 작동원리

1) 필터별 작동원리

  • 추출 필터: 데이터 소스에서 추출된 데이터 필터링
  • 데이터 원본 필터: 데이터 원본 소스에서 일부 데이터만 필터링
  • 컨텍스트 필터: 특정값에 대한 데이터만 필터링
  • 차원 필터: 차원을 기준으로 데이터 필터링
  • 측정값 필터: 측정값을 기준으로 데이터 필터링
  • 테이블 계산 필터: 특정 계산 결과를 기준으로 데이터 필터링

 

2) 계산과 필터의 작동 순서

 

 

필터 활용법

 

>> 컨텍스트 필터를 활용해 작동 순서 바꿀 수 있음

 

퀵 테이블 계산

 

<전주/월/년 대비 함수>

 

YTD: 연초 대비 증감률

YoY: 전년 대비 증감률

MoM: 전월 대비 증감률

WoW: 전주 대비 증감률

 

 

함수

 

1) 논리함수

  • IF
IF SUM([Sales]) >= 10000
 THEN '상위 매출' ELSE '하위 매출' END

 

  • Case when
CASE [측정값]
WHEN 'Sales' THEN [매출]
WHEN 'Profit' THEN [수익] 
...
END

 

 

2) 날짜 함수

  • DATEDIFF 함수: 두 날짜 사이의 차이를 반환
DATEDIFF(단위, 시작 날짜, 끝 날짜)

 

  • DATEADD 함수: 날짜 더하기
DATEADD(단위, 간격, 기준 날짜)

 

 

LOD식 활용하기

 

기본 문법 구조

{[FIXED | INCLUDE | EXCLUDE] [차원1], [차원2] : AVG([측정값])}

 

1) FIXED

 

뷰에 있는 차원과 상관없이 계산된 필드에서 FIXED 계산식을 고정시켜 지정된 차원을 계산

 

2) INCLUDE

 

뷰에 지정된 차원 뿐만 아니라 모든 차원을 포함해서 계산

 

3) EXCLUDE

 

차원을 제거해서 계산