주제
1. 데이터 기반 의사결정
2. 좋은 지표 KPI와 지표의 종류
3. 시각화 툴 소개 (실습)
데이터 기반 의사결정
- 두가지 : Data Driven Decision vs. Data Informed Decision
- 데이터 분석가는 인사이트와 분석 케이스를 잘 살펴볼 줄 알아야 함
조직 구조의 중요성과 트렌드
| 중앙 집중 구조 | 분산 구조 | 하이브리드 구조 |
| 모든 팀원이 하나의 팀으로 존재 | 데이터 팀이 현업 부서별로 존재 | 데이터 팀원의 일부는 중앙에서 인프라적 일을 수행. 나머지는 현업팀에서 작업 |
| 일의 우선 순위는 중앙 팀이 결정 | 일의 우선 순위는 각 팀별로 결정 | 가장 이상적인 구조 |
| 팀원 간의 지식과 경험 공유가 쉽고, 커리어 경로가 뚜렷함 |
팀원 간의 지식과 경험 공유가 힘듬, 데이터 인프라 구축이 힘들어짐 |
|
| 단점 : 현업 부서들의 만족도는 상대적으로 떨어짐 | 단점 : 부서 간 중복 투자 발생, 초반에 만족도는 높으나 많은 데이터 팀원의 퇴사 발생. 데이터 전략이 서로 다를 수 있음 |
※ 데이터 메쉬 (Data Mesh)
- 중앙 관리와 표준을 염두에 둔 데이터 분산 아키텍처
- 마이크로서비스와 흡사함
- 마이크로서비스 : 웹서비스를 다수의 작은 서비스들로 구현하는 방식
- 각 서비스들은 팀 단위로 원하는 언어 / 기술로 개발하는 자율성을 가짐
좋은 지표란?
KPI 기준
- 현재 가치뿐만 아니라 재발생되는 가치를 찾을 수 있는 것
- Lagging indicator(후행지표) vs. Leading indicator(선행지표)
- ex. 가입된 회원 vs. 유료 회원
- 사용할 수 있는 피드백 메커니즘 (의사결정에 사용됨)
- WAU vs. MAU
※ 지표(Metrics)
- 지표와 KPI의 차이점 = 중요도
- KPI는 회사의 중요한 지표
- 지표가 더 큰 개념
- 팀 / 개인별로 중요한 성과 목표를 '정량적'으로 갖는 것이 중요함
지표 기반 결정을 하지 못하면 벌어지는 현상
-> 대시보드를 계속해서 만들게 됨 (의사결정 장애). 따라서 지표와 대시보드의 수는 적을수록 좋음
선행지표와 후행지표
- "입력에 초점을 맞춰서 출력에 긍정적인 영향을 끼쳐라" - Working Backwards by Bill Carr, Colin Bryar
| 인풋 지표 (입력) | 아웃풋 지표 (출력) |
| 아웃풋 지표를 움직이는 지표로 직접 통제 가능한 지표 | 인풋 지표의 결과로 직접 통제 불가능한 지표 |
| 선행 지표 | 후행 지표 |
| ex. 제품 다양성, 가격, 편의성 등 | ex. MAU, 판매량, 매출 등 |
KPI와 선행지표
- 매출액(vs. active users)
- 기존 고객 매출 (recurring) vs. 새로운 고객 매출 (new)
- 매출 = 가격(P) * 판매량(Q)
- P가 고정됐다는 전제하에 Q를 늘릴 방법을 모색
- Q에 영향을 주는 인풋 지표는?
- 아웃바운드 영업 건수, 온라인 강의 수, 사이트 방문자 수 등을 생각해볼 수 있음
- 중요한 KPI
- 매출 vs. 서비스 사용 고객수(DAU, WAU, MAU)
- 보통 매출이 훨씬 더 중요함 (단, 새 고객에게서 발생하는 매출과 기존 고객에게서 발생하는 매출을 따로 볼 것!)
- 네트워크 현상이 중요한 도메인에서는 "서비스 사용 고객수"도 중요한 지표가 됨
- 서비스 사용의 정의가 중요함 -> What makes an active user? -> ex. paid user
시각화 툴 소개
시각화 툴
- 대시보드 혹은 BI(Business intelligence) 툴이라고도 함
- KPI, 지표, 중요한 데이터 포인트를 데이터 기반으로 계산 / 분석 / 표시해주는 툴
- 결정권자들에게 데이터 기반 의사결정을 할 수 있게 도와줌
어떤 툴을 선택해야 할까?
- Looker(구글)나 Tableau(세일즈포스)가 많이 쓰이는 추세임
- 두 개 모두 배우는데 시간이 필요
- Tableau가 더 싸고 투명함. 무료 버전도 존재
- 중요한 포인트 : 셀프서비스 대시보드를 만드는 것
- 그렇지 않다면 매번 사람의 노동이 필요하기 때문.
- 60-70%의 질문을 셀프서비스 대시보드로 할 수 있다면 성공적
- 사용하기 쉬어야 함
- 데이터 민주화 (Data Democratization), 데이터 탈중앙화 (Data Decentralization)
- 데이터 품질이 중요해지면서 데이터 거버넌스가 필요한 이유가 됨
Tableau 써보기
- Tableau public은 무료! 윈도우와 맥 버전 모두 존재
- csv 파일은 텍스트 파일로 열면 됨

- Columns(열)에는 보통 dimension이 들어감
- Dimension : 시간에 따라 수치가 어떻게 변하는지를 확인
- Rows(행)에는 measure가 들어감
- Measure : 우리가 트랙킹하고 싶은 수치
- 하단에서 worksheet(차트)를 열어서 원하는 데이터를 column 혹은 row에 끌어다 넣을 수 있음
- 대시보드는 worksheet 옆에서 열 수 있고, 만들어 둔 sheet를 drag & drop하면 완성
- Tableau 서버에 나의 대시보드를 저장하여 업로드 할 수 있음
느낀점
강사님이 보통의 데이터 분석가의 일주일을 알려주셨는데 미팅이 굉장히 많아서 놀라웠다. 또한 좋은 지표에 대해서 상세하게 학습할 수 있어서 좋았다. 좋은 지표란 곧 좋은 데이터 기반 의사결정을 내리는데에 필수적인 것이라는 생각이 들었다. 그리고 오늘은 처음으로 Tableau를 경험해볼 수 있었는데 아주 짧은 맛보기였지만 크게 어렵다는 생각은 들지 않았다. 생각보다 직관적인 것 같기도 하고..? 더 깊은 실습이 기대된다.
'Data Science > TIL (Today I Learned)' 카테고리의 다른 글
| 프로그래머스 데이터분석 데브코스 1기 - 6일차 (0) | 2023.11.27 |
|---|---|
| 프로그래머스 데이터분석 데브코스 1기 - 5일차 (0) | 2023.11.24 |
| 프로그래머스 데이터분석 데브코스 1기 - 4일차 (0) | 2023.11.23 |
| 프로그래머스 데이터분석 데브코스 1기 - 3일차 (1) | 2023.11.22 |
| 프로그래머스 데이터분석 데브코스 1기 - 1일차 (1) | 2023.11.20 |