주제

1. 데이터 분석 소개

2. 데이터 팀의 구성원과 역할

3. 클라우드 (AWS)

 

 

데이터란?

-> 일상생활에서 관찰할 수 있는 모든 것.

  • 데이터를 기록하고 수집하는 것이 가장 기본이 된다(Digitization)
  • 데이터에서 가장 중요한 것 : 1. 품질, 2. 크기

 

 

그럼 데이터 팀이 하는 일은 뭘까?

  • 신뢰할 수 있는 데이터를 이용하여 부가 가치를 생성하는 것!
  • Decision Science : 고품질 데이터를 이용하여 의사 결정권자에게 입력을 제공함. 데이터 기반 지표 정의, 대시보드 생성 등을 수행.
    • Data informed decisions vs. Data driven decisions
  • Product Science : 고품질 데이터를 기반으로 사용자 서비스 경험을 개선
    • 머신러닝

 

데이터 팀의 구성원

  1. 데이터 엔지니어
  2. 데이터 분석가
  3. 데이터 과학자
  4. ML 엔지니어 등

1. 데이터 엔지니어

  • 데이터 인프라를 구축함.
  • ETL을 통해 데이터 웨어하우스 밖에 존재하는 데이터를 추출(Extract)하고, 변환(Transform)시켜 웨어하우스에 가져온다(Load).

데이터 웨어하우스 vs. 데이터 레이크

데이터 웨어하우스(Data Warehouse) 데이터 레이크(Data Lake)
보존 기한이 있는 구조화된 데이터를 저장하고 처리하는 스토리지 보존 기한이 없는 구조화 + 비구조화된 데이터를 원래 형태대로 보존하는 스토리지.
데이터 웨어하우스보다 몇 배 이상 크다

 

 

2. 데이터 분석가

  • 데이터 분석을 수행
  • ELT -> ETL된 데이터를 조합하여 새로운 정보를 생성함.
  • 좋은 지표를 정의하고, 대시보드 생성하고 관리, 데이터 기반 레포트 작성을 수행
  • A/B 테스트 분석

A/B 테스트 (=Split Test or Bucket Test)

  • 실제 사용자를 대상으로 두 그룹으로 나눔
  • 한 그룹에게는 기존 기능을 제공하고 다른 그룹은 새로운 기능을 제공함
  • 두 그룹 사이의 차이를 분석하여 어떤 기능이 더 좋은 성과를 냈는지 알 수 있음

 

KPI(Key Performance Indicator)

  • 조직 내에서 달성하고자하는 중요한 목표
  • 정량적인 숫자를 선호함
  • KPI의 수는 적을수록 좋음

시각화 대시보드 : 중요한 지표를 시간의 흐름과 함께 보여주는 것

  • 3A : Accessible / Actionable / Auditable
  • 가장 많이 사용되는 대시보드 : Tableau, Power BI, Looker

 

3. 데이터 과학자

  • 데이터 과학 적용
  • 머신러닝 모델을 만들어 사용자 경험 개선하는 등의 일을 수행

 

데이터 문해력(Data Literacy)

  • 데이터 팀 구성원이 가져야 할 능력
  • 데이터를 문제와 연결하여 가치 있는 결론을 내는 사고방식 또는 능력을 뜻함

 

클라우드란?

  • 컴퓨팅 자원을 네트워크를 통해 서비스 형태로 사용하는 것을 뜻함
  • 필요한만큼 할당하고 사용한만큼 지불하는 시스템
  • 장점 : 
    • 초기 투자 비용 감소
    • 리소수 준비시간 감소
    • 글로벌 확장 용이
  • 가장 흔한 클라우드 서비스로는 아마존의 AWS가 있음

 

 


 

느낀점

OT를 제외하면 첫 수업이었는데 가장 기본인 데이터의 정의부터, 데이터 팀은 어떤 일을 하는지 상세하게 배울 수 있어서 좋았다. 다른 직업과는 달리 데이터 관련 직업들의 얘기는 쉽게 찾아볼 수 없는데 오늘 강의를 통해 많은 걸 배웠다. 특히 데이터 분석가의 로드맵을 보여주셔서 앞으로 어떤 스킬들을 습득해야하는지 조금 명확해진 것 같다. 내일부터 실습도 해보는 것 같은데 재밌어질 거 같다! 앞으로 5개월동안 화이팅!

+ Recent posts