Excel을 활용한 다양한 데이터 분석 실습

주제

 

1. 데이터란 무엇인가

2. 공공데이터포털을 이용한 실습

 

 

데이터란 무엇인가

  • 이론을 세우는 데 기초가 되는 사실적 자료
  • 데이터의 종류 : 문자형, 숫자형, 날짜형 등

 

실습

  • 공공데이터포털에 접속 (https://www.data.go.kr/)
  • 이 중 관심있는 데이터의 파일을 다운로드
  • 엑셀, 스프레드 시트 등으로 열어서 데이터 분석해보기
  • (공공 데이터지만 함부로 데이터를 공개하면 안될 것 같아서 스크린샷은 없습니다..!)

 

분석

  • 내가 사용한 데이터는 행정안전부에서 제공한 폭염 발생 현황 데이터였다.
  • 데이터는 주요 6도시의 2007년부터 2022년까지의 폭염 발생 일수가 담겨있다.
  • 데이터에 따르면 가장 폭염이 많이 발생한 도시는 대구
    • 대구 - 광주 - 대전 - 강릉 - 서울 - 부산
    • 대구가 한국에서 가장 더운 도시라고 추측해볼 수 있다
  • 가장 오래 지속됐던 폭염은 2013년 대구에서 54일동안 지속되었다
  • 부산은 2007-2009년, 2014년에는 폭염이 발생하지 않았다
  • 전국폭염일평균 데이터에 따르면 전국적으로 가장 더웠던 해는 2016년으로, 전국 평균 22.4일의 폭염이 기록되었다

 


느낀점

3주차에는 새로운 강사님이 엑셀을 이용한 데이터 분석 강의를 알려주셨다. 비전공자도 쉽게 따라갈 수 있도록 코딩 없는 방식으로 진행됐고, 첫날 실습은 간단하게 데이터를 확인하고 분석해보는 일이었다. 방대한 데이터를 선택하진 않아서 분석은 어렵지 않았다. 사실 다른 데이터를 가지고 간단하게 판다스로 분석해보려고 했는데 이게 한글로 된 파일이고 맥북에서는 인코딩 문제로 csv파일을 불러올 수가 없어서 포기했다... 다음엔 해결법을 찾아보고 다시 시도해봐야겠다.

+ Recent posts