# 맷플롯립은 한글 지원이 되지 않기 때문에 인코딩 필요(Mac 버전)
from matplotlib import rc
rc('font', family='AppleGothic')
# 플롯
x = construct_by_district['지역명']
y = construct_by_district['건축년도']
plt.figure(figsize=(12, 6))
sns.barplot(x=x, y=y)
plt.title('서울특별시 구별 아파트 평균 건축년도')
plt.xlabel('서울 특별시 구')
plt.ylabel('평균 건축년도')
plt.ylim(1990, 2010)
plt.xticks(rotation=45)
plt.show()
서울의 구 별 거래된 아파트의 평균 건축년도
노원구와 도봉구의 아파트들이 제일 오래된 것을 알 수 있다.
평균 건축년도가 가장 높은 지역은 은평구였다.
건축년도 별 평균 거래금액 구하기
위의 그래프를 보니 평균 거래금액도 같이 보고 싶다는 생각이 들었다.
따라서 건축년도를 10년씩 나눠서 범주화한 후, 그에 대한 평균 거래금액을 구해보기로 했다
우선 원본 데이터에서 [지역명], [건축년도], [거래금액]만을 가져왔다
construct_cost = df[['지역명', '건축년도', '거래금액']]
그 다음에는 건축년도를 범주화하기 위한 함수를 만들었다
10년씩 끊어서 60년대부터 2020년대까지 카테고리화시킬 함수
def categorize_year(year):
if 1960 <= year < 1970:
return '1960년대'
elif 1970 <= year < 1980:
return '1970년대'
elif 1980 <= year < 1990:
return '1980년대'
elif 1990 <= year < 2000:
return '1990년대'
elif 2000 <= year < 2010:
return '2000년대'
elif 2010 <= year < 2020:
return '2010년대'
else:
return '2020년대'