-
[부트캠프] 파이썬을 활용한 데이터 시각화 및 웹 크롤링대외활동 및 교육/패스트캠퍼스 데이터 분석 부트캠프 2023. 3. 30. 16:36
이번 주 부트캠프에서는 파이썬을 활용해 다양한 데이터 시각화를 하는 것과
간단한 웹 크롤링에 대해 학습했습니다!
데이터 시각화
파이썬으로 데이터를 시각화할 수 있는 라이브러리는 대표적으로 matplotlib과 seaborn이 있습니다.
각각 살펴보겠습니다!
matplotlib
가장 먼저 matplotlib을 이용한 시각화에 대해 배웠습니다.
먼저 matplotlib의 유틸리티는 대부분 pyplot이라는 하위 모듈 아래 있기 때문에 아래와 같이 불러옵니다.
import matplotlib.pyplot as plt
이렇게 plt라는 별칭으로 라이브러리를 불러오게 되면 앞으로 plt.함수 이렇게 적어주면 되기 때문에
훨씬 적기 편하겠죠?
matplotlib에서는 기본적으로 plt.figure() 로 도화지를 그려주고,
plt.plot() 으로 그래프를 만들고,
plt.show() 로 그래프를 보여줍니다.
예시를 보면서 이어서 설명드리겠습니다.
matplotlib으로 그려본 예시 plt.title() 함수로 그래프의 제목을 적을 수 있습니다.
plt.xlabel() 과 plt.ylabel() 을 이용해 x축과 y축의 이름도 적을 수 있습니다.
plt.grid(True) 로 그리드를 넣을 수도 있습니다.
이런 line plot 외에도
scatter plot, bar plot, pie chart 등을 실습해볼 수 있었습니다.
Seaborn
다음으로는 seaborn 라이브러리로도 다양한 시각화를 해봤는데요.
seaborn 라이브러리는 matplotlib을 기반으로 다양한 기능을 추가한 시각화 패키지라고 합니다.
수업 시간에는 seaborn에 기본적으로 내장되어 있는 다양한 샘플 데이터를 가지고 시각화를 해봤습니다.
seaborn으로는 커널 밀도 히스토그램, pairplot, box plot 등 더 다양한 그래프들을 그려봤습니다.
선형 회귀 모델을 그래프로 나타내는 것도 해봤는데요.
선형 회귀 모델 시각화 tips 데이터에서 점심 시간과 저녁 시간으로 나눠 전체 금액과 팁과의 상관관계를 나타내본 결과입니다.
sns.lmplot() 으로 선형 회귀 모델을 시각화할 수 있었습니다.
여기서 직선 주위에 그림자같은 건 신뢰 구간을 나타낸 거라고 하네요!
데이터 시각화 디자인
각각 라이브러리에서 그래프의 색을 바꾸거나, 마커의 모양을 바꾸는 등 간단한 디자인도 커스텀이 가능한데
모든 걸 외우고 있기엔 힘들겠죠?
전 못 외워요그래서 이렇게 공식문서나 cheatsheet을 이용해서 그때그때 보면서 시각화 하면 훨씬 편하답니다! 😉
https://matplotlib.org/cheatsheets/
Matplotlib cheatsheets — Visualization with Python
matplotlib.org
seaborn: statistical data visualization — seaborn 0.12.2 documentation
seaborn: statistical data visualization
seaborn.pydata.org
이렇게 파이썬 수업까지 끝이 났습니다.
마무리를 기념하며 파이썬 퀴즈도 봤는데요, 다행히 이번에도 다 맞을 수 있었답니다 😆
파이썬 퀴즈 점수 다음 주부터는 파이썬 미니 프로젝트가 시작되는데요!
과연 어떤 결과물을 만들어낼 수 있을지 기대가 됩니다 😊
'대외활동 및 교육 > 패스트캠퍼스 데이터 분석 부트캠프' 카테고리의 다른 글
[부트캠프] Tableau를 활용한 데이터 시각화 (2) 2023.04.21 [부트캠프] 데이터 분석을 위한 파이썬 활용 (0) 2023.03.24 [부트캠프] 직방 데이터분석가 특강 (0) 2023.03.17 [부트캠프] 데이터 분석을 위한 SQL과 Python (2) 2023.03.17 [부트캠프] Business Analyst를 위한 핵심 SQL 실전 (0) 2023.03.10