ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [부트캠프] Tableau를 활용한 데이터 시각화
    대외활동 및 교육/패스트캠퍼스 데이터 분석 부트캠프 2023. 4. 21. 12:03

    지난 주까지 약 일주일 간의 미니 프로젝트를 끝내고,

    이번 주엔 오랜만에 다시 강의로 가득 찬 한 주였습니다!

    미니 프로젝트에 관한 내용이 궁금하신 분들은 제 이전 글 참고해주세요 😊

     

    이번 주부터는 Tableau를 활용한 데이터 시각화에 대해 공부했습니다.

    Tableau는 요즘 많은 기업에서도 활용하는 BI 툴인데,

    어려운 코딩 없이 drag & drop으로 쉽게 데이터 시각화를 할 수 있고

    대시보드로 만들어 여러 그래프를 한 곳에서 볼 수 있다는 장점을 가진 툴입니다.

     

    Tableau 강의는 VizLab의 최정민 강사님께서 진행해주셨습니다.

    강사님은 엄청 오랜 경력을 가지고 계시며 강의를 통해 여러 노하우들을 공유해주셨답니다 👍

    강사님께서 유튜브 채널도 운영하고 계셔서 무료로 Tableau 강의를 듣고 싶으신 분들은 아래 링크 참고해보세요!

    https://www.youtube.com/@vizlab_kr

     

    VizLab

    VizLab, Transforming Data into Insight

    www.youtube.com


    먼저 가장 기본적인 차트들을 그리는 것에 대해 배웠습니다.

     

    막대 그래프

    막대 그래프는 주로 불연속형 데이터를 시각화할 때 사용하고,

    가장 기본적이면서도 가장 가독성이 좋은 그래프입니다.

     

    Tableau에서 샘플로 제공되는 슈퍼 스토어 데이터를 사용해 시도별 수익을 막대 그래프로 그려봤습니다.

    모든 시도를 나타내지 않고 수도권과 비수도권으로 그룹핑하는 방법도 있습니다.

    파이썬 같은 경우에는 group by를 사용하거나, 열을 추가하는 방식으로 코딩이 필요한데,

    Tableau에서는 클릭만으로 그룹을 만들 수 있습니다.

    왼쪽 데이터 탭에서 [그룹을 만들고 싶은 데이터 우클릭] - [만들기] - [그룹] 을 누르면 이런 창이 나옵니다.

    이 창에서 경기도, 서울특별시, 인천광역시를 묶어 [그룹]을 눌러 수도권으로 묶어주고,

    나머지는 ['기타' 포함]을 눌러 비수도권으로 묶어준 뒤

    수도권과 비수도권의 매출을 비교하는 막대 그래프를 그리면 아래와 같이 그릴 수 있습니다.

     

    라인 그래프

    라인 그래프는 주로 시계열 데이터를 시각화할 때 쓰이고 추세를 볼 때 사용합니다.

     

    분기별 매출의 트렌드를 라인 그래프로 그려볼까요?

    이렇게 카테고리를 색상 카드에 넣어주면 카테고리별 분기별 매출 트렌드를 볼 수 있는 그래프가 나옵니다.

    레이블 카드에 매출을 넣어 그래프에 수치를 표현해줄 수도 있는데,

    백만 단위로 수치를 변경해주는 기능도 있습니다.

    [서식] - [패널] - [숫자] 에 들어가면 아래와 같은 창이 나옵니다.

    디스플레이 장치로 백만, 십만 등 단위를 설정할 수 있고,

    접두사에 ₩를 넣어 원을 나타내줍니다.

     

    파이 그래프

    파이 그래프는 각도를 이용해 전체 중 얼만큼의 비율을 차지하는지 알고 싶을 때 사용합니다.

     

    고객 세그먼트별 매출이 어떻게 되는지 파이 그래프로 나타내면 다음과 같습니다.

    전체 매출의 51%가 개인고객 세그먼트인 고객에서 발생했음을 알 수 있습니다.

     

    일반 집계된 값을 비율로 나타내기 위해서는

    [비율을 알고 싶은 데이터 우클릭] - [퀵 테이블 계산] - [구성 비율] 을 통해 비율을 구할 수 있습니다.

    간단하죠?

     

    스캐터 플롯

    스캐터 플롯은 주로 상관관계를 살펴볼 때 사용합니다.

     

    매출과 수익 간의 상관관계가 있는지 확인해보겠습니다.

    보통 생각할 때도 매출이 높으면 그만큼 수익도 많이 발생할 것으로 예측할 수 있습니다.

    실제 데이터를 시각화 해봐도 어느 정도 정비례한다는 것을 확인할 수 있습니다.

     

    위 그래프 처럼 추세선을 나타낼 때는 [분석 탭]에서 [추세선]을 워크시트 안으로 드래그합니다.

    추세선을 선형, 로그, 지수, 다항식, 거듭제곱 총 5가지로 나타낼 수 있는데,

    위 그래프에서는 선형 추세선을 넣은 예시입니다.

     

    박스 플롯

    박스 플롯은 데이터의 분포와 이상치를 파악할 때 유용한 그래프입니다.

    예를 들어 학생들의 시험 점수를 박스 플롯으로 그려보겠습니다.

    박스 플롯에는 총 5개의 선이 있다고 할 수 있는데,

    가장 가운데에 있는 선은 중앙값을 의미합니다.

    중앙값 바로 위 선과 바로 아래 선은 데이터를 4분위수로 나눴을 때 Q1Q3을 의미합니다.

    맨 위 선과 맨 밑 선은 이상치를 판별하는 기준이라고 할 수 있는데,

    Q3에서 Q1을 뺀 값을 IQR이라고 할 때

    Q1에서 IQR * 1.5을 뺀 값과 Q3에서 IQR * 1.5을 더한 값 사이의 범위 밖에 있으면 이상치라고 판별한다고 합니다.

    맨 위에 있는 선은 Q1 - IQR * 1.5, 맨 밑에 있는 선은 Q3 + IQR * 1.5 를 나타냅니다.

     

    대시보드

    이렇게 다양한 차트들을 배워봤는데, 다양한 차트들을 한 곳에 모아 보는 걸 대시보드라고 합니다.

    대시보드로 만들어서 보면 한 눈에 전체 분석 결과를 확인하기에도 용이하고,

    차트별로 비교분석 하기에도 용이하기 때문에 굉장히 중요한 개념이라고 할 수 있습니다.

     

    지금까지 배운 그래프들을 활용해 대시보드를 만들어보면 다음과 같습니다.


    이렇게 이번 주는 Tableau를 활용한 데이터 시각화에 대해 배울 수 있었습니다!

    어렵지 않고 알록달록 해서 재밌게 공부했던 것 같아요 😝

    다음 주부터는 Tableau 미니 프로젝트도 진행되는데, 어떻게 좋은 시각화를 할 수 있을지 기대가 됩니다 🙌

    댓글

Designed by Tistory.