데이터시각화
-
[부트캠프] Tableau를 활용한 데이터 시각화대외활동 및 교육/패스트캠퍼스 데이터 분석 부트캠프 2023. 4. 21. 12:03
지난 주까지 약 일주일 간의 미니 프로젝트를 끝내고, 이번 주엔 오랜만에 다시 강의로 가득 찬 한 주였습니다! 미니 프로젝트에 관한 내용이 궁금하신 분들은 제 이전 글 참고해주세요 😊 이번 주부터는 Tableau를 활용한 데이터 시각화에 대해 공부했습니다. Tableau는 요즘 많은 기업에서도 활용하는 BI 툴인데, 어려운 코딩 없이 drag & drop으로 쉽게 데이터 시각화를 할 수 있고 대시보드로 만들어 여러 그래프를 한 곳에서 볼 수 있다는 장점을 가진 툴입니다. Tableau 강의는 VizLab의 최정민 강사님께서 진행해주셨습니다. 강사님은 엄청 오랜 경력을 가지고 계시며 강의를 통해 여러 노하우들을 공유해주셨답니다 👍 강사님께서 유튜브 채널도 운영하고 계셔서 무료로 Tableau 강의를 듣고 ..
-
[프로젝트] RFM 모형을 활용한 고객 세그먼테이션과 세그먼트별 마케팅데이터분석 2023. 4. 19. 11:42
0. 배경 많은 기업에서 신규 고객을 유입시키고 기존 고객을 유지하기 위해 CRM 마케팅 기법을 사용합니다. CRM 마케팅은 Customer Relationship Management의 약자로, 말 그대로 고객 관계 관리를 말합니다. 기존 고객과의 관계를 유지하고, 신규 고객의 원활한 정착을 돕기 위해 사용한다고 할 수 있습니다. 그렇기 때문에 모든 고객에게 똑같은 마케팅을 적용하면 안 되고, 고객별 특징에 따라 세그먼테이션을 진행하고, 세그먼트별로 마케팅하는 것이 중요합니다. 1. 주제 선정 이유 및 데이터 소개 위와 같은 이유로 CRM 마케팅을 경험해보고 싶었고, 데이터로 CRM의 대표적인 기법인 RFM 고객 세그먼테이션을 직접 해보며 세그먼트별 특징을 살펴 보면 좋은 경험이 될 것이라고 생각했습니다..
-
[부트캠프] 파이썬을 활용한 데이터 시각화 및 웹 크롤링대외활동 및 교육/패스트캠퍼스 데이터 분석 부트캠프 2023. 3. 30. 16:36
이번 주 부트캠프에서는 파이썬을 활용해 다양한 데이터 시각화를 하는 것과 간단한 웹 크롤링에 대해 학습했습니다! 데이터 시각화 파이썬으로 데이터를 시각화할 수 있는 라이브러리는 대표적으로 matplotlib과 seaborn이 있습니다. 각각 살펴보겠습니다! matplotlib 가장 먼저 matplotlib을 이용한 시각화에 대해 배웠습니다. 먼저 matplotlib의 유틸리티는 대부분 pyplot이라는 하위 모듈 아래 있기 때문에 아래와 같이 불러옵니다. import matplotlib.pyplot as plt 이렇게 plt라는 별칭으로 라이브러리를 불러오게 되면 앞으로 plt.함수 이렇게 적어주면 되기 때문에 훨씬 적기 편하겠죠? matplotlib에서는 기본적으로 plt.figure() 로 도화지를 ..
-
Python 에러 해결 | seaborn 샘플 데이터 불러올 때 에러데이터분석 2023. 3. 27. 22:01
Seaborn에서 iris 샘플 데이터 불러올 때 에러 오늘 vscode에서 seaborn에 기본 저장되어 있는 iris 데이터를 불러오려고 할 때 에러가 났다. 맨 마지막에 보면 URLError라고 뜨는데 이게 무슨 에런가 싶어서 구글링을 해봤고, 해결 방안을 찾아 아카이빙 하려고 한다. 나는 Mac OS 환경에 파이썬은 3.10 버전을 사용하는데 맥북을 산 이후에 샘플 데이터를 불러올 일이 없어서 처음 겪는 에러였다. 해결 방법 해당 에러의 원인은 파이썬 인증서가 설치 되지 않아 생긴 문제라고 한다. 파인더에서 문서 폴더에 들어가서 python 3.10이라고 검색하면 파이썬이 설치된 폴더가 나온다. 해당 폴더에 들어가서 Install Certificates.command 파일을 더블클릭 하면 터미널이..
-
[BOAZ] 제 16회 BOAZ 빅데이터 컨퍼런스대외활동 및 교육/BOAZ 2022. 7. 18. 18:40
제가 속한 동아리 BOAZ에서 16번째 컨퍼런스를 개최합니다! BOAZ에 대한 간략한 소개는 앞서 제 15회 컨퍼런스 소개 글에서도 했었는데요, BOAZ는 국내 최초 빅데이터 연합 동아리로 데이터 분석 부문, 데이터 시각화 부문, 데이터 엔지니어링 부문으로 나뉘어 1년 간 활동한 뒤 컨퍼런스에서 발표 후 수료합니다 😊 코로나로 인해 최근 몇 년 간 온라인으로 진행되었던 컨퍼런스가 이번에는 드디어 오.프.라.인.으로 진행되어 소개드리고자 합니다! 그래서 제 16회 BOAZ 컨퍼런스는요? 일정: 2022년 7월 23일 (토) 12:00~17:00 장소: 서울 경기대학교 본관 블랙홀 참가 대상: 빅데이터에 관심 있는 누구나 참가비: 무.료. 이번 컨퍼런스에 오프라인으로 참석하고 싶으신 분들은 아래 링크를 통해..
-
[BOAZ] 15번째 컨퍼런스에 여러분을 초대합니다대외활동 및 교육/BOAZ 2022. 1. 20. 00:40
이번에 제가 속해있는 동아리에서 제 15회 컨퍼런스를 개최해서 소개드리려고 합니다! 국내 최초 빅데이터 연합동아리 보아즈(BOAZ)는 2013년 창립되어 어느덧 17기, 18기가 함께 활동하고 있는데요, 분석 부문, 시각화 부문, 엔지니어링 부문으로 나뉘어 총 1년간 활동하고 마지막에 컨퍼런스로 활동을 마무리합니다. 원래는 오프라인으로 컨퍼런스가 진행되었기 때문에 신청을 통해 참석할 수 있었지만, 이번에는 코로나로 인해 보아즈 유튜브 채널에서 실시간 스트리밍으로 진행되어 누구나 쉽게 보실 수 있어요 😊 BOAZ 제 15회 컨퍼런스는 2022년 1월 22일 토요일 12시에 동아리 소개로 시작하여 총 11팀의 발표가 진행되고, 마지막에 저희 동아리 담당 교수님이신 연세대학교 이원석 교수님의 폐회사 순으로 컨..
-
[TWBX] 대학(원)생을 위한 TWBX Day 9대외활동 및 교육/TWBX 2022. 1. 14. 15:49
9일차 과제는 ‘데이터 시각적 분석 태블로로 끝내기’ 책에 있는 Sales Ranking Podium을 만들어보는 것입니다. 이번 과제에서는 세 가지 생각할 점을 제시해주셨는데요, 다음과 같습니다. 첫째, 매번 만드는 화면이 비슷하다면 새로운 접근 방법이 없을까요? 둘째, 평소에 관심 있는 분야(또는 어디선가 본 기억 나는 장면)를 활용할 방법이 있을까요? 셋째, 사람들이 일반적으로 인식하는 색상(금, 은, 동메달)을 활용해 봅니다. 그래서 이번 과제에서는 태블로에서 기본적으로 제공해주는 데이터인 Sample Superstore 데이터를 사용해 가장 많이 팔린 제품의 카테고리의 순위를 올림픽 메달 단상의 형태로 제작했습니다. 완성된 대시보드는 이러한 형태입니다! 먼저 Category를 열 선반에, Sal..
-
[TWBX] 대학(원)생을 위한 TWBX Day 8대외활동 및 교육/TWBX 2022. 1. 14. 14:48
8일차 과제는 잉글랜드 프리미어리그 순위 대시보드 만들기였는데요! ESPN에서 제공하는 순위 테이블을 2003년부터 2021년까지 가져와 시각화를 진행했습니다. 시각화 하기에 앞서 수집한 데이터 원본을 보면 이렇게 하나의 열에 순위, 구단 약자, 구단명이 같이 적혀있는 것을 볼 수 있습니다. 이걸 다 나눠주기 위해 계산된 필드를 사용하여 각각의 열로 만들었습니다. 먼저 RANK라는 계산된 필드를 만들어서 정규표현식을 이용하여 추출하는 REGEXP_EXTRACT 함수로 숫자(순위)를 추출하고 같은 방식으로 문자만 추출하여 계산1이라는 계산된 필드를 만들었습니다. 문자만 추출한 계산1을 이용해 Club_abbr과 Club 필드를 만들었는데요, 계산1에서 앞에 3글자는 구단의 약어, 나머지는 구단 명이기 때문..