2021. 4. 17. 16:00ㆍ자기 개발 🔎/③ 데이터 공부
👀
① DV 프로젝트 시작.
디자이너에게 요구되는 데이터 능력을 채워가기 위해 데이터 시각화와 데이터 리터러시에 집중하여 스킬업 중이다. (방학 동안에는 SQL과 구글 애널리틱스 습득할 예정!!) 최대한 오픈되어 있는 공공 데이터 등의 정보를 활용하여 Tableau(태블로), Exel(엑셀). Google data-studio(구글 데이터 스튜디오) + 일러스트를 활용해 데이터 시각화 작업을 진행 중이다. 정보를 정리하고 다듬는 시각화 업무에 학부 때부터 큰 흥미를 갖고 있었는데, 데이터를 활용해 제대로 해보니 너무 재밌어서 욕심이 막 난다. 며칠 전 데이터 시각화 작업물을 업로드하는 Wix 사이트를 개설했다. 데이터 시각화하는 작업 과정과 데이터 해석을 블로그에도 올리면 좋을 것 같다는 판단 하에 오늘의 게시물을 작성한다.
👇TRA의 데이터 시각화 작업물 Wix👇
COVID-19 CFR
코로나-19 치명률 분석
데이터 준비
www.worldometers.info/coronavirus/에서 제공하는 실시간 데이터를 엑셀에 불러와 데이터 시각화를 진행하였다. 4월 15일 오후 시간대를 기준으로 데이터 시각화를 진행하였다.
데이터 시각화
테블로를 이용해 시각화 작업을 진행했다. 엑셀 데이터를 시각화 하기에 용이하고, 다양한 그래프 표현과 표현이 가능하다는 특징이 있다. 태블로에서 작업 후 일러스트로 옮겨가 상세 시각화 작업을 진행할 것이기에 가장 기초적인 작업만 진행하였다.
지도 그래프
CFR (Case Fatality Rate %) = Total Deaths / Total Cases *100
본 데이터는 CFR(치명률)을 제공하고 있지 않다. 따라서 Total Cases 데이터와 Total Deaths 데이터를 활용해 수식을 만들어 CFR데이터를 만들어 냈다. 밀폐된 공간(MS Zaandan 등..)에서 집단 감염된 사례를 제외한 각 나라의 CFR을 살펴봤을 때 예멘이 가장 높은 수치를 보였다.
원형 그래프
사망하지 않은 누적 확진자 수 > Total Cases - Total Deaths
누적 사망자 수 > Total Deaths
예멘의 CFR이 확진자 수 대비 타국에 비해 높음을 강조하기 위해 원형 차트를 사용했다. 더 강조하기 위해 우리나라와 비교했다. 사망하지 않은 누적 확진자 수(완치자+치료 중인 환자)와 누적 사망자 수를 원형 차트에 표현했다. 예멘의 확진자는 우리나라에 비해 적으나 사망자 수는 훨씬 높음을 확인할 수 있었다. 재밌었던 점은 '서사하라'의 CFR(10.00)이 굉장히 높아 함께 비교해봤는데, 누적 확진자 10명 중 1명의 사망자가 발생했기에 나온 데이터였다. CFR값만 봤다면 확인할 수 없던 데이터를 발견해서 너무 재밌었다!
디테일 작업
이를 일러스트로 옮겨와 세밀한 시각화 작업을 진행했다. 시각화 작업은 아래 사이트를 참고하여 진행했다.
코로나 19가 이어짐에 따라 각국의 사망자에 대한 관심이 크다. 하지만 이에 대한 데이터만을 살펴보았을 때에는 각국 인구와 확진자 수가 큰 영향을 줄 수 있어 편협된 시각으로 바라보게 될 것이다. 확진자 대비 사망자의 비율을 살펴본다면 의료체계 현황이나 각 나라의 상황 등을 살펴볼 수 있어 더 깊은 데이터 해석이 가능할 것이다. 때문에 코로나 19로 인한 CFR을 계산해 보았다.
밀폐된 공간(ex-여러 크루즈선)에서 집단 감염된 사례를 제외한 각 나라의 CFR을 살펴봤을 때 예멘 > 서사하라 > 멕시코 > 수단 > 시리아... 순으로 높은 수치를 보였다.
가장 높은 치명률을 지닌 예멘은 우리나라와 비교했을 때 적은 확진자 수(5,507)를 갖고 있다. 이는 우리나라보다 104,130명 적은 값이다. 하지만 사망자 수는 700여 명 정도밖에 차이가 나지 않는다.
예멘은 2020년 4월 10일 하드라마우트주에서 코로나 19 첫 확진 판정을 받으면서 공식 전파됐다. 내전으로 인한 극심한 인도주의 상황과 계속되는 기근, 공습과 포격으로 많은 의료 시설이 파괴되고 의료종사자의 부족이 발생하는 등 코로나 19로 인한 사망에 취약하다. 시리아 역시 내전으로 인해 코로나 치명률이 높은 모습을 발견할 수 있다.
재밌는 점은 2위인 서사하라이다. 서사하라의 CFR은 10%이다. 10명의 확진자 중 1명의 사망자가 발생했기 때문에 확진자 수는 현저히 적음에도 높은 치명률을 보였다.
'자기 개발 🔎 > ③ 데이터 공부' 카테고리의 다른 글
[A/B TESTING-②] A/B 테스트, 뭐부터 시작해야 하지? (0) | 2021.05.23 |
---|---|
[A/B TESTING-①] A/B 테스트는 왜 해야할까? (0) | 2021.05.11 |
[데이터 시각화 프로젝트] S.Korea CCSI (0) | 2021.04.21 |
[데이터] 데이터 리터러시에 주목하라! -2편 (0) | 2021.03.08 |
[데이터] 데이터 리터러시에 주목하라! - 1편 (0) | 2021.03.07 |