Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 코로나 사망자
- 미니맥스
- 인공지능
- 틱택토
- React
- Project
- 인턴쉽
- 캐글
- Vendor
- streamlit
- seaborn
- 씨본
- resume
- 코로나
- plotly
- Machine Learning
- 파이썬
- python
- pandas
- tictactoe
- nltk
- matplotlib
- 스타트업
- EDA
- 코로나 확진자
- minimax
- 시본
- internship
- AI Developer
- 체스
Archives
- Today
- Total
대학생 경복궁
코로나 바이러스 데이터를 활용한 Python EDA 본문
Idea
일상생활 속에서 코로나 관련 사망자수와 확진자수를 보던중 한가지 인사이트가 머리속을 스쳤습니다.
"확진자 대비 사망자수가 적을수록 그 나라가 코로나 확진자에 대한 대처를 잘한다"
솔직히 어느 통계학적 근거도 없다. 다른 변수가 있을수도 있지만 이 인사이트는 직관적으로 봤을때 말이 된다.
그래서 이 인사이트를 근거로 한국의 코로나 확진자에 대한 대처를 잘하고 있는지 확인을 해보자.
데이터 출처
www.kaggle.com/sudalairajkumar/novel-corona-virus-2019-dataset
Code
Prepare
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
sns.set_style("whitegrid")
Data preprocessing
# 가장 최근의 데이터 수집
df = df[df["ObservationDate"] == "09/23/2020"]
# 열이름 단순화
df = df.rename(columns = {"Country/Region":"Country"})
df = df.rename(columns = {"ObservationDate":"Date"})
# 확진자수 top 10 data frame 생성
df_countries = df.groupby("Country").sum().sort_values(by = "Confirmed",ascending = False)
df_countries_top10 = df_countries[:10]
# 사망자수 top 10 data frame 생성
df_countries_death = df.groupby("Country").sum().sort_values(by = "Deaths", ascending = False)
df_countries_death_top10 = df_countries_death[:10]
Compare
확진자수가 가장많은 10개의 나라를 보여줌
plt.figure(figsize=(12, 6))
sns.barplot(data = df_countries_top10,x = df_countries_top10.index, y = "Confirmed").set_title("Confirmed")
plt.show()
사망자수가 가장 많은 10개의 나라를 보여줌
plt.figure(figsize=(12, 6))
sns.barplot(data = df_countries_death_top10,x = df_countries_death_top10.index, y = "Deaths")
plt.title("Deaths")
plt.show()
대충봐도 많이 겹치는걸 볼수있습니다. 여기서도 확진자수는 인도가 브라질 보다 많지만 사망자수는 브라질보다 인도가 현저히 적을걸 볼수있고 이는 인도가 코로나 확진자에대한 대처를 브라질보다 잘한다는 것을 유추할수 있습니다.
South Korea
이제 한국의 경우를 보겠습니다.
한국의 확진자수는 세계 66위인데 반해 사망자수는 78위로 현저히 낮습니다.
따라서 "한국은 다른나라들에 비해 코로나 확진자에 대한 대처를 잘하고있다"라고 결론을 내릴수있습니다.
github.com/bok-bok/projects/blob/master/corona_virus_EDA/Corona_virus_simple_Graph.ipynb
'프로젝트 > EDA' 카테고리의 다른 글
과연 자유가 사람을 행복하게 할까? Python EDA (0) | 2020.09.30 |
---|