21.12.12 포켓몬 데이터 분석 & 혼자 데이터분석할 때 데이터셋 얻기

2021. 12. 13. 22:53작업/데이터분석

탐색적 데이터 분석(EDA Exploratory Data Analysis) 연습

: 데이터의 특징을 찾고 패턴을 분석 -> 데이터 이해

: 데이터 분석 단계에 해당하며, 데이터 분포 확인, 변수간 관계 파악을 통해

전체 데이터의 특징을 발견하고 이해할 수 있다.

 

데이터 분석 : 의미있는 값을 얻어내는 과정

문제 정의 -> 가설 설정 -> 데이터 준비(데이터 수집,선정,정제) -> 데이터 분석 -> 결과 정리

 

 

주제 : 포켓몬 데이터 뭉치에서 전설의 포켓몬을 골라낼 수 있을까?

(전설의 포켓몬의 특징을 분석해야 한다)

 

포켓 몬스터: 몬스터볼에 넣어서 주머니에 휴대하고 다닐 수 있는 몬스터

각 몬스터마다 공격력, 방어력 등의 속성을 가진다

속성에 따라 일반 포켓몬과 전설 포켓몬으로 분류된다.

 

전설 포켓몬: 보통 포켓몬보다 강력하고 수량이 한정되어 있음. 즉 일반포켓몬과는 구분되는 속성을 가질 것!

 

문제 : 일반 포켓몬과 전설 포켓몬이 혼합되어 있는 데이터셋에서 데이터의 속성만을 보고 전설 포켓몬을 골라낼 수 있을까?

 

데이터셋 받으려면 Kaggle 여기서 받으면 재밌는 데이터들이 많음

 

 

 

1. Scikit Learn : 라이브러리

(Toy Datasets load_boston보스턴 집값, load_iris 붓꽃 등 해볼 수 있음)
(Real World Datasets 좀 더 많은 fetch_20newsgroups 등..)

 

2. Kaggle : 데이터 분석 플랫폼

 

3. 서울 열린데이터 광장

 

4. 공공데이터 포털

5. 기타

구글 데이터셋 검색 엔진, UCI 데이터셋, 데이터셋 모음집

'작업 > 데이터분석' 카테고리의 다른 글

21.12.13 모의테스트  (0) 2021.12.13
21.12.06 파이썬 데이터처리 모의테스트  (0) 2021.12.06
21.12.06 파이썬 정리2  (0) 2021.12.06
21.12.06 파이썬 정리 1  (0) 2021.12.06
21.12.04 numpy, pandas  (0) 2021.12.05