2021. 12. 13. 22:53ㆍ작업/데이터분석
탐색적 데이터 분석(EDA Exploratory Data Analysis) 연습
: 데이터의 특징을 찾고 패턴을 분석 -> 데이터 이해
: 데이터 분석 단계에 해당하며, 데이터 분포 확인, 변수간 관계 파악을 통해
전체 데이터의 특징을 발견하고 이해할 수 있다.
데이터 분석 : 의미있는 값을 얻어내는 과정
문제 정의 -> 가설 설정 -> 데이터 준비(데이터 수집,선정,정제) -> 데이터 분석 -> 결과 정리
주제 : 포켓몬 데이터 뭉치에서 전설의 포켓몬을 골라낼 수 있을까?
(전설의 포켓몬의 특징을 분석해야 한다)
포켓 몬스터: 몬스터볼에 넣어서 주머니에 휴대하고 다닐 수 있는 몬스터
각 몬스터마다 공격력, 방어력 등의 속성을 가진다
속성에 따라 일반 포켓몬과 전설 포켓몬으로 분류된다.
전설 포켓몬: 보통 포켓몬보다 강력하고 수량이 한정되어 있음. 즉 일반포켓몬과는 구분되는 속성을 가질 것!
문제 : 일반 포켓몬과 전설 포켓몬이 혼합되어 있는 데이터셋에서 데이터의 속성만을 보고 전설 포켓몬을 골라낼 수 있을까?
데이터셋 받으려면 Kaggle 여기서 받으면 재밌는 데이터들이 많음
1. Scikit Learn : 라이브러리
(Toy Datasets load_boston보스턴 집값, load_iris 붓꽃 등 해볼 수 있음)
(Real World Datasets 좀 더 많은 fetch_20newsgroups 등..)
2. Kaggle : 데이터 분석 플랫폼
3. 서울 열린데이터 광장
4. 공공데이터 포털
5. 기타
구글 데이터셋 검색 엔진, UCI 데이터셋, 데이터셋 모음집
'작업 > 데이터분석' 카테고리의 다른 글
21.12.13 모의테스트 (0) | 2021.12.13 |
---|---|
21.12.06 파이썬 데이터처리 모의테스트 (0) | 2021.12.06 |
21.12.06 파이썬 정리2 (0) | 2021.12.06 |
21.12.06 파이썬 정리 1 (0) | 2021.12.06 |
21.12.04 numpy, pandas (0) | 2021.12.05 |