728x90
데이더 사이언스에는 대략적으로 다음과같은 단계들이 있다.
- 문제 정의하기
- 데이터 모으기
- 데이터 다듬기
- 데이터 분석하기
- 데이터 시각화 및 커뮤니케이션
1. 문제 정의하기
해결하고자 하는 문제를 정의한다
- 목표설정
- 기간설정
- 평가방법 설정
- 필요한 데이터 설정
2. 데이터 모으기
필요한 데이터를 모을 수 있는 방벙을 찾는다.
- 웹 크롤링
- 자료모으기
- 파일 읽고 쓰기
3. 데이터 다듬기
데이터의 퀄리티를 높여서 의미있는 분석이 가능하게끔 한다.
- 데이터 관찰하기
- 데이터 오류 제거
- 데이터 정리하기
4. 데이터 분석하기
준비된 데이터로부터 의미를 찾는다.
- 데이터 파악하기
- 데이터 변형하기
- 통계분석
- 인사이트 발견
- 의미 도출
5. 커뮤니케이션
분석 결과를 다른 사람들에게 전달한다
- 다양한 시각화
- 커뮤니케이션
- 리포트
728x90
'파이썬 > Data Science' 카테고리의 다른 글
[Data Science] 데이터 퀄리티 높이기 (0) | 2021.06.18 |
---|---|
[Data Science] 큰데이터 프레임/큰 시리즈를 살펴볼때 도움이 되는 함수 (0) | 2021.06.06 |
[Data Science] pandas라이브러리 정리 (0) | 2021.06.06 |
[Data Science] numpy라이브러리 사용하기 [스마트인재개발원] (0) | 2021.06.02 |