파이썬/Data Science

[Data Science] 데이터 사이언스 프로세스

취준생코린이 2021. 5. 31. 22:21
728x90

데이더 사이언스에는 대략적으로 다음과같은 단계들이 있다.

  1. 문제 정의하기
  2. 데이터 모으기
  3. 데이터 다듬기
  4. 데이터 분석하기
  5. 데이터 시각화 및 커뮤니케이션

 

1. 문제 정의하기

해결하고자 하는 문제를 정의한다

  • 목표설정
  • 기간설정
  • 평가방법 설정
  • 필요한 데이터 설정

 

2. 데이터 모으기

필요한 데이터를 모을 수 있는 방벙을 찾는다.

  • 웹 크롤링
  • 자료모으기
  • 파일 읽고 쓰기

 

3. 데이터 다듬기

데이터의 퀄리티를 높여서 의미있는 분석이 가능하게끔 한다.

  • 데이터 관찰하기
  • 데이터 오류 제거
  • 데이터 정리하기

 

4. 데이터 분석하기

준비된 데이터로부터 의미를 찾는다.

  • 데이터 파악하기
  • 데이터 변형하기
  • 통계분석
  • 인사이트 발견
  • 의미 도출

 

5. 커뮤니케이션

분석 결과를 다른 사람들에게 전달한다

  • 다양한 시각화
  • 커뮤니케이션
  • 리포트

 

728x90