일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 안드로이드
- ubuntu
- 블로그
- 손민한
- 뉴스타파
- arm
- Git
- 리뷰
- 문파문파 공략
- 애플
- 우분투
- 데이터베이스
- 프로야구
- ubuntu 12.04
- NC다이노스
- 국정원
- 문파문파
- Linux
- 해외직구
- 조세피난처
- 야구
- NC 다이노스
- 태그를 입력해 주세요.
- 김경문
- 타이젠
- Tizen
- 인공지능
- 단통법
- python
- mysql
Archives
- Today
- Total
목록data cleansing (1)
꿈꾸는 사람.
Python::프로야구 팀순위 분석
개요 빅데이터나 데이터 사이언스가 할 일의 가장 큰 부분은 데이터 전처리이다. 데이터 전처리는 데이터 정제와 데이터 변환으로 구성된다. 이번 포스팅은 이전 포스팅에서 쓴 데이터를 수집을 통해 읽은 데이터를 변환하는 방법을 사례를 통해 구현해 본다. 1. 데이터 수집 이번 포스팅은 Kaggle에서 타이타닉 데이터를 다루지는 않는다. 한국 프로야구의 팀 순위 데이터를 엑셀 파일로 저장한다. 순위 팀명 경기 승 패 무 승율 게임차 최근10경기 연속 홈 원정 1 SSG 86 57 26 3 0.687 0 9승0무1패 6승 33-0-10 24-3-16 2 키움 87 54 32 1 0.628 4.5 6승0무4패 2패 25-1-18 29-0-14 3 LG 84 52 31 1 0.627 5 8승0무2패 1승 23-0-2..
Python
2022. 7. 19. 23:50