-
[모두의 데이터분석] Unit03 서울이 가장 더웠던 날은 언제였을까python/모두의 데이터분석 2021. 1. 31. 20:25
이번 유닛에서는 기상 관측아래,
서울의 최고 기온이 가장 높았던 날은 언제였고 몇도 였는지 데이터를 통해 알아낼 것이다.
먼저 문자열로 되어있는 최고 기온 데이터를 실수(float) 데이터로 변환해보자.
float() 함수를 사용해서 row[-1]을 실수 데이터로 변환하고
각 행을 for 반복문을 사용해서 출력했다.
실행 결과 실행 결과를 보면 1950-09-01의 기온 데이터가 누락되어 있기 때문에
1950-08-31까지의 데이터만 나오고 오류가 발생하는 것을 알 수 있다.
이 오류를 해결하기 위해 빈 값을 대체할 특정 값을 넣어봤다.
특정 값은 최고 기온 값으로 나오기 힘든 -999로 정했다.
실행 결과 대체값을 넣은 결과, 오류가 발생하지 않고 끝까지 데이터가 출력된다.
여기까지 문자열을 실수로 변환하는 데이터 정리를 마쳤다.
이젠 정리된 데이터로 최고 기온이 가장 높았던 날은 언제였고 몇도 였는지 구해보자.
'최댓값 구하기' 알고리즘 방식으로 구한다.
먼저 기존 코드에 최댓값을 저장할 변수 max_temp와 최고 기온 날짜를 저장할 변수 max_date를
만들고 if문을 사용해서 최고 기온 값과 최고 기온 날짜를 업데이트하는 형식으로 코드를 짰다.
실행 결과
여기까지 문자열 데이터를 실수 형식으로 바꿔보고 빈 값에 대체 값을 넣어 데이터를 정리하여
최댓값을 구해보는 것까지 해보았다.
다음 unit에서는 데이터를 시각화하는 것을 배워볼 것이다.
'python > 모두의 데이터분석' 카테고리의 다른 글
[모두의 데이터분석] Unit05 내 생일의 기온 변화를 그래프로 그리기 (0) 2021.02.02 [모두의 데이터분석] Unit04 기본 그래프 그리기 (0) 2021.01.31 [모두의 데이터분석] Unit02 서울의 기온 데이터 분석하기 (0) 2021.01.29 [모두의 데이터분석] Unit12 지하철 시간대별 데이터 시각화하기 (0) 2021.01.28