본문 바로가기
Book/IT

모두의 데이터분석 with 파이썬] 1장-1 기온공공데이터/서울이 가장 더웠던 날은 언제였을까?

by KyoD 2021. 6. 15.
반응형

1. 질문 다듬기

서울의 가장 더웠던 날은 언제였을까?

 

이 질문은 구체적인 해결책으로 이어지는 질문일까? 

 

해결책을 구하기 위해서는 우선 질문을 잘 던져야 한다. 

 

위의 질문은 구체적으로 어떤 정보를 원하는지, 어떻게 해결책을 찾아야 하는지 실마리를 주지 못하고 있다. 

 

때문에 질문을 구체적으로 다듬어볼 필요가 있다.

 

기상 관측 이래, 서울의 최고 기온이 가장 높았던 날은 언제였고, 몇 도였는가?

이 질문에서는 더웠던 날의 기준을 기온으로 잡았으며, '기상 관측 이래'라는 찾을 데이터의 범위를 설정해주었다.

 

따라서 우리는 기상 관측 이래 기록된 기온 데이터를 찾아서 서울 지역의 기온이 가장 높았던 날을 찾으면 된다.

 

 

2. 문제 해결 방안 구상하기

1. 데이터를 읽어온다.
2. 순차적으로 최고 기온을 확인한다.
3. 최고 기온이 가장 높았던 날짜의 데이터를 저장한다.
4. 최종 저장된 데이터를 출력한다.

 

 

3. 파이썬 코드로 구현하기

 

* 기상자료개방포털에서 자료 가져오기

기온분석 -> 검색조건 -> 

자료구분: 일
자료형태: 기본
기간: 19040501 ~ 20210621
지역: 서울

신기한 점은 자료가 1904년 일제 강점기 시절부터 존재한다는 것이다.

 

자료를 설정했으면 csv파일로 다운받는다.

다운받은 원본 자료는 그대로 두고 복사하여 이름을 알아보기 쉽게 변경한다.

(원본자료는 나중을 위해서 그대로 남겨 두는 것이 좋다.)

 

다운받아서 notepad++로 파일을 열어보면 

데이터 위에 어떤 자료를 다운받았는지 간략하게 설명이 나와있으며, 맨 아래로 내려가보면 공백이 존재한다.

데이터 분석을 위해서는 이 부분들이 필요없기 때문에 모두 지우고 저장한다.

 

 

* 다운 받은 자료 불러오기

 

 

* 헤더 저장하기 & next()함수 이해하기

 

 

*  데이터를 한 줄씩 출력해보기

데이터를 한 줄로 뽑았을 때 각 행이 리스트의 형태로 뽑힌다는 것에 주목해야 한다.

 

반응형