소스코드
모델 소개
- 중국 도시별 미세먼지 PM10 농도와, 서울의 기온, 풍속, 습도를 가지고, 서울의 하루 뒤 미세먼지 PM10 농도를 예측하는 모델
- 서울의 기온, 풍속, 습도는 현재(중국 미세먼지 데이터 날짜와 일치)와 다음날(서울 미세먼지 데이터 날짜와 일치) 데이터를 모두 넣음.
- 학습할 중국의 도시는 공업이 발달한 도시로 선정하였으며, 다음과 같이 총 10개 시를 선정
- 베이징, 항저우, 청도, 충칭, 칭다오, 난징, 톈진, 쑤저우, 우한, 상하이
데이터
데이터 출처
- 중국 미세먼지 데이터 : https://aqicn.org
- 서울 구별 미세먼지 데이터 및 강수량, 풍속, 풍향 : https://www.airkorea.or.kr
전처리
- feature : 일별 중국 10개도시의 미세먼지 농도, 서울의 오늘/내일 기온, 풍속, 습도
- label : 서울의 하루 뒤 PM10 농도
- 이때, 서울 각 구별 데이터를 하나의 독립적인 label로 취급함.
- 즉, 하나의 feature에 조금씩 다른 label을 매칭시켜서 데이터를 급격히 증가시킴.
학습
- DecisionTree 모델 사용
결과
- Learning Curve
- RMSE : 7.2
참조
Jeong, Yemin & Youn, Youjeong & Cho, Subin & Kim, Seoyeon & Huh, Morang & Lee, Yangwon (2020). Prediction of Daily PM10 Concentration for Air Korea Stations Using Artificial Intelligence with LDAPS Weather Data, MODIS AOD, and Chinese Air Quality Data. 대한원격탐사학회지, 대한원격탐사학회