본문 바로가기
기후데이터 분석 실습

[기후데이터를 읽는다는 것] 기후데이터 분석 시리즈 구성안: 시리즈를 준비하며..

by 주인장 민해피 2025. 4. 16.

대표 이미지

 

기후변화는 이제 숫자와 그래프로도 이야기되는 시대이다. 내가 꿈꾸는 저탄소 사회를 향한 계획은 결국, 데이터를 어떻게 읽고 해석할 수 있는가에 달려있다.

 

이 카테로기에서는 '기후데이터분석실습'을 시리즈형태로 연재해보고자한다.

 

기후데이터를 다루는 첫 걸음이자, 동시에 기후문제를 객관적으로 바라보려는 하나의 시도이다.

 


 

분석시리즈를 준비하며

 

내가 데이터를 분석하고 시각화하며 가장 어려웠던 건 '어디서부터 어떻게 시작해야할지 몰랐다'는 점이다.

기후데이터는 한눈에 보기에도 방대하고 수집경로도 다양하며 무엇보다 그 안의 맥락을 이해하지 못하면 숫자는 의미를 잃는다. 그래서 앞으로 시리즈물에서는 다음과 같은 분석 흐르을 기준 삼아 구성하고자 한다.

 

 

기후데이터분석 시리즈 구성안

1. 문제 정의 - 무엇을 알고싶은가?

분석의 시작은 항상 질문에서 출발한다.

 

 예를 들면 '대한민국의 이산화탄소 배출은 어느 산업에서 가장 많을까?'라던가 '최근 10년간 기온 변화가 가장 뚜렷한 도시는 어디일까?'등이다. 문제 정의에서는 분석 목적을 명확히하고, 데이터를 수집하는 방향을 결정할 것이다.

 

 

 

2. 데이터 수집 - 어디에서 데이터를 얻을 것인가?

공공데이터포털과 환경부 산하 정보센터, 기후변화 특화 사이트 등에서 데이터를 얻을 계획이다.

 

데이터를 얻는 여러가지 경로가 궁금하다면?(이전 글보러가기 아래 글 제목 클릭)

 

2025.04.09 - [기후데이터 분석 실습] - 데이터 너머의 기후 이야기 #1: 데이터는 어디에 있을까?(글로벌편)

 

데이터 너머의 기후 이야기 #1: 데이터는 어디에 있을까?(글로벌편)

기후위기라는 단어를 처음 들었을 때, 나는 그게 얼마나 '실체있는 일'인지 감이 오지 않았다.언론과 내가 들은 환경교육에서는 매일같이 심각성을 강조하지만, 정작 나는 그 현실을 '체감'하지

minhappy-earth-lab.tistory.com

2025.04.11 - [기후데이터 분석 실습] - 데이터 너머의 기후 이야기 #2: 데이터는 어디에 있을까?(국내편)

 

데이터 너머의 기후 이야기 #2: 데이터는 어디에 있을까?(국내편)

기후위기는 어느 한 지역만의 문제가 아니다. 그러한 관점에서 이전 글에서는 글로벌한 분야에서의 기후 데이터를 찾는 방법을 살펴보았다. 2025.04.09 - [기후데이터 분석 실습] - #1 데이터 너머

minhappy-earth-lab.tistory.com

 

API 연동을 통한 실시간 수집이 될 수도 있고, 정적 CSV 데이터를 활용할 수도 있다. 이 경우, 기후변화통계포털, GHG Inventory, NASA Open Data 등과 같은 예시로, 수집 경로도 함께 기록할 예정이다.

 

 

 

3. 데이터 전처리 - 분석에 맞게 다듬기

누락값을 처리하고 단위를 통일하거나 필요한 열을 추출하는 등. 사실상 데이터분석에서 가장 많은 시간을 할애해야만하는 단계이다.

파이썬에서 판다스(Pandas)를 활용하는 데이터 클렌징 실습 등을 포함할 예정이고, 데이터 탐색적 분석(EDA)을 통해 구조를 파악할 단계가 되겠다.

 

 

 

4. 분석 - 패턴을 찾고 의미를 해석

산업별, 지역별, 시간대별 분석 등으로 다양한 접근을 시도할 것이다. 시계열 분석과 상관관계 분석, 군집화 등 간단한 통계 기법을 적용시켜보고, 질문에 맞는 해석을 위한 간단한 시각화를 함께 진행할 예정이다.

 

 

 

5. 시각화 - 숫자에 입히는 색과 모양

Seaborn, Plotly, Folium, Tableau 등 다양한 도구를 활용해볼 계획이다. 독자가 직관적으로 이해할 수 있도록 구성할 것이다. 지도 시각화, 트렌드 라인, 대시보드 형태 등으로 발전 시킬 목표를 가지고 있다.

 

 

 

6. 인사이트 도출 및 정리 - 우리가 얻을 수 있는 것은?

단순한 숫자 나열이 아닌, 기후 정책 혹은 시민 실천으로 이어질 수 있는 해석을 수행할 것이다. 데이터를 통해 알게된 것, 의외의 발견, 제한사항 등도 함께 공유할 것이다.

 

 

 

이 시리즈는 단발성이 아닌, 하나의 분석 프로젝트가 끝나면 새로운 질문으로 넘어갈 수 있는 연속형 실습 아카이브로 운영하고자 한다.

예를 들면, 산업별 탄소배출 분석 -> 지역별 재생에너지 확대 현황 분석 -> 기후변화가 농업에 미치는 영향 분석 등... 이어지는 흐름을 만들고 싶다.

 

데이터 분석은 정답을 찾아가는 과정이 아니라, 더 나은 질문을 찾아가는 과정이라고 생각한다. 기후 데이터와 함께 걷는 이 여정에서 내가 배운 것들을 정리하고, 공유하고, 함께 성장하고 싶다.