본문 바로가기
3단원

[학생활동] 수도권 집중과 저출산

by ziriboy 2023. 11. 4.

학생활동 수도권 집중과 저출산
// 인공지능 활용 // 

수도권 집중이 우리나라 저출산의 원인이라는 주장이 있다. 청년들이 교육과 취업을 위해 서울로 몰리면서 서울의 높은 생활비와 집값으로 결혼과 임신이 늦어지거나 포기하는 경향이 나타나고, 결과적으로 우리나라의 인구수가 감소한다는 주장이다. 이 주장은 얼마나 근거를 갖고 있을까? 

우리나라 시군구별 인구밀도(인구수 대신 인구밀도를 활용했다)와 출산율 데이터를 수집하여 둘 간의 상관관계를 계산한다면 위 주장을 검증하는 것이 가능하다. 

 

데이터 수집

시군구별 인구밀도 데이터는 통계청(kostat.go.kr)에서 도시별 면적과 인구수를 통해 계산한다. 

시군구별 합계출산율 데이터는 통계청에서 수집할 수 있다. 

시군구별 인구밀도와 합계출산율을 정리한 엑셀파일을 만든다. 여기서 다운받을 수 있다. 

pop.xlsx
0.02MB

 

인공지능을 활용한 상관관계 분석

인공지능(ChatGPT Advanced Data Analysis)을 활용해 두 변수(도시별 인구밀도, 도시별 합계출산율)의 상관관계 분석을 요청할 수 있다(예, 업로드한 파일은 우리나라 시군구의 인구밀도와 출산율 데이터야. 인구밀도와 출산율의 상관관계를 조사하고, 시각화해줘). 

 

ChatGPT는 두 변수(인구밀도와 출생률) 간의 상관관계를 -0.594으로 계산했다.

이 상관계수는 인구밀도와 합계출산율 간에 강한 음의 상관관계가 있음을 나타낸다. 즉, 인구밀도가 증가함에 따라 합계출산율이 감소하는 경향이 있다는 의미이다. 

 

참고로, 상관관계 값을 상관계수라 한다. 상관계수는 -1에서 1 사이의 값을 갖는다. 

  • 절대값이 1에 가까울수록 거의 확실한 상관관계를 갖는다고 할 수 있다. 
  • 절대값이 0.5 정도면 강한 상관관계라 할 수 있다. 
  • 절대값이 0.2 정도면 미약한 상관관계라 할 수 있으며, 상관관계가 있다고 장담할 수 없다. 
  • 절대값이 0에 가까우면 상관관계가 없다고 본다.