학생활동 수도권 집중과 저출산
// 인공지능 활용 //
수도권 집중이 우리나라 저출산의 원인이라는 주장이 있다. 청년들이 교육과 취업을 위해 서울로 몰리면서 서울의 높은 생활비와 집값으로 결혼과 임신이 늦어지거나 포기하는 경향이 나타나고, 결과적으로 우리나라의 인구수가 감소한다는 주장이다. 이 주장은 얼마나 근거를 갖고 있을까?
우리나라 시군구별 인구밀도(인구수 대신 인구밀도를 활용했다)와 출산율 데이터를 수집하여 둘 간의 상관관계를 계산한다면 위 주장을 검증하는 것이 가능하다.
데이터 수집
시군구별 인구밀도 데이터는 통계청(kostat.go.kr)에서 도시별 면적과 인구수를 통해 계산한다.
시군구별 합계출산율 데이터는 통계청에서 수집할 수 있다.
시군구별 인구밀도와 합계출산율을 정리한 엑셀파일을 만든다. 여기서 다운받을 수 있다.
인공지능을 활용한 상관관계 분석
인공지능(ChatGPT Advanced Data Analysis)을 활용해 두 변수(도시별 인구밀도, 도시별 합계출산율)의 상관관계 분석을 요청할 수 있다(예, 업로드한 파일은 우리나라 시군구별(region)의 인구밀도(pop_den)와 출산율(br_rate) 데이터야. 우리나라의 시군구별 인구밀도와 출산율의 상관관계를 조사하고, 시각화해줘).
ChatGPT는 두 변수(인구밀도와 출생률) 간의 상관관계를 -0.594으로 계산했다.
이 상관계수는 인구밀도와 합계출산율 간에 강한 음의 상관관계가 있음을 나타낸다. 즉, 인구밀도가 증가함에 따라 합계출산율이 감소하는 경향이 있다는 의미이다.
참고로, 상관관계 값을 상관계수라 한다. 상관계수는 -1에서 1 사이의 값을 갖는다.
- 절대값이 1에 가까울수록 거의 확실한 상관관계를 갖는다고 할 수 있다.
- 절대값이 0.5 정도면 강한 상관관계라 할 수 있다.
- 절대값이 0.2 정도면 미약한 상관관계라 할 수 있으며, 상관관계가 있다고 장담할 수 없다.
- 절대값이 0에 가까우면 상관관계가 없다고 본다.
작성된 그래프는 한글 폰트를 지원하지 않기 때문에 아래 파일을 ChatGPT 창에 업로드 하고, 명령어("업로드한 라이브러리를 설치하고 Matplotlib 한글 사용 환경을 설정해 줘")를 입력하면, 한글이 표시된 그래프를 확인할 수 있다.
'3단원' 카테고리의 다른 글
가장 젊은 도시 - 화성 (0) | 2024.03.19 |
---|---|
지역별 산업구조의 변화 - 5가지 핵심 포인트 찾기 (0) | 2024.03.19 |
[학생활동] 인구가 지속적으로 증가한 지역은 어디인가? (0) | 2023.11.03 |
[학생활동] 지하철 승하차 인원수로 살펴보는 도시구조 (0) | 2023.11.02 |
한지탐 [03-04] 수도권 집중과 지방소멸 (0) | 2022.12.21 |