지하철 승하차 인원으로 알아보는 도시구조
목표 – 교통카드를 이용하게 되면서, 이제는 지하철 역별, 시간대별, 이용자 연령대별(학생, 일반, 노년층) 승하차 인원을 파악할 수 있게 되었다. 이러한 데이터는 과거에서 알기 어려웠던 다양한 도시의 모습과 이용자 특성을 드러낸다. 아침 출근 시간에 가장 붐비는 지하철 역은 어디인지? 낮시간 동안 노년층이 가장 많이 찾는 지하철 역은 어디인지? 이번 활동에서는 생성형 인공지능의 도움을 받아 지하철의 시간대별 승하차 데이터를 분석하고, 이를 통해 도시의 구조와 공간적 특성을 탐색해 볼 것이다.
1단계 – 추측하기
질문 1-1. 서울시 지하철 역 중에서 아침 출근 시간대에 가장 붐비는 역은 어디일까? 왜 그렇게 생각하는가?
질문 1-2. 서울시 지하철 역 중에서 저녁 퇴근 시간대에 하차 인원은 많지만 승차 인원이 적은 곳은 어떤 특징을 가진 지역일까?
2단계 – 필요한 데이터 다운받기
활동 1 – 아래의 순서에 맞춰 필요한 데이터를 다운 받습니다.
1. 공공데이터 포털(https://data.go.kr)에 접속합니다. 2. 검색창에 ‘서울시 지하철 역별 시간대별 승하차인원 정보’를 입력합니다. ‘바로가기’를 눌러, ‘csv’ 파일(서울시 지하철 호선별 역별 시간대별 승하차 인원 정보)을 다운받습니다. 3. 엑셀로 다운받은 파일을 열어보고, 어떤 정보들이 포함되어 있는지 확인합니다. |
※공공데이터 포털(data.go.kr)은 행정기관이나 공공기관이 보유한 데이터를 국민 누구나 자유롭게 사용할 수 있도록 개방한 플랫폼입니다. 이곳에서는 교통, 환경, 인구, 교육, 기후, 건강 등다양한 분야의 데이터를 검색하고, 엑셀(csv) 등 다양한 형태로 내려받아 활용할 수 있습니다. 공공데이터 포털에는 우리가 사는 사회와 생활 속 여러 정보를 담은 자료들이 공개되어 있어요. 예를 들어,
서울시 버스 노선별 승하차 인원
우리 동네의 미세먼지 농도 변화
학교별 학생 수와 학급 수 통계
따릉이(공공자전거)의 시간대별 이용 현황
지역별 전통시장 현황과 시설 정보
유기동물 보호소 위치와 입양 통계
기후 변화에 따른 작물 생산량 변화
지역별 화재 발생 현황
질문 2-1. 다운받은 '서울시 지하철 역별 시간대별 승하차인원' 파일에는 어떤 정보들이 포함되어 있나요?
3단계 – AI로 데이터 분석하기
활동 2 – 아래의 순서에 맞춰 지하철 승하차 인원 데이터를 분석합니다.
1. ChatGPT에 다운받은 엑셀 파일(csv)을 업로드 합니다. 2. ChatGPT의 창에 다음과 같이 입력합니다. "업로드한 파일은 서울시 지하철 역별 시간대별 승하차인원 정보야. 아침에 하차하는 인원은 많지만 승차 인원은 적은 역 top 5를 찾아줘” 3. 만일, 하나의 지하철역이 반복될 경우 "중복된 지하철역은 1회만 반영하시오."라는 요청을 입력한다. 4. 이번에는 반대로 "저녁에 하차하는 인원은 많지만 승차 인원은 적은 역 top 5를 찾아줘"라고 입력한다. |

질문 3-1. 아침에 하차하는 인원은 많지만 승차 인원은 적은 역 5곳은 어디인가? 이들 지역은 어떤 공통된 특징을 갖고 있는가?
질문 3-2. 저녁에 하차하는 인원은 많지만 승차 인원은 적은 역 5곳은 어디인가? 이들 지역은 어떤 공통된 특징을 갖고 있는가?
질문 3-3. ChatGPT의 결과 중에서 ‘나의 예상과 일치하는 답변’ 혹은 ‘예상치 못한 답변’은 무엇인가?
활동 3 – 아래의 순서에 맞춰 지하철 승하차 인원 데이터를 분석합니다.
1. ChatGPT의 창에 다음과 같이 입력합니다. “평일 하루를 골라, OO역의 24시간 승하차 인원수의 변화를 그래프로 작성해줘”. OO역은 아침에 하차하는 인원은 많지만 승차 인원은 적은 역이다. 2. 이 그래프를 토대로, OO역이 위치한 지역의 특징을 도시의 내부구조 측면에서 설명해줘. |

질문 3-4. ChatGPT가 찾은 결과는 무엇인가? 요약해 보자.
4단계 – AI로 패턴 찾기
'홍대입구'역은 일반적인 도심(부도심)이나 주거지와는 다른 특징을 갖는다. 생성형 인공지능(ChatGPT)를 활용해 2호선 홍대입구 역과 유사한 승하차 인원 패턴을 가진 지하철 역을 찾을 수 있다.
활동 4 - 아래의 순서에 맞춰 데이터를 분석한다.
1. ChatGPT의 창에 다음과 같이 입력합니다. “2호선 홍대입구역과 시간대별 승하차 인구수의 패턴이 비슷한 역을 찾아줘”. |
질문 4-1. ChatGPT가 찾은 결과는 무엇인가?
질문 4-2. 이처럼 특정 데이터(A)와 유사한 패턴을 가진 다른 데이터를 찾아주는 AI의 기능은 어떤 점에서 유용하다고 생각하나요? (복수 선택 가능)
□ 복잡한 데이터를 빠르게 비교할 수 있다
□ 사람보다 더 정교하게 유사성을 분석할 수 있다
□ 다양한 데이터 간 숨겨진 연결점을 찾아볼 수 있다
□ 흥미로운 탐구 질문을 던지는 데 도움이 된다
□ 특별히 유용하다고 느끼지 않았다
질문 4-3. 이런 기능을 활용해서, 당신이 새롭게 던지고 싶은 질문이 있다면 무엇인가요?
참고자료
위 자료에 제시된 지하철 역의 시간대별 승하차 인원수 그래프이다.






