DOI QR코드

DOI QR Code

Proposal of Cause Analysis and Solutions for Subway Congestion using R

R을 이용한 지하철 혼잡도 원인분석 및 대책방안 제안

  • 김정준 (안양대학교 소프트웨어학과) ;
  • 황승연 (안양대학교 컴퓨터공학과) ;
  • 장석우 (안양대학교 소프트웨어학과)
  • Received : 2024.05.01
  • Accepted : 2024.08.09
  • Published : 2024.08.31

Abstract

As time progresses and technology advances, many modes of transportation have emerged compared to the past. People use various means of transportation including personal cars, subways, buses, and taxis, among which public transport is utilized by people of all ages and genders. Public transportation has the advantage of being affordable and convenient, but with the increase in population compared to the past, traffic congestion has also been increasing, making it increasingly uncomfortable. Especially during specific times or on certain dates, traffic congestion can become significantly worse than usual. Among these, the subway is the mode of transportation used most frequently. Therefore, in this study, we will discuss solutions and analyze the causes of congestion by subway section using the R program.

시대가 흐르고 기술이 발전함에 따라 과거에 비해 많은 교통수단들이 생겨났다. 사람들은 자가용뿐만이 아니라 지하철과 버스 그리고 택시와 같은 다양한 교통수단을 사용하고 있는데, 그 중에서도 대중교통은 남녀노소 상관없이 사용되는 교통수단이다. 대중교통은 적은 비용으로 편하게 이용할 수 있다는 장점이 있으나 과거에 비해 인구수가 증가함에 따라 교통체증도 점점 증가해 불편한 요소가 늘어가고 있다. 특히 특정 시간대나 특정 날짜의 경우 평소보다 배는 교통체증이 심각해진다. 그런 대중교통 중 가장 높은 비율로 활용되는 수단이 지하철이다. 그러므로 이번 연구에서는 R 프로그램을 통해 지하철의 구간별 혼잡도와 그 원인에 대해 분석하고 대책방안에 대해 논의해보기로 한다.

Keywords

Ⅰ. 서론

오늘날 기술이 발전함에 따라 과거에 비해 많은 교통수단들이 생겨났다. 자가용, 자전거, 버스, 지하철부터 시작해서 기차, 비행기 등 다양한 교통수단들이 있으며 도로에는 언제나 자동차들이 북적이고 휴일이면 고속도로를 꽉 채운 자동차들을 심심치 않게 목격할 수 있다. 그런 현대 사람들에게 자가용뿐만이 아니라 지하철과 버스 그리고 택시와 같은 다양한 교통수단은 이미 일상과 떼려야 뗄 수 없는 관계이다. 이렇게 일상생활과 상당히 밀접한 교통수단 중에서도 여러 사람과 함께 이용하는 대중교통은 남녀노소 상관없이 흔하게 사용되는 교통수단이다. 대중교통은 적은 비용으로 편하게 이용할 수 있다는 장점이 있으나 과거에 비해 인구수가 증가함에 따라 교통체증도 같이 증가해 불편한 요소가 점점 늘어나고 있다. 특히 특정 시간대나 특정 날짜의 경우 평소보다 배는 교통체증이 심각해져 여러 사람들이 불편을 호소하고 있다. 그런 대중교통 중 가장 높은 비율로 이용되는 수단이 지하철이다. 지하철 일부 구간 중에는 극심한 혼잡도 속에서 사람들이 호흡곤란을 겪기도 하며 간혹 약간의 타박상과 접촉사고가 일어나기도 한다[1-2]. 따라서 본 연구에서는 R 프로그램을 통해 실생활에서 흔히 접할 수 있는 지하철의 구간별 혼잡도를 분석하고 해당 구간이 왜 혼잡한지, 지리적, 사회적 데이터를 수집하여 원인 분석을 실시한다. 또한, 이를 통해 얻어낼 수 있는 대책 방안을 제안한다. 차내 혼잡도는 전동차 승차 정원에 대하여 실제 승차 인원의 비율을 뜻한다. 보통 각 노선의 최대 승차 구간과 최대 혼잡시간대를 기준으로 산출한다. 우리가 흔히 타는 전철 1량의 적정 인원은 160명이므로 이를 기준으로 차내 혼잡도를 계산한다[3].

Ⅱ. 관련 연구

1. 빅데이터 분석

1990년대 이후 인터넷의 확산으로 정형화된 데이터와 비정형화된 데이터가 대량으로 생성되었다. 이로 인해 엄청난 양의 데이터가 축적되었고, 이에 따라 빅데이터라는 개념이 등장하게 되었다. 빅데이터는 주로 규모, 속도, 다양성의 세 가지 특성으로 설명된다. '규모'는 수십 테라바이트에서 수십 페타바이트에 이르는 데이터의 크기를 의미하며, '속도'는 데이터가 매우 빠른 속도로 생성되고 실시간으로 저장, 유통, 수집, 분석될 수 있는 능력을 가리킨다. '다양성'은 정형, 반정형, 비정형 등 다양한 형태의 데이터를 포함한다. 이러한 세 가지 주요 특성을 기반으로 한 빅데이터 분석은 방대한 데이터 집합을 통해 패턴을 탐색하고 데이터 간의 상관관계 및 객관성을 평가하는 과정이다[4].

2. 빅데이터 수집 기술

데이터 수집 기술은 빅데이터 제공 서비스의 품질을 결정하는 중요한 기술이다. 데이터 수집은 다양한 유형의 데이터를 수집하는 것을 말하는데 얼마나 핵심적인 데이터를 깔끔하게 수집하는가에 따라 분석 결과가 달라진다. 종류는 대표적으로 크롤링, ETL (Extraction Transformation Loading)이 있으며 그 외에도 FTP, RSS, Streaming, Aggregator(Log, RDB) 등이 있다[5].

3. 빅데이터 저장 기술

빅데이터에서는 데이터를 '대용량, 비정형, 실시간'으로 저장하는 방식이 필요하다. 그중에서도 대량의 데이터를 파일 형태로 저장할 수 있는 기술과 비정형 데이터를 정형화된 데이터 형태로 저장하는 기술이 아주 중요하다[6]. 대표적으로는 분산 파일 시스템인 HDFS (Hadoop Distributed File System)과 NoSQL이 주로 활용되며 그 외에 HBase나 Cassandra 등이 사용된다.

4. 빅데이터 처리 기술

위에서 설명한 수집 기술로 수집한 데이터를 분석하기 위해선 필요한 데이터만을 정확히 추출하는 처리기술이 필요하다. 대표적으로 사용되는 기술은 맵리듀스가 있다. 맵리듀스는 HDFS 등에 분산 저장되어있는 데이터를 map()과 reduce()라는 간단한 분산 프로그래밍 방식을 통해 병렬처리를 가능하게 해주는 데이터 처리 시스템이다. 그리고 Hive와 Pig언어도 데이터 처리에 큰 영향을 미치는데 Hive는 HDFS와 호환되는 대용량 데이터에 대한 분석을 지원하고 HiveQL을 지원하여 SQL언어를 사용하는 사용자들이 좀 더 쉽게 사용할 수 있도록 활용성을 높였다. Pig는 데이터를 적재/변환하고 결과를 정렬하는 과정을 쉽게 처리하기 위해 야후에서 개발한 프로그래밍 언어로 Hive보다는 전문성이 높아 활용이 약간 어렵다는 특징이 있다[7].

Ⅲ. 본론

도로에서 주행하는 자동차들과 달리 지하철은 예정된 시간에 일정한 수의 차량으로 운행되어 사람들은 목적지에 예상한 시간 안에 도착할 수 있다. 특히 도로의 혼잡도가 높은 출퇴근 시간 때, 안정적인 지하철을 많이 이용한다. 이러한 이유로 지하철의 혼잡도가 증가함에 따라 이용자의 불만이 증가하고 있다. 따라서 본 연구에서는 지하철 혼잡도를 줄이기 위한 지역별 및 시간대에 따른 지하철의 혼잡도와 그 주변 업체 등을 분석하고자 한다. 그리고 분석한 자료들을 기반으로 대책을 제시한다.

본 연구에서 사용하는 호선별 지하철 승하차 인원과 구간별, 시간별 혼잡도 데이터는 서울시 열린 데이터 광장에서 수집하였고 주야간 상주인구 수와 지역별 사업체수 데이터는 서울시 통계 사이트에서 수집하였다.

수집한 데이터를 분석 목적에 따라 전처리하고 R 프로그램을 이용하여 그래프로 시각화하였다. 먼저 방대한 데이터에서 약 500개의 역 구간 중 승 하차 인원과 혼잡도 데이터의 상위 10개 역 구간을 기준으로 데이터를 분석하였다. 그래프로 시각화하여 분석한 결과 주로 1~4호선에서 많은 혼잡도가 발생하는 것을 확인할 수 있었다. 실제 분석 대상이 된 역 구간은 혼잡도가 높은 순서대로 강남, 잠실, 홍대입구, 신림, 고속터미널, 삼성, 구로디지털단지, 신도림, 서울역, 선릉이다. 실제로 혼잡도가 가장 높은 구간은 9호선이지만, 평균 지하철이 8-10량으로 구성된 것에 비해 9호선은 4량으로 이루어져있고 배차간격이 비교적 길다. 또한 2017년 12월 이후 4량에서 6량으로 증가함에 따라 혼잡도가 약간 감소하였고 그에 대한 정확한 혼잡도는 나와 있지 않기 때문에 다른 호선들과 비교하기 어렵다고 판단하여 분석에서 제외하였다. 그림 1은 승 하차 인원 상위 10위의 시간별 혼잡도 그래프를 나타낸다.

OTNBBE_2024_v24n4_183_3_f0001.png 이미지

그림 1. 지하철 상위 10위 시간별 혼잡도

Fig. 1. Top 10 Subway Congestion Levels Over Time

위 그래프를 살펴보면 예상대로 출퇴근 시간으로 보이는 오전과 저녁 시간대의 혼잡도가 높고 점심 시간대는 비교적 한산한 것을 알 수 있다. 오전에는 전체적으로 6, 7시부터 조금씩 증가해 8시에 최고점을 찍으며 9시쯤 줄어든다. 그리고 오후 시간대에는 오후 5시부터 조금씩 증가해 오후 6시에 오후 시간대 중 가장 높은 시간대를 찍고 내려가기 시작한다. 그리고 의아하게도 다시 밤 10시부터 증가하기 시작한다. 그림 2의 대중교통 이용 유동인구와 그림 3의 권역별 통행목적을 통해 시간대별 혼잡도가 큰 편차를 보이는 이유를 알 수 있다.

OTNBBE_2024_v24n4_183_3_f0002.png 이미지

그림 2. 대중교통 이용 유동인구

Fig. 2. Floating Population Using Public Transportation

OTNBBE_2024_v24n4_183_3_f0003.png 이미지

그림 3. 권역별 통행목적

Fig. 3. Purpose of Passage by Region

즉, 그림 1의 오전 8시에 지하철 혼잡도가 높은 것은 업무 및 출근으로 인한 유동인구가 많음에 따라 기인된 결과라고 할 수 있다. 이와 같은 맥락으로, 그림 2에서 저녁 6시 이후에도 유동인구가 많음을 확인할 수 있고, 그림 3에서도 퇴근 목적의 유동인구 비율이 존재하며, 그림 1에서도 높은 혼잡도를 보이고 있기 때문에, 이 시간대에 주로 퇴근 및 귀가로 인한 유동인구가 많음을 알 수 있다. 지하철 혼잡도가 높은 역들이 소재한 지역구들의 주간 상주인구 비율도 대체적으로 높게 나타난다. 그림 4를 참고하면, 주간 상주인구 비율은 전체 구 평균이 120.1이지만, 강남역, 삼성역, 선릉역 등을 포함해서 10개 역의 대부분이 평균치를 넘는 상주인구 비율을 가진 지역구에 소재하고 있다는 것을 알 수 있다.

OTNBBE_2024_v24n4_183_4_f0001.png 이미지

그림 4. 혼잡도 상위 10위 주간(야간) 상주인구

Fig. 4. Top 10 Congestion Levels of Daytime Resident Population

그림 5는 혼잡도가 높았던 10개 역 중 승하차 인원이 가장 많았던 강남역, 홍대입구역, 잠실역의 주변 업체의 업종을 조사한 결과를 의미한다. 강남역이 소재한 강남구에는 음식점과 경영컨설트업, 홍대입구역이 소재한 마포구에는 음식점과 주점이 많은 것으로 나타났는데, 주로 두 지역 모두 맛집이나 술집 등의 먹거리를 찾기 위해 방문하면서 유동인구가 많은 것으로 보여지며 강남의 경우 경영업체가 높은 비율을 차지하는 것으로 보아 직장인들의 출퇴근 상의 이유로 유동인구가 높은 것으로 보인다. 그리고 이 두 지역과는 다르게 예외적으로 잠실역은 업체가 적은 편이었는데, 대신 잠실역에는 롯데월드가 존재하기 때문에 이곳을 방문하고자 하는 방문객들이 주요 유동인구로 보인다.

OTNBBE_2024_v24n4_183_4_f0002.png 이미지

그림 5. 혼잡도 상위 3위 주변 시설 분포표

Fig. 5. Top 10 Congestion Levels of Ambient Facilities Distribution

가장 먼저 생각할 수 있는 대책방안으로 버스의 배차 시간을 조정하는 방법이 있다. 그림 6을 참고하였을 때, 지하철과 버스는 분담률을 38%, 특히 버스의 분담률은 26.9%를 담당하고 있다. 하지만, 최근 광역버스의 배차시간이 30-40분으로 매우 길어서 버스 승차를 포기하는 승객이 늘고 있다고 전하고 있다. 하지만, 단순히 버스의 배차시간만 줄여서 더 많은 버스가 다니게 하기에는 한계가 있다. 자가용 운용으로 인한 교통체증이 큰 걸림돌이다. 실제로 그림 6의 승용차 분담률도 2010년에 60.4%, 2016년에 61.8%로 점점 늘고 있다. 정부 차원에서 대중교통 활성화 캠페인을 하고 있지만, 다수의 사람이 이용하기 때문에 특히 출/퇴근 시간대에는 많은 불편함을 초래하는 것을 피할 수 없다. 결국, 버스, 택시 등의 대중교통보다 승용차가 많은 실정이기에 버스의 운영 대수를 증설하면 지상의 교통체증이 더욱 가중될 수밖에 없다. 버스전용 차로가 있긴 하지만, 그림 7(각 도시별로 왼쪽이 버스전용차로, 오른쪽이 전체 도로)를 참고하면 현재 서울시뿐만 아니라 다른 지역에도 모든 차로에 전용차로가 있는 것은 아닌 데다, 심지어 버스전용차로가 아예 없는(왼쪽 수치가 0인) 도시도 있기 때문이다. 따라서 버스의 배차시간 조정 외에도 추가적인 대책이 필요하다.

OTNBBE_2024_v24n4_183_4_f0003.png 이미지

그림 6. 전국 여객 통행수단 통행량 및 분담률(%) 변화

Fig. 6. Changes in Passenger Traffic Volume and Share Ratio (%) Across the Country

OTNBBE_2024_v24n4_183_4_f0004.png 이미지

그림 7. 각 도시 도로 및 버스전용차로 비율

Fig. 7. Percentage of Urban Roads and Bus Lanes

그동안 우리는 흔히 “대중교통”이라고 하면 지하철, 버스, 택시를 주로 생각해왔다. 하지만 대중교통에는 대중들이 이용할 수 있는 교통수단이면 대중교통이 될 수 있음을 의미한다. 본 논문에서는 지하철, 버스, 택시 외의 다른 대중교통에 대해서도 언급하고자 한다. 현재 지하철의 형태는 6량, 8량, 10량 전기철도가 기본적으로 운영되고 있다. 하지만 이 외에도 의정부경전철, 우이신설선, 대구도시철도 3호선 등의 경우 자기부상열차 및 모노레일이 운영 중에 있다. 별도의 교량을 설치해서 운영하기 때문에 지상의 교통량에 영향을 주지 않아 교통문제를 해결하는 데에 가장 효율적인 방법 중 하나로 알려져 있다. 유동인구를 감안하여 다른 시간대에 전철을 이용하거나, 혼잡도가 높은 탑승 위치를 피하는 것도 하나의 대책방안이 될 수 있다. 이를 유도하기 위해 지하철마다 지하철 혼잡도를 계산할 수 있는 센서 혹은 시스템 등을 부착하여 지하철을 이용하는 승객들이 휴대폰 애플리케이션 혹은 역사에서 혼잡도를 확인할 수 있게 하면 될 것이다.

버스 종류는 광역버스, 일반(지선/간선) 버스, 시내버스 등이 있다. 시내버스의 경우 광역버스나 일반 버스에 비해 배차시간이 짧지만, 지하철은 장거리를 빠르게 이동한다는 것을 주요 목적으로 하기 때문에 광역버스의 배차시간을 조절하는 것이 지하철 혼잡도를 낮추는 데에 더 효과적일 것으로 판단된다. 광역버스의 배차시간이 조절되어 더 많은 광역버스가 통행할 수 있게 된다면 굳이 버스를 포기하지 않고도 버스를 이용하는 승객들이 많아질 것이다. 또한, 버스를 포기함에 따라 자신의 승용차를 이용하는 시민들 또한 줄어들 것이다. 적절한 노선 경전철의 증대 또한 지하철 혼잡도를 낮추는 데에 큰 기여를 할 것으로 기대된다. 해외의 여러 사례 및 우이신설선 등 다른 경전철 노선들의 사례를 보았을 때 지하철 혼잡도를 줄이면서 지상의 교통량에 영향을 주지 않는 가장 효율적인 방법일 것이다. 특히, 본 논문에서 언급한 10개 역사를 포함하여 혼잡도가 가장 높은 구역들을 선정하여 경전철로의 환승이 이루어질 수 있게 노선을 구성한다면, 지하철 혼잡도뿐만 아니라 출/퇴근 시간대 교통체증도 줄어드는 효과를 볼 수 있을 것이다. 마지막으로 다른 대응방안들과 함께 지하철 혼잡도를 탑승 전에 미리 알 수 있는 시스템이 있다면, 굳이 지하철을 이용하려 하지 않고 다른 수단으로 이동하려는 사람들도 생기게 되어 지하철 혼잡도를 낮추는 데에 효율적인 면에서 시너지를 낼 수 있다고 예상된다.

Ⅳ. 결론

본 논문에서는 R 프로그램을 이용하여 강남, 잠실, 홍대입구, 신림, 고속터미널, 삼성, 구로디지털단지, 신도림, 서울역, 선릉역이 가장 혼잡도가 높은 것을 확인하였으며, 그리고 이 역사들 주변에 있는 여러 업체들로 인해 유동인구가 매우 높은 것도 확인하였고, 마지막으로 이 높은 혼잡도를 줄이기 위해서 버스 배차 증설, 경전철 개통, 지하철 혼잡도 알림 등의 대응방안을 제시하였다. 표 1은 지하철 혼잡도 문제 및 대책 방안을 표로 정리한 것이다.

표 1. 지하철 혼잡도 문제 및 대책방안

Table 1. Subway Congestion Issues and Countermeasures

OTNBBE_2024_v24n4_183_5_t0001.png 이미지

본 논문을 통해 도출된 대책방안들을 실행하였을 때보다 더 효율적이고 쾌적한 지하철 운영이 가능할 것으로 예상된다. 특히, 대중교통의 특성상 많은 사람들이 몰리게 되면 그만큼 불쾌감도 올라가면서 승용차를 이용하면서 교통체증이 증가하는 등의 다른 문제들도 야기하기 때문에, 지하철의 혼잡도를 낮추는 것이 교통운영 면에서 중요성이 높다고 예상된다.

References

  1. Seo. J. O. "Effectiveness of Urban Planning ; Comparative Analysis between Public Transit Use Patterns and Non-Residential Zoning in Seoul", Journal of The Urban Design Insitute of Korea, Vol. 20, No. 3, pp. 45-54, 2019. DOI: https://doi.org/10.38195/judik.2019.06.20.3.45
  2. Kim. K. W. "An Exploratory Study on Improvement Method of the Subway Congestion Based Big Data Convergence", Journal of Digital Convergence, Vol. 13, No. 2, pp. 35-42, 2015. DOI: https://doi.org/10.14400/JDC.2015.13.2.35
  3. Kang. Y. K. "A Study on the Factors Affecting Crowding Degree in the Subway Train Considering the Seoul Metropolitan Subway Network and the Land Use of Its Catchment Area", Journal of Korea Planning Association, Vol. 49, No. 1, pp. 203-218, 2014.
  4. Lee. K. Y. "Construction of Knowledge Base for The Utilization of Big Data in Public Domain", Communications of the Korean Institute of Information Scientists and Engineers, Vol. 30, No. 6, pp. 40-46, 2012.
  5. Jeon. J. H. "Designing a Crime-Prevention System by Converging Big Data and IoT", Journal of Internet Computing and Services, Vol. 17, No. 3, pp. 115-128, 2016.
  6. Kim. J. S. "Big Data Analytics Methodology for Customer-oriented Services in Ubiquitous Environment", Journal of Korean Society Of Communication Design, Vol. 19, pp. 131-144, 2012.
  7. Shin. D. J. "Bigdata-based Anomaly Detection Technology in Web Services Environment", Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, Vol. 8, No. 4, pp. 231-250, 2018. DOI: https://doi.org/10.35873/ajmahs.2018.8.4.021
  8. Kim. M. H. "Design of Congestion Standardization System Based on IoT", Journal of the Korea Academia-Industrial Cooperation Society, Vol. 17, No. 5, pp. 74-79, 2016. DOI: https://doi.org/10.5762/KAIS.2016.17.5.74
  9. Kim. J. S. "Subway Congestion Prediction and Recommendation System using Big Data Analysis", Journal of Digital Convergence, Vol. 14, No. 11, pp. 289-295, 2016. DOI: https://doi.org/10.14400/JDC.2016.14.11.289