DOI QR코드

DOI QR Code

Relationship Analysis Between CCTV Installation and Crime Rates using Big Data

빅데이터를 이용한 CCTV 설치와 범죄율 간의 연관성 분석

  • 김정준 (안양대학교 소프트웨어학과) ;
  • 황승연 (안양대학교 컴퓨터공학과) ;
  • 장석우 (안양대학교 소프트웨어학과)
  • Received : 2024.06.11
  • Accepted : 2024.10.04
  • Published : 2024.10.31

Abstract

Recently, CCTV cameras have been installed not only in crowded streets but also in less frequently traveled alleyways. This is because CCTV increases the arrest rate. The arrest rate directly affects the crime rate, as potential criminals tend to avoid areas with high arrest rates. Therefore, this paper collects public data on CCTV installation locations, arrest rates, and crime rates in various regions, stores the collected data using the Hadoop big data system, and refines and processes the data using appropriate tools. Subsequently, R programming is employed to analyze and visualize the relationship between the number of CCTV installations and crime rates. By leveraging big data correlation analysis techniques, this study evaluates the effectiveness of CCTV installations.

최근 CCTV가 사람들이 많은 거리뿐만 아니라 사람들이 자주 안 다니는 골목길에도 설치되고 있다. 이는 CCTV로 인해 검거율을 증가시키고 있기 때문이다. 특히 검거율은 범죄율과 직접적인 영향을 미치는데, 검거율이 높은 장소일수록 잠재적 범죄자들이 그 장소를 피하기 때문이다. 따라서 본 논문에서는 공공데이터를 활용하여 CCTV 설치 지역, 각 지역의 검거율과 범죄율을 수집하고 빅데이터 시스템의 Hadoop을 이용하여 수집된 데이터를 저장하고, 처리 도구를 이용하여 데이터를 정제·처리 후, R 프로그래밍을 사용하여 CCTV 설치 개수와 범죄율 간의 연관성을 분석·시각화하는 빅데이터를 접목한 연관성 분석 기술을 사용하여 CCTV의 설치 효과를 분석하였다.

Keywords

Ⅰ. 서론

CCTV의 용도는 대표적으로 방범, 감시, 화재 예방 등 안전을 위해 설치된다. 이런 역할을 하는 CCTV는 2014년 공공데이터를 기준으로 현재까지 설치량이 꾸준하게 증가하고 있다. 이에 따라 초상권 및 사생활 침해에 따른 인권침해를 주장하며 CCTV가 실제로 범죄 예방에 도움이 되지 않는다고 생각하는 의견과 CCTV 증가에 따라서 범죄가 예방되며 검거율이 높아져 CCTV를 설치해야 한다는 의견이 나누어지고 있다. 실제로 CCTV 설치 증가율과 범죄율, 검거율을 비교해 실질적으로 어떤 상관관계를 이루고 있는지를 알아보고자 한다. 연구는 공공 데이터 포털에서 제공하는 공공데이터를 바탕으로 2014년부터 현재까지 전국 CCTV 설치량, 전국 범죄율, 전국 검거율 데이터를 빅데이터를 활용해 진행되었다. 이 연구 결과를 토대로 어린이 납치, 아동 성범죄, 어린이 보호구역 교통사고 등 어린이 보호구역에서 보호받지 못하는 상황을 방지하기 위해 어린이 보호구역 CCTV 설치 증가에 대한 당위성을 제시하려고 한다[1-2].

Ⅱ. 관련 기술

네트워크에 연결된 CCTV 기술은 빅데이터를 기반으로 하며 이를 지능형 CCTV라고 한다. 이를 통해 영상처리, 정보 수집을 하여 사람의 얼굴, 차량번호 식별, 산불과 같은 재난들을 구별 및 식별한다. 이러한 기술들을 분석해보았을 때 빅데이터는 기존 데이터베이스 관리 도구의 능력을 넘어서는 대량(수십 테라바이트)의 정형, 심지어 비정형 형태의 데이터까지 가치를 추출하고 결과를 분석하는 기술이다[3]. 이러한 빅데이터는 다양한 종류의 대규모 데이터에 대한 생성, 수집, 분석, 표현을 그 특징으로 하는 빅데이터 기술의 발전은 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동케 하고 개인화된 현대 사회 구성원마다 맞춤형 정보를 제공, 관리, 분석 가능케 하며 과거에는 불가능했던 기술을 실현시키기도 한다[4]. 또 이러한 데이터들을 분석과 처리하기 위한 기술로는 hdfs, Python, R이 있다.

hdfs는 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술이다. 하둡은 수천대의 분산된 x86 장비에 대용량 파일을 저장할 수 있는 기능을 제공하는 분산파일 시스템과 저장된 파일 데이터를 분산된 서버의 CPU와 메모리 자원을 이용해 쉽고 빠르게 분석할 수 있는 컴퓨팅 플랫폼인 맵리듀스로 구성돼 있다[5].

Python은 대용량 데이터 집합을 분석하는 프로그래밍 언어로 대용량 데이터를 분석하기 쉽도록 처리해준다. 다양한 라이브러리 (pandas, numpy 등)을 사용하여 데이터를 처리하고 matplotlib 라이브러리를 사용하여 데이터를 시각화하는 것도 가능하다. 첫 번째로 pandas는 Python에서 사용하는 데이터 분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되고 좀 더 안정적으로 대용량의 데이터들을 처리하는 라이브러리입니다. 두 번째로 numpy는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 Python의 라이브러리이다[6].

R은 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경이다[7]. 뉴질랜드 오클랜드 대학의 로버트 젠틀맨(Robert Gentleman)과 로스 이하카 (Ross Ihaka)에 의해 시작되어 현재는 R 코어 팀이 개발하고 있다[8]. R은 GPL 하에 배포되는 S 프로그래밍 언어의 구현으로 GNU S라고도 한다. R은 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이해 통계 소프트웨어 개발에 많이 쓰이고 있다[9].

Ⅲ. 본론

본 논문의 목적은 CCTV의 설치 비율이 범죄율과 검거율에 어떠한 영향을 끼치고 있는지를 분석하고자 한다. 연구의 목적을 달성하기 위해 다양한 공공데이터를 Python을 사용하여 데이터를 처리한 뒤 R 언어로 시각화하여 분석하였다. 전국의 CCTV 설치 비율, 범죄율, 검거율에 대한 공공데이터를 사용하였고 여기서 Python을 사용하여 공공데이터 csv 파일을 정제 및 가공하였다. 먼저 CCTV의 위치와 연도를 분석하기 쉽게 데이터를 처리하였다. 두 번째로 CCTV의 위치와 년도 별 설치에 따른 검거율, 범죄율의 영향을 분석하기 위해 어린이보호구역의 위치 데이터인 school.csv 파일을 R로 시각화하였다. 세 번째로 R 언어를 사용하여 각 데이터를 시각화하여 분석한 내용이다.

ggplot2 라이브러리에서 제공하는 ggplot 함수로 축을 만들고 geom_bar 함수를 사용하여 그림 1과 같은 전국 각 지역의 연도별 CCTV 설치량을 막대 그래프로 시각화하였다. 전국 각 지역의 연도별 CCTV 설치량에 관한 데이터는 공공정보 포털에서 제공하는 데이터를 사용하였다. 그림 1을 통해 알 수 있는 것은 CCTV 설치량은 매년 꾸준하게 증가하여 2017년에는 가장 많은 양이 설치된 것을 알 수 있다. 이것을 통해서 전국 CCTV 총량은 계속 증가하는 것을 볼 수 있다.

OTNBBE_2024_v24n5_183_2_f0001.png 이미지

그림 1. 지역의 연도별 CCTV 설치량

Fig. 1. Amount of CCTV Installations per Year

먼저 CCTV 총량 증가와 범죄율 감소의 상관관계가 있는지 확인하기 위하여 전국 지역별 범죄율을 시각화하였다. 전국 지역별 범죄율에 관한 데이터는 공공정보 포털사이트에서 제공하는 데이터를 사용하였다.

ggplot2 라이브러리에서 제공하는 ggplot 함수로 축을 만들고 geom_line 함수를 사용하여 그림 2와 같이 표현하였다. 그림 2를 보면 연도별로 전국 전체의 범죄율이 소폭 감소하는 것을 볼 수 있다. 2014년에서 2015년 사이에서 유의미한 감소 폭을 보여주고 있다. 반면 2015년에서 2016년과 2017년까지의 변동은 소폭 증가와 소폭감소를 나타내고 있는 것을 볼 수 있다. 그림 2를 통해서 CCTV 총량 증가에 따라서 범죄율이 감소한다고 볼 수 있다.

OTNBBE_2024_v24n5_183_3_f0001.png 이미지

그림 2. 지역별 범죄율

Fig. 2. Crime Rate by Region

다음으로는 CCTV 총량 증가에 따른 전국 연도별 검거율을 알아보기 위해 전국 범죄별 검거율을 시각화하였다. 전국 범죄별 검거율에 관한 데이터는 공공정보 포털 사이트에서 제공하는 데이터를 사용하였다. ggplot2 라이브러리에서 제공하는 ggplot 함수로 축을 만들고 geom_line 함수를 사용하여 그림3과 같이 표현하였다. 그림 3을 보면 연도별로 전국 범죄별 검거율이 선형적으로 증가하고 있는 것을 볼 수 있다. 그림 3을 통해CCTV 총량 증가와 검거율 증가에 비례하는 상관관계를 알 수 있다. 즉 CCTV 총량이 증가할수록 검거율이 상승하는 것을 알 수 있다.

OTNBBE_2024_v24n5_183_3_f0002.png 이미지

그림 3. 연도별 범죄별 검거율

Fig. 3. Annual Arrest Rate by Crime

OTNBBE_2024_v24n5_183_3_f0003.png 이미지

그림 4. 연도별 및 범죄별 범죄율

Fig. 4. Crime Rate by Year and Crime

그림 1, 그림 2, 그림 3을 보면 CCTV 총량의 증가에 검거율은 비례하고 범죄율은 반비례하는 것을 볼 수 있다. 다시 말해서 CCTV 총량이 증가하면 검거율은 증가하고 범죄율은 감소하는 효과가 있다고 말할 수 있다. 하지만 범죄 요소마다 CCTV가 많은 효과를 발휘하여 큰 감소가 되는 것이 있고 CCTV가 설치되어도 많은 감소가 되지 않는 범죄 요소가 있다는 것을 확인하였다.

감소비율이 큰 5가지 범죄요소를 따로 R로 시각화했을 때 특히 특수강도, 준강도가 비중이 큰 것을 확인하였다.

OTNBBE_2024_v24n5_183_4_f0001.png 이미지

그림 5. 연도별 검거율

Fig. 5. Annual Arrest Rate

OTNBBE_2024_v24n5_183_4_f0002.png 이미지

그림 6. 연도별 및 지역별 강도 범죄율

Fig. 6. Annual and Regional Robbery Rates

검거율 또한 특수강도, 준강도가 큰 폭으로 증가하는 것을 확인하였고 이는 CCTV가 강도 범죄율에서 많은 효과가 있다는 결론을 내릴 수 있었다.

강도 범죄율만 연도별로 시각화를 하였을 때 경상도, 광주, 울산 지역이 범죄율이 지속적으로 감소하지 않았고 이 지역들은 CCTV를 추가적인 설치가 필요하다.

이제 전국의 어린이 보호구역 CCTV 설치 비율과 전국 지역별 인원수 비율을 살펴볼 것이다. 먼저 그림 7의 워드 클라우드를 통해 현재 기준 범죄에 대한 가장 키워드 이슈가 무엇인지 보여준다. 아동, 성범죄자, 조두순이 대표적이다. 이에 따라 어린이 보호구역 CCTV 설치 비율에 대해 분석해 볼 것이다.

OTNBBE_2024_v24n5_183_4_f0003.png 이미지

그림 7. 범죄 키워드 워드 클라우드

Fig. 7. Crime keyword Word Cloud

먼저 학교 어린이 보호구역 CCTV 설치량에 관한 데이터시각화하기 위해 공공정보 포털사이트에서 제공하는 데이터를 사용하였다. 그리고 plotrix 라이브러리의 pie 함수를 사용하여 지역별 어린이 보호구역 CCTV 현황을 시각화하여 그림 8과 같이 나타내었다.

OTNBBE_2024_v24n5_183_4_f0004.png 이미지

그림 8. 지역별 어린이 보호구역 CCTV 현황

Fig. 8. Current Status of CCTV in Child Protection Zones by Region

그림 8과 그림 9를 비교하면 서울, 인천, 경기, 부산, 대구 등 인원수가 많은 지역이 인원수 비율은 높으나 CCTV 비율이 적은 것을 볼 수 있다.

OTNBBE_2024_v24n5_183_5_f0001.png 이미지

그림 9. 지역별 인원수 비율

Fig. 9. Percentage of Number of People by Region

Ⅳ. 분석 결과

1. CCTV 총량 증가와 범죄율의 상관관계

본 연구에서 시각화를 통하여 분석한 데이터들을 확인해 보면 그림 1과 그림 2를 통해서 CCTV 총량 증가에 따라서 범죄율이 감소하는 것을 볼 수 있다. 즉 CCTV 총량이 증가하면 범죄율이 감소하며 CCTV 총량 증가가 범죄율에 영향을 미치는 것을 알 수 있다.

2. CCTV 총량 증가와 검거율의 상관관계

본문에서 시각화를 통해 분석한 그림들을 확인해 보면 그림 1과 그림 3을 통해서 CCTV 총량 증가에 따라서 검거율이 증가하는 것을 알 수 있다. 즉 CCTV 총량이 증가하면 검거율이 증가하며 CCTV 총량 증가가 검거율에 영향을 미치는 것을 알 수 있다.

3. 범죄율과 검거율에 대한 상관관계

그림 1, 2, 3을 통합적으로 볼 때 추가적인 상관관계를 알 수 있는데, CCTV로 인한 검거율 증가는 곧 범죄에 대한 이성 억지력을 높여주어 범죄율 감소에 영향을 주는 것을 알 수 있다.

4. 범죄 요소중 강도범죄와 CCTV의 상관관계

CCTV가 범죄율 감소에 영향을 미치지 않는 범죄요소들이 있고 큰 영향을 미치는 범죄요소가 있다. 특히 감도 범죄가 CCTV에 따른 감소비율이 높았는데 이를 범죄율과 검거율을 시각화로 다른 범죄 요소의 비율과 비교하여 강도범죄가 가장 큰 영향을 끼친다는 분석 결과를 도출해내었고 지역별 강도범죄만을 시각화하여 다른 지역과 비교하여 추가적인 CCTV가 필요한 지역(경상도, 광주, 울산)을 제시하였다.

5. 지역별 인원 비율과 어린이 보호구역 CCTV 비율의 차이

그림 4와 그림 5를 통해서 서울, 인천, 경기, 대구, 부산 등 지역에서 인구수 비율보다 어린이 보호구역 CCTV 비율이 상대적으로 낮은 것을 확인했다. 추가적인 설치가 필요하다는 분석 결과를 도출하였다.

Ⅴ. 결론

본 논문에서는 KOSIS 국가통계포탈에서 제공하는 데이터를 전국 주요 도시를 중심으로 최근 정부가 실시한 CCTV 설치 시기, 위치와 범죄율과 검거율의 연도별 지역별 공공데이터를 비교하여 분석하면 CCTV 설치가 범죄율과 검거율에 큰 영향을 미칠 거라고 판단하였다. CCTV 설치에 따라 검거율은 높아지고 범죄율은 낮아질거라고 일반적으로 생각한다. 하지만 CCTV가 범죄 가능성에 있어 완전히 영향을 미치는 것은 아니었다. 하지만 CCTV를 설치를 통해 검거율은 대폭 증가했으며 이로 인한 범죄억지력 증가 효과를 낼 수 있다는 것을 알 수 있으며 2014년도에는 큰 폭으로 범죄율이 감소하였고 꾸준하게 감소하고 잘 유지되고 있다는 것을 빅데이터 처리 과정을 통해 확인하였다. 추가로 본 논문에서는 범죄 요소들 중에서 강도범죄가 CCTV의 많은 영향을 받는다는것을 분석하였고 지역별 강도비율을 비교하며 추가적인 CCTV 설치해야 하는 지역을 제시하였다. 또한, 어린이 관련 범죄에 대한 분석을 하였는데 인구 대비 CCTV 비율이 아직은 미흡한 것을 알 수 있다. 현재 범죄율 KOSIS 국가 통계포탈에서 어린이 보호구역의 CCTV 설치 개수를 파악하여 전체인구 대비 CCTV가 더 필요한 지역을 찾아내었다. 따라서 분석 결과에 나온 지역에 CCTV 추가적인 설치가 필요하다는 것을 알 수 있다. 그에 따른 부족한 지역에 CCTV가 추가로 설치된다면 어린이 보호구역에서의 범죄율 감소로 사전의 예방할 수 있는 확률이 높아질 것이라고 기대된다.

References

  1. Hyungjin Lim, Julak Lee,, "The Seasonal Crime Prevention Effects of Open-street CCTV", The Korean Association of Police Science Review (KAPS), Vol. 16, No. 2, pp. 99-120, 2014.
  2. Eung-Ryul Choi, Yeonsoo Kim, "The Effectiveness of the Closed Circuit TVs (CCTVs) on the Crime Prevention", Korean Journal of Public Safety and Criminal Justice, Vol. 16, No. 1, pp. 143-186, 2007.
  3. Joo, J. H., "The Improvement Plans of Legal Framework and Regulations of IoT Healthcare Service", Kangwon Law Review, Vol. 50, pp. 801-837, 2017. DOI: http://doi.org/10.18215/kwlr.2017.50..801
  4. Yoon Su Jeong, Kun-Hee Han, "Service Management Scheme Using Security Identification Information Adopt to Big Data Environment", Journal of Digital Convergence, Vol. 11, No. 12, pp. 393-399, 2013. DOI: http://doi.org/10.14400/JDPM.2013.11.12.393
  5. Kwang-Min Ahn, Jong-Yoon Lee, DongMin Yang, Bong-Hwan Lee, "Design and Implementation of a Hadoop-based Efficient Security Log Analysis System", Journal of the Korea Institute of Information and Communication Engineering, Vol. 19, No. 8, pp. 1797-1804, 2015. DOI: http://doi.org/10.6109/jkiice.2015.19.8.1797
  6. Sang-Yong Choi, Eun-Young Cheon, Dae-Sik Ko, "Analysis of the Network Traffic Collection Performance Using Suricata", Journal of Korean Institute of Information Technology, Vol. 17, No. 8, pp. 59-66, 2019. DOI: http://doi.org/10.14801/jkiit.2019.17.8.59
  7. Yang-Ui Lim, Kang-Chul Kim, "Methods to Propel Tourism of Yeosu City Using Big Data", The Journal of the Korea Institute of Electronic Communication Sciences, Vol. 15, No. 4, pp. 739-746, 2020.
  8. Min-Kwan Kim, Yong Lee, Chang Hee Han, "Analysis of Consulting Research Trends Using Topic Modeling", Journal of Korean Society of Industrial and Systems Engineering, Vol. 40, No. 4, pp. 46-54, 2017.
  9. Jong-Ki Lee., "A Case Study of R Analysis of Big Data in Seoul Special City Expenditure Settlement Data", The Journal of Business Education, Vol. 29, No. 4, pp. 57-74, 2015. DOI: http://doi.org/10.34274/krabe.2015.29.4.003