• 제목/요약/키워드: 데이터 집계

검색결과 215건 처리시간 0.026초

경찰 대응 능력 강화를 위한 마약 범죄 검거 수와 언론보도량의 시계열 분석 (Time Series Analysis of the Correlation Between the Number of Drug Crime Arrests and Media Coverage for Enhancing Police Response to Drug Crimes)

  • 이정우;노승국
    • 산업융합연구
    • /
    • 제21권6호
    • /
    • pp.13-21
    • /
    • 2023
  • 본 연구의 목적은 마약 범죄와 관련된 언론보도량과 실제 마약사범 검거 건수 간의 관계를 탐구하고, 이 관계가 경찰이 마약 범죄 대응 정책을 수립하는 데 있어 시사하는 바를 확인하는 것이다. 이를 위해, 2001년부터 2022년까지의 국내 온라인 언론보도 데이터 50,355건과 경찰청이 집계한 마약사범 검거 건수 데이터를 수집하고 분석하였다. 분석결과, 마약 범죄 온라인 언론보도량과 실제 마약사범 검거 건수 간에는 유의미한 인과관계가 있음을 확인할 수 있었다. 이 관계는 지배적 이슈의 존재 및 유명 사건 관련 여부에 영향을 받는데, 언론보도량은 마약 범죄 검거 수 외 대중적 관심에도 영향을 받는 것으로 판단되었다. 이러한 결과를 통해 경찰은 국민의 신뢰를 얻기 위하여 범죄 관련 언론보도량을 모니터링하고, 국민적 관심을 받는 범죄에 대한 치안역량을 강화해야 한다고 제안하였다.

OpenCV를 활용한 고객 출입 관리시스템 설계 및 구현 (Design and Implementation of Customer access management system utilized OpenCV)

  • 홍두표;김승범;유연준;이재훈;홍석민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1101-1104
    • /
    • 2021
  • 최근 COVID-19(코로나 바이러스 감염증) 확산에 따라 다양한 분야에서 힘든 상황이 이어지고 있다. 중앙 재난 안전 대책본부에 따르면 지난 2월 한 달간 코로나 안전신고는 약 2만 5천 건의 방역수칙 위반 신고가 들어온 것으로 집계됐다. 이에 따라 음식점 및 매장은 QR코드. 수기 작성을 통한 동선 체크, 온도 검사 등 코로나 확산을 방지하기 위한 방법을 시행하고 있지만 이는 단지 코로나 확산 방지를 위한 대책 일뿐 소상공인의 매장 운영이나 안정적인 영업 유지 등 직접적인 영향을 줄 수 없다. 이에 본 논문은 OpenCV를 활용한 고객 출입 관리 시스템을 제안한다. 본 시스템은 OpenCV 영상처리기술을 활용하여 매장을 방문하는 고객의 나이, 성별을 수집하여 주요 고객층 분석, 출입 현황 및 이용 시간을 파악한다. 본 시스템은 코로나 확진자 동선 파악을 위한 역학조사와 소상공인의 효율적인 매장 운영 시간을 분석하여 '코로나 확산 방지', '소상공인 매출 증가'의 기대 효과를 얻을 수 있다. 향후, 제안하는 기법의 실질적인 검증을 위해 실제 매장 환경에서의 테스트가 필요하다.

사회학 분야의 연구데이터 특성과 지적구조 규명에 관한 연구 (An Investigation on Characteristics and Intellectual Structure of Sociology by Analyzing Cited Data)

  • 최형욱;정은경
    • 정보관리학회지
    • /
    • 제34권3호
    • /
    • pp.109-124
    • /
    • 2017
  • 여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 'Sociology'로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 'Sociology'로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.

1인가구의 시공간적 분포 분석 - 부산시를 사례로 - (Spatio-Temporal Distribution Analysis of One-Person Household - The Case of Busan City -)

  • 유창주;남광우
    • 한국지리정보학회지
    • /
    • 제17권2호
    • /
    • pp.59-71
    • /
    • 2014
  • 현재 우리나라는 총 인구 감소 속에서도 1인가구는 꾸준히 증가하는 추세를 보이고 있다. 1인 가구의 증가는 사회적, 제도적인 관심사로 부각되고 있으며 이에 따라 1인가구의 증가로 인하여 주택수요의 변화뿐만이 아니라 사회적 약자, 독거노인가구 등 생활 취약계층을 위하여 국가적 차원에서 사회 경제적 대응을 해야 할 필요성이 대두되었다. 이에 본 연구에서는 부산시 1인가구의 분포를 알아보기 위해 센서스 자료를 이용하여 1인가구의 증가지역, 고밀지역, 다수지역 등을 중심으로 접근하였다. 2000년, 2005년, 2010년 각 년도별 시계열적 변화에 따른 공간적 분포에 초점을 두어 주택특성을 고려한 1인가구 밀집지역을 중심으로 대상지를 선정하고 정책적 효율성 차원에서 우선적으로 지원해야 할 밀집지역 선정을 위하여 부산의 6066개의 집계구 데이터를 활용하여 파악하였다. 그 결과 젊은층의 1인가구는 대학가, 오피스시설, 역세권 주변에 많이 분포하고 있었으며 중장년층의 1인가구는 부산의 원도심 지역과 산복도로 상에 많이 분포하고 있는 것으로 나타났다. 이러한 특성들을 종합하여 군집 분석을 실시한 결과 부산의 1인가구 밀집지는 4개의 유형으로 나눌 수 있었다. 이러한 연구는 향후 1인가구의 주택수요 증가 대응방안이나 소형주택공급정책 측면의 업무를 지원하는 기초자료로서의 활용을 기대한다.

개별차량 통행기반 고속도로 혼잡 속도 지표 연구 (Indicator of Motorway Traffic Congestion Speed Based On Individual Vehicular Trips)

  • 장현호;백준혁
    • 한국재난정보학회 논문집
    • /
    • 제17권3호
    • /
    • pp.589-599
    • /
    • 2021
  • 연구목적: 고속도로 구간의 소통상태 정보제공에 있어 신뢰성 있는 혼잡속도 지표는 핵심이다. 본 연구는 비집계 구간속도 자료를 이용하여 개별 고속도로 구간의 소통상태를 결정하기 위한 순응형 혼잡속도 지표를 제시하는데 그 목적이 있다. 연구방법: 교통류의 상태는 전형적으로 비혼잡 상태, 혼재 상태, 혼잡 상태로 구분된다. 개별 차량의 속도를 이용하여 교통류 상태를 계층화함으로써 도로구간별 혼잡속도 지표를 산정하는 방법론을 개발하였다. 도로구간별 혼잡속도는 혼재상태와 혼잡상태의 차량 속도분포를 이용하여 결정된다. 분석결과: 도로구간별 혼잡속도는 미국과 유럽의 혼잡속도 기준인 48.28 ~ 66.0 kp와 유사하게 분석되었다. 이는 도로구간별로 혼잡 경계속도가 다를 수 있음을 의미한다. 결론: 본 연구에서 제시된 방법론과 혼잡지표는 빅 데이터 시대의 고속도로 구간별 맞춤형 실시간 소통정보제공 및 교통혼잡 비용의 산정에 효율적으로 활용될 수 있을 것으로 기대된다.

도로 주행환경 분석을 위한 빅데이터 플랫폼 구축 정보기술 인프라 개발 (Development of Information Technology Infrastructures through Construction of Big Data Platform for Road Driving Environment Analysis)

  • 정인택;정규수
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.669-678
    • /
    • 2018
  • 본 연구는 차량센싱데이터, 공공데이터 등 다종의 빅데이터를 활용하여 주행환경 분석 플랫폼 구축을 위한 정보기술 인프라를 개발하였다. 정보기술 인프라는 H/W 기술과 S/W 기술로 구분할 수 있다. 먼저, H/W 기술은 빅데이터 분산 처리를 위한 병렬처리 구조의 소형 플랫폼 서버를 개발하였다. 해당 서버는 1대의 마스터 노드와 9대의 슬래이브 노드로 구성하였으며, H/W 결함에 따른 데이터 유실을 막기 위하여 클러스터 기반 H/W 구성으로 설계하였다. 다음으로 S/W 기술은 빅데이터 수집 및 저장, 가공 및 분석, 정보시각화를 위한 각각의 프로그램을 개발하였다. 수집 S/W의 경우, 실시간 데이터는 카프카와 플럼으로 비실시간 데이터는 스쿱을 이용하여 수집 인터페이스를 개발하였다. 저장 S/W는 데이터의 활용 용도에 따라 하둡 분산파일시스템과 카산드라 DB로 구분하여 저장하는 인터페이스를 개발하였다. 가공 S/W는 그리드 인덱스 기법을 적용하여 수집데이터의 공간 단위 매칭과 시간간격 보간 및 집계를 위한 프로그램을 개발하였다. 분석 S/W는 개발 알고리즘의 탐재 및 평가, 장래 주행환경 예측모형 개발을 위하여 제플린 노트북 기반의 분석 도구를 개발하였다. 마지막으로 정보시각화 S/W는 다양한 주행환경 정보제공 및 시각화를 위하여 지오서버 기반의 웹 GIS 엔진 프로그램을 개발하였다. 성능평가는 개발서버의 메모리 용량과 코어개수에 따른 연산 테스트를 수행하였으며, 타 기관의 클라우드 컴퓨팅과도 연산성능을 비교하였다. 그 결과, 개발 서버에 대한 최적의 익스큐터 개수, 메모리 용량과 코어 개수를 도출하였으며, 개발 서버는 타 시스템 보다 연산성능이 우수한 것으로 나타났다.

실시간 SNS 데이터를 위한 Storm 기반 동적 태그 클라우드 (Storm-Based Dynamic Tag Cloud for Real-Time SNS Data)

  • 손시운;김다솔;이수정;길명선;문양세
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권6호
    • /
    • pp.309-314
    • /
    • 2017
  • 일반적으로 SNS (social network service) 데이터는 정형, 비정형 데이터가 섞여 빠르게 생성되는 빅데이터의 특성을 갖기 때문에 실시간 수집/저장/분석에 많은 어려움이 있다. 본 논문에서는 이러한 SNS 데이터의 분석에 활용할 수 있는 Apache Storm 기반 실시간 동적 데이터 시각화 기술을 제안한다. Storm은 대표적인 빅데이터 기술 중 하나로, 실시간으로 수집되는 데이터를 분산 환경에서 처리 및 분석하는 소프트웨어 플랫폼이다. 본 논문은 Storm을 사용하여 빠르게 발생하는 트위터(Twitter) 데이터를 수집 및 집계하고, 태그 클라우드를 통해 그 결과를 동적으로 표현하고자 한다. 이를 위해, 사용자가 요구하는 키워드를 입력받고 해당 키워드를 통한 시각화 결과를 실시간으로 확인할 수 있는 웹 인터페이스를 설계 및 구현한다. 또한, 각각의 태그 클라우드 결과를 비교하여 올바로 시각화되었는지 확인한다. 본 연구를 통해, 사용자는 관심있는 주제가 SNS에서 어떻게 변화하고 있는지 직관적으로 판단할 수 있게 되며, 시각화 결과는 주제별 트렌드 분석, 고객 니즈 파악 등 다른 서비스에도 활용이 가능하다.

공간 빅데이터와 야간 위성영상을 활용한 도시 활력 평가: 대구시를 사례로 (Urban Vitality Assessment Using Spatial Big Data and Nighttime Light Satellite Image: A Case Study of Daegu)

  • 정시윤;전병운
    • 한국지리정보학회지
    • /
    • 제23권4호
    • /
    • pp.217-233
    • /
    • 2020
  • 본 연구는 공간 빅데이터, 공공 Wi-Fi AP와 야간 위성영상과 같은 새로운 지리 데이터를 활용하여 2018년 대구광역시의 도시 활력을 평가하였다. 새로운 지리 데이터는 다양한 시공간 스케일에서 도시민의 활동을 보다 직접적으로 파악하기 위하여 본 연구에서 사용되었다. 이동전화 데이터, 대중교통 스마트카드 데이터, 신용카드 데이터와 같은 세 가지 공간 빅데이터가 도시 활력의 사회적, 경제적 및 모빌리티 측면을 반영하기 위하여 사용되었다. 반면에, 공중 Wi-Fi AP와 야간 위성영상은 도시 활력의 가상적 및 물리적 측면을 고려하기 위하여 사용되었다. 다섯 개의 도시활력 지표들은 주성분 분석을 통해 통합되어 네 개의 시간대에서 집계구별 도시 활력 지수로 변환 되었다. 연구 결과에 의하면, 높은 도시 활력을 가진 다섯 개의 클러스터가 대구 도심, 대구은행 네거리와 범어역 네거리, 성서, 동대구역, 칠곡 3지구 주변에서 확인되었다. 또한, 도시 활력 지수는 같은 도시 공간상에서도 시간대별로 변한다는 것이 밝혀졌다. 본 연구는 도시 활력을 측정하기 위한 대리변수로 공간 빅데이터, 공공 Wi-Fi AP, 야간 위성영상을 통합하여 활용할 수 있는 가능성을 제시한다.

스마트카드 데이터를 활용한 대중교통 서비스 평가 (Evaluation of Transit Services based on Transit Smart Card Data)

  • 최명훈;엄진기;이준;박종훈
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2011년도 춘계학술대회 논문집
    • /
    • pp.1811-1825
    • /
    • 2011
  • 본 연구에서는 2009년 집계된 스마트카드 데이터를 활용하여 대중교통 서비스를 평가하였다. 평가항목으로는 한국교통연구원에서 제시한 '대중교통정책수립을 위한 교통카드자료 활용방안'과 미국의 대중 교통 매뉴얼인 'TCQSM(Transit Capacity and Quality of Service Manual)'을 참고하여 스마트카드 데이터로부터 서비스평가 항목으로 추출될 수 있는 정류장과 정류장의 재차인원(load factor), 승객 승 하차 인원에 따른 정차시간(dwell time), 통행시간과 거리 산출에 의한 속도(speed) 등 정량적인 항목들로 선정하였다. 사례분석 평가대상 버스노선은 서울역환승센터 정류장을 운행하는 지선버스 7024번 노선 중 승객이 가장 많은 시간대의 버스로 선정하였다. 평가결과 '이대부고~삼호아파트' 구간의 재차인원은 1좌석/인을 점유할 수 없는 상태로 나타났으며, 정차시간은 승객의 수와 큰 연관성이 없는 것으로 분석되었다. 이는 승객의 패턴이 일률적이지 않으며 카드 tag 과정 또한 다양하기 때문인 것으로 파악되었다. 속도의 경우 정차시간을 고려하여 정류장 간 주행속도와 전 구간에서의 평균통행속도의 비교를 통해 분석하였다. 현재 운영 중인 대중교통 서비스에 대한 정확한 이해를 바탕으로 이를 개선 및 조정함으로써 승객뿐만 아니라 운영자 측면에서도 효율화를 가져올 수 있을 것이라 기대된다.

  • PDF

트위터에서 형태소 분석과 PageRank 기반 화제단어 추출 방법 제안 (Proposal of keyword extraction method based on morphological analysis and PageRank in Tweeter)

  • 이원형;조성일;김동회
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.157-163
    • /
    • 2018
  • SNS를 이용하는 사람들은 매일 자신의 다양한 생각을 SNS에 게시한다. SNS에 게시된 데이터는 수많은 사람들의 생각과 의견이 담겨있다고 할 수 있다. 특히 트위터에서 서비스되는 인기 화제어는 사용자가 올린 글에서 자주 등장한 단어의 횟수를 집계해 순위를 결정한다. 하지만 이와 같은 방법은 단순히 중복된 단어가 나열된 불필요한 데이터에 민감하다. 제안하는 방법은 단어간의 관계도를 이용한 단어의 화제성을 기반으로 순위를 결정하므로 불필요한 데이터의 영향을 적게 받고 주요단어를 안정적으로 추출할 수 있다. 성능 비교를 위하여 내림차순 화제어 순위와 상위 20개중에서 의미 없는 화제어의 비율 측면에서 형태소 분석과 PageRank 기반의 제안 방식과 단순 등장 횟수 기반의 기존 방식을 비교한다. 제안하는 방안과 기존 방안은 상위 20개중에서 무의미한 화제어를 각각 55%과 70%를 순위권에 포함시켰으며 제안한 방법이 기존 방법과 비교할 때 15% 정도 향상된다.