• 제목/요약/키워드: 궤적 데이터 마이닝

검색결과 11건 처리시간 0.031초

대규모 궤적 데이타를 위한 데이타 마이닝 툴 (A Data Mining Tool for Massive Trajectory Data)

  • 이재길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.145-153
    • /
    • 2009
  • 궤적(trajectory) 데이타는 실세계 어디에서든지 쉽게 찾아볼 수 있다. 최근 들어, 위성, 센서, RFID, 비디오 및 무선 통신 기술의 발전으로 말미암아 이동 객체를 체계적으로 추적하고, 많은 양의 궤적데이타를 수집할 수 있게 되었다. 이에 따라, 궤적 데이타의 분석에 대한 필요성이 점차 증대되고 있다. 본 논문에서는 대규모 궤적 데이타를 위한 마이닝 툴을 개발한다. 본 마이닝 툴에서는 가장 널리 사용되는 마이닝 연산인 집단화(clustering), 분류(classification), 이상치 발견(outlier detection)을 제공한다. 궤적 집단화는 공통적인 이동 패턴을 발견하며, 궤적 분류는 궤적에 기반하여 이동 객체의 범주를 예측하며, 궤적 이상치 발견은 나머지 궤적들과 크게 다르거나 일관적이지 않은 궤적을 발견한다. 본 마이닝 툴의 가장 큰 장점은 데이타 마이닝 도중에 부분 궤적 정보를 활용한다는 점이다. 본 마이닝 툴의 우수성은 다양한 실제 궤적 데이타 셋을 사용하여 입증되었다. 본 논문의 결과로 궤적 데이타 마이닝을 위한 실용적인 소프트웨어를 개발하였고 많은 실제 응용에 적용될 수 있을 것이라 사료된다.

GPS 데이터 분포를 고려한 실내 Stay Point 추출 방법 (Extraction Method of Indoor Stay Point considering the Distribution of GPS Time Data)

  • 박진관;최상길;백종길;정민아;이성로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1196-1198
    • /
    • 2015
  • 최근 모바일 기기의 발전으로 사용자의 위치를 수집하고 분석하는 방법들이 연구되고 있다. 이러한 방법들 중 하나인 궤적 데이터 마이닝은 사용자의 궤적을 바탕으로 의미 있는 정보를 추출하기 위해 사용된다. 궤적 데이터 마이닝을 수행하기 위해서는 사용자의 GPS로그를 분석하여 Stay Point를 추출하는 과정이 선행되어야 한다. 기존의 Stay Point 추출 방법은 실내와 실외의 Stay Point를 구분하지 못한다. 본 논문에서는 기존의 Stay Point 알고리즘을 보완하기 위해 GPS 데이터 분포를 고려하여 실내에서 머무른 지점만을 추출하는 Stay Point 알고리즘을 제안한다.

통계적 분석방법을 이용한 Stay Point 추출 연구 (Extraction method of Stay Point using a Statistical Analysis)

  • 박진관;오수열
    • 스마트미디어저널
    • /
    • 제5권4호
    • /
    • pp.26-40
    • /
    • 2016
  • 최근 모바일 기기가 발전함에 따라 사용자의 위치 수집 및 분석 방법에 대한 연구가 활발히 이루어지고 있다. 사용자의 위치분석 방법 중 궤적 데이터 마이닝은 사용자의 궤적을 바탕으로 의미 있는 정보를 추출하기 위해 사용된다. 궤적 데이터 마이닝을 수행하기 위해서는 사용자의 GPS 궤적을 분석하여 Stay Point를 추출하는 과정이 선행되어야 한다. 기존의 Stay Point 추출 알고리즘은 두 가지의 임계값이 필요하며 해당 임계값들은 사용자가 임의로 설정함으로써 알고리즘의 신뢰도가 떨어지고, 실내에서 머문 지점과 실외에서 머문지점에 대한 구분이 없기 때문에 Stay Point 위치의 모호성이 높아지는 문제점이 있다. 본 논문에서는 통계적 분석방법을 이용하여 SP를 추출하는 방법을 제안한다. 제안 알고리즘은 가우시안 확률분포를 사용하여 실내와 실외 SP를 각각 추출함으로써 SP 위치의 모호성을 개선하였다. 또한, 사용자가 임의로 설정하는 임계값이 없기 때문에 알고리즘의 신뢰도를 향상시켰다.

데이타 축소와 군집화를 사용하는 시공간 데이타의 이산화 기법 (Discretizing Spatio-Temporal Data using Data Reduction and Clustering)

  • 강주영;용환승
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권1호
    • /
    • pp.57-61
    • /
    • 2009
  • 항목 기반의 순차 패턴 마이닝 기법들을 시공간 데이타에 적용하기 위해서는 시공간 속성 값에 대한 적절한 이산화가 필수적이다. 본 논문에서는 입력 데이타의 시공간적 상판 정보를 유지함과 동시에 데이타 수를 축소시킴으로써 마이닝 프로세스의 효율성을 높이는 이산화 기법을 제안한다. 제안된 기법은 선 단순화를 사용하여 궤적에 대한 근사치를 구함으로써 마이넘 단계에서 처리할 데이터 크기를 축소시킨다. 또한 단순화 된 궤적을 유사한 시공간적 특성을 가지는 논리적 그룹으로 군집화하여 데이터의 분포를 고려한 이산화를 수행한다. 실험을 통해 제안된 기법이 마이넝 프로세스의 효율성을 높일 뿐 아니라 보다 직관적이고 해석이 용이한 패턴을 도출하는 것을 보였다.

이동 사용자의 다음 장소 예측을 위한 맵리듀스 기반의 분산 데이터 마이닝 (A MapReduce-Based Distributed Data Mining Approach to Next Place Prediction for Mobile Users)

  • 김종환;이석준;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.777-780
    • /
    • 2014
  • 본 논문에서는 휴대용 기기 사용자들의 이동 궤적을 기록한 대용량의 GPS 위치 데이터 집합으로부터 각 사용자의 이동 패턴 모델을 학습해내고, 이 모델을 적용하여 각 사용자의 다음 방문 장소를 효율적으로 예측할 수 있는 맵리듀스 기반의 분산 데이터 마이닝 시스템을 소개한다. 본 시스템은 크게 사용자별 이동 패턴 모델을 학습하는 후단부와 실시간으로 다음 방문 장소를 예측하는 전단부로 구성된다. 이 중에서 후단부는 주요 장소 추출, 이동 궤적 변환, 이동 패턴 모델 학습 등 총 3개의 맵리듀스 작업 모듈들로 구성된다. 이에 반해, 본 시스템의 전단부는 이동 경로 후보군 생성, 다음 장소 예측 등 총 2개의 맵리듀스 작업 모듈들로 구성된다. 그리고 본 시스템을 구성하는 각각의 작어마다 분산처리를 극대화할 수 있도록 맵과 리듀스 함수를 설계하였다. 끝으로, 대용량의 GeoLife 벤치마크 데이터 집합을 이용하여 본 논문에서 소개한 시스템의 예측 성능을 분석하기 위한 실험을 수행하였고, 이를 통해 본 시스템의 높은 성능을 확인할 수 있었다.

도로 네트워크에서 이동 객체를 위한 시공간 유사 궤적 검색 알고리즘 (Trajectory Search Algorithm for Spatio-temporal Similarity of Moving Objects on Road Network)

  • 김영창;라빈드라 비스타;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권1호
    • /
    • pp.59-77
    • /
    • 2007
  • 모바일 환경의 대중화와 이를 위한 기반 기술의 발전으로 인하여 이동 객체들을 효과적으로 표현하고 분석하는 것이 중요한 문제로 대두되고 있다. 이러한 환경에서 이동 객체 궤적의 유사성 검색은 궤적에 대한 데이터 마이닝의 일부분으로 중요한 연구 분야중의 하나이다. 본 논문에서는 도로 네트워크상의 이동 객체 궤적을 위한 시공간 유사 궤적 검색 알고리즘을 제안한다. 이를 위하여 도로 네트워크상에서 두 이동 객체 궤적 사이의 시공간 거리를 정의하고, 이를 기반으로 궤적 사이의 시공간 유사도 측정 방법을 제안한다. 유사 궤적 알고리즘은 효율적인 검색을 위하여 시그니쳐 파일 기법을 이용하여 궤적을 검색한다. 마지막으로, 본 논문에서 제안하는 시공간 유사 궤적 검색 알고리즘을 구현하고, 성능 분석을 통해 제안하는 알고리즘의 효율성을 입증한다.

  • PDF

궤적 데이터 스트림에서 동반 그룹 탐색 기법 (A Technique for Detecting Companion Groups from Trajectory Data Streams)

  • 강수현;이기용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권12호
    • /
    • pp.473-482
    • /
    • 2019
  • 이동 객체의 데이터 스트림으로부터 객체들의 궤적을 분석하는 연구는 이미 이루어진 바가 있다. 그 중 같이 움직이는 객체들의 그룹, 즉 동반 그룹을 찾는 연구도 이미 존재한다, 이들 대부분은 서로 가까이 존재하는 객체들의 그룹을 탐색하기 위해 기존의 클러스터링 기법을 사용한다. 하지만 클러스터링에 기반한 방법들은 정확한 클러스터의 수를 미리 알 수 없거나 클러스터의 모양이나 크기를 제어할 수 없기 때문에 정확한 동반 그룹을 찾기 어려운 경우가 많다. 본 논문은 실시간으로 유입되는 궤적 데이터 스트림에서 기존의 클러스터링 기법이 아니라 사용자가 지정한 거리를 기반으로 동반 그룹을 탐색하는 새로운 방법을 제안한다. 본 논문에서 제안하는 기법은 서로 가까이 존재하는 객체들의 그룹을 주기적으로 탐색하며, 이 때 사용자가 지정한 거리 내에 존재하는 객체들의 그룹을 매우 효율적으로 찾아내는 기법을 사용한다. 또한 동반 그룹 및 그의 궤적만을 반환하는 기존 방법과 달리 제안 방법은 동반 그룹의 생성 시간과 지속 시간도 같이 알려준다. 본 논문에서는 다양한 실험을 통해 제안 방법이 동반 그룹을 정확하고 매우 효율적으로 탐색할 수 있음을 보인다.

LiDAR 센서를 활용한 배회 동선 검출 알고리즘 개발 (An Algorithm of Identifying Roaming Pedestrians' Trajectories using LiDAR Sensor)

  • 정은비;유소영
    • 한국ITS학회 논문지
    • /
    • 제16권6호
    • /
    • pp.1-15
    • /
    • 2017
  • 최근 국제적인 테러 위협이 불특정 다수를 대상으로 발생하고 있으며, 이러한 위협에서 시민을 보호하기 위한 다양한 대책이 논의 중이다. 저렴해진 센서 기술을 활용한 사전 감시 시스템에 대한 요구가 높아지고 있으나, 보행 궤적의 고유 특성 검출 및 상세 분석 연구가 미비한 실정이다. 본 연구에서는 상용화된 보행 동선 솔루션을 활용하여, 삼성역 개찰구에서 코엑스와 직접 연결되는 연결 통로 (3-6번 출구 근처) 일대의 보행 동선 궤적 조사를 수행하였다. 조사된 궤적 자료를 바탕으로, 궤적 자료의 정규화 기법, Clustering 방법을 중심으로 보행 궤적을 유형화하고 배회 동선을 추출하는 분석 방법론을 제시하였다. 분석 결과, 동일 군집내에서 유사성이 크게 떨어지는 보행 궤적의 검출 가능성을 검증하였다.

RFID 데이터 스트림에서 이동궤적 패턴의 탐사 (Mining Frequent Trajectory Patterns in RFID Data Streams)

  • 서성보;이용미;이준욱;남광우;류근호;박진수
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권1호
    • /
    • pp.127-136
    • /
    • 2009
  • 이 논문은 RFID 데이터 스트림의 변화 특성을 고려하면서 단일 패스로 이동궤적 패턴을 실시간 추출하는 새로운 기법을 제안한다. RFID, 센서와 무선 네트워크 기술의 발달로 인해 현실 세계에서 실시간으로 데이터를 수집하고 유용한 패턴을 탐사하는 연구에 많은 관심이 집중되고 있다. 스트림 데이터에서 순차 패턴 또는 이동궤적 패턴을 탐사하는 기존의 연구 기법들은 반복적으로 데이터베이스 또는 트리를 탐색하는 고비용 문제점과 시간의 변화에 따르는 동적 특성을 실시간으로 패턴에 반영하지 못하는 단점이 있다. 제안하는 기법은 시간에 따라 RFID 데이터 스트림의 변화를 정확히 반영하기 위해 시간진화 그래프를 이용하여 이진 시간관계 테이블에 빈발한 2-길이 항목간 정보를 유지한다. 또한 다중 패스의 문제점을 해결하기 위해 t 시점에 이진 시간관계 테이블을 이용하여 k-길이의 후보 이동궤적 패턴을 추론하고, t+1 시점에서 후보 패턴을 검증하는 과정을 통해 k-길이 이동궤적 패턴을 단일 패스로 추출한다. 실험결과 제안하는 기법은 기존의 Apriori-계열 기법들과 비교하여 약 7% 정도 후보 패턴의 비율이 적게 생성되어 시간 및 공간 복잡도 측면에서 우수한 성능을 보였다.

  • PDF

다음 장소 예측을 위한 맵리듀스 기반의 이동 패턴 마이닝 시스템 설계 (Design of a MapReduce-Based Mobility Pattern Mining System for Next Place Prediction)

  • 김종환;이석준;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권8호
    • /
    • pp.321-328
    • /
    • 2014
  • 본 논문에서는 모바일 기기 사용자들의 다음 방문 장소를 효율적으로 예측할 수 있는 맵리듀스 기반의 이동 패턴 마이닝 시스템을 소개한다. 이 시스템은 대용량의 사용자 이동 궤적 데이터 집합으로부터 은닉 마코프 모델로 표현되는 각 사용자의 이동 패턴을 학습해내고, 이 모델을 현재 이동 궤적에 적용함으로써 다음 방문 장소를 예측한다. 본 시스템은 사용자별 이동 패턴 모델을 학습하는 후단부와 실시간으로 다음 방문 장소를 예측하는 전단부 등 크게 두 부분으로 구성된다. 이 중에서 후단부는 주요 장소 추출, 이동 궤적 변환, 이동 패턴 모델 학습 등 총 3개의 맵리듀스 작업 모듈들로 구성된다. 이에 반해, 본 시스템의 전단부는 이동 경로 후보군 생성, 다음 장소 예측 등 총 2개의 작업 모듈들로 구성된다. 그리고 본 시스템을 구성하는 각 작업 모듈의 맵과 리듀스 함수들은 하둡 인프라를 효과적으로 활용하여 병렬 처리를 극대화할 수 있도록 설계하였다. 대용량의 공개 벤치마크 데이터 집합인 GeoLife를 이용하여 본 논문에서 소개한 시스템의 성능을 분석하기 위한 실험들을 수행하였고, 실험 결과를 통해 본 시스템의 높은 성능을 확인할 수 있었다.