• 제목/요약/키워드: Spatial-Temporal Data Mining

검색결과 36건 처리시간 0.023초

$R^*$-Tree와 Grid를 이용한 이동 객체의 위치 일반화 기법 (Location Generalization Method of Moving Object using $R^*$-Tree and Grid)

  • 고현;김광종;이연식
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.231-242
    • /
    • 2007
  • 패턴 탐사에 관한 기존의 연구들[1,2,3,4,5,6,11,12,13]은 이동 객체의 위치 이력 데이터 집합에 대한 위치 일반화 접근법을 사용하지 않거나 사용해도 특정 공간상의 이동 패턴들 중 단순히 시공간 제약이 없는 빈발 패턴만을 추출하므로, 특정 지점들 간의 최적 이동 경로나 스케줄링 경로와 같은 시공간 제약을 갖는 빈발 패턴 탐사에는 적용하기 어렵다. 또한 패턴 탐사의 수행에 있어 기존의 기법들은 데이터베이스에 대한 반복 접근을 줄이기 위해 메모리 상에 패턴 트리를 생성하여 사용하므로 보다 많은 메모리 공간을 소요하게 된다. 따라서 이러한 기존 탐사 기법들의 문제점들을 해결하기 위한 보다 효율적인 패턴 탐사 기법이 필요한 실정이다. 효율적 탐사 기법을 개발하기 위하여 본 논문에서는 방대한 이동 객체의 이력 데이터 집합에 대한 탐사 수행 시간 및 탐사에 필요한 메모리 공간을 최소화하기 위해서 상세 수준의 데이터들을 의미있는 공간영역 정보로 변환하는 새로운 위치 일반화 방법을 제안한다. 제안된 방법은 패턴 탐사의 전처리 과정에서 $R^*$-Tree와 영역 Grid 해쉬 테이블(AGHT:Area Grid Hash Table)을 기반으로 이동 객체의 위치 속성들을 2차원 공간영역으로 일반화하여 이동 시퀀스를 생성함으로써 효율적인 이동 객체의 공간 이동 패턴 마이닝을 유도할 수 있다.

  • PDF

검침데이터를 이용한 전력설비 시공간 부하분석모델 (Spatio-temporal Load Analysis Model for Power Facilities using Meter Reading Data)

  • 신진호;김영일;이봉재;양일권;류근호
    • 전기학회논문지
    • /
    • 제57권11호
    • /
    • pp.1910-1915
    • /
    • 2008
  • The load analysis for the distribution system and facilities has relied on measurement equipment. Moreover, load monitoring incurs huge costs in terms of installation and maintenance. This paper presents a new model to analyze wherein facilities load under a feeder every 15 minutes using meter reading data that can be obtained from a power consumer every 15 minute or a month even without setting up any measuring equipment. After the data warehouse is constructed by interfacing the legacy system required for the load calculation, the relationship between the distribution system and the power consumer is established. Once the load pattern is forecasted by applying clustering and classification algorithm of temporal data mining techniques for the power customer who is not involved in Automatic Meter Reading(AMR), a single-line diagram per feeder is created, and power flow calculation is executed. The calculation result is analyzed using various temporal and spatial analysis methods such as Internet Geographic Information System(GIS), single-line diagram, and Online Analytical Processing (OLAP).

Labeling Big Spatial Data: A Case Study of New York Taxi Limousine Dataset

  • AlBatati, Fawaz;Alarabi, Louai
    • International Journal of Computer Science & Network Security
    • /
    • 제21권6호
    • /
    • pp.207-212
    • /
    • 2021
  • Clustering Unlabeled Spatial-datasets to convert them to Labeled Spatial-datasets is a challenging task specially for geographical information systems. In this research study we investigated the NYC Taxi Limousine Commission dataset and discover that all of the spatial-temporal trajectory are unlabeled Spatial-datasets, which is in this case it is not suitable for any data mining tasks, such as classification and regression. Therefore, it is necessary to convert unlabeled Spatial-datasets into labeled Spatial-datasets. In this research study we are going to use the Clustering Technique to do this task for all the Trajectory datasets. A key difficulty for applying machine learning classification algorithms for many applications is that they require a lot of labeled datasets. Labeling a Big-data in many cases is a costly process. In this paper, we show the effectiveness of utilizing a Clustering Technique for labeling spatial data that leads to a high-accuracy classifier.

Semantic Trajectory Based Behavior Generation for Groups Identification

  • Cao, Yang;Cai, Zhi;Xue, Fei;Li, Tong;Ding, Zhiming
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권12호
    • /
    • pp.5782-5799
    • /
    • 2018
  • With the development of GPS and the popularity of mobile devices with positioning capability, collecting massive amounts of trajectory data is feasible and easy. The daily trajectories of moving objects convey a concise overview of their behaviors. Different social roles have different trajectory patterns. Therefore, we can identify users or groups based on similar trajectory patterns by mining implicit life patterns. However, most existing daily trajectories mining studies mainly focus on the spatial and temporal analysis of raw trajectory data but missing the essential semantic information or behaviors. In this paper, we propose a novel trajectory semantics calculation method to identify groups that have similar behaviors. In our model, we first propose a fast and efficient approach for stay regions extraction from daily trajectories, then generate semantic trajectories by enriching the stay regions with semantic labels. To measure the similarity between semantic trajectories, we design a semantic similarity measure model based on spatial and temporal similarity factor. Furthermore, a pruning strategy is proposed to lighten tedious calculations and comparisons. We have conducted extensive experiments on real trajectory dataset of Geolife project, and the experimental results show our proposed method is both effective and efficient.

시퀀스 빈발도와 가중치를 이용한 최적 이동 패턴 탐사 (Optimal Moving Pattern Mining using Frequency of Sequence and Weights)

  • 이연식;박성숙
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.79-93
    • /
    • 2009
  • 사용자들의 특성에 맞게 개인화되고 세분화된 위치 기반 서비스를 개발하기 위한 목적으로 시공간 상에서 발생하는 이동 객체의 다양한 패턴들 중 의미있는 유용한 패턴을 추출하기 위한 시공간 패턴 탐사가 필요하다. 이에 본 논문에서는 방대한 이동 객체의 이력 데이터로부터 패턴 탐사를 통해 실세계에 적용 가능한 위치 기반 서비스의 개발에 대한 응용으로, STOMP(F)[25]에서 정의한 최적의 이동 패턴을 탐사하는 문제들을 기반으로 시간 및 공간 제약을 갖는 패턴을 추출하기 위한 새로운 탐사 기법인 STOMP(FW)를 제안한다. 제안된 기법은 패턴 빈발도 만을 이용한 기존 연구(STOMP(F)[25])에 가중치(거리, 시간, 비용 등)를 복합적으로 이용하는 패턴 탐사 방법으로, 특정한 지점들 사이를 이동한 객체의 이동 패턴들 중 패턴 빈발도가 특정 임계치 이상이고 가중치가 가장 적게 소요되는 이동 패턴을 최적 경로로 결정하는 방법이다. 제안된 방법의 패턴 탐사는 경험적인 이동 이력을 사용함으로써 기존의 최적 경로 탐색 기법들($A^*$, Dijkstra 알고리즘)이나 빈발도 만을 이용한 방법들 보다 접근하는 노드 수가 상대적으로 적어 보다 빠르고 정확하게 최적 패턴을 탐색할 수 있음을 보인다.

  • PDF

도로 네트워크에서 이동 객체를 위한 시공간 유사 궤적 검색 알고리즘 (Trajectory Search Algorithm for Spatio-temporal Similarity of Moving Objects on Road Network)

  • 김영창;라빈드라 비스타;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권1호
    • /
    • pp.59-77
    • /
    • 2007
  • 모바일 환경의 대중화와 이를 위한 기반 기술의 발전으로 인하여 이동 객체들을 효과적으로 표현하고 분석하는 것이 중요한 문제로 대두되고 있다. 이러한 환경에서 이동 객체 궤적의 유사성 검색은 궤적에 대한 데이터 마이닝의 일부분으로 중요한 연구 분야중의 하나이다. 본 논문에서는 도로 네트워크상의 이동 객체 궤적을 위한 시공간 유사 궤적 검색 알고리즘을 제안한다. 이를 위하여 도로 네트워크상에서 두 이동 객체 궤적 사이의 시공간 거리를 정의하고, 이를 기반으로 궤적 사이의 시공간 유사도 측정 방법을 제안한다. 유사 궤적 알고리즘은 효율적인 검색을 위하여 시그니쳐 파일 기법을 이용하여 궤적을 검색한다. 마지막으로, 본 논문에서 제안하는 시공간 유사 궤적 검색 알고리즘을 구현하고, 성능 분석을 통해 제안하는 알고리즘의 효율성을 입증한다.

  • PDF

시공간 이동 패턴 추출을 위한 효율적인 알고리즘 (An Efficient Algorithm for Spatio-Temporal Moving Pattern Extraction)

  • 박지웅;김동오;홍동숙;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제8권2호
    • /
    • pp.39-52
    • /
    • 2006
  • 최근 들어 이동 객체의 이력 (history) 데이타에서 이동 객체의 이동 패턴, 즉 연속되는 시간 영역에서 반복적으로 발생되는 공간 이동 경로와 같은 다양한 지식을 추출하여 활용하는 응용 서비스의 활용성이 점점 증대되고 있다. 그러나 기존의 이동 패턴 추출 방법은 최소지지도(minimum support)가 낮은 경우에 많은 수의 후보 이동 패턴이 생성되고 이로 인하여 수행 시간과 소요 메모리가 급격히 증가하게 되는 단점이 있다. 본 논문에서는 대용량의 시공간 데이타 집합으로부터 이동 객체의 이동 패턴을 효율적으로 추출하기 위한 STMPE(Spatio-Temporal Moving Pattern Extracting) 알고리즘을 제안한다. STMPE 알고리즘은 시공간 데이타를 일반화시킴으로서 메모리 사용량을 최소화할 수 있으며, 단기 이동 패턴을 작성하여 유지하기 때문에 데이타베이스 스캔 횟수를 최소화할 수 있다. STMPE 알고리즘은 모든 부분에서 시간 정보를 갖는 다른 시공간 이동 패턴 추출 알고리즘보다 최소지지도가 낮아질수록, 이동 객체의 수가 증가할수록, 시간 분할 횟수가 많아질수록 더욱 뛰어난 성능을 보였다.

  • PDF

gCRM과 공간데이타마이닝 (gCRM and Spatial Data Mining)

  • 황정래;이기준
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2002년도 춘계학술대회 논문집
    • /
    • pp.38-44
    • /
    • 2002
  • 고객관계관리(CRM)나 마케팅과 같은 경영방식에서도 대용량의 공간 데이터베이스를 사용하는 지리정보시스템(GIS)과 같은 응용분야를 접목하고 있다. gCRM은 지리정보시스템과 고객관계관리를 결합한 것으로, 이러한 실정을 단적으로 보여 주고 있는 경영방식이다. gCRM은 대용량의 데이터베이스로부터 관심 있는 분야를 찾아내고 분석하게 된다. 그러기 위해서는 데이터마이닝이라는 기술이 필요하다. 하지만, gCRM은 일반적인 데이터베이스뿐만 아니라 공간 데이터베이스 역시 많이 사용되어진다. 이러한 공간데이터베이스로부터 관심 있는 부분이나 관계 그리고 특성 등을 찾아내기 위해서는 공간데이타마이닝이 요구된다. 본 논문에서는 gCRM 솔루션들의 기능을 중심으로 다양한 공간데이타마이닝 기법과 어떠한 관계가 있는지를 살펴봄으로써 gCRM과 공간데이타마이닝이 접목할 수 있는 부분에 대하여 정리하였다.

  • PDF

GIS-우편 마케팅 시스템에서 Geo-Lifestyle 군집화 및 시공간 데이터 큐브를 이용한 구매.소비 성향 예측 (Prediction of Consumer Propensity to Purchase Using Geo-Lifestyle Clustering and Spatiotemporal Data Cube in GIS-Postal Marketing System)

  • 이헌규;최용훈;정훈;박종흥
    • 한국공간정보시스템학회 논문지
    • /
    • 제11권4호
    • /
    • pp.74-84
    • /
    • 2009
  • 이 연구는 국내 우편물량 감소와 우편사업 경쟁력 강화를 위하여 GIS 및 시공간 마이닝 기술을 이용한 GIS 기반의 새로운 우편 마케팅 기법을 제안한다. 홍보를 원하는 기업체에게 의미 있고 정확한 마케팅 정보 제공을 위해서 Geo-Lifestyle 군집화를 적용한 인구 사회학적 마켓 세분화 기법과, 시간 공간 차원의 다차원적 분석을 통한 시공간 구매 소비 성향 예측 기법을 제안하였다. Geo-Lifestyle 군집분석 및 시공간 큐브 마이닝의 평가를 위해서 강남구, 송파구 지역의 내부 외부데이터를 사용하였고, 실험결과 14개의 최적 마케팅 클러스터를 생성하였으며 구매 소비 성향 예측을 위한 시 공간 패턴을 추출하였다.

  • PDF

의미 패턴 추출을 위한 이동 객체의 위치 일반화 (Location Generalization of Moving Objects for the Extraction of Significant Patterns)

  • 이연식;고현
    • 한국산학기술학회논문지
    • /
    • 제12권1호
    • /
    • pp.451-458
    • /
    • 2011
  • 최적 이동 경로 탐색이나 스케줄링 경로 예측 등 최적의 위치 기반 서비스 제공을 위하여 이동 객체의 위치 이력 데이터들에 대한 시공간적 속성들을 고려한 이동 객체들의 의미 있는 이동 패턴 추출 기법이 요구된다. 이에 본 논문에서는 의미 있는 이동 패턴 추출을 위하여 이동 객체의 연속적 위치 변화를 보다 효과적으로 패턴화하고 2차원 공간 영역으로의 인덱싱을 위한 $R^*$-tree 기반의 이동 객체 위치 속성 일반화 기법을 제안한다. 제안한 위치 일반화 방법은 이동 객체들의 각 공간 영역 데이터를 이용하여 영역 간의 시간 간격에 대한 제약을 만족하는 이동 시퀀스를 생성하며, 생성된 이동 시퀀스들을 통하여 의미 있는 이동 패턴들을 추출한다. 추출된 이동 패턴들은 최적의 위치기반 서비스를 위한 이동 객체의 시간 패턴 마이닝이나 객체의 이동 추이 분석 등에 효과적으로 이용될 수 있다.