• 제목/요약/키워드: temporal mining

검색결과 119건 처리시간 0.03초

맵리듀스기반 워크플로우 빅-로그 클러스터링 기법 (A MapReduce-Based Workflow BIG-Log Clustering Technique)

  • 진민혁;김광훈
    • 인터넷정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.87-96
    • /
    • 2019
  • 본 논문에서는 분산 워크플로우 실행 이벤트 로그를 수집하고 분류하기 위한 사전 처리 도구로서 맵-리듀스기반 클러스터링 기법을 제안한다. 특히 우리는 볼륨, 속도, 다양성, 진실성 및 가치와 같은 BIG 데이터의 5V 속성에 만족하고 잘 충족되어 있기 때문에 분산 워크플로우 실행 이벤트 로그를 특별히 워크플로우 빅-로그(Workflow BIG-Logs)라고 정의한다. 이 논문에서 개발하는 클러스터링 기술은워크플로우 빅-로그를 기반으로 하는 특정 워크플로 프로세스 마이닝 및 분석 알고리즘의 사전 처리 단계에 적용하기 위한 목적으로 고안된 것이다. 즉, 맵리듀스(Map-Reduce) 프레임워크를 워크플로우 빅-로그 처리 플랫폼으로 사용하고, IEEE XES 표준 데이터 형식을 지원하며, 결국 본 연구에서 개발중에 있는 구조적 정보제어넷기반 워크플로우 프로세스 마이닝 알고리즘인 ${\rho}$-알고리즘의 사전 처리 단계 전용으로 사용되도록 구현된 것이다. 보다 자세하게 말하자면, 워크플로우 빅-로그의 클러스터링 패턴은 단위업무액티버티 기반 클러스터링 패턴과 단위업무 수행자 기반 클러스터링 패턴으로 분류되는데, 특별히 단위업무 액티버티 패턴의 하나인 시간적 워크케이스 패턴과 그의 발생 건수를 재발견하는 맵리듀스 기반 클러스터링 알고리즘을 설계하고 구현하고자 한다. 마지막으로, 우리는 BPI 챌린지에서 공개한 워크플로우 실행 이벤트 로그 데이터세트에 대해 일련의 실험을 수행함으로써 제안된 클러스터링 기법의 기술적 타당성을 검증한다.

공간 데이터웨어하우스에서 시공간 분석 지원을 위한 비중복 적재기법 (Non-Duplication Loading Method for supporting Spatio-Temporal Analysis in Spatial Data Warehouse)

  • 전치수;이동욱;유병섭;이순조;배해영
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권2호
    • /
    • pp.81-91
    • /
    • 2007
  • 본 논문에서는 공간 데이터 웨어하우스에서 시공간 분석지원을 위한 공간 데이터의 비중복 적재 기법을 제안한다. SDW는 이기종의 다양한 서비스를 지원하는 SDBMS로부터 공간 데이터를 추출한다. 제안 기법에서는 SOW에 소스로 참여하는 SDBMS에서 변경된 부분만을 추출하고, 이를 공간연산을 통해 중복된 데이터를 제거한 후 통합된 형태로 적재함으로써 빠른 공간 데이터 분석을 지원할 수 있으며, 저장 공간의 낭비를 줄일 수 있다. 이는 공간 마이닝등의 시간에 따른 분석 및 예측 분야에 효율적인 형태로 공간 데이터를 적재한다.

  • PDF

Predicting Land Use Change Affected by Population Growth by Integrating Logistic Regression, Markov Chain and Cellular Automata Models

  • Nguyen, Van Trung;Le, Thi Thu Ha;La, Phu Hien
    • 한국측량학회지
    • /
    • 제35권4호
    • /
    • pp.221-230
    • /
    • 2017
  • Demographic change was considered to be the most major driver of land use change although there were several interacting factors involved, especially in the developing countries. This paper presents an approach to predict the future land use change using a hybrid model. A hybrid model consisting of logistic regression model, Markov chain (MC), and cellular automata (CA) was designed to improve the performance of the standard logistic regression model. Experiment was conducted in Giao Thuy district, Nam Dinh Province, Vietnam. Demography and socio-economic variables dealing with urban sprawl were used to create a probability surface of spatio-temporal states of built-up land use for the years 2009, 2019, and 2029. The predicted land use maps for the years 2019 and 2029 show substantial urban development in the area, much of which are located in areas sensitive to source protections. It also showed that aquacultural land changes substantially in areas where are in the vicinity of estuary or near the sea dike. There was considerable variation between the communes; notably, communes with higher household density and higher proportion of people in working age have larger increases in aquacultural areas. The results of the analysis can provide valuable information for local planners and policy makers, assisting their efforts in constructing alternative sustainable urban development schemes and environmental management strategies.

스트레스 경험 유무에 따른 질병 및 활동제약이 고연령층 우울증에 미치는 영향에 관한연구: 국민건강영양조사 자료분석 (An empirical approach to analyzing effects of disease and activity limit on depression prevalence rate in the elderly depending on stress experience: KNHANES Data Analysis)

  • 전현규;심재문;이건창
    • 보건교육건강증진학회지
    • /
    • 제33권1호
    • /
    • pp.13-22
    • /
    • 2016
  • Objectives: By using six years of KNHANES dataset (2008~2013) about 60 ages older people, we analyzed how the depression prevalence rate in the elderly is influenced by disease and activity limit. Especially, to add a sense of more reality, we adopted stress experience as a control variable to see how the depression prevalence rate in the elderly is influenced by disease and activity limit depending on the stress experience. Methods : We adopted six years of KNHANES dataset, indicating that our results were based on long period of time capable of considering temporal patterns in the depression prevalence rate in the elderly. Total 1,160 elderly people in KNHANES were selected for our empirical analyses. Dependent variable is either 0 or 1 depending on whether the elderly people feel depression. Main explanatory variables for our study include disease and activity limit. Logistic regression analysis was applied for two group such as stress experience and non-experience. Results : According to the empirical results, stress factor is found to be significant in explaining the depression in the elderly. Depression prevalence rate increased when the elderly has stress experience: chronical disease(OR=1.650), chronical disease with activity limit(OR=3.388), non-chronical disease with stress(OR=11.841) chronical disease with stress (OR=13.561) and chronical disease with activity limit and stress(OR=28.691). Conclusions: The finding suggest that the Countermeasures of elderly's depression alleviation should include stress management.

Unsupervised Motion Pattern Mining for Crowded Scenes Analysis

  • Wang, Chongjing;Zhao, Xu;Zou, Yi;Liu, Yuncai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권12호
    • /
    • pp.3315-3337
    • /
    • 2012
  • Crowded scenes analysis is a challenging topic in computer vision field. How to detect diverse motion patterns in crowded scenarios from videos is the critical yet hard part of this problem. In this paper, we propose a novel approach to mining motion patterns by utilizing motion information during both long-term period and short interval simultaneously. To capture long-term motions effectively, we introduce Motion History Image (MHI) representation to access to the global perspective about the crowd motion. The combination of MHI and optical flow, which is used to get instant motion information, gives rise to discriminative spatial-temporal motion features. Benefitting from the robustness and efficiency of the novel motion representation, the following motion pattern mining is implemented in a completely unsupervised way. The motion vectors are clustered hierarchically through automatic hierarchical clustering algorithm building on the basis of graphic model. This method overcomes the instability of optical flow in dealing with time continuity in crowded scenes. The results of clustering reveal the situations of motion pattern distribution in current crowded videos. To validate the performance of the proposed approach, we conduct experimental evaluations on some challenging videos including vehicles and pedestrians. The reliable detection results demonstrate the effectiveness of our approach.

다차원 데이터 큐브 모델을 이용한 구제역의 위기 대응 방안 분석 (Crisis Management Analysis of Foot-and-Mouth Disease Using Multi-dimensional Data Cube)

  • 노병준;이종욱;박대희;정용화
    • 한국콘텐츠학회논문지
    • /
    • 제17권5호
    • /
    • pp.565-573
    • /
    • 2017
  • 재난 재해 발생 시, 정부의 위기 대응방식에 대한 사후 평가는 향후 유사한 위기 상황이 발생할 경우를 대비하고 국가의 장기적인 위기관리의 초석이 되는 필수적인 단계이다. 본 논문에서는 국내에서 발생한 구제역에 관하여 정부에서 어떠한 대응 전략을 펼쳤는지를 언론에 보도된 기사 내용을 통해 분석한 연구로써, 먼저 온라인 뉴스 기사로부터 구제역에 관한 키워드들을 추출하여 데이터 큐브를 구성한 후, OLAP 연산과 연관규칙 분석을 수행함으로써 시간 축에 따른 정부의 위기상황 대응행동 및 그에 따른 사회적 파급 효과들을 분석한다. 구제역이 가장 심각했던 2010년 11월부터 2011년 12월까지 국내에서 발생한 구제역에 관한 정부의 위기 상황 대응 방법을 사례분석을 통해 분석하였다.

이동 객체 데이터베이스에서 빈발 시퀀스 패턴 탐색 (Discovery of Frequent Sequence Pattern in Moving Object Databases)

  • ;이범주;류근호
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.179-186
    • /
    • 2008
  • 위치 기반 장치의 발전과, GIS 기능의 확장 그리고 위치 정보기술들의 정확성과 가용성이 증가함에 따라서 위치 기반 서비스들의 새로운 영역에 대한 새로운 가능성이 나타나게 되었다. 데이터의 시간과 공간 형태에 따라서 정의되는 Relationship에 기인하여 시공간 데이터 마이닝 영역에서 공간에 대한 지식 검색이 증가할 경우 매우 큰 문제에 직면한다. 이 논문에서는 모바일 환경에서 시공간 패턴 마이닝을 위한 알고리즘들을 제안한다. 이동 패턴들은 All_MOP와 Max_MOP 두 개의 알고리즘을 활용하여 생성된다. 이 알고리즘들은 먼저 모든 빈발 패턴들을 탐사한 후 오직 최대의 빈발 패턴만을 탐사한다. 아울러, 제안한 기법과 기존의 DFS_MINE 기법의 수행 시간 비교를 통하여 제안한 기법이 수행시간에서 다소 우수한 것을 나타낸다. 이러한 제안접근법은 관광 서비스, 교통 서비스 등과 같은 위치 기반 서비스 등에 활용할 수 있다.

Impacts of Urban Land Cover Change on Land Surface Temperature Distribution in Ho Chi Minh City, Vietnam

  • Le, Thi Thu Ha;Nguyen, Van Trung;Pham, Thi Lan;Tong, Thi Huyen Ai;La, Phu Hien
    • 한국측량학회지
    • /
    • 제39권2호
    • /
    • pp.113-122
    • /
    • 2021
  • Urban expansion, particularly converting sub-urban areas to residential and commercial land use in metropolitan areas, has been considered as a significant signal of regional economic development. However, this results in urban climate change. One of the key impacts of rapid urbanization on the environment is the effect of UHI (Urban Heat Island). Understanding the effects of urban land cover change on UHI is crucial for improving the ecology and sustainability of cities. This research reports an application of remote sensing data, GIS (Geographic Information Systems) for assessing effects of urban land cover change on the LST (Land Surface Temperature) and heat budget components in Ho Chi Minh City, where is one of the fastest urbanizing region of Vietnam. The change of urban land cover component and LST in the city was derived by using multi-temporal Landsat data for the period of 1998 - 2020. The analysis showed that, from 1998 to 2020 the city had been drastically urbanized into multiple directions, with the urban areas increasing from approximately 125.281 km2 in 1998 to 162.6 km2 in 2007, and 267.2 km2 in 2020, respectively. The results of retrieved LST revealed the radiant temperature for 1998 ranging from 20.2℃ to 31.2℃, while that for 2020 remarkably higher ranging from 22.1℃ to 42.3℃. The results also revealed that given the same percentage of urban land cover components, vegetation area is more effective to reduce the value of LST, meanwhile the impervious surface is the most effective factor to increase the value of the LST.

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

서울 대도시권 지하철 통행흐름의 요일 간 변이성 분석: 동적 시각화방법을 토대로 (Time-Space Variability Analysis for the Weekly Passenger Flow of the Seoul Subway System: Based on Dynamic Visualization Methods)

  • 이금숙;김호성;박종수
    • 한국경제지리학회지
    • /
    • 제20권2호
    • /
    • pp.158-172
    • /
    • 2017
  • 본 연구는 동적 시각화 방법을 토대로 서울 대도시권 지하철 통행흐름의 요일 간 변동성을 분석한다. 이를 위하여 본 연구에서는 수도권의 1주일치 교통카드 자료에서 요일별로 1분 간격으로 지하철 승객흐름을 추출한다. 지하철망상의 통행흐름의 시공간적 분포를 나타낼 수 있도록 동적 시각화 방법을 고안하여 지하철 승객의 시공간적 분포에 나타나는 요일 간 변동성을 직관적으로 분석한다. 그 결과로 주중과 주말 지하철 승객흐름의 시공간적 분포 패턴은 확연한 차이를 보인다. 주중과 주말에도 요일에 따라 다소 다른 양상을 보인다. 서울의 주요 중심업무지역들과 유흥지역들의 승객흐름에도 요일별 승객흐름 양상에 뚜렷한 차이가 있음을 확인할 수 있다. 이러한 분석결과는 도시계획과 교통계획의 토대가 될 뿐 만 아니라 도시 재해 재난이 발생할 경우 피해에 노출되는 인구규모를 파악하고 신속한 대피대책마련에 유용한 정보를 제공할 수 있다.