• 제목/요약/키워드: 시계열 데이타베이스

검색결과 25건 처리시간 0.02초

윈도우를 구성하는 방법의 이원성을 이용한 효율적인 시계열 서부시퀀스 매칭 (Efficient Time-Series Subsequence Matching using Duality in Constructing Windows)

  • 문양세;노웅기;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권1호
    • /
    • pp.15-30
    • /
    • 2001
  • 서브시퀀스 매칭은 질의 시퀀스와 유사한 서브시퀀스를 가지는 데이터 시퀀스와 해당 서브시퀀스의 위치를 찾는 문제이다. 본 논문에서는 윈도우를 구성하는 방법의 이원성을 이용한 새로운 서부시퀀스 매칭 방법인 Dual-Match는 윈도우를 구성하는 방법에 있어서 Faloutsos 등이 사용한 방법(간단히 FRM 이라한다)의 이원적 접근법이다. 즉, FRM에서는 데이터 시퀀스를 슬라이딩 윈도우로 나누고 질의 시퀀스를 디스조인트 윈도우로 나누는 방법을 사용한 반면, Dual-Match에서는 데이터 시퀀스를 디스조이트 윈도우로 나누고 질의 시퀀스를 슬라이딩 윈도우로 나누는 방법을 사용한다. FRM은 색인에 필요한 저장공간을 줄이기 위하여 개별 점 대신 최소 포함 사각형만을 저장함으로 인하여 많은 착오해답(유사하지 않은 후보 서브시퀀스)을 발생시켰다. Dual-Match는 FRM과 비슷한 크기의 저장공간에 개별 점을 직접 저장함으로써 이 문제를 해결한다. 실험결과, Dual-Match는 많은 경우에 있어서 FRM에 비하여 후보 개수를 크게 줄이고 성능을 향상시켰다. 특히, 선택률이 낮은 경우($10^{-4}$이하)에는 후보 개수를 최대 8800배 까지 줄이고, 페이지 액세스 횟수를 최대 26.9배까지 줄였으며, 성능을 최대 430배까지 향상시켰다. 또한, 동일한 크기의 색인을 생성하는데 있어서 Dual-Match는 FRM보다 4.10~25.6배 빠르게 색인을 구성하였다. 이는 색인 구성시에 CPU 오버헤드의 많은 부분을 차지하는 저차원 변환의 횟수를 FRM에 비해 크게 줄이기 때문이다. 이 같은 결과로 볼 때, Dual-Match는 대용량 데이터베이스에 대한 서부시퀀스 매칭의 성능을 크게 향상시킬 수 있는 획기적인 연구 결과라 믿는다.

  • PDF

시간간격을 고려한 시간관계 규칙 탐사 기법 (Discovering Temporal Relation Rules from Temporal Interval Data)

  • 이용준;서성보;류근호;김혜규
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.301-314
    • /
    • 2001
  • 데이터마이닝은 대용량 데이터베이스에 내재된 유용한 지식을 탐사하는 기술로 정의된다. 데이터마이닝에 대한 연구가 진행되면서 순차 패턴, 유사 시계열 탐사, 시간 연관규칙 탐사 등과 같이 시간 값을 가진 데이터로부터 지식을 탐사하고자 하는 시간 데이터마이닝에 대한 연구가 수행되었다. 그러나 기존 연구는 트랜잭션의 발생 시점만을 가진 데이터를 다루고 있으며 시간 간격을 가진 데이터는 거의 고려하고 있지 않다. 실세계에서는 환자의 병력, 상품 구매 이력, 웹 로그 등과 같은 시간간격을 가진 다양한 데이터가 존재하며 이로부터 여러 유용한 지식을 찾아낼 수 있다. Allen은 시간간격 데이터 사이에 발생할 수 있는 시간 관계와 시간 관계를 구할 수 있는 시간간격 연산자를 정의하였다. 본 논문에서는 Allen의 정의를 기반으로 시간간격 데이터로부터 시간관계 규칙을 효율적으로 탐사하기 위한 새로운 데이터마이닝 기법을 제안하였다. 이 기법은 발생 시점을 가진 시간 데이터를 시간간격 데이터로 요약하여 일반화하는 전처리 알고리즘과 시간간격 데이터로부터 시간관계 규칙을 생성하는 규clr 탐사 알고리즘으로 구성된다. 이 기법은 기존 데이터마이닝 기법에서 찾지 못하는 유용한 시간 규칙을 탐사할 수 있다.

  • PDF

인터넷을 이용한 육상물류중개시스템 개발에 관한 연구

  • 박남규;최형림;송근곤;박영재;손형수
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.335-345
    • /
    • 1999
  • 오늘날 날로 증가하는 물류비는 개별 기업은 물론 국가 전체의 수출 경쟁력을 약화시키는 주요 원인으로 지적되고 있다. 그러나 그동안 우리나라에서는 물류비 절감을 위한 종합적이고 체계적인 대책이 이루어지지 못하였다. 특히 본 논문의 연구대상인 육상물류의 경우 그 비중이 전체 화물 운송의 60% 이상을 차지함에도 불구하고 심각한 교통체증 및 물류기반 시설의 미비, 효율적인 정보시스템의 미비 등으로 인하여 물류비가 계속 증가하는 양상을 보여 왔다. 따라서 본 논문에서는 우리나라 육상물류시스템이 안고 있는 문제점의 해결을 위한 방안들 중의 하나로 정보기술의 활용에 관한 내용을 다루고 있다. 즉 영세한 기업들도 누구나 손쉽게 이용할 수 있도록 인터넷을 이용한 육상물류중개시스템의 개발에 관한 내용을 소개하고 있다. 육상물류중개시스템은 복합화물주선업체인 (주) 대형물류와 함께 개발한 시스템으로 인터넷을 통하여 화주의 화물 운송의뢰를 접수받아 이를 여러 운송업체에게 제공해주는 역할을 수행하게 된다. 특히 육상물류중개시스템은 화물의 운송과 관련하여 발생하는 다양한 정보들을 데이터베이스에 저장하여 두었다가 세관을 비롯한 터미날에 대한 각종 신고업무에 이용할 수 있으며, 이밖에도 교통정보 및 화물 위치정보 등 다양한 서비스를 제공해줄 수 있다. 따라서 운송업체의 공차율을 줄이고 화주에게는 자신의 화물에 대한 정보를 실시간으로 전달해 줄 수 있다는 장점이 있다. 또한 이러한 육상물류중개시스템은 현재 개발중인 통합데이터베이스를 기반으로 한 항만물류원스톱서비스 시스템과 연계되어 차후에는 물류원스톱시스템으로 발전할 수 있을 것이다. 연구가 진행되고 있는 인공신경망과의 모형결합을 통해 기존연구와는 다른 새로운 통합예측방법론을 제시하고자 한다. 본 연구에서 제시하는 통합방법론은 크게 2단계 과정을 거쳐 예측모형으로 완성이 된다. 즉, 1차 모형단계에서 원시 재무시계열은 먼저 웨이블릿분석을 통해서 노이즈가 필터링 되는 동시에, 과거 재무시계열의 프랙탈 구조, 즉 비선형적인 움직임을 보다 잘 반영시켜 주는 다차원 주기요소를 가지는 시계열로 분해, 생성되며, 이렇게 주기에 따라 장단기로 분할된 시계열들은 2차 모형단계에서 신경망의 새로운 입력변수로서 사용되어 최종적인 인공 신경망모델을 구축하는 데 반영된다.ocioeconomic impacts are resulted from the program. It would be useful for the means of (ⅰ) fulfillment of public accountability to legitimate the program and to reveal the expenditure of pubic fund, and (ⅱ) managemental and strategical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic ev

  • PDF

시계열 데이터베이스에서의 서브시퀀스 매칭을 위한 윈도우 구성의 일반화 (Generalization of Window Construction for Subsequence Matching in Time-Series Databases)

  • 문양세;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.357-372
    • /
    • 2001
  • 본 논문에서는 서브시퀀스 매칭에서 윈도우 구성의 일반화 개념을 제안하고, 이에 기반한 새로운 서브시퀀스 매칭 방법인 GeneralMatch를 제안한다. 기존 연구인 Faloutsos 등의 방법 (간단히 FRM이라 한다)은 점 여과 효과의 결여로 인해 많은 착오해답을 발생시켰다. 본 저자들의 DualMatch는 점 여과 효과를 발휘하여 성능을 크게 향상시켰으나, 주어진 최소 질의 시퀀스 길이에 대해 최대 윈도우 크기가 작은(FRM의 1/2) 문제가 있었다. GeneralMatch는 DualMatch를 더욱 개선한 방법으로서, 두 방법의 장점을 모두 취한다. 즉, FRM과 같이 큰 윈우를 사용할 수 있으며, 동시에 DualMatch와 같이 점 여과 효과를 발휘할 수 있다. GeneralMatch는 데이터 시퀀스를 J-슬라이딩 윈도우(일반화된 슬라이딩 윈도우)로 나누고, 질의 시퀀스를 J-디스조인트 윈도우(일반화된 디스조인트 윈도우)로 나누는 방법을 사용한다. 본 논문에서는 GerneralMatch의 정확성, 즉 GeneralMatch가 착오기각이 발생하지 않음을 증명한다. 또한, 주어진 최소 질의 시퀀스 길이에 대해 GeneralMatch가 바르게 동작하기 위한 최대 윈도우 크기가 있음을 증명한다. 그리고, 페이지 액세스 횟수를 최소로 하는 J 값의 결정 방법을 제안하다. 실제 주식 데이터에 대한 실험 결과, GeneralMatch는 낮은 선택률 범위($10^{-6}~10^{-4}$)에서 DualMatch에 비해 평균 114%, FRM에 비해 998% 성능을 향상시켰으며, 높은 선택률 범위($10^{-6}~10^{-4}$)에서도 DualMatch에 비해 평균 46%, FRM에 비해 평균 65% 성능을 향상시켰다.

  • PDF

동적 특성의 시각화를 수행하는 새로운 패턴변환 기법에 의한 온라인 서명인식 기술 (Online Signature Verification by Visualization of Dynamic Characteristics using New Pattern Transform Technique)

  • 지수영;이재연;오원근;김창헌
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.663-673
    • /
    • 2005
  • 본 논문에서는 서명패턴에 내재되어 있는 동적인 특성을 패턴변환을 이용하여 시각화 함으로써 위조서명에 대한 안정성을 향상시킨 새로운 온라인 서명인증 알고리즘을 제안한다. 제안하는 첫 번째 패턴변환방식인 속도 평활화(Speed Equalization)는 서명과정의 시간적인 특성을 효율적으로 모델링하기 위하여, 주어진 서명의 시계열 패턴을 선 속도가 일정하도록 재구성함으로써 변환된 패턴을 생성한다 한편 두 번째 패턴변환방식인 속도변환(Velocity Transform)은 주어진 서명패턴을 수평/수직 속도 평면으로 매핑 함으로써 변환된 패턴을 생성한다. 이러한 변환을 통하여 원래의 서명과정에서의 동적인 특성이 변환된 도메인에서는 변환된 패턴의 모양에 반영되게 되므로, 변환된 패턴에 대한 형체분석(Shape Analysis) 을 통하여 효율적으로 동적인 특성에 대한 분석이 이루어진다. 본 논문에서 제안하는 모델의 장점은 변환된 패턴들이 본래의 서명패턴과 동일한 형태로 표현된다는 점이다. 따라서 기존의 많은 연구를 통하여 제안되어 은 대부분의 서명인식 알고리즘을 변환된 패턴에도 그대로 적용할 수 있다는 장점을 가진다. 271명의 6770개의 서명패턴으로 이루어 진 데이타베이스를 대상으로 한 실험을 통하여 본 논문에서 제안된 방식을 사용한 경우, 1.17$\%$의 EER(Equal Error Rate)를 보여 제안된 변환을 사용하지 않은 경우의 1.93$\%$와 비교하여 성능이 현격하게 향상되었음을 보였다. 특히 위조서명에 대한 실험에서는 이 차이가 더욱 현저하여 본 논문에서 제안된 방식이 위조서명을 거부하는데 유용함을 보였다.