• 제목/요약/키워드: large database

검색결과 1,444건 처리시간 0.034초

A Taxonomy of Workflow Architectures

  • Kim, Kwang-Hoon;Paik, Su-Ki
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.525-543
    • /
    • 1998
  • This paper proposes a conceptual taxonomy of architectures far workflow management systems. The systematic classification work is based on a framework for workflow architectures. The framework, consisting of generic-level, conceptual-level and implementation-level architectures, provides common architectural principles for designing a workflow management system. We define the taxonomy by considering the possibilities for centralization or distribution of data, control, and execution. That is, we take into account three criteria. How are the major components of a workflow model and system, like activities, roles, actors, and workcases, concretized in workflow architecture? Which of the components is represented as software modules of the workflow architecture? And how are they configured and operating in the architecture? The workflow components might be embodied, as active (processes or threads) modules or as passive (data) modules, in the software architecture of a workflow management system. One or combinations of the components might become software modules in the software architecture. Finally, they might be centralized or distributed. The distribution of the components should be broken into three: Vertically, Horizontally and Fully distributed. Through the combination of these aspects, we can conceptually generate about 64 software Architectures for a workflow management system. That is, it should be possible to comprehend and characterize all kinds of software architectures for workflow management systems including the current existing systems as well as future systems. We believe that this taxonomy is a significant contribution because it adds clarity, completeness, and "global perspective" to workflow architectural discussions. The vocabulary suggested here includes workflow levels and aspects, allowing very different architectures to be discussed, compared, and contrasted. Added clarity is obtained because similar architectures from different vendors that used different terminology and techniques can now be seen to be identical at the higher level. Much of the complexity can be removed by thinking of workflow systems. Therefore, it is used to categorize existing workflow architectures and suggest a plethora of new workflow architectures. Finally, the taxonomy can be used for sorting out gems and stones amongst the architectures possibly generated. Thus, it might be a guideline not only for characterizing the existing workflow management systems, but also for solving the long-term and short-term architectural research issues, such as dynamic changes in workflow, transactional workflow, dynamically evolving workflow, large-scale workflow, etc., that have been proposed in the literature.

  • PDF

A Taxonomy of Workflow Architectures

  • Kim, Kwang-Hoon;Paik, Su-Ki
    • 정보기술과데이타베이스저널
    • /
    • 제5권1호
    • /
    • pp.97-108
    • /
    • 1998
  • This paper proposes a conceptual taxonomy of architectures for workflow management systems. The systematic classification work is based on a framework for workflow architectures. The framework, consisting of generic-level, conceptual-level and implementation-level architectures, provides common architectural principles for designing a workflow management system. We define the taxonomy by considering the possibilities for centralization or distribution of data, control, and execution. That is, we take into account three criteria. How are the major components of a workflow model and system, like activities, roles, actors, and workcases, concretized in workflow architecture. Which of the components is represented as software modules of the workflow architecture\ulcorner And how are they configured and operating in the architecture\ulcorner The workflow components might be embodied, as active (processes or threads) modules or as passive (data) modules, in the software architecture of a workflow management system. One or combinations of the components might become software modules in the software architecture. Finally, they might be centralized or distributed. The distribution of the components should be broken into three: Vertically, Horizontally and Fully distributed. Through the combination of these aspects, we can conceptually generate about 64 software Architectures for a workflow management system. That is, it should be possible to comprehend and characterize all kinds of software architectures for workflow management systems including the current existing systems as well as future systems. We believe that this taxonomy is a significant contribution because it adds clarity, completeness, and global perspective to workflow architectural discussions. The vocabulary suggested here includes workflow levels and aspects, allowing very different architectures to be discussed, compared, and contrasted. Added clarity is obtained because similar architectures from different vendors that used different terminology and techniques can now be seen to be identical at the higher level. Much of the complexity can be removed by thinking of workflow systems. Therefore, it is used to categorize existing workflow architectures and suggest a plethora of new workflow architectures. Finally, the taxonomy can be used for sorting out gems and stones amongst the architectures possibly generated. Thus, it might be a guideline not only for characterizing the existing workflow management systems, but also for solving the long-term and short-term architectural research issues, such as dynamic changes in workflow, transactional workflow, dynamically evolving workflow, large-scale workflow, etc., that have been proposed in the literature.

  • PDF

내용 기반 음악 정보 검색에서 주제 선율의 변화 패턴을 이용한 색인 및 검색 기법 (Indexing and Retrieval Mechanism using Variation Patterns of Theme Melodies in Content-based Music Information Retrievals)

  • 구경이;신창환;김유성
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.507-520
    • /
    • 2003
  • 본 연구에서는 내용 기반 음악 정보 검색 시스템의 검색 속도를 증진하기 위해 음악의 대표 선율인 주제 선율을 추출하여 주제 선율 색인을 구성하고 이를 이용한 효율적인 내용 기반 음악 정보 검색 기법을 제안하였다. 추출된 주제 선율을 다차원 공간 색인 기법인 M-tree를 이용하여 주제 선율 색인으로 구성하기 위해 주제 선율의 평균 음 높이 변화량과 평균 음 길이 변화량을 이용하였으며 검색의 정확도를 증진하기 위해 음 높이 변화 패턴을 요약한 높이 시그니처와 음 길이 변화 패턴을 요약한 길이 시그니처를 이용하였다. 또한 제안된 내용 기반 음악 정보 검색 기법에서는 사용자의 질의 선율로부터 질의 선율의 패턴 정보를 구성하고 M-tree의 k-근접 검색 및 범위 검색 기법을 이용하여 사용자의 질의 선율과 유사한 주제 선율을 포함하고 있는 음악 정보를 검색한다. 검색된 결과로부터 순위 부여한 후 사용자 피드백을 하여 사용자의 만족도를 증진하기 위한 특성을 포함하도록 하였다. 또한, 본 논문에서 제안된 주제 선율 색인 기법 및 내용 기반 검색 기법을 포함한 내용 기반 음악 정보 검색 시스템의 프로토타입을 구현하여 제안된 기법의 실효성을 입증하였다.

데이터마이닝 알고리즘의 분류 및 분석 (Classification and Analysis of Data Mining Algorithms)

  • 이정원;김호숙;최지영;김현희;용환승;이상호;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.279-300
    • /
    • 2001
  • 지식탐사 프로세스의 핵심적인 역할을 담당하는 데이터마이닝 단계에서는 여러 가지 목적에 따라 알고리즘을 선택하여 사용한다. 최근 통계, 비즈니스, 전자 상거래, 의학, 생물학 등의 분야에서 데이터마이닝 기술아 적극적으로 활용되고 있으며, 이를 위해 다양한 알고리즘들이 계속해서 연구.개발되고 있다. 그러나 시간이 지나면 이들 중 각 분야 별로 우수한 응용성을 보이는 알고리즘이나 방대한 양의 데이터를 다루는데 있어 좋은 성능을 보이는 몇몇 알고리즘만이 남게 될 것이며 또한 앞으로는 이러한 알고리즘들만을 선별하여 집중 연구할 필요가 있다. 따라서 본 논문에서는 데이터마이닝에 널리 사용되고 활발한 연구가 진행중인 알고리즘들 중에서 연관규칙(association rule), 클러스터링(clustering), 신경망(neural network), 결정트리(decision tree), 유전자 알고리즘(genetic algorithm), 베이지안 네트워크(bayesian network), 메모리 기반 추론(memory-based reasoning)등 7가지 카테고리에 속하는 알고리즘들을 선정하여 분류.분석하였다. 우선 각 알고리즘의 계통과 특성들을 분석하였고 이를 토대로 비교.분석을 위한 14가지의 분류 기준을 제시하였다. 이러한 분류 기준에 근거하여 세부 알고리즘들을 분석해 보고 비교 가능한 일부 알고리즘은 여러 특징과 성능을 중심으로 각각 최상의 알고리즘을 도출해 보았다. 본 연구 결과는 데이터마이닝 분야의 흔재된 알고리즘들을 분류.분석함으로써 마이닝 기술 적용시 사용자에게 알고리즘 선택의 지표를 제시할 수 있을 것이다.

  • PDF

패턴 매칭과 자동 규칙 생성에 기반한 2단계 주식 트레이딩 시스템 (A Two-Phase Stock Trading System based on Pattern Matching and Automatic Rule Induction)

  • 이종우;김유섭;김성동;이재원;채진석
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.257-264
    • /
    • 2003
  • 일반적인 동적 매매 환경에서의 금융 예측 시스템은 주어진 목적을 최적으로 만족시키는 매매 형태를 찾고자 한다. 본 논문은 수익률을 극대화시키기 위하여 추출과 여과라는 두개의 단계로 구성된 새로운 형태의 주식 매매 시스템을 제안한다. 주식 추출 단계에서는 특정 시계열 패턴에 부합하는 주식을 추출하는데, 이러한 시계열 패턴은 기술 지표 값들의 조합으로 표현된다. 그리고 여과 단계에서는 추출된 주식 집합에 여과 규칙들을 적용하여 실제 매매 대상이 되는 주식들을 골라내는데, 여과 규칙은 과거 주가 데이터로부터 자동으로 유도되었다. 이를 위하여, 우리는 먼저 방대한 과거 일별 주가 데이터로부터 기술 지표 값들을 계산하였다. 계산된 기술 지표 값들은 시계열 패턴을 추출하는데 사용되고 이 값들의 이산화 구간들의 분포가 양성 및 음성 데이터들에 대하여 계산된다. 본 논문에서는 독특한 분포를 보이는 구간에 존재하는 기술 지표 값들이 주가의 향후 움직임을 예측하는 데 도움을 준다는 가정을 하였다. 그리고 여과 규칙은 바로 이런 독특한 분포를 보이는 구간 내의 데이터 값들로부터 자동으로 유도되었다. 우리는 시뮬레이션을 통해, 본 논문에서 제시한 트레이딩 시스템이 시장 평균 수익률을 상회한다는 사실을 확인함으로써 위의 가정에 대한 검증을 할 수 있었다.

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상 (Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood)

  • 정경용;김진수;김태용;이정현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.287-296
    • /
    • 2003
  • 추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

이동객체의 현재 위치정보 관리를 위한 셀 기반 색인 기법 (A Cell-based Indexing for Managing Current Location Information of Moving Objects)

  • 이응재;이양구;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권6호
    • /
    • pp.1221-1230
    • /
    • 2004
  • 모바일 환경에서 정보 제공 및 처리의 대상이 되는 사람, 자동차, 비행기 둥과 같은 이동객체는 시간이 경과함에 따라 끊임없이 자신의 위치를 변경하는 특징을 가지며, 이러한 정보들을 데이터베이스에서 효과적으로 처리하기 위해서는 연속적인 위치 변경을 수용할 수 있는 저장공간과 색인 유지 및 관리 기술이 필요하다. 기존의 색인 기법들은 색인의 유지 성능보다 질의 처리 능력을 향상시키는데 노력을 기울여 왔기 때문에 복잡하게 이동하며 매우 빈번하게 위치 정보를 갱신하는 이동객체 정보를 관리하기 어렵다. 이 논문에서는 질의 처리 성능뿐만 아니라 이동객체의 빈번한 위치 갱신을 효율적으로 처리하기 위해 고정 그리드 방식의 색인과 R-Tree의 장점을 결합한 ACAR-Tree(Adaptive Cell index with Auxiliary R-Tree)를 제안한다. 제안된 ACAR-Tree는 R-Tree에서 색인의 재구성으로 인하여 갱신 성능이 저하되는 단점을 보완하기 위하여 고정 그리드 방법의 셀 기반의 색인 방법을 기초로 한다. 또한 고정 그리드 방법에서의 데이터 분포가 편중되었을 경우의 색인 성능저하 문제를 해결하기 위하여, 셀과 버켓이 1 : 1로 매핑되는 셀에서 오버플로가 발생하였을 경우 해당 버켓이 부가적인 색인 구조인 보조R-Tree로 전환하여 처리한다. 제안된 방법을 다양한 데이터 분포 및 데이터 크기에서 실험한 결과, 기존의 R-Tree 기반의 색인 방법과 비교하여 색인의 크기가 크게 감소하였으며, 질의 및 갱신 성능에 대해서도 뛰어난 성능을 보였다.

효율적인 시공간 영역 질의 처리를 위한 궤적 색인의 노드 재배치 전략 (A Node Relocation Strategy of Trajectory Indexes for Efficient Processing of Spatiotemporal Range Queries)

  • 임덕성;조대수;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.664-674
    • /
    • 2004
  • TB-tree와 같이 시공간에서 궤적 검색을 위한 색인 구조는 단말 노드에 하나의 궤적만을 저장하는 궤적 보존의 특성을 가지기 때문에 궤적의 일부분을 추출하는 항해 질의(Navigational Query)에서 우수한 성능을 보인다. 그러나, 궤적 보존을 위해 공간적 지역성을 완전히 배제하는 구조를 가짐으로써 비단말 노드의 MBR(Minimum Bounding Rectangle)은 큰 사장 영역을 가지는 단점이 있다. 사장 영역 증가는 노드간의 중첩을 높이는 원인을 제공하기 때문에 영역 질의의 성능을 저하시키는 문제가 있다. 이 논문에서는 궤적 검색을 위한 색인 구조에서 항해질의 성능을 유지하면서 영역 질의의 성능을 향상시키기 위한 비단말 노드 분할 정책과 엔트리 재배치 정책을 제시한다. 분할 정책은 비단말 노드의 분할시 비단말 노드의 MBR을 최대한 감소시키는 최대 영역 축소(Maximal Area Reduction) 정책을 사용하고, 엔트리 재배치 정책은 비단말 노드를 구성하는 다수의 엔트리에서 MBR을 최대로 감소시킬 수 있는 엔트리의 위치를 재배치시키는 방법으로 이 논문에서는 분할 방법에 따라 2가지 재배치 전략을 제시하고 TB-tree와 성능을 비교한다.

웹 기반 GIS 응용을 위한 변경 프로토콜 (Update Protocols for Web-Based GIS Applications)

  • 안성우;서영덕;김진덕;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.321-333
    • /
    • 2002
  • 웹 기반 서비스의 급속한 성장으로 다양한 서비스를 이용할 수 있도록 웹 환경에서 공간 데이타의 동시 변경이 가능해야 한다. 웹 기반 GIS 응용은 다양한 사용자 층에 대한 요구를 만족시키기 위하여 다양한 서비스 데이타를 필요로 하고, 이 데이타들은 지속적으로 변경되어야 한다. 또한 웹 환경에서 사용하는 HTTP 프로토콜은 연결 해제(Connectionless)와 상태 비유지(Stateless)를 가정한다. 그러나 웹 환경에서 웹 클라이언트에 의한 데이타 변경 시, 긴 트랜잭션이 특징인 공간 데이타베이스 등의 응용은 클라이언트 간의 동시성과 서버 데이타의 일관성 유지에 문제점을 발생시킨다. 이 논문에서는 웹 환경에서 웹 클라이언트가 서버 측의 공간 데이타를 변경할 때 서버 데이타의 일관성 유지를 위한 해결책을 제시한다. 웹 환경에서 공간 데이타를 변경할 때 HTTP 프로토콜의 연결 해제와 상태 비유지에 의해서 발생하는 휴면 영역 잠금(Dormancy Region Lock) 문제를 영역 잠금 기법인 RX(Region-exclusive) 잠금과 주기적인 메시지(ALIVE_CLIENTi) 전송에 의해서 해결한다. 그리고 이 방법을 기반으로 한 프로토콜을 제시하고, 메인 메모리 공간 데이타베이스 시스템인 사이버맵을 이용한 시스템 설계 및 구현을 통하여 검증하고 있다.

경로정보의 중복을 제거한 XML 문서의 저장 및 질의처리 기법 (Storage and Retrieval of XML Documents Without Redundant Path Information)

  • 이혜자;정병수;김대호;이영구
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.663-672
    • /
    • 2005
  • 본 논문에서는 대용량 XML 문서를 저장하고 그로부터 원하는 정보를 효율적으로 찾기 위한 방법으로, 경로정보의 중복을 제거하면서 역 인덱스를 함께 이용한 방법을 제안한다. XML 문서는 트리구조에 기반한 노드로 분해되어, 노드 타입에 따라, 루트에서 각 노드까지의 경로정보와 함께 관계형 테이블에 저장된다. 경로정보를 이용한 기존의 U 질의 기법들에서는 모든 엘리먼트 노드들에 대해 경로정보를 저장함에 따라 정보의 양이 증가하여 질의 처리의 성능을 저하시키는 요인이 되고 있다. 제안 방법에서는 경로정보 중 가장 긴 단말 엘리먼트 노드까지의 경로인 단말 엘리먼트 경로(leaf element path)만 저장하고 내부 엘리먼트 노드까지의 경로인 내부 엘리먼트 경로들(internal element paths)은 저장하지 않는다. 단말 엘리먼트 경로만을 대상으로 하여 역 인덱스를 구성함에 따라, 기존의 역 인덱스 이용 기법에 비해 키워드별 포스팅 리스트(posting lists)의 수를 줄이게 된다. 제안 방법에서는 U 문서의 저장과 질의를 위하여 XML 문서에 대한 스키마 정보가 없어도 되며, 관계형 데이터베이스의 어떤 확장도 요구하지 않는다. 실험을 통해 제안 방법은 실험 범위 내에서 기존 기법들에 비해 좋은 성능을 보인다.