• 제목/요약/키워드: main-memory databases

검색결과 37건 처리시간 0.018초

PPFP(Push and Pop Frequent Pattern Mining): 빅데이터 패턴 분석을 위한 새로운 빈발 패턴 마이닝 방법 (PPFP(Push and Pop Frequent Pattern Mining): A Novel Frequent Pattern Mining Method for Bigdata Frequent Pattern Mining)

  • 이정훈;민연아
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권12호
    • /
    • pp.623-634
    • /
    • 2016
  • 현존하는 빈발 패턴 마이닝 방법은 대부분 시간 효율성을 목표로 하고, 물리적 메모리 사용에 매우 의존적이다. 하지만 빅데이터 시대가 도래함에 따라 실제 세상의 데이터베이스는 급속도로 증가하고 있으며, 그에 따라 기존의 방법으로 현실적인 거대한 양의 데이터를 마이닝하기에 물리적 메모리 공간이 부족한 실정이다. 이러한 문제를 해결하기 위해, 빈발 패턴 마이닝의 메모리 의존성을 줄이기 위한 보조저장장치 기반의 연구들이 진행되었으나, 메모리 기반의 방법들에 비해 처리 시간이 너무 많이 소비된다는 한계가 있었다. 따라서 확장성을 가지며, 기존의 디스크 기반의 방법들에 비해 시간효율성을 높인 새로운 빈발 패턴 마이닝이 필요하게 되었다. 본 논문에서는 빅데이터로부터 빈도 아이템 집합들을 마이닝하기 위해 메모리와 디스크를 함께 사용하는 스택 기반의 새로운 접근법인 PPFP 알고리즘을 제안하였다. PPFP는 빈발 패턴 마이닝 접근법 중 가장 인기 있고 효율적인 접근법 중 하나인 FP-growth를 기반으로 하고 있다. PPFP 마이닝 방법은 다음과 같이 두 단계로 진행된다. (1) IFP-tree 구축: FP-tree를 생성한 후, 새로운 인덱스 번호 부여 방법으로 FP-tree의 각 노드에 인덱스 번호를 부여하고, 이 인덱스 번호가 부여된 FP-tree(IFP-tree)를 테이블로 변환하여(IFP-table) 디스크에 저장한다. (2) PPFP 알고리즘을 이용한 빈발 패턴 마이닝: 스택 기반의 PUSH-POP 방식으로 패턴을 확장시켜 나가며 빈발 패턴을 마이닝한다. 이러한 방식을 통해 메모리 기반의 방법에 비해 반복적으로 많은 시간이 소모되는 연산에 매우 적은 양의 메모리를 활용하여 확장성과 함께 시간효율성 또한 향상시킬 수 있었다. 그리고 기존의 연구 방법들과 비교 실험을 통해 새로운 알고리즘의 성능을 증명하였다.

한시적 연관규칙을 위한 데이타 주도 탐사 기법 (Data-Driven Exploration for Transient Association Rules)

  • 조일래;김종덕;이도헌
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.895-907
    • /
    • 1997
  • 연관규칙(asscociation rule) 탐사(mining)는 대용량 데이타베이스로부터 사건간의 동시 발생 경향을 발견하는 작업이다. 기존의 연관규칙은 전체 트랜잭션에 대하여 성립하는 사건 간의 연관 관계만을 고려하고 있다. 그러나 어떤 연관규칙은 비록 전체 시간구간에 대해서는 신뢰도가 그리 높지 않더라도 특징 기간에서 특별히 강한 신뢰도로 성립할 수 있고, 이러한 정보를 알 수 있다면 의사 결정에 매우 유용하리라고 생각한다. 본 논문 에서는 임의의 부분 시간구간에서 특별히 높은 신뢰도를 갖는 연관성을 한시적 연관규칙(transient assosiation rule)이라 정의하고, 대용량의 데이타베이스로부터 한시적 연관규칙이 성립하는 시간구간을 탐사하는 효율적인 알고리즘을 제안한다. 제안된 알고리즘은 불필요한 구간 검색을 배제할 수 있는 데이타 주도(data-driven) 검색 기법을 제시하고, 한 번의 데이타베이스 스캐닝(scaning)으로 다음 단계의 검색에 필요한 정보를 획득하여 주기억장치 상에 관리할 수 있도록 하는 효과적인 자료구조를 설계한다. 아울러 실험을 통해, 제안 알고리즘이 현장에 적용할 만한 시간 비용으로 수행됨을 보인다.

  • PDF

공간 효율적인 DNA 시퀀스 인덱싱 방안 (A Space Efficient Indexing Technique for DNA Sequences)

  • 송혜주;박영호;노웅기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.455-465
    • /
    • 2009
  • 서픽스 트리는 공통의 프리픽스의 빈도수가 높을 때 효과적인 알고리즘으로, 한정된 문자로만 구성된 DNA 유사성 검색을 위한 연구에서 널리 활용되고 있다. 그러나, 서픽스 트리는 인덱스 특성상 메모리 공간을 많이 차지하며, 트리의 분할 시 DNA 시퀀스의 비율로 인한 쏠림현상이 발생한다는 문제점을 가진다. 따라서, 본 논문에서는 공통의 프리픽스를 가지는 가변길이의 파티셔닝 방법으로 합병하지 않는 인덱싱 방안인 SENoM을 제안한다. SENoM은 전체 시퀀스에서 공통의 프리픽스를 가지는 서픽스들의 발생 빈도수가 임계치 이하인 경우 디스크에 저장하고, 임계치 이상인 경우 임계치 이하가 될 때까지 프리픽스를 확장한다. 모든 파티션은 서브트리로 구축한 후 디스크에 저장하며, 질의처리를 위해, 구축된 파티션의 프리픽스를 서픽스로 가지는 트리를 구축한다. 제안하는 기법은 복잡한 합병과정을 제거하고, 많은 파티션 발생으로 인한 디스크 I/O 발생을 줄인다. 실험을 통해, SENoM이 Trellis 알고리즘에 비해 메모리 사용량을 약 35%, 인덱스 크기를 약 20% 감소시켰음을 보인다. 또한, 질의길이가 긴 경우에도 프리픽스 트리를 이용하여 효과적인 질의처리가 가능함을 보인다.

관계형 데이터베이스의 물리적 설계에서 유전해법을 이용한 속성 중복 수직분할 방법 (An Attribute Replicating Vertical Partition Method by Genetic Algorithm in the Physical Design of Relational Database)

  • 유종찬;김재련
    • 산업경영시스템학회지
    • /
    • 제21권46호
    • /
    • pp.33-49
    • /
    • 1998
  • In order to improve the performance of relational databases, one has to reduce the number of disk accesses necessary to transfer data from disk to main memory. The paper proposes to reduce the number of disk I/O accesses by vertically partitioning relation into fragments and allowing attribute replication to fragments if necessary. When zero-one integer programming model is solved by the branch-and-bound method, it requires much computing time to solve a large sized problem. Therefore, heuristic solutions using genetic algorithm(GA) are presented. GA in this paper adapts a few ideas which are different from traditional genetic algorithms, for examples, a rank-based sharing fitness function, elitism and so on. In order to improve performance of GA, a set of optimal parameter levels is determined by the experiment and makes use of it. As relations are vertically partitioned allowing attribute replications and saved in disk, an attribute replicating vertical partition method by GA can attain less access cost than non-attribute-replication one and require less computing time than the branch-and-bound method in large-sized problems. Also, it can acquire a good solution similar to the optimum solution in small-sized problem.

  • PDF

주기억장치 데이타베이스에서 교착 상태의 검출을 위한 락 대기 정보의 효과적인 상호 배제 기법 (An Effective Method Guaranteeing Mutual Exclusion of Lock Waiting Information for Deadlock Detection in Main Memory Databases)

  • 김상욱;이승선;최완
    • 한국통신학회논문지
    • /
    • 제24권7B호
    • /
    • pp.1313-1321
    • /
    • 1999
  • 이단계 라킹 규약은 다수의 트랜잭션들의 수행이 병행되는 데이터베이스 환경에서 데이터의 논리적인 일관성을 보장하기 위하여 널리 사용되는 동시성 제어 기법이다. 이단계 라킹 규약을 사용하는 시스템에서는 두 개 이상의 트랜잭션들이 락을 잡은 상태를 서로 다른 트랜잭션이 가진 락을 무한정으로 상호 대기하는 교착 상태가 발생할 수 있다. 교착 상태 검출기는 트랜잭션들 간의 락 대기 정보를 기반으로 시스템 내에 교착 상태가 발생하였는가를 주기적으로 검출하는 기능을 제공한다. 데이터베이스 시스템에서는 트랜잭션들과 교착 상태 검출기의 수행이 병행되며, 이들은 각각의 수행을 위하여 락 대기 정보를 공통으로 읽고 쓰게 된다. 이와 같이, 락 대기 정보는 공유 정보에 해당되므로 상호 배제 기법을 이용한 락 대기 정보의 물리적 일관성을 보장하는 기법이 요구된다. 특히, 고성능의 주기억장치 데이타베이스에서는 이러한 상호 배제 기법의 성능이 전체 시스템에 큰 영향을 미치게 되므로 효율적인 상호 배제 기법은 매우 중요하다. 본 연구에서는 락 대기 정보의 물리적 일관성을 효과적으로 보장하는 새로운 상호 배제 기법을 제안한다. 제안\ulcorner는 기법은 상호 배제를 위한 처리 오버헤드를 극소화하고, 전체 시스템의 동시성을 극대화하는 것을 주요 목표로 한다.

  • PDF

The opportunities of virtual reality in the rehabilitation of children with attention deficit hyperactivity disorder: a literature review

  • Bashiri, Azadeh;Ghazisaeedi, Marjan;Shahmoradi, Leila
    • Clinical and Experimental Pediatrics
    • /
    • 제60권11호
    • /
    • pp.337-343
    • /
    • 2017
  • Attention deficit hyperactivity disorder (ADHD) is one of the most common psychiatric disorders in childhood. This disorder, in addition to its main symptoms, creates significant difficulties in education, social performance, and personal relationships. Given the importance of rehabilitation for these patients to combat the above issues, the use of virtual reality (VR) technology is helpful. The aim of this study was to highlight the opportunities for VR in the rehabilitation of children with ADHD. This narrative review was conducted by searching for articles in scientific databases and e-Journals, using keywords including VR, children, and ADHD. Various studies have shown that VR capabilities in the rehabilitation of children with ADHD include providing flexibility in accordance with the patients' requirements; removing distractions and creating an effective and safe environment away from real-life dangers; saving time and money; increasing patients' incentives based on their interests; providing suitable tools to perform different behavioral tests and increase ecological validity; facilitating better understanding of individuals' cognitive deficits and improving them; helping therapists with accurate diagnosis, assessment, and rehabilitation; and improving working memory, executive function, and cognitive processes such as attention in these children. Rehabilitation of children with ADHD is based on behavior and physical patterns and is thus suitable for VR interventions. This technology, by simulating and providing a virtual environment for diagnosis, training, monitoring, assessment and treatment, is effective in providing optimal rehabilitation of children with ADHD.

웹 기반 GIS 응용을 위한 변경 프로토콜 (Update Protocols for Web-Based GIS Applications)

  • 안성우;서영덕;김진덕;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권4호
    • /
    • pp.321-333
    • /
    • 2002
  • 웹 기반 서비스의 급속한 성장으로 다양한 서비스를 이용할 수 있도록 웹 환경에서 공간 데이타의 동시 변경이 가능해야 한다. 웹 기반 GIS 응용은 다양한 사용자 층에 대한 요구를 만족시키기 위하여 다양한 서비스 데이타를 필요로 하고, 이 데이타들은 지속적으로 변경되어야 한다. 또한 웹 환경에서 사용하는 HTTP 프로토콜은 연결 해제(Connectionless)와 상태 비유지(Stateless)를 가정한다. 그러나 웹 환경에서 웹 클라이언트에 의한 데이타 변경 시, 긴 트랜잭션이 특징인 공간 데이타베이스 등의 응용은 클라이언트 간의 동시성과 서버 데이타의 일관성 유지에 문제점을 발생시킨다. 이 논문에서는 웹 환경에서 웹 클라이언트가 서버 측의 공간 데이타를 변경할 때 서버 데이타의 일관성 유지를 위한 해결책을 제시한다. 웹 환경에서 공간 데이타를 변경할 때 HTTP 프로토콜의 연결 해제와 상태 비유지에 의해서 발생하는 휴면 영역 잠금(Dormancy Region Lock) 문제를 영역 잠금 기법인 RX(Region-exclusive) 잠금과 주기적인 메시지(ALIVE_CLIENTi) 전송에 의해서 해결한다. 그리고 이 방법을 기반으로 한 프로토콜을 제시하고, 메인 메모리 공간 데이타베이스 시스템인 사이버맵을 이용한 시스템 설계 및 구현을 통하여 검증하고 있다.