• Title/Summary/Keyword: 데이터베이스 중복

Search Result 229, Processing Time 0.021 seconds

Evaluation of the Redundancy in Decoy Database Generation for Tandem Mass Analysis (탠덤 질량 분석을 위한 디코이 데이터베이스 생성 방법의 중복성 관점에서의 성능 평가)

  • Li, Honglan;Liu, Duanhui;Lee, Kiwook;Hwang, Kyu-Baek
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.1
    • /
    • pp.56-60
    • /
    • 2016
  • Peptide identification in tandem mass spectrometry is usually done by searching the spectra against target databases consisting of reference protein sequences. To control false discovery rates for high-confidence peptide identification, spectra are also searched against decoy databases constructed by permuting reference protein sequences. In this case, a peptide of the same sequence could be included in both the target and the decoy databases or multiple entries of a same peptide could exist in the decoy database. These phenomena make the protein identification problem complicated. Thus, it is important to minimize the number of such redundant peptides for accurate protein identification. In this regard, we examined two popular methods for decoy database generation: 'pseudo-shuffling' and 'pseudo-reversing'. We experimented with target databases of varying sizes and investigated the effect of the maximum number of missed cleavage sites allowed in a peptide (MC), which is one of the parameters for target and decoy database generation. In our experiments, the level of redundancy in decoy databases was proportional to the target database size and the value of MC, due to the increase in the number of short peptides (7 to 10 AA). Moreover, 'pseudo-reversing' always generated decoy databases with lower levels of redundancy compared to 'pseudo-shuffling'.

The Replication Control using the Replica Tree in the Partially Replicated Databases (부분 중복 데이터베이스에서 사본 트리를 이용한 중복 제어)

  • Bae, Mi-Sook;Hwang, Bu-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11c
    • /
    • pp.1453-1456
    • /
    • 2003
  • 데이터의 중복은 데이터의 가용성과 시스템의 성능을 향상시키기 위해 사용한다. 대규모 부분 중복 데이터베이스에서 효율적인 중복 관리를 위해서는 정확한 수행을 보장하기 위한 정확성 검증방법과 효율적인 갱신 전파 방법이 필요하다. 이 논문에서는 부분 중복 환경에서 각 주사본 사이트의 중복 데이터에 대한 트리 구조를 기반으로 한 갱신 전파 방법을 제시하며, 갱신 지연 전파로 인해 갱신 전파도중에 발생할 수 있는 전파 트랜잭션과 주 트랜잭션의 충돌로 인한 비직렬성 문제를 타임스탬프와 상태 데이터베이스를 이용하여 해결한다. 이것은 판독 가용성을 증가시키면서 비직렬성으로 인한 재수행을 회피하게 되어 트랜잭션의 완료율을 증가시킨다.

  • PDF

Design and Implementation of Real-Time Cache Server Using Memory Resident DBMS (주기억장치 상주형 DBMS를 이용한 실시간 캐쉬서버 설계 및 구현)

  • Kim, Jong-Chun;Doo, Yong-Jae;Jin, Seong-Il
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1635-1638
    • /
    • 2003
  • 이질적인 데이터베이스간의 중복 데이터 일관성을 유지문제를 해결함으로써 기존의 디스크 기반 범용 데이터베이스를 사용하는 시스템의 방대한 데이터들을 주기억장치 상주형 데이터베이스에 중복 저장함으로써 디스크 I/O 와 관련된 지연 시간 없이 빠른 성능 향상을 기대할 수 있으므로 네트워크상의 불특정 다수의 서비스 형태에 빠른 응답 시간과 처리 시간을 제공 할 수 있다. 본 본문에서 제시하는 중복 데이터 일관성 유지 기법은 디스크 기반 범용 데이터베이스의 REDO LOG를 참조하여 갱신트랜잭션에 관한 로그를 주기억 상주형 데이터베이스에 적용하도록 설계하고 두 데이터베이스간의 일관성 유지를 위해 수행되는 기능들이 성능 향상을 위한 목적을 위배하지 않으면서 이질적인 데이터베이스간의 일관성을 보장하도록 한다. 또한 두 데이터베이스의 성능 차이로 인해 발생할 수 있는 문제점들을 해결하고, 시스템 붕괴 시를 고려하여 유지되지 못한 데이터 일관성에 대해서도 복구 후에 일관성 유지를 가능케 하는 기법을 제공한다.

  • PDF

Design of Main Memory Database Replication System (주기억장치 데이터베이스 중복 시스템 설계)

  • Choi, Jung-Hyun;Choi, Woo-Young;Jin, Seong-Il;Yeom, Tai-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1883-1886
    • /
    • 2002
  • 본 논문은 많은 종류의 인터넷 정보시스템에서 데이터의 고속 검색과 저장 및 처리를 지원하는 주기억장치 데이터베이스 시스템을 중복하여 관리할 수 있는 중복 주기억장치 데이터베이스 시스템의 요구사항에 대해 알아본다. 아울러, 자료의 고속처리라는 측면을 주로 고려하여 중복되어 관리되는 주기억장치 데이터베이스 시스템의 아키텍쳐 및 트랜잭션 수행구조를 설계한다.

  • PDF

돋보기 / 정부 부처간 IT부문 업무 조정

  • Korea Database Promotion Center
    • Digital Contents
    • /
    • no.8 s.99
    • /
    • pp.39-43
    • /
    • 2001
  • 정부의 업무 중 각 부처간 영역에 있어 중복 부분은 늘 있게 마련이다. 때문에 정부는 각 부처 간 중복 사업 때문에 언론의 지탄을 받기도 했다. 최근 들어서 IT부문의 중복 투자 및 업무영역 분쟁 등으로 언론에 오르내렸던 부분이 관련 부처의 협의를 통해 수정되었다. 특히, 정통부와 산자부, 정통부와 문화부, 정통부와 공정위 등 IT산업의 특성상 정통부와의 업무 중복 논란이 많았던 점을 감안할때 정통부 업무와 관련한 조정이 많았던 것이 특징이다. 더불어 정통부는 정보통신산업 및 정보화의 종합 조정 부처로서의 역할을 담당한다는 것에 합의안을 도출했다. 관련 기관 및 업계에 정보를 전달하기 위해 지난 7월 13일 최종 합의된 정부부처간 경제정책 조정회의 최종안을 게재한다.

  • PDF

Vertical Relation Partitioning Method With Attribute Replications (속성 중복을 고려한 릴레이션의 수직 분할방법)

  • 유종찬;김재련
    • Proceedings of the Korea Database Society Conference
    • /
    • 1997.10a
    • /
    • pp.504-514
    • /
    • 1997
  • 관계형 데이터베이스의 성능을 향상시키는데 중요한 요소 중의 하나는 트랜잭션을 처리하기 위해 데이터를 디스크에서 주기억장치로 옮기는데 필요한 디스크 액세스(access) 횟수이다. 본 연구는 관계형 데이터베이스에서 트랜잭션을 처리할 때, 릴레이션(relation)을 수직분할하여 디스크에 단편(fragment)으로 저장하므로써 필요한 단편만 액세스하여 액세스 횟수를 감소시키는데 목적이 있다. 단편에 속성을 중복할당하여 수직분할하므로써 트랜잭션을 만족시키는 단편의 수를 감소시켜 중복할당을 고려하지 않은 방법보다 디스크 액세스 횟수를 감소시킬 수 있다. 갱신트랜잭션의 경우 하나의 속성이 갱신되면 중복된 속성을 모두 갱신하여야 하므로 액세스 횟수가 증가하지만, 조회트랜잭션의 경우 각 단편에 속성을 중복할당하여 액세스 횟수를 감소시킬 수 있다. 본 연구에서는 속성의 중복을 허용하여 단편을 구성하는 경우에 중복을 고려하지 않은 경우를 포함하므로 효과적으로 디스크 액세스 횟수를 감소시킬 수 있다. 본 연구에서는 중복할당을 고려하여 디스크의 액세스 횟수를 최소화시킬 수 있는 수직분할문제의 0-1 정수계획모형을 개발하고, 모형에 대한 최적해법으로 분지한계법을 제안한다.

  • PDF

A Study of Overlap Records of Korean Medical Papers Retrieved from EMBASE, MEDLINE and SCISEARCH : Their Extent and Characteristics (EMBASE, MEDLINE, SCISEARCH에서 검색된 한국의학논문의 중복정도와 특성분석)

  • 이춘실;이은숙
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.105-108
    • /
    • 1998
  • 여러 색인들에 수록된 한국의학논문의 중복정도를 연구하여, 연구업적을 효율적으로 평가하기 위한 색인 선정방법을 제시하고자 하였다. EMBASE, MEDLINE, SCISEARCH에 수록된 1990년에서 1995년 사이의 한국의학논문 중에서, 외국 학술지에 게재된 한국의학논문의 건수와 연도별 증가추이를 조사 분석하였다. 1990년, 1992년, 1994년 3개년을 선정하여, 2개 이상 데이터베이스에서 중복 검색된 논문수, 특정 데이터베이스에서만 검색된 논문수, 그 논문들이 실린 학술지를 분석하였다. 의학연구업적을 평가할 때에, 한 개의 데이터베이스를 사용한다면 한국의학논문이 가장 많이 검색된 SCISEARCH를, 두 개의 데이터베이스를 활용한다면 EMBASE를 추가하는 것이 효율적인 데이터베이스 선정방법이라고 할 수 있다.

  • PDF

The Consistency Management Using Trees of Replicated Data Items in Partially Replicated Database (부분 중복 데이터베이스에서 중복 데이터의 트리를 이용한 일관성 유지)

  • Bae, Mi-Sook;Hwang, Bu-Hyun
    • The KIPS Transactions:PartD
    • /
    • v.10D no.4
    • /
    • pp.647-654
    • /
    • 2003
  • The replication of data is used to increase its availability and to improve the performance of a system. The distributed database system has to maintain both the database consistency and the replica consistency. This paper proposes an algorithm which resolves the conflict of the operations by using the mechanism based on the structure that the replicas of each data item are hierarchically organized. Each update is propagated along the tree based on the fact that the root of each data item is the primary replica in partially replicated databases. The use of a hierarchy of data may eliminate useless propagation since the propagation can be done only to sites having the replicas. In consequence, the propagation delay of updates may be reduced. By using the timestamp and a compensating transaction, our algorithm resolves the non-serializability problem caused by the conflict of operations that can happen on the way of the update propagation due to the lazy propagation. This resolution also guarantees the data consistency.

A Vertical File Partitioning Method Allowing Attribute Replications (속성 중복을 허용한 파일 수직분할 방법)

  • 유종찬;김재련
    • The Journal of Information Technology and Database
    • /
    • v.4 no.2
    • /
    • pp.3-19
    • /
    • 1998
  • 관계형 데이터베이스 성능을 향상시키는데 중요한 요소 중의 하나는 트랜잭션을 처리하기 위해 데이터를 디스크에서 주 기억장치로 옮기는데 필요한 디스크 액세스(access) 횟수이다. 본 연구는 관계형 데이터베이스에서 트랜잭션을 처리할 때, 릴레이션(relation)을 속성의 중복할당을 허용하여 분할하고, 디스크에 단편(fragment)으로 저장하므로써 필요한 단편만을 액세스하여 디스크의 액세스 횟수를 줄이는 방법을 연구하였다. 본 연구에서는 속성의 중복할당을 허용하여 디스크의 액세스 횟수를 최소화시킬 수 있는 수직분할문제에 수리모형을 조회, 갱신트랙잭션을 모두 고려하여 0-1 정수계획법으로 개발하였다. 또한 모형에 대한 최적해법으로 분지한계법을 제안하였으며, 분지한계법으로 큰 문제를 푸는데는 많은 시간이 소요되므로 계산량을 줄일 수 있는 초기처리방법과 비용계산방법을 제안하였다. 속성의 중복을 허용하여 구한 해가 중복을 고려하지 않은 경우의 해보다 디스크 액세스횟수가 감소한 것으로 나타났으며, 갱신트랜?션의 수가 증가함에 따라 중복되는 속성의 수가 감소하는 결과를 나타내었다.

A Heterogeneous Mobile Data Synchronization Technique Using the Tuple Based Message Digest (튜플 단위 메시지 다이제스트를 이용한 이기종 모바일 데이터 동기화 기법)

  • Park, Seong-Jin
    • Journal of Internet Computing and Services
    • /
    • v.7 no.5
    • /
    • pp.1-12
    • /
    • 2006
  • In mobile database environments, the efficient synchronization technique is required to maintain the consistency of replicated data because the same data can be replicated between so many different databases, In this paper, we propose a message digest based synchronization technique to maintain the consistency of replicated data between client databases and a server database in mobile environments. The proposed data synchronization technique has the advantage of generality aspect and extensibility aspect by using the tuple-based message digest output to detect the data conflicts.

  • PDF