• 제목/요약/키워드: 데이터베이스 중복

검색결과 229건 처리시간 0.024초

의사결정 트리 앙상블을 구축하기 위한 상관성 기반 기법을 이용한 속성 중복성 제거 (Removing the Feature Redundancy using Correlation-Based Approach for Decision Tree Ensemble)

  • 박영준;박명호;손호선;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1229-1231
    • /
    • 2011
  • 대량의 분류 규칙 탐사 과정은 앙상블기법을 사용하여 다양한 연구들이 이루어지고 있다. 본 논문에서는 의사결정 트리의 분열 문제와 singleton 포함 한계를 해결하기 위하여 Cascading-and-Sharing 앙상블 기법을 적용하여 점진적 다중 의사결정 트리를 구축하였다. 또한 분류의 정확도를 향상시키고, 트리의 복잡도와 모델 과잉접합을 피하기 위하여 다중 트리 구축과정에서 선형 상관분석기법을 기반으로 훈련 데이터 속성들의 중복성을 제거하였다. 실험 결과, 속성들의 중복성을 제거하여 구축한 트리들은 원래 기법보다 더 좋은 결과를 보여주었다.

중복 데이터베이스 시스템에서 낙관적인 원자적 방송을 이용한 동시성제어 기법 (A Concurrency Control Technique Using Optimistic Atomic Broadcast In Replicated Database Systems)

  • 최희영;황부현
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.543-552
    • /
    • 2001
  • 중복 데이터베이스 시스템에서 트랜잭션을 처리하기 위해서 원자적 방송이 주로 사용된다. 그런데 원자적 방송을 사용할 경우에는 트랜잭션을 처리하기 전에 먼저 서버들 사이에 조정단계가 선행되어야 하므로 트랜잭션 지연과 같은 문제점이 있다. 이 논문에서는 원자적 방송을 사용하여 트랜잭션을 처리할 경우에 발생되는 트랜잭션 지연문제를 해결할 수 있는 알고리즘을 제안한다. 이를 위해서 제안된 알고리즘에서 트랜잭션은 낙관적인 방법을 이용하여 처리하고, 판독연산은 트랜잭션이 제출된 사이트에서 수행된다. 그리고 기록연산은 중복된 모든 사이트에서 원자적으로 갱신이 이루어지도록 한다. 이렇게 함으로써 각 사이트의 클라이언트가 지역 데이터베이스에 제출한 연산을 모든 사이트에서 독립적으로 수행할 수 있게 되어 병행성이 향상되고 트랜잭션의 지연이 방지된다. 또한 트랜잭션이 직렬가능성은 완료 검사 단계에서 트랜잭션의 순서번호를 검사함으로서 보장되도록 한다.

  • PDF

국가학술연구인력 데이터베이스 구축에 관한 연구 (A Study on the Development of National Researcher Information Database)

  • 지정규
    • 한국컴퓨터정보학회지
    • /
    • 제10권1호
    • /
    • pp.16-23
    • /
    • 2003
  • 본 논문은 국가학술연구인력 데이터베이스의 구축 방안에 대해 기술했다. 학술연구자 정보는 국가적 연구지원 관련 업무의 가장 기본이 되고, 사회 각 분야에 있어서의 연구활동에 참여할 최적의 연구자를 찾거나 연구계획서를 심사할 최적의 심사자를 찾는데 필수적이다. 그러나 학술연구자 관련 정보들이 중복 구축되어 여러 낭비요소들이 많고 정보의 일관성이 유지되지 않아 정보로서의 질적 가치 저하로 오히려 혼란만 가중되고 있으며, 표준화 미비로 상호 정보 교환이 어려운 실정이다. 따라서 국가적 차원에서 표준 형식의 국가학술연구인력 데이터베이스를 구축하여 모든 관련 기관이나 연구자들이 공유함으로써 중복 구축에 따른 비용을 절감하고, 일관성을 유지하여 정확한 정보를 제공할 수 있는 구축방안을 제시하고자 한다.

  • PDF

공간 데이터베이스의 중복 제어를 위한 Floating Primary Copy 기법 (Floating Primary Copy Method for Replica Control of Spatial Data)

  • 최진오
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.68-72
    • /
    • 2002
  • CIS 응용에서 공간 객체들이 여러 사이트에 걸쳐 중복 저장되어 있다면, 이 객체들의 수정 시 일관성 제어를 위한 중복 제어 기법이 필요하다. 그러나, 일반적인 비즈니스 데이터를 위한 정통적인 중복 제어기법은 공간 데이터에는 그대로 사용될 수 없다. 공간 데이터의 수정은 긴 트랜 션을 필요로 하며, 또한 일반 데이터와 달리 데이터간의 공간 종속성을 지니기 때문이다. 본 논문은 기존의 Primary Copy 중복 제어 기법을 확장하며, time-stamp에 기반하여 Primary Copy 사이트가 변경되는 Floating Primary Copy 기법을 제안한다. 본 논문에서 제안하는 중복 제어 기법은 Primary Copy 사이트를 동적으로 변경함으로써, 긴 트랜 션의 중복 일관성 제어를 지원할 수 있다.

  • PDF

EMBASE, MEDLINE, SCISEARCH에서 검색된 한국의학논문의 중복정도 연구 (A study of overlatp records of Korean medical papers retrieved from EMBASE, MEDLINE, SCISEARCH: Their extents and characteristics)

  • 이춘실;이은숙
    • 정보관리학회지
    • /
    • 제15권2호
    • /
    • pp.29-46
    • /
    • 1998
  • 국내에서는 연구업적을 평가할 때에, 주요국제색인 초록에 수록되는 외국 학술지에 게재된 한국의학노문에 가중치를 부여하고 잇다. 본 논문에서는 이러한 연구업적평가에 이용되는 의학분야의 주요 색인 및 초록 데이터베이스인 EMBASE, MEDLINE, SCISEARCH에 수록된 논문중 1990년에서 1995년 사이에 외국학술지에 발표된 한국의학논문의 중복정도를 측정하고, 그 특성을 분석하여 연구업적 평가의 효율성과 타당성을 제고하기 위한 데이터베이스 선정방법을 제시하고자 하였다. 한국의학논문이 게재되는 학술지의 주제분야, 발행국, 언어 등은 데이터베이스간에 서로 큰 차이를 보이지 않았다. 따라서 각 데이터베이스에서 검색된 논문의 수량만으로 데이터베이스 선정방법을 제시하는 기준으로 하여야 할 것이다. 의학연구업적을 평가할때에, 한개의 데이터베이스를 사용한다면 MEDLINE보다는 한국의학논문이 가장 많이 검색된 SCISEARCH를, 두 개의 데이터베이스를 활용한다면 EMBASE를 추가하는 것이 효율적인 데이터베이스 선정방법이라고 할 수 있다.

  • PDF

수출입 컨테이너화물 통합데이터베이스 구축

  • 최형림;김현수;박남규;박영재;김성훈;이현철
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 1999년도 종합학술대회발표논문집
    • /
    • pp.408-416
    • /
    • 1999
  • 우리 나라의 수출입은 대부분 항만을 통해서 이루어지고 있으나 수출입 전체적인 흐름에서의 정보교환이 원활히 이루어지고 있지 않아 육상물류와 해상물류와의 정보흐름이 단절되어 육상물류부문에서 생겨나는 원천정보를 활용할 수 없다. 또한 각 선사를 비롯한 해운대리점과 관련업계, 그리고 정부기관들이 독자적인 데이터베이스를 보유하고 있어 정보의 중복성, 불일치성 등이 문제점으로 지적되고 있다. 그리고 물류망의 경우 망업자라는 한계와 독자적인 데이터베이스를 보유하지 못함으로써 항만관련업자나 기관들에 보다 유익한 정보를 제공 하지 못하고 있다. 이에 본 논문에서는 우리 나라의 수출입 물동량 중 가장 비중이 높은 컨테이너 화물을 대상으로 수출입 컨테이너화물의 모든 정보를 원천지에서부터 입수하여 이를 통합 관리하여 저장함으로써 육상과 해상의 정보흐름을 유연하게 연계시킴은 물론 데이터의 불일치, 중복성 등과 같은 문제를 해결하고자 하였다. 본 연구에서 구축 된 통합데이터베이스 시스템은 컨테이너화물의 수출입과정에서 발생하는 모든 정보를 활용할 수 있도록 이들을 거시적인 관점에서 구조화하였으며, 또한 수출입상의 EDI 업무를 지원하기 위해 통합데이터베이스의 데이터와 코드를 설계하였다. 마지막으로 이러한 정보를 실시간으로 제공하고 사용자의 접근성을 높임과 동시에 사용자에게 비용의 부담을 줄일 수 있도록 웹을 기반으로 하여 모든 정보의 입력과 조회 및 정보의 교환이 가능하도록 하였다.

  • PDF

수출입 컨테이너화물 통합데이터베이스 구축

  • 최형림;김현수;박남규;박영재;김성훈;이현철
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 1999년도 추계학술대회논문집
    • /
    • pp.207-215
    • /
    • 1999
  • 우리 나라의 수출입은 대부분 항만을 통해서 이루어지고 있으나 수출입 전체적인 흐름에서의 정보교환이 원활이 이루어지고 있지 않아 육상물류와 해상물류와의 정보흐름이 단절되어 육상물류에서 생겨나는 원천정보를 활용할 수 없다. 또한 각 선사를 비롯한 해운대리점과 관련업계, 그리고 정부기관들이 독자적인 데이터베이스를 보유하고 있어 정보의 중복성, 불일치성 등이 문제점으로 지적되고 있다. 그리고 물류망의 경우 망업자라는 한계와 독자적인 데이터베이스를 보유하지 못함으로써 항만관련업자나 기관들에 보다 유익한 정보를 제공하지 못하고 있다. 이에 본 논문에서는 우리 나라의 수출입 물동량 중 가장 비중이 높은 컨테이너 화물을 대상으로 수출입 컨테이너화물의 모든 정보를 원천지에서부터 입수하여 이를 통합 관리하여 저장함으로써 육상과 해상의 정보흐름을 유연하게 연계시킴은 물론 데이터의 불일치. 중복성 등과 같은 문제를 해결하고자 하였다. 본 연구에서 구축된 통합데이터베이스 시스템은 컨테이너화물의 수출입과정에서 발생하는 모든 정보를 활용할 수 있도록 이들을 거시적인 관점에서 구조화하였으며, 또한 수출입상의 EDI 업무를 지원하기 D NL해 통합 데이터베이스의 데이터와 코드를 설계하였다. 마지막으로 이러한 정보를 실시간제공하고 사용자의 접근성을 높임과 동시에 사용자에게 비용의 부담을 줄일 수 있돌고 웹을 기반으로 하여 모든 정보의 입력과 조회 및 정보의 교환이 가능하도록 하였다.

역할기반 접근 제어를 적용한 데이터베이스 보안 시스템에서의 보안 정책 최소화 (Minimization of Security Policies in Database Security System applying Role-Based Access Control)

  • 정민아;이광호
    • 한국정보통신학회논문지
    • /
    • 제9권6호
    • /
    • pp.1364-1370
    • /
    • 2005
  • 데이터베이스 보안을 위해 주로 정책기반 접근 제어를 이용하며, 이 중 역할 기반 접근 정책의 도입은 강제적 접근 제어 정책과 임의적 접근 제어 정책의 단점을 보완하고자 하는 노력으로, 이를 통하여 적용 환경의 상황에 적합한 보안 정책을 유연하게 시행할 수 있다. 최근 사용자의 다양한 보안 요구사항을 수용하기 위해 정책기반 접근 제어 정책을 변형 및 적용하여 데이터베이스 보안 시스템을 구현한 바 있다. 이러한 시스템에서 보안 정책은 새로운 접근 제어가 필요할 경우 정책을 추가 생성하므로 같은 사용자에 따른 정책들의 중복 현상이 나타나 시스템의 성능을 저하시킬 수 있다. 본 논문에서는 기존의 접근 제어 정책을 변형 및 조합하여 적용한 데이터베이스 보안 시스템에서 역할 기반 접근 제어 정책을 적용하는 과정에서의 정책 중복의 문제를 소개하고 이를 해결하기 위한 정책 관리 모듈을 제안하고자 한다. 정책 관리 모듈은 사용자별로 생성되는 정책에 대하여 중복여부를 검사하고 중복된 정책에 대하여는 삭제하며, 사용자 별로 이미 생성된 정책에 데이터 그룹에 대한 접.근 제어 정책을 통합할 수 있도록 구현하였다.

Mr.Data 칼럼(4) SQL내의 중복성에 관해

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 11호통권66호
    • /
    • pp.98-102
    • /
    • 1998
  • 장황한(redundant) ; 쓸모없는(detrop), 산만한(diffuse), 과잉의(excessive), 필수적이지 않은(inessential), 완곡한(periphrastic), 반복적인(repetitious), 원하지 않는(unwanted), 불필요한(unnecessary) 등은 Chambers Twentieth Century 유의어 사전에서 발췌된 redundant의 유사어들이다(동 사전은 concise, essential, necessary 등과 같은 redundant의 반의어들의 명단도 잘 정리되어 있다). GROUP BY와 HAVING(이후부터는 GBH로 칭하기로 한다)으로 시작하는 절(clauses)들이 SQL내에서 반복적으로 사용된다는 사실을 알고 있는지에 대한 의문을 제기할 수 있다. 다시 말해, SQL 내에서 표현되고, 상기의 절들 모두 또는 어느 한쪽이 포함된 어떠한 종류의 상식적인 질문도 그러한 절들을 사용하지 않고도 표현될 수 있다는 것이다(필자가 여기서 '상식적'이란 말로 한정한 이유는 나중에 설명하겠다). 필자는 중복성에 관해 설명하고 이것이 내포하고 있는 의미에 관해 논의코자 한다.

  • PDF

데이터베이스 테이터의 고장진단 및 복구를 위한 전문가 시스팀

  • 이길행;우왕돈;조주현
    • ETRI Journal
    • /
    • 제14권4호
    • /
    • pp.148-164
    • /
    • 1992
  • 본 논문에서는 TDX-10 데이터베이스 데이터의 고장을 주기적으로 진단하고 복구할 수 있는 고장진단 전문가 시스팀을 제안하고 구현하였다. 실시간 환경 및 분산구조를 갖는 데이터베이스 관리 시스팀에서 데이터베이스의 효과적인 접근을 위해서 필요한 데이터베이스의 데이터 즉, 디렉토리와 딕셔너리는 매우 중요하며 고장이 발생할 경우 데이터베이스 관리시스팀에 미치는 영향은 치명적이다. 따라서, 실시간 환경을 갖는 데이터베이스 관리 시스팀에서 데이터베이스 데이터에 대한 고장 진단 및 복구는 필수적이라고 할 수 있다. 본 논문에서 제안한 고장진단 전문가 시스팀은 데이터베이스 데이터를 운용중 변하는 부분과 변하지 않는 부분으로 분류하고 미리 주어진 고장진단 규칙에 따라 진단하는 방법이다. 데이터베이스 데이터의 고장진단 데이터, 고장진단 규칙, 고장진단 데이터 생성기, 고장진단 데이터 검증기, 그리고 고장진단기로 구성되어 있다. 고장진단 데이터는 고장진단기가 데이터베이스 데이터를 주기적으로 진단하기 위하여 사용하는 마스터 데이터로서 두개가 존재한다. 고장진단 데이터 생성기는 데이터베이스 데이터의 고장진단을 위한 데이터 구조를 생성하고 데이터베이스로부터 데이터베이스를 데이터를 중복하여 읽어들이는 역할을 한다. 이와 같은 과정은 시스팀이 초기에 동작을 시작하거나 운용중 운용자에 의해서 릴레이션의 추가 및 삭제, 그리고 튜플의 추가등과 같은 사건이 발생할 경우에 이루어진다. 데이터베이스 검증기는 고장진단 데이터 생성기가 중복하여 생성한 데이터에 대해서 데이터베이스 데이터의 제작시의 초기 오류를 검증해냄으로써 데이터베이스 관리 시스팀의 안전한 운용을 가능하게 하며 고장진단기가 데이터베이스 데이터를 주기적으로 진단할 데이터를 탄생시킨다. 마지막으로 고장진단기는 주기적으로 데이터베이스 데이터의 고장을 진단하여 고장이 발생한 데이터를 미리 분류한 규칙에 따라 원래의 데이터로 복구하거나 운용자에게 보고함으로써 고장에 대비하도록 한다. 그리고 데이터베이스 상의 운용자에 의한 변경을 감지하여 고장진단 데이터의 재생성을 지시한다. 본 논문에서 제시하고 구현한 데이터베이스 데이터의 고장진단 및 복구를 위한 전문가 시스팀은 실시간 환경과 고장허용 환경, 분산 구조 그리고 빈번한 접근을 갖는 데이터베이스 관리 시스팀에서 아주 중요한 역할을 할 수 있다.

  • PDF