• 제목/요약/키워드: 데이터베이스 중복

검색결과 229건 처리시간 0.026초

RDBMS를 이용한 XML DTD 데이터베이스와 확장 SQL의 설계 (Design of Extended SQL and XML DTD Database using RDBMS)

  • 오준환;이병욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.228-230
    • /
    • 2000
  • 최근 XML 문서를 저장 및 검색하기 위한 연구가 활발히 진행되고 있다. 하지만 기존의 연구는 주로 XML문서 저장을 위한 연구들이었다. 즉 XML 문서를 정의해 주는 DTD 문서의 저장에 관한 연구는 상대적으로 적었다. 하지만 DTD 문서를 효율적으로 저장하고 관리하여 재활용함으로써 XML 문서를 효율적으로 관리할 수 있다. 본 논문에서는 DTD를 RDBMS에 저장하기 위한 스키마를 제안하고, 저장 방식은 정보의 중복저장을 막고 DTD의 모든 내용을 수용할 수 있도록 설계하였다. 또 제안하는 데이터모델에 적용하여 SQL의 DDL을 확장하였다. 제안한 DTD 데이터베이스로 인해 DTD의 재활용과 관리를 할수 있게 되었고 SQL의 확장으로 제안 시스템의 사용을 용의하게 하였다.

  • PDF

지역 스키마간 충돌 문제를 고려한 XML 문서의 전역 스키마 생성 모델 (XML Global Schema Generation Model of XML Documents Considering Conflicts on Local Schema Integration)

  • 김정희;곽호영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.70-72
    • /
    • 2002
  • 본 논문에서는 분산된 XML 문서를 수집 처리하여 상호 제공하는 과정에서 활용될 통합된 XML 문서의 전역 스키마를 생성하는 시스템을 제안한다. 제안된 시스템에서는 분산 환경에 존재하는 개별적인 XML 문서들에 대한 지역 스키마 정보를 관계형 데이터베이스로 구축하고, 통합된 XML 문서의 데이터를 기반으로 각각의 지역 스키마 데이터베이스를 검색한 후 데이터에 적합한 스키마 정의를 추출하게 된다. 또한 추출과정에서 중복 정의에 의한 충돌 범주를 분석하고, 이를 해결하는 방법도 제시하였다. 시스템 모델링 결과 XML 문서의 구조와 검증을 명확하게 보장하는 통합된 XHL 문서의 전역 스키마 생성과 지역 스키마간 발생되는 충돌문제 해결이 가능함을 알 수 있었다.

  • PDF

다중 테이블을 활용한 챗봇의 중복 응답 감소 연구 (A Study on Reducing Duplication Responses of Chatbot Based on Multiple Tables)

  • 권혁무;서영석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권10호
    • /
    • pp.397-404
    • /
    • 2018
  • 현재 스마트폰에서는 사용자의 요구에 맞는 다양한 앱(App)들이 활용되고 있는데, 특히 많은 기업들에서 비즈니스 마케팅, 상업적인 홍보 등을 위해 모바일 메신저 형태의 대화형 시스템을 연구 개발하여 고객들에게 다양한 서비스를 제공하고 있다. 이러한 대화형 시스템을 우리는 '챗봇(Chatbot)'이라고 부른다. 이러한 챗봇의 경우 사용자와 대화시 중복 응답이 자주 발생할 수 있는데, 이러한 중복응답의 경우 특정 서비스에 대한 사용자의 흥미와 관심도를 떨어뜨린다. 따라서 본 논문에서는 이러한 챗봇 개발시 사용자로부터 입력된 발화(utterance)에 따른 챗봇의 중복 응답을 정의하고 이를 감소시킬 수 있는 기법을 제안한다. 이를 위해 데이터베이스 내 다중 테이블을 구축하고 테이블별로 사용자 입력에 따른 챗봇의 응답 조합을 구성하여 새로운 중복 회피 알고리즘을 통해 챗봇의 중복 응답을 감소시킬 수 있도록 한다. 이렇게 제안한 기법의 검증을 위해 자동화된 챗봇을 구현하였고, 본 연구에서 제시한 기법과 기존 응답 방식 연구를 분석해본 결과, 본 연구에서 제안한 기법을 통해 평균 70% 정도의 중복 감소 효과를 확인할 수 있었다.

맵리듀스를 이용한 다중 조인의 효율적인 처리 기법 (Efficient Processing of Multi-Way Joins using MapReduce)

  • 최연정;박진경;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.779-782
    • /
    • 2014
  • 맵리듀스(MapReduce)는 대용량 데이터의 병렬 처리에 사용되는 프로그래밍 모델이다. 조인(join)은 둘 이상의 테이블에서 동일한 애트리뷰트 값을 가지는 레코드들을 결합하는 연산으로, 데이터베이스 분야에서 가장 중요한 연산 중 하나이다. 본 논문은 맵리듀스를 이용하여 다중 조인(multi-way)을 효율적으로 처리하는 방법을 제안한다. n개 테이블의 다중 조인을 처리하기 위해 기존 방법은 2-way 조인을 수행하는 맵리듀스 잡을 (n-1)번 수행하거나, 레코드들을 중복시켜 n개 테이블의 조인을 1 개의 맵리듀스 잡으로 한 번에 처리한다. 하지만 전자는 맵리듀스 잡을 (n-1)번 수행해야 하며, 후자는 레코드들을 상당히 많이 중복시켜야 한다는 단점이 있다. 본 논문은 레코드를 전혀 중복시키지 않고도 ${\lceil}{\log}_2n{\rceil}$개의 맵리듀스 잡만으로 다중 조인을 효율적으로 처리하는 방법을 제안한다. 실험을 통해 제안 방법은 기존 방법에 대해 다중 조인을 더 빠르게 처리함을 보인다.

UNISQL/X를 이용한XML 문서 저장 시스템 설계 및 구현 (Design and Implementation of XML Documents Storage System using UNISQL/X)

  • 안병태;김현아
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.38-44
    • /
    • 2001
  • 최근 인터넷의 발전으로 인하여 정보교환을 위한 표준으로 XML에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 객체관계 데이터베이스인 uniSQL/X를 이용한 XML 문서 저장 시스템 설계하고 구현하였다. 관계 데이터베이스와 객체지향 데이터베이스의 장점을 수용한 객체관계 데이터베이스(Object-Relational Database : ORDB)를 이용하여 XML 문서 저장 모델을 설계하여 XML 문서의 구조적인 정보를 효과적으로 표현할 수 있다. XML 문서의 빈번한 수정이 용이하도록 분할저장 방식을 사용하였고, DTD에 관계없이 XML 문서를 저장할 수 있도록 DTD 독립적인 모델을 제안하였다. 또한 데이터의 중복문제를 해결함으로써 검색 속도가 향상되었다

  • PDF

반도체 약액 공급 장치용 데이터베이스 구축

  • 문순란;문진식;김두용;조현찬;김광선;조중근
    • 한국반도체및디스플레이장비학회:학술대회논문집
    • /
    • 한국반도체및디스플레이장비학회 2005년도 춘계 학술대회
    • /
    • pp.73-78
    • /
    • 2005
  • 반도체 약액 공급 시스템의 데이터베이스가 공정간의 상호관계가 효율적이지 않으면 데이터들의 중복현상으로 나타날 수 있으며 이로 인해 저장 공간의 낭비뿐 아니라 시스템 공정 전반에 걸쳐 프로세스 시간에 좋지 않은 영향을 줄 수 있다. 본 논문에서는 약액 공급 제어 장치의 보편적 속성인 CHEMICAL 엔티티와 SUPPLY_PROCESS_UNIT 엔티티, NOZZLE 엔티티를 주요 엔티티로 설정하고, 데이터베이스 설계 시공정 흐름에 맞추어 간략화 함으로써 대부분의 필요한 정규화가 자연스럽게 이루어졌다. 향후 본 연구의 데이터베이스는 약액 공급 제어 장치를 이용한 SWP 3004 세정 장비 및 KDNS에서 생산하는 다른 세정 장비의 실시간 모니터링 시스템을 구축하는데 활용될 수 있다.

  • PDF

멀티데이터베이스 환경 하에서의 Description Logic을 이용한 의미상 질의 최적화 (emantic Query Optimization Using Description Logic in Mutidatabase Systems)

  • 이태웅;권주흠;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.644-646
    • /
    • 2003
  • 물류 공급 관리 시스템과 같은 정보 통합 시스템은 분산되어 있는 데이터베이스들에 대해서 정보를 통합하여 사용자에게 보여준다. 이러한 정보 통합 시스템은 전역 질의를 생성하고 지역 질의로 변환하여 실행하기 전에 질의를 최적화할 필요성이 있다. 그런데, 단일데이터 베이스 시스템에서의 질의 최적화 기법은 멀티데이터베이스 시스템에서 사용하기에는 부적절하다. 이는 분산된 데이터베이스 환경에서 오는 높은 연결 오버헤드, 높은 계산 시간, 데이터의 중복성 뿐만 아니라 의미 이질성 문제 때문에 기존의 최적화 방법은 사용하기가 어렵다. 이를 해결하기 위해서 의미상 질의 최적화 방법이 연구되어 왔다. 의미상 질의 최적화는 전역 질의보다 더 효과적으로 응답하고 의미상으로 동등한 질의로 변환하기 위해서 의미상 지식을 사용한다. 본 논문에서는 정보 통합 시스템에서 Description Logic(DL)을 이용하여 의미상 지식으로 사용할 지식 기반을 표현하고 이를 바탕으로 추론화된 지식을 이용하는 의미상 질의 최적화 방식을 제시한다.

  • PDF

화행별 템플릿 기반 적응형 대화 에이전트의 점증적 지식 획득 (Incremental Knowledge Acquisition for Conversational Agent Using Dialogue Act Templates)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.544-546
    • /
    • 2004
  • 최근 자연언어를 이용하여 정보를 제공하거나 업무를 수행하는 대화 에이전트가 활발히 연구되고 있다. 보다 다양한 사용자 질의를 분석하고 적절한 답변을 제공하기 위해서는 대규모의 답변 데이터베이스를 구축하여야 한다. 기존 답변 데이터베이스의 구축은 설계자가 수동으로 입력질의의 패턴을 분석하고 이에 대한 답변을 작성하여 패턴-답변쌍을 제작하여 이루어졌다. 따라서 패턴의 분석이 설계자에 의존적이어서 일반적이지 못하며 중복되거나 쓸모없는 패턴-답변쌍이 생성되기도 한다. 또한 초기에 구축된 답변 데이터베이스에 의해 성능이 제한되어 답변 성능의 향상을 위해서는 답변 데이터베이스를 수동으로 추가해야한다. 본 논문에서는 대화를 통해 필요한 정보론 수집하여 자동으로 괘턴-답변쌍을 생성하는 방법을 제안하다. 사용자 입력문장을 화행별로 구분하고 각 화행별 답변 템플릿을 이용하여 패턴-답변쌍을 완성한다. 기존의 수동제작 방식과 비교 실험을 통해 제안하는 방법이 지식구조 구축 속도나 사용자 평가 면에서 훨씬 우수함을 확인하였다.

  • PDF

중복글자 구분을 지원하는 집합 기반 POI 검색 알고리즘 구현 (Implementation of A Set-based POI Search Algorithm Supporting Classifying Duplicate Characters)

  • 고은별;이종우
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권4호
    • /
    • pp.463-469
    • /
    • 2013
  • 집합 기반 POI 검색 기법은 부정확한 질의어 입력 시 검색결과의 재현율과 정확도가 현저히 떨어지는 기존 하드매칭 기법에 비해 우수한 성능을 보인다. 하지만 집합 개념을 바탕으로 했기 때문에 한 POI 레코드 내에 중복으로 포함된 동일 글자들을 구분하지 못하는 문제점이 있다. 본 논문에서는 이러한 문제를 해결하여 한 POI 내에 동일 글자가 여러 개 등장해도 동작하는 개선된 집합 기반 POI 검색 기법을 제시하고 구현하였다. 또한 개선된 집합 기반 POI 검색 기법의 검색결과와 기존 집합 기반 POI 검색 기법의 검색결과를 비교하는 실험을 통해 레코드 내에 중복으로 포함된 동일 글자가 있는 레코드에 대한 검색 성능이 향상되었음을 확인하였다.

가상 디렉토리 확장 해시 색인: 확장 해싱에서의 새로운 디렉토리 구조를 이용한 저비용 해시 색인 (Virtual Directory Extendible Hash index: An Economic Hash Index Using New Directory Structure)

  • 박상근;박순영;김명근;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (하)
    • /
    • pp.1493-1496
    • /
    • 2003
  • 데이터베이스 관계 연산자 중 프로젝션(projection)과 집단 연산(aggregate function)시 사용되는 GROUP BY절, 그리고 동등 조인(equi join)에 대한 질의 처리는 중복된 튜플 중복된 GROUP BY 필드, 조인 중 발생하는 임시결과에 대한 제거나 집단 연산, 임시 결과의 저장을 위해 정렬이나 해싱 기반 알고리즘을 적용하고 있다. 이 중 해싱 기반 알고리즘은 데이터에 대한 직접적인 접근 방법과 정렬비용이 없다는 장점으로 인해 자주 사용하게 된다. 그러나 이러한 해싱(extendible hashing)[1] 기반 알고리즘은 키 값이 저장되는 버켓(bucket) 페이지의 넘침(overflow)으로 인해 분할(split)이 발생하는 경우, 분할을 야기시킨 버켓 페이지에 대한 정보를 제외한 동일한 내용의 기존 디렉토리 구조를 배로 확장해야 하는 공간 확장과, 확장된 디렉토리 구조의 유지를 위해 많은 비용을 소모하게 된다. 본 논문에서는 다량의 데이터에 대한 접근 기법과 디렉토리 구조의 저장공간, 유지 비용 절감 및 중복 해시 값을 지니는 데이터를 처리하기위한 해시 색인인 가상 디렉토리 확장 해시 색인을 제안한다. 가상 디렉토리 확장 해시 색인은 디렉토리 구조를 다단계 구조로 유지함으로써, 넓은 저장 공간을 필요로 하는 다량의 데이터에 대한 접근경로 문제를 해결하였고, 가상 디렉토리 레벨이라는 새로운 구조를 통해, 기존 디렉토리 구조의 공간 낭비 및 유지 비용을 최소화 시켰으며, 버켓 페이지를 리스트(list) 구조로 유지함으로써 중복 해시 값에 의한 디렉토리 구조의 연쇄적 분할 문제를 해결하였다.

  • PDF