• 제목/요약/키워드: 복합질의

검색결과 353건 처리시간 0.024초

내용 기반 이미지 검색을 위한 복합 질의문 계획 생성 기법 (Generating Combined Query Plan for Content-Based Image Retrieval)

  • 박미화;엄기현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.562-571
    • /
    • 2000
  • 이미지 데이터는 텍스트 데이터와는 달리 다양한 색상과 모양, 질감과 같은 비정형적인 특징을 가진다. 따라서 이미지 데이터베이스는 텍스트 기반의 전통 데이터베이스와는 다른 모델링 방법과 질의, 검색 방법을 사용한. 특히, 내용 기반 이미지 검색에서의 검색 속도와 정확도를 향상시키기 위해서는 새로운 복합 질의문 계획 생성 기법이 필요하다. 본 논문에서는 이를 위해 먼저, 단일 조건을 갖는 시각 질의에 대한 처리 기법들을 토대로 여러 조건을 갖는 복합 질의를 처리하기 위한 복합 질의문 계획 생성기법인 SSCC(Similarity Search for Conjunction Combination Query) 알고리즘을 제안한다. SSCC는 이미지 데이터베이스 검색 시스템에서 복합 질의를 처리하기 위한 질의 최적화 과정에서 질의 수행 시간과 투플 I/O를 최소화하는 질의문 계획을 생성하기 위해 사용된다. SSCC 알고리즘은 복합질의를 단일 질의들로 준해하고 퍼지 집합 이론을 도입하여 단일 질의의 결과들을 통합한다. 논문에서 연구된 내용 기반 복합 질의문 계획 생성 기법은 특정 이미지 영역에 국한되지 않으며 다양한 종류의 시각 질의를 수행하기 위한 효율적인 질의문 계획 생성 기법으로 사용될 수 있다.

  • PDF

복합질의의 효율적 수행을 위한 궤적질의 필터링 기법 (A Filtering Method of Trajectory Query for Efficient Process of Combined Query)

  • 반재훈;김종민
    • 한국정보통신학회논문지
    • /
    • 제12권9호
    • /
    • pp.1584-1590
    • /
    • 2008
  • 영역 질의와 궤적 질의로 구성된 복합질의는 특정 영역에 위치하는 이동체의 궤적을 검색하는 질의이다. 궤적질의는 선행궤적을 찾기 위해 점질의를 계속 반복하기 때문에 복합질의의 성능을 결정짓는 중요한 요소이다. 이 경우에 점질의는 인덱스의 노드를 중복해서 방문하기 때문에 질의처리의 수행속도가 매우 느려진다. 이 논문은 영역 질의에 우수한 성능을 가진 R-tree 기반의 이동체 색인을 대상으로 궤적 질의를 효율적으로 처리함으로써 복합 질의의 성능을 향상시키기 위한 방법을 제시한다. 기존 연구의 문제점인 노드의 중복 방문을 방지하기 위해 최소 공통 탐색 선분을 정의하여 단일 방향으로만 탐색하며 궤적을 예측하고 예측된 선분을 이용하여 연속된 궤적을 동시에 탐색하는 예측기반 여과 방법을 제안한다.

질의 유형 분류기를 활용한 지식 베이스 기반의 복합 질의 응답 시스템 (Knowledge based Complex Question Answering System using CNN Based Question Type Classifier)

  • 홍동균;심홍매;최동근;김광민;정용일;이반 베를로셰
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.621-624
    • /
    • 2018
  • 최근 지식 베이스의 발전과 함께 지식 베이스 기반의 질의 응답에 관한 연구가 많은 관심을 받고 있다. 특히 지식 베이스상의 여러 개의 사실이 필요한 복합 질의에 대한 처리의 중요성이 높아지고 있다. 그러나 기존 연구에서는 일반적인 지식을 묻는 질의 처리에만 집중하여, 그 외의 다른 유혀을 갖는 복합 질의에 대한 처리의 연구는 시작 단계에 머물러 있다. 이에 본 논문은 질의 유형 분류기를 활용한 지식 베이스 기반의 복합 질의 응답 시스템을 제안한다. 복합 질의 응답 시스템은 단순 질의를 포함하여 다양한 유형(일반형, 판정형, 비교형)을 갖는 복합 질의를 처리한다. 우리는 실험을 통해서 질의 유형 분류기가 복합 질의 응답 시스템의 정답률을 높임을 보였다.

시소러스 및 요약화일을 이용한 문서 검색시스템 (The development of a document retrieval system using thesaurus and signature file)

  • 정상철;신동욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.400-408
    • /
    • 1994
  • 본 논문에서는 요약화일을 이용하여 복합명사를 효율적으로 처리하며 시소러스를 이용하여 검색하는 한글문서 검색시스템을 제안한다. 본 한글문서 검색 시스템은 한글문서를 대상으로 색인하는 자동색인기와 사용자의 질의를 받아 관련된 문서를 검색하는 검색기로 구성된다. 자동색인기는 우선 한글문서를 대상으로 최장일치 방법으로 명사들을 출출한 후 복합명사의 패턴을 분석하여 복합명사의 가능성이 높은 것들을 복합명사화한다. 두번째로 이들 복합명사들을 1+2SP 방식으로 코딩한 후 요약화일 방법을 이용하여 요약화일을 작성한다. 검색기는 사용자 질의어를 받아 명사들을 추출한 후 시소러스를 이용하여 질의어를 확장한다. 다음 확장된 질의어를 1+2SP 방식으로 코딩한 후 관련된 문서를 검색한다. 본 논문에서는 한국통신에서 만든 코퍼스를 이용하여 제안된 방법의 성능을 평가하였는데 복합명사 처리 및 시소러스 이용방식이 효율적임이 입증되었다. 또한 KAIST에서 개발한 문서검색 시스템보다 동일한 코퍼스로 실험하였을 경우 재현률 및 정확률이 $7{\sim}8%$ 정도 앞서 기존의 시스템보다도 성능이 우수하다는 것이 밝혀졌다.

  • PDF

이동체 데이타베이스에서 복합 질의를 위한 궤적 분할 트리의 설계 및 구현 (Design and Implementation of Trajectory Riving Tree for Combined Queries in Moving Object Databases)

  • 임덕성;전봉기;홍봉희;조대수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.150-162
    • /
    • 2004
  • 이동체는 시간에 따라 위치를 변경하는 특성과 이동체의 경로는 궤적으로 표현되는 특성을 가진다. 이동체 궤적 데이타에 대한 저장 및 검색을 처리하는 이동체 데이타베이스 시스템에서는 효율적인 데이타 접근 방법이 필요하다. 특히 궤적 검색을 위한 대표적인 질의 유형인 복합 질의는 영역내의 궤적 검색과 궤적의 일부분을 추출하는 과정을 포함한다. 그러나, 영역 질의에 우수한 색인 방법은 부분 궤적을 추출하기 위한 비용이 높은 단점을 가진다. 반면, 궤적 질의를 위한 색인 방법의 경우 노드간의 중첩이 매우 높아 영역내의 궤적 검색 비용이 높은 단점이 있다. 이 논문에서는 이동체 데이타베이스에서 복합 질의를 효율적으로 처리하기 위해 TR-tree를 제시한다. TR-tree는 궤적 질의를 위해 궤적 보존 및 단말 노드의 용량을 증가시키고, 영역 질의 처리를 위해 사장영역과 MBB(Minimum Bounding Box)의 중첩을 감소시키는 논리적 궤적 분할을 지원하는 특징을 가진다. 실험 평가에서 TR-tree는 STR-tree, TB-tree의 복합 질의 성능 비교에서 평균 25%의 노드 접근 회수를 감소시킨다.

복합명사확장을 이용한 KRISTAL2000 DBMS검색 성능 향상 (Using the Extension of Korean Compound Noun the improvement of KRISTAL2000 DBMS Retrieval System)

  • 서정현;김광영;최성필
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.124-126
    • /
    • 2002
  • 복합명사는 한국어에서 가장 빈번하게 나타나는 색인어의 한 형태로서, 영어권 중심의 정보검색모델로는 다루기가 어려운 언어 현상의 하나이다. 복합명사는 2개 이상의 단일어들의 조합으로 이루어져 있고. 그 형태 또한 여러 가지로 나타나기 때문에 색인과 검색의 큼 문제로 여겨져 왔다. 특히 한국어에서는 복합명사 분석이 어렵고 복잡하다. 그러므로 본 논문에서는 복합명사 질의어 대해서 질의어를 확장 또는 최적방법을 이용하여 KRISTAL2000 DBMS의 성능을 항상 연구에 중점을 두었다.

  • PDF

복합 이벤트 스트림 질의 처리 성능 개선을 위한 질의 전처리 도구 (A Query Preprocessing Tool for Performance Improvement in Complex Event Stream Query Processing)

  • 최중현;조은선;이강우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권8호
    • /
    • pp.513-523
    • /
    • 2015
  • 복합 이벤트 스트림 처리 시스템(Complex Event Processing System)은 연속적으로 발생하는 이벤트의 스트림을 효율적으로 처리하기 위한 시스템으로써, IoT 시스템에서 처리되는 센서 데이터 등 최근 생활 속에서 그 필요성이 많이 나타나고 있다. 그러나 아직은 질의 처리의 성능에 대해 개발자의 책임으로 돌리고 있는 부분이 있어 이용에 세심한 주의가 요구되고 있다. 그 중 한 예로, 향상된 성능을 가지는 동일한 의미의 질의를 선정하기 위한 충분할 만큼의 안내는 제공되고 있지 않은 상태이다. 본 논문에서는 이벤트 스트림 처리 시스템의 성능 개선을 위한 질의 전처리 도구를 제안한다. 이 도구는 입력된 질의를 분석하여 성능에 나쁜 영향을 미치는 패턴의 질의로 판정 되면, 성능을 향상시킬 수 있는 대안을 제시해줌으로써 개발자들의 스트림 질의 성능에 대한 부담을 덜어주게 된다. 결과적으로 디버깅, 테스팅, 성능 조정의 어려움을 해소하는 데에 도움을 줄 것으로 기대한다.

한국어 정보검색에서의 복합명사 가중치 부여 방법 및 평가 (Weighting Methods and their Evaluations for Compound Nouns in Korean Text Retrieval)

  • 김지영;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.157-162
    • /
    • 2001
  • 한국어의 경우 띄어쓰기의 자유로움과 명사들이 비교적 자유롭게 결합하여 새로운 복합명사(compound noun)를 형성한다. 따라서, 정보검색에서 복합명사를 적절하게 처리하게 되면 검색 효율을 향상시킬 수 있다. 본 논문에서는 질의에 포함된 단일명사, 복합명사, 그리고 복합명사를 이루는 구성명사의 적절한 가중치 부여 방법에 대하여 기술한다. 일반적인 tf*idf가중치 방법은 문서 내 빈도수(tf)만을 강조하여 문서 내 발생빈도가 낮은 복합명사의 경우 낮은 가중치를 갖는다. 반대로, 역문헌 빈도수(idf)로 인해 복합명사가 단일명사보다 높은 가중치를 갖게 되면 단일명사의 가중치를 지나치게 떨어뜨려 검색 성능을 저하시킨다. 이런 문제를 해결하기 위해서 복합명사의 통계적인 특성을 고려하고, 복합명사를 이루는 구성명사의 적절한 가중치 사용과 tf*idf 변화 범위에 따른 파라메터를 이용하였다. 결과적으로 본 논문에서는 질의 색인어의 종류에 따라 가중치를 달리 부여함으로써 검색 성능을 향상시킬 수 있는 가중치 부여 방법을 제시하고 검증 실험을 통해 유효성을 제시했다는 점에서 그 의의가 있다고 하겠다.

  • PDF

한국어 정보검색에서 복합명사 색인 실험 (Compound Noun Indexing Experiments in Korean Information Retrieval)

  • 강병주;최기선;윤준태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.130-136
    • /
    • 1998
  • 한국어 정보검색에서 복합명사의 불규칙한 표기 형태로 인하여 발생하는 색인과 질의의 불일치 문제는 단순명사 단위로 색인하고 질의함으로써 해결할 수 있지만 원래의 복합명사가 가지고 있던 정보를 상실함으로써 정확도의 하락이 예상된다. 따라서 보다 정교한 문서검색을 위해서는 복합명사를 색인으로 사용하는 것이 필요하다. 본 논문에서는 단순한 패턴을 이용한 복합명사 색인 방법으로부터 정교한 명사구 구문분석을 통한 복합명사 색인 방법까지 그 동안 연구되었던 대표적인 복합명사 색인 방법을 실험을 통하여 비교 평가하여 복합명사 색인의 검색성능에 대한 효과성을 검증한다.

  • PDF

시공간 근접성을 고려한 TB-tree의 동적 삽입 정책 (Dynamic Insertion Policy based on Spatiotemporal Proximity in the TB-tree)

  • 장종우;임덕성;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.776-778
    • /
    • 2003
  • 이동체 데이터베이스에서 대용량 궤적 정보를 효율적으로 검색학기 위해서는 색인이 필요하다. 특히 궤적을 선택하는 과정과 선택된 궤적의 일부분을 추출하는 과정으로 이루어진 복합 질의를 효율적으로 처리하기 위해서는 궤적 보존을 지원하는 TB-tree와 같은 색인 구조가 적합하다. 그러나, TB-tree는 공간적인 인접성을 고려하지 않아 비단말 노드의 겹침과 사장 영역이 매우 커 영역 질의의 비용이 증가하는 문제가 있다. 이 논문에서는 복합 질의 및 영역 질의를 효율적으로 처리하기 위하여, TB-tree에서 사장 영역을 감소시킬 수 있는 최대 영역 감소 정책을 제시한다. 최대 영역 감소 정책을 공간 활용도를 최대로 유지하면서 사장 영역을 점진적으로 감소시키는 삽일 및 분할 정책으로서 TB-tree의 비단말 노드의 겹침을 줄여 영역 질의의 비용을 감소시킨다.

  • PDF