• 제목/요약/키워드: 구조 검색

검색결과 2,314건 처리시간 0.044초

노드정보를 이용한 문서검색의 성능에 관한 연구 (A Study on the Performance of Structured Document Retrieval Using Node Information)

  • 윤소영
    • 정보관리학회지
    • /
    • 제24권1호
    • /
    • pp.103-120
    • /
    • 2007
  • 노드는 문서를 구성하는 작은 크기의 의미 있는 정보 단위이다. 정보검색에 문서의 구조정보를 이용함과 더불어 문서보다 작은 검색단위에 대한 연구가 활발히 이루어지고 있다. 이 연구에서는 노드정보를 이용한 검색실험을 위해 벡터공간모델 검색기법을 사용하여 다양한 유사도 산출방식을 적용한 실험과 구조정보를 활용한 확장 실험을 수행하였다. 실험결과 문서의 유사도를 산출하는 방식에 따른 검색성능의 차이는 거의 나타나지 않았으며, 구조정보를 적용하는 확장 노드검색이 가장 좋은 성능을 나타냈다.

시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현 (Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data)

  • 김점숙;안동언;정성종
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이에 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현 (Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data)

  • 김점숙;안동언;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이의 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여 할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

XML을 이용한 구조적 문서 생성 및 탐색을 위한 깊이중심분할 색인기법에 관한 연구 (A Study on the Depth-Oriented Decomposition Indexing Method for Creating and Searching Structured Documents Based-on XML)

  • 양옥렬;이용주
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1025-1042
    • /
    • 2002
  • 본 논문은 정보검색을 위한 용어들 간에 존재하는 관련정보인 시소러스를 이용하여 정보 검색 시스템의 검색 성능을 향상시키기 위한 구조적 문서를 생성하고 이를 검색하는 검색 기법에 대하여 연구하였다. 이를 위해 시소러스를 이용한 구조적 문서의 탐색을 위한 깊이중심분할 색인(DODI : Depth-Oriented Decomposition Index) 기법을 제안하였으며, 또한 시소러를 이용한 색인 기법으로서 효과적인 정보 검색이 가능하도록 검색 알고리즘을 통해 연관관계의 정보들에 대한 검색이 가능하도록 하였다. 또한 색인기법에 의해 생성된 구조적 문서는 OpenXML을 통해 데이터베이스 내에 저장되고, ForXML 메소드를 이용하여 재구성된 XML문서를 생성하도록 구조적 문서 저장 시스템을 구현하였다.

개인화된 방송 컨텐츠의 효율적 검색을 위한 메타데이터 검색 구조 설계 (Design of Metadata Retrieval Structure for Efficient Browsing of Personalized Broadcasting Contents)

  • 이혜규;박성한
    • 전자공학회논문지CI
    • /
    • 제46권2호
    • /
    • pp.100-105
    • /
    • 2009
  • 본 논문에서는 개인화된 방송 컨텐츠의 보기 시스템에서 사용자가 보다 빠르게 검색할 수 있도록 메타데이터 저장 구조를 계층화하는 방법을 제안한다. 이를 위하여 본 논문에서는 원하는 컨텐츠를 찾는데 걸리는 시간을 단축시킬 수 있도록 MPEG-7 MDS 구조의 분류 기술구조와 기술구조 사이에 세부장르 목록이 들어있는 하위 장르 테이블을 추가한다. 그리고 기술구조에서 기존의 메타데이터들이 분류 없이 트리 형태의 계층구조로 저장되던 부분을 사건과 객체로 구분하여 저장하도록 한다. 이러한 방법은 기존 연구에 비해 장르의 단계별 검색이 가능해짐으로 사용자가 원하는 계층적 검색이 가능해진다. 또한, 메타데이터를 사건과 객체를 구분하여 저장함으로써 탐색의 복잡성을 최소화한다. 실험 결과에서 제안하는 검색 구조의 시스템이 기존 시스템의 구조보다 향상된 검색 시간을 보여준다.

XML 문서에 대한 효율적인 구조 기반 검색을 위한 색인 모델 (An Indexing Model for Efficient Structure-based Retrieval on XML Documents)

  • 박종관;강형일;손충범;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.18-20
    • /
    • 2000
  • XML 문서의 구조검색을 위한 기존 방법들은 특정 엘리먼트의 조상, 자손, 형제에 대한 다양한 구조검색을 효율적으로 지원하지 못한다. 본 논문에서는 XML 문서의 효율적인 관리와 구조검색을 위해 DTD(Document Type Definition)의 논리적 구조를 따르는 XML 문서에 대해 구조정보를 표현하기 위한 방법을 제시한다. 구조정보는 엘리먼트 이름을 식별할 수 있는 EID, 부모와 자식 엘리먼트간의 계층정보를 위한 ETID, 동일한 부모 엘리먼트를 갖는 자식 엘리먼트들의 순서정보를 위한 SORD, 그리고 동일한 부모 엘리먼트를 갖는 자식들 중 동일한 타입의 엘리먼트들에 대한 순서정보를 위한 SSORD로 구성된다. 이런 구조정보를 이용해 빠른 검색을 위한 내용 색인, 구조 색인, 애트리뷰트 색인을 설계한다. 설계된 색인을 통하여 질의를 처리하는 과정을 설명함으로써 다양한 구조적 질의를 효과적으로 처리할 수 있음을 보인다.

  • PDF

문서의 동적 삽입 삭제를 위한 STEER 역파일 구조 (STEER Inverted File Structure for Dynamic Document Insertion/Deletion)

  • 김남일;박영찬;주종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.174-176
    • /
    • 1998
  • 역파일 구조(inverted file structure)는 검색 속도가 빠르기 때문에 정보검색 시스템의 색인정보 하부 저장구조로 널리 이용되지만 문서의 동적 삭제는 어려운 형태이다. 본 논문에서는 기존역파일 구조에 문서마다 색인어의 포스팅 레코드를 기록한 목록을 유지함으로써 문서의 동적 삭제가 용이하고, 위치정보를 포스팅 레코드에서 분리하여 위치 검색이 효율적인 역파일 구조를 설계한다. 설계된 역파일 구조는 STEER(Structured Entity Element Retrieval) 정보검색 시스템에서 구현되었다.

  • PDF

내용 기반 검색을 지원하는 멀티미디어 XML 데이터베이스 시스템 (Multimedia XML Database System supporting Content-based Retrieval)

  • 김연희;신판섭;김병곤;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.76-78
    • /
    • 2001
  • 현재 웹 서비스 기반검색 시스템의 일반화에 힘입어 단순한 덱스트 정보뿐 만 아니라 이미지 데이터와 같은 멀티미디어 정보가 보편화되고 그 교류의 양이 크게 증가하였다. 따라서 덱스트 정보에 대한 검색과 함께 멀티미디어 정보에 대한 효과적 검색을 지원하는 시스템 개발이 중요시되고 있다. 그러나 기존에 개발된 시스템들은 멀티미디어 데이터를 검색 결과의 부가적 정보로서 사용하는 것이 일반적이며 그 자체를 질의 검색의 주요 대상으로 처리하지 못하였다. 따라서 본 논문에서는 웹 상에서 대용량 이미지 데이터베이스를 구축하고 이를 기반으로 효과적 검색을 지원하는 멀티미디어 검색 시스템을 설계한다. 제안 시스템은 크게 두 가지 검색 구조를 제공하는데, 먼저 기존의 덱스트 기반 검색을 위하여 이미지의 의미 정보를 XML로 표현하여 이를 DTD 독립적인 스키마에 따라 관계형 데이터베이스에 저장, 관리하여 체계적이고 구조적인 서비스를 지원한다. 또한 이미지에 대한 내용 기반 검색을 위하여 이미지 데이터베이스를 구축하고 이미지 데이터로부터 색상 히스토그램 특성을 자동으로 추출하여 구축한 인덱스를 유지, 관리하며, 이를 통한 내용 기반 검색 구조와 사용자 질의 인터페이스를 설계한다.

  • PDF

자기 조직적 링 구조를 이용한 P2P 검색기법 (A Peer-to-Peer Search Scheme using Self-Organizing Ring)

  • 손재의;한세영;박성용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (D)
    • /
    • pp.349-351
    • /
    • 2006
  • 본 논문에서는 비구조적 피어-투-피어 시스템에서의 낮은 검색 성공률과 긴 검색 시간을 개선하기 위하여, 성능이 우수한 우수 피어들로 자기 조직적인 링 구조를 구성하고 광고 및 검색에 이용하는 검색 기법을 제안하였다. 우수 피어 링 구조는 동적인 환경에서 시스템의 상황에 따라 적응적으로 크기가 변하고, 에이전트를 이용하여 지속적으로 우수한 피어들이 링 구조에 참여하게 함으로써 검색 성공률을 높이고, 빠른 검색 시간을 유지할 수 있게 하였다.

  • PDF

분산된 생물정보 데이터베이스의 통합검색 시스템연구 (Integrated Information Retrieval System from Distributed Biological Database)

  • 윤홍원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.311-314
    • /
    • 2000
  • 분자 생물학의 발전염기서열, 단백질 서열, 지놈 서열 등의 서열데이터베이스와 단백질 3차구조를 제공하는 구조 데이터베이스등이 구축되어서 웹을 통해 많은 정보를 제공하고 있다. 전세계적으로 분산되어 있는 다양한 생물정보 데이터베이스의 효율적인 검색을 위해서 통합 검색 시스템의 개발이 필요하다. 이 논문에서는 전세계의 생물정보 데이터베이스의 개발 현황을 보이고 분산되어 있는 생물정보데이터베이스로부터 통합검색을 위한 생물정보 통합검색시스템(GenPlus)를 제안하였다. 제안한 GenPlus 에서는 염기 서열, 단백질서열, 그리고 키워드를 이용한 서열정보, 구조정보,완전한 지놈 정보, 그리고 문헌정보의 통합 검색을 제공한다.

  • PDF