• 제목/요약/키워드: 색인 구성

검색결과 969건 처리시간 0.036초

문서 검색 시스템을 위한 도치 색인 파일의 압축 저장 기법 개선 (An Improved Bit Vector Compression Method for a Document Retrieval System)

  • 이준영;김민정;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.18-22
    • /
    • 1995
  • 문서 검색 시스템의 도치 색인 파일은 저장 공간과 검색 시간을 줄이기 위해 색인어 사전과 문서번호를 위한 이진 도치 파일 또는 비트벡터로 구성할 수 있다. 비트벡터는 1의 값을 가지는 비트만 저장함으로써 압축이 가능하나, Bit tree 압축 방법은 block의 크기가 어떻게 결정되느냐에 따라 압축률이 달라진다. 본 논문에서는 비트벡터에 나타나는 1의 값을 가지는 비트의 개수에 의해 bit tree 압축에 대한 최적의 block 크기를 결정하는 방법을 했다. 최적의 block의 크기는 (전체 비트벡터의 크기 / 1의 개수)보다 작거나 같은 최대의 2의 승수이다. 또한 block내의 1의 값을 가지는 비트의 위치에 의해 상대 위치값을 계산해서 block의 오른쪽 반에 나타나는 비트를 더 압축할 수 있는 기법을 구현한다. 본 논문에서 구현한 압축 기법은 Run Length를 이용한 방법에 비해서 13.65%, 기존의 Bit Tree 방법에 비해서 1.88%의 압축률을 개선했다.

  • PDF

RDBMS를 이용한 DTD 엘리먼트 타입 기반의 문서 색인 기법 (A XML Indexing Technique based on DTD's Element Types in RDBMS)

  • 박관순;김택곤;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.55-57
    • /
    • 2006
  • 최근 XML 문서가 인터넷 기반의 애플리케이션 간의 자료 저장 및 교환을 위한 표준으로써 부상함에 따라 XML 문서의 저장 및 관리에 대한 연구가 활발히 이루어지고 있다. 하지만 XML 문서의 검색에 관련된 많은 연구들이 모든 XML 엘리먼트 경로에 대한 색인화로 인해 인덱스의 크기가 커지고 이에 비례하여 검색성능이 뜯어지는 문제를 보이고 있다. 본 논문에서는 이를 개선하기 위해 엘리먼트 타일을 기반으로 전통적인 역색인 방법을 XML 문서에 맞게 확장하고, RDBMS에 기반하여 계층구조를 갖는 XML 문서들의 자료를 구조적 넘버링(Numbering) 방법의 인덱스로 설계 하였다. 인덱스 테이블들은 엘리먼트 타입의 정보를 담고 있는 엘리먼트 타입 테이블, XML문서의 경로를 가지고 있는 경로 테이블, 역색인으로 구성된 Term테이블. Term 경로를 나타내는 Term경로 테이블을 생성한다. 이전의 XML 인덱싱 기법에 관련된 연구들에서 보이는 XML 문서상의 모든 경로에 대한 표현을 간소화 시키고, 이를 통해 보다 좋은 검색 성능을 보이고자 하였다.

  • PDF

위치 기반 질의를 지원하기 위한 셀 레벨링 공간 색인 기법 (Cell Leveling Spatial Indexing Technique to Support Location Based Query)

  • 정연욱;김유성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.127-129
    • /
    • 2003
  • 최근 GPS기능을 탑재한 휴대폰ㆍPDA등의 모바일 장치를 사용하여 위치 기반 서비스 (LBS : Location Based Service)를 이용하는 사용자가 급증하고 있다. 이에 대용량의 공간 데이터베이스에 대해 효율적 검색을 가능하게 하기 위한 색인이 필요하다. 공간 데이터베이스를 위한 다차원 공간 색인 기법으로는 R-Tree가 널리 사용되고 있다. 기존의 R-Tree를 이용한 검색은 질의 영역과 관계없는 공간 데이터까지 검색하는 고비용의 연산이 요구되며, 사용자의 질의 위치 단위(Granularity)를 고려하지 않아 사용자의 빠른 검색 응답시간 및 질의 영역에 대한 정확한 공간 객체 검색에 대해 충족하지 못한다. 이에 본 논문에서는 임의의 셀 안에 존재하는 공간 데이터가 자신이 속한 노드의 전체 MBR(Union MBR)영역과 셀 영역에 따라 셀 레벨 값을 구성하는 CLR-Tree(Cell Leveling R-Tree)를 제안한다. CLR-Tree를 사용할 경우 사용자의 질의 영역 셀 레벨 값과 데이터베이스에 저장된 공간 데이터의 셀 레벨 값을 비교한 뒤 겹침 연산 대상이 되는 공간 객체 수를 줄임으로써 검색 시간을 향상시킬 수 있다.

  • PDF

색의 순서 변경을 이용한 색채 조화 개선 방법 (Enhancing harmony of color theme by changing the order of colors)

  • 유민준;이인권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.391-393
    • /
    • 2012
  • 색 테마(Color Theme)은 여러 가지 색의 구성을 뜻하며 디자인 등의 높은 활용성으로 인하여 최근 많은 사람들의 관심을 받고 있다. 본 논문에서는 임의의 색 테마에서 색상의 배치에 따라서 사람이 느껴지는 조화로움이 차이가 있다는 사실을 보인다. 먼저 [Ou et al., 2011]을 이용한 색상 배치 방법을 소개하고, 이 방법에서 인접하지 않은 색상 부분을 변경한 방법을 제안한다. 또한 인접한 색상의 차이를 고려한 방법을 제안한다. 이 방법들에 대한 사용자 평가를 통하여 본 논문에서 제안하는 방법이 색 테마의 전체적인 조화로움을 더욱 증가시킴을 알 수 있었다.

이동체의 과거, 현재 및 미래 위치 질의 처리를 위한 통합 색인의 설계 및 구현 (Design and Implementation of Unified Index for Query Processing Past, Current and Future Positions of Moving Objects)

  • 반재훈;전희철;안성우;김진덕;홍봉희
    • 한국공간정보시스템학회 논문지
    • /
    • 제7권1호
    • /
    • pp.77-89
    • /
    • 2005
  • 최근 이동 통신과 GPS 기술의 발달로 위치 기반 서비스에 대한 요구 및 관련된 연구가 활발히 진행되고 있다. 이동체 색인에 관한 기존 연구는 시간 도메인에 따라 과거 궤적 색인과 현재 및 미래 위치 색인으로 분류된다. 그러나 실세계 응용에서는 과거 궤적뿐만 아니라 현재 및 미래 위치 검색을 모두 요구하므로 모든 시간 도메인에 대한 질의를 지원하는 통합 색인을 개발해야 한다. 이 논문에서는 이동체의 과거 궤적을 표현하는 3차원 공간상의 선분과 이동체의 현재 및 미래 위치를 표현하는 시간에 대한 선형 함수를 하나의 색인에 구성함으로써 이동체의 과거, 현재, 미래의 위치 데이터가 통합된 새로운 색인인 PCR-tree(Past, Current R-tree)을 제안한다. PCR-tree 는 노드 내에 포함된 과거, 현재, 미래 위치 데이터에 대한 새로운 경계 영역을 가지며 색인의 모든 엔트리에 대한 단일 인터페이스를 제공한다. 그리고, 제안된 색인과 색인 실험 도구를 구현하여 모든 시간 도메인에 대한 질의 처리가 가능함을 보인다.

  • PDF

채색 분리 기반의 색 변환 기법 (Color Transfer Method Based on Separation of Saturation)

  • 곽정민;김재협;문영식
    • 전자공학회논문지CI
    • /
    • 제45권3호
    • /
    • pp.149-159
    • /
    • 2008
  • 참조 영상을 이용하여 영상의 분위기를 전환하고자 할 때, 영상의 분위기에 영향을 주는 요소 중 하나인 색을 이용하여 영상이 가지는 분위기를 변환한다. 색을 변환할 때, 국부적인 색상의 특징을 반영하기 위해 입력 영상의 화소에 대하여 색인을 하는데 낮은 채도 상에서는 색상의 식별력 저하로 인해 부적절한 색인의 색상 항목으로 색인이 되는 문제가 발생한다. 따라서 본 논문에서는 유채색과 무채색을 분리하여 처리함으로써, 낮은 채도 상에서의 잘못된 색인이 일어나지 않도록 제한하는 기법을 제안한다. 제안하는 기법은 채도의 문턱치를 이용하여 유채색과 무채색을 구분하는 단계, 구분된 화소들을 실린드리컬 거리(Cylindrical metric)를 이용하여 11가지 색상 항목(Index color)으로 색인을 하는 단계, 각 색상 항목의 우선순위 결정하고 평균과 표준편차를 구하는 단계, 마지막으로 Lab 색 공간에서 색을 변환하고 영상의 잡음과 의사 윤곽선(pseudo-contour)을 제거하기 위한 후처리 단계의 4단계로 구성된다. 실험결과를 통해 제안하는 기법은 낮은 채도 상에서도 유채색과 무채색이 잘 분리되어 색인이 되었으며 원본 영상의 색이 참조 영상의 색으로 자연스럽게 변환된 결과를 얻을 수 있음을 확인하였다.

지도적 잠재의미색인(LSI)기법을 이용한 의견 문서 자동 분류에 관한 실험적 연구 (An Experimental Study on Opinion Classification Using Supervised Latent Semantic Indexing(LSI))

  • 이지혜;정영미
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.451-462
    • /
    • 2009
  • 본 연구에서는 의견이나 감정을 담고 있는 의견 문서들의 자동 분류 성능을 향상시키기 위하여 개념색인의 하나인 잠재의미색인 기법을 사용한 분류 실험을 수행하였다. 실험을 위해 수집한 1,000개의 의견 문서는 500개씩의 긍정 문서와 부정 문서를 포함한다. 의견 문서 텍스트의 형태소 분석을 통해 명사 형태의 내용어 집합과 용언, 부사, 어기로 구성되는 의견어 집합을 생성하였다. 각기 다른 자질 집합들을 대상으로 의견 문서를 분류한 결과 용어색인에서는 의견어 집합, 잠재의미색인에서는 내용어와 의견어를 통합한 집합, 지도적 잠재의미색인에서는 내용어 집합이 가장 좋은 성능을 보였다. 전체적으로 의견 문서의 자동 분류에서 용어색인 보다는 잠재의미색인 기법의 분류 성능이 더 좋았으며, 특히 지도적 잠재의미색인 기법을 사용할 경우 최고의 분류 성능을 보였다.

SGML 한글문서의 논리적 구조에 근거한 색인기법에 관한 연구 (A Study of Automatic Indexing Technique based on Logical Structure of SGML Hangul Document)

  • 유석종
    • 정보관리학회지
    • /
    • 제12권2호
    • /
    • pp.85-101
    • /
    • 1995
  • 기존 색인 시스템은 전자문서에 대하여 전문색인 (full-text indexing) 방법만을 지원하며, 문서의 논리적 구조를 검색 방법으로 적절하게 활용하지 못하고 있다. 대부분의 전자문서는 특정 시스템에 의존적인 형식으로 되어 있으며, 문서의 물리적 형태만을 나타내고 논리적 구조에 대한 정보는 포함하고 있지 않다. 이에 반해 1986년에 ISO에서 문서교환에 대한 표준방식으로 제정한 SGML (Standard Generalized Markup Language)은 문서의 논리적 구조에 대한 정보를 포함하고 있다. 본 논문에서는 기존의 전문색인 시스템의 단점을 보완하고 표준문서형식을 사용하기 위해 SGML 문서에서의 색인 시스템을 설계 구현하고자 한다. 기존 색인 시스템에서는 문서 전체에 대하여 색인이 이루어지는데 비하여 본 시스템에서는 SGML 문서의 구성요소인 엘리먼트에 기반하여 색인 영역을 지정할 수 있게 하엿다. 따라서 문서의 논리적 구조를 반영한 다양한 검색기법에 응용될 수 있다. 또한 본 시스템에서는 SGML 한글문서에 대하여 자동색인이 가능하다.

  • PDF

색 분포 재배열을 이용한 색 분별력 향상 색역 사상 (Color Discrimination Enhancement Gamut Mapping Using Color Distribution Rearrangement)

  • 이재민;김경만;이채수;이철희;하영호
    • 전자공학회논문지S
    • /
    • 제36S권10호
    • /
    • pp.58-71
    • /
    • 1999
  • 많은 칼라 장치에서 동일한 영상을 출력했을때, 재현된 색들은 장치 사이의 색역 차로 인해 많은 차이를 나타내므로 이를 개선하기 위한 많은 색역 사상 방법들이 제안되었다. 본 논문에서는 기존의 장치 의존적 색역 사상의 단점인 압축 사상에서의 불필요한 왜곡을 줄이고 절단 사상에 의한 색 분별력 저하를 최소화시키기 위해 색 분포 재배열을 이용한 색 분별력 향상 색역 사상 방법을 제안한다. 제안한 방법은 입력 영상의 색을 색 분포라는 3차원 배열로 구성한다. 색 분포의 최대치가 출력 장치 색역의 경계치보다 작다면 같은 색으로 사상을 한다. 반대로 크다면 색역 내부에 색역 외부의 색을 재배열하여 사상을 한다. 결과적으로 모니터에 나타난 영상을 색과 비슷하고 채도가 높은 색이 선형적으로 변하는 영역에서 색의 분별력이 높은 영상을 프린터로 재현할 수 있었다.

  • PDF

시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 (A Single Index Approach for Subsequence Matching that Supports Normalization Transform in Time-Series Databases)

  • 문양세;김진호;노웅기
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.513-524
    • /
    • 2006
  • 정규화 변환은 시계열 시퀀스를 구성하는 엔트리들의 전체적인 패턴을 분석하는데 매우 유용하다. 본 논문에서는 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 다양한 길이의 질의 시퀀스를 지원하기 위하여 여러 개의 색인을 생성해야 하고, 이에 따라 색인 저장 공간의 오버헤드와 색인 관리의 오버헤드가 발생한다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 질의 시퀀스에 대한 정규화 변환을 지원하는 효율적인 서브시퀀스 매칭 방법을 제안한다. 이를 위하여, 우선 정규화 변환을 일반화한 포함-정규화 변환(inclusion-normalization transform) 개념을 제시한다. 포함 정규화 변환이란 색인에 저장할 윈도우에 대해서 해당 윈도우를 포함하는 서브시퀀스의 평균과 표준편차로 정규화하는 것으로서, 기본적인 정규화 변환을 윈도우 및 서브시퀀스 개념을 사용하여 확장한 것이다. 다음으로, 포함-정규화 변환을 기존 서브시퀀스 매칭 연구에 적용하기 위한 이론적 근거를 정리로서 제시하고 증명한다. 그리고, 이 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시한다. 실제 주식 데이터에 대한 실험 결과, 제안한 방법은 기존 방법에 비해 최대 $2.5{\sim}2.8$배까지 성능을 향상 시킨 것으로 나타났다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 정규화 변환 이외의 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있다. 따라서, 제안한 방법은 정규화 변환을 포함하는 많은 다른 종류의 변환을 지원하는 서브시퀀스 매칭에 폭넓게 적용될 수 있는 좋은 연구결과라 사료된다.