• 제목/요약/키워드: 색인기법

검색결과 654건 처리시간 0.028초

무선 데이터 방송 시스템의 설계 및 구현 (Design and Implementation of Wireless Data Broadcast System)

  • 손지훈;성민경;정하림;정연돈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.386-388
    • /
    • 2008
  • 무선 데이터 방송 시스템은 다수의 이동 클라이언트 들에게 효율적으로 데이터를 전달하는 방법이다. 최근까지 이동 클라이언트들의 평균 접근 시간을 줄이기 위한 스케줄링 기법과 튜닝시간을 줄이기 위한 색인 기법에 대한 많은 연구가 진행되고 있다. 본 논문에서 우리는 실제 기기를 사용하여 기존의 색인 기법과 스케줄링 기법을 활용한 무선데이터 방송시스템을 구현하였다. 또한 구현한 무선 방송 시스템에서 키워드 탐색 질의 처리시, 기존의 색인 기법과 스케줄링 기법의 성능을 평가 하였다.

XML 문서의 상향식 질의처리를 지원하는 효율적인 색인구조 (An Efficient Index Structure for Bottom-Up Query Processing of XML Documents)

  • 서동민;김은재;성동욱;유재수;조기형
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.101-113
    • /
    • 2006
  • XML에서의 질의는 경로 질의를 사용하고, 경로 질의를 효과적으로 처리하기 위한 여러 가지 색인 기법들이 연구되었다. 최근에는 구조 조인 기법과 더불어 접미사(suffix) 트리를 이용한 기법이 제안되고 있다. 그 중에서 가장 대표적인 기법이 ViST(Virtual Suffix Tree) 이다. ViST는 질의 처리 시간을 줄이기 위해서 접미사 트리와 B+ 트리를 이용하여 질의 처리에 참여하는 엘리먼트만을 비교한다. 그러나 실제 문서에서 조상-후손 관계가 아닌 엘리먼트도 후손으로 보고 처리하는 문제점으로 인해 디스크 접근이 많아지는 비효율성을 지닌다. 따라서 본 논문에서는 ViST의 문제점을 해결하는 색인구조를 제안하고 이 색인구조에 알맞은 질의 처리기법을 제안한다. 그리고 다양한 질의 처리 실험을 통해 기존에 제안된 색인구조에 비해 향상된 질의 처리 성능을 나타냄을 보인다.

  • PDF

언어학적 분석기법에 의한 신문기사 자동색인시스팀 설계에 관한 연구 (A Study of automatic indexing based on the linguistic analysis for newspaper articles)

  • 서경주;사공철
    • 정보관리학회지
    • /
    • 제8권1호
    • /
    • pp.78-99
    • /
    • 1991
  • 본 연구는 전자신문인 한경 KETEL의 기사 전문을 대상으로 키워드를 자동 추출하는 자동색인 시스팀을 구축한 것으로서 한글의 형태적 특성을 이용한 언어학적 분석기법을 적용해서 키워드 화일을 생성하는 법을 제시하였으며, 불용어리스트 조사표 용언인식표의 작성법을 상세히 기술했다. 본 연구에서 얻어진 결론은 다음과 같다. 첫째, 형태소 분석을 통한 자동색인 기법으로 만족할 만한 키워드를 추출할 수 있었다. 둘째, 아직까지는 컴퓨터에 의한 한글의 구문분석과 의미분석이 완전하지 못하므로 자동색인으로 추출된 색인어를 색인자가 조절함으로써 색인의 성능을 향상시킬 수 있었다. 셋째, 이 시스팀에서 만들어진 약 20,000어 정도의 키워드 화일은 향후 디소러스 작성에 기본 자료로 사용할 수 있다. 넷째, 본 시스팀에서는 역순사전을 활용해 조사표와 용언인식표 작성법을 제시하였는데, 이는 여러 자동색인 시스팀 설계에 적용될 수 있을 것이다.

  • PDF

이동 P2P 환경에서 효율적인 피어 지역 색인 (An Efficient Local Peer Indexing in Mobile P2P Environment)

  • 곽동원;최길성;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.67-69
    • /
    • 2010
  • 본 논문에서는 이동 피어의 효율적인 콘텐츠 탐색을 지원하는 피어 지역 색인 기법을 제안한다. 제안하는 기법은 인덱스 테이블, 버디 테이블, 라우팅 테이블로 구성되며 타임스탬프 메시지를 이용하여 메시지 전송 비용을 감소시킨다. 제안하는 색인 구조는 동적인 이동성과 상황 정보를 고려하여 탐색정확도를 향상하고 탐색 비용을 감소시킨다.

  • PDF

Spark 기반의 인 메모리 분산 이동객체 색인 기법 (In-memory Distributed Moving Object Indexing Method based on Spark)

  • 이윤수;송석일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2014년도 추계 종합학술대회 논문집
    • /
    • pp.35-36
    • /
    • 2014
  • 이 논문에서는 다수 노드로 구성되는 클러스터 환경을 위한 인-메모리 이동객체 분산 색인기법을 제안한다. 제안하는 방법은 Spark Stream의 D-strem모델을 사용하여 처리율 저하등의 문제를 유할 할 수 있는 잠금 기반의 동시성 제어방법을 배제한다.

  • PDF

XML 문서를 기반으로 한 Local 검색을 위한 색인 기법 (A Indexed Technique for Local search based on XML Document)

  • 정혜진;유춘식;김용성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.728-730
    • /
    • 2003
  • 오늘날 방대한 양의 정보를 관리하고 검색하기 위해 정보를 효율적으로 처리 할 수 있는 방안에 대해서 많은 연구가 진행되고 있다. 본 논문에서는 문서를 구조화하기 위한 방법으로써 XML을 기반으로 하고, 이를 효과적으로 검색하기 위해서 색인기법을 제안하므서 CD-ROM이나 하드 디스크와 Locai 보조 기억 장치에 저장되어 있는 문서 파일을 효율적으로 검색할 수 있도록 한다.

  • PDF

자동색인에서 단어의 품사와 빈도를 이용한 색인후보어 발췌 (Extraction of the Latent Index Terms Using the Word Frequency and Part of Speech in Automatic Indexing)

  • 이태영;남궁황
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.181-184
    • /
    • 2001
  • 본 논문에서는 적합한 색인어를 자동으로 추출해 내기 위해 잘 알려진 통계적 기법과 구문분석적 기법을 혼용하였다. 적용결과를 검색효율로 나타내지 않고 각 방법에 따라 추출된 단어들을 실증적으로 보여주어 성능에 대한 판단을 유도하였다. 빈도나 품사가 단독으로 사용된 것보다 동시에 적용된 것이 보다 좋은 결과를 가져왔다.

  • PDF

모양 영상 검색을 위한 효율적인 색인구조와 검색방법 (Efficient Index Structure and Search Mehtod for Shape Image)

  • 장용석;김성재;최병걸;안철웅;김승호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.347-349
    • /
    • 1999
  • 본 논문에서는 대규모 영상 데이터베이스로부터 모양 영상에 대한 검색을 빠르고 효율적으로 수행하기 위해 해싱기법을 변형한 색인구조와 검색방법을 제안한다. 제안된 색인 구조는 이진 모양 영상(binary shape image)의 불변 모멘트 집합(invariant moments set)을 특징 벡터로 사용하여 다차원으로 구성된다. 이 색인 구조를 기반으로 제안된 해싱을 변형한 검색방법은 기존의 방법들에 비해 검색공간을 줄임으로써 검색속도를 높인다. 본 논문에서 제안한 색인구조와 검색방법을 1000개의 이진 모양 영상들에 적용해 본 결과 검색공간이 전체 공간의 10% 미만으로 줄어드는 효과가 있었다.

  • PDF

복합명사 분리 색인 방법이 문서 클러스터링에 미치는 영향 분석 (An Analysis of the Hierarchical Agglomerative Clustering based on various Compound Noun Indexing Method)

  • 양명석;최성필
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.697-699
    • /
    • 2002
  • 본 논문에서는 복합명사에 대한 색인 방법을 다각적으로 적용하여 계층적 결함 문서 클러스터링 시스템의 결과를 분석하고자 한다. 우선 한글 색인 엔진과 HAC(Hierarchical Agglumerative Clustering) 엔진에 대해서 설명하고 한글 색인엔진에서 제공되는 세가지 복합명사 분석 모드에 대해서 설명한다. 또한 구현된 클러스터링 엔진의 특징과 속도 향상을 위한 기법 등을 설명한다. 실험에서는 다양한 요소를 가지고 클러스터링된 문서 집합에 대한 분석 결과를 보인다. 실험 결과에 대한 분석에서 복합명사에 대한 색인 방법이 문서 클러스터링의 결과에 직접적인 영향을 준다는 것을 보여준다.

  • PDF

다차원 색인구조 M-트리에서 노드 색인 공간의 중첩을 최소화하기 위한 효율적인 분할 알고리즘 (An Efficient Split Algorithm to Minimize the Overlap between Node Index Spaces in a Multi-dimensional Indexing Scheme M-tree)

  • 임상혁;구경이;김기창;김유성
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.233-246
    • /
    • 2005
  • 멀티미디어 데이터를 위한 내용기반 검색 서비스의 속도를 증진하기 위해 다차원 색인 기법에 대한 연구가 활발하게 진행되고 있다. 다차원 색인 기법의 하나인 M-트리는 노드의 중심점과 객체간의 상대적 거리를 이용하여 색인을 구성하고, 검색 공간에 포함되는 객체를 액세스하는 기법으로서 노드들은 페이지 단위로 구성되며 하위 엔트리들을 포함할 수 있는 반경, 즉 유사도 거리에 의해 노드의 영역이 표현되어진다. 그러나 이와 같은 노드의 영역 표현에 있어서 노드 색인 공간의 중첩으로 인해 질의 시 검색해야 하는 노드수가 증가하고 이는 거리계산과 디스크 입출력의 횟수를 증가시킨다. 본 논문에서는 M-트리에서 문제가 되고 있는 노드 색인 공간 중첩을 최소화하는 노드 분할 정책을 제안한다. M-트리의 기존 분할 정책들과는 다르게 노드의 가상 중심점을 계산하여 라우팅 객체로 이용하여 노드 색인 공간의 중첩을 최소화하고 노드 안의 엔트리 재분배를 통해 노드의 색인 공간의 크기를 작게 유지하며 밀도 높은 노드를 구성하도록 한다. 실험으로부터 제안된 노드 분한 알고리즘이 라우팅 노드의 색인 공간의 반경을 작게 유지하며 결과적으로는 사용자 질의에 대해 개선된 응답 시간을 제공하는 것으로 판명되었다.