• Title/Summary/Keyword: 색인

Search Result 9,888, Processing Time 0.041 seconds

Korean Automatic Indexing System Using the PDA (PDA를 이용한 한국어 자동 색인 시스템)

  • Park, Pyeung-Koo;Chung, In-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.375-378
    • /
    • 2000
  • 인터넷의 급속한 발달로 사용자는 자신의 질의에 적합한 검색결과를 빠르고 정확하게 보장하는 검색도구를 요구하게 되었다. 이러한 사용자의 요구는 검색도구의 성능향상에 필수적인 문서의 내용을 대표하는 색인어를 추출하는 색인 시스템에 대한 관심을 가지게 되었다. 기존의 한국어에서의 자동 색인 방법에는 어절 중심 색인법, 형태소 중심 색인법과 최근에 n-gram 중심 색인법 등이 주류를 이루어 왔다. 그러나 한국어에서 색인어를 추출하는 기존의 방법은 복합명사의 색인과 복잡한 문법적 지식이 필요하고 잘못된 색인어를 추출하는 등의 검색효율에 문제점을 가지고 있다. 본 논문에서는 PDA를 이용한 정형화된 한국어와 영어문장의 자동 색인 방법을 제안한다. 제안하는 방법은 별도의 사전지식이 필요하지 않고 단일 명사와 복합명사의 색인이 가능하며 인터넷으로의 확장과 다양한 언어로 확장성이 좋은 장점 등을 갖는다. 성능 평가로써 한국통신의 KTSET으로 MS사의 IIS를 웹 서버로 ASP를 이용하여 인터넷 환경에서 테스트를 통하여 한국어 뿐 아니라 영어문장의 정형화되고 이용이 간편한 자동색인 결과를 보여준다.

  • PDF

A Study on Christian Website Indexing (기독교 관련 웹 사이트 내 색인에 관한 연구)

  • Yoo, Yeong-Jun
    • Journal of Korean Library and Information Science Society
    • /
    • v.38 no.4
    • /
    • pp.257-276
    • /
    • 2007
  • Back-of-book-style indexes have a similar function as back-of-book indexes. The best advantage o4 back-of-book-style indexes for Information access on the web is to give direct access to specific subjects of interest. Though back-of-book-style indexes are alphabetically arranged as back-of-book indexes, they have linked index entries to contents on the site by using a anchor tag of HTML. In this research, I have created back-of-book-style indexes in two separated ways, by hand-crafted and semi-automatic Indexing. We have utilized back-of-book-style indexes, that is similar to back-of-book index of traditional information organization method of library and information science, in library circumstances.

  • PDF

A Study on Indexing Technique for Efficient Search of XML Data (XML 데이타의 효율적인 검색을 위한 색인 모델에 관한 연구)

  • Kwon, Guk-Bong;Hong, Dong-Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11c
    • /
    • pp.1399-1402
    • /
    • 2003
  • 본 연구에서는 XML 데이타의 효율적인 검색을 위한 색인 모델을 제안한다. 제안한 색인 모델은 문서 계층상의 모든 레벨에서 내용 기반 질의, 구조 기반 질의와 같은 다양한 질의를 지원하기 위한 구조정보와 이를 이용한 색인 구조로 구성된다. 그리고 구조 검색을 지원하기 위해 새로운 구조정보 표현 방법을 제안한다. 또한 제안된 색인 모델에 지속성을 부여하기 위해 색인 모델을 디스크에 저장하는 방법을 제안하고 간단한 질의의 처리 과정을 설명한다.

  • PDF

Performance Evaluation of Spatial Indices for Moving Object Database (이동체 데이터베이스의 공간 색인 성능평가)

  • 이주형;김진덕;전봉기;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.193-195
    • /
    • 2001
  • 이동체는 끊임 없이 위치 정보를 변경하는 특징을 가지고 있다. 빈번한 데이터 변경이 발생하는 이동체에 대한 효율적인 색인 기법의 대한 연구가 필요하다. 이 논문에서는 이동체의 공간 데이터 표현 방법과 색인 변경 정책을 제안한다. 그리고 제안한 색인 변경 정책에 따른 공간 색인별 성능 평가와 구축된 공간 색인의 영역 질의 처리에 대한 성능 평가를 위한 실험 평가기를 설계한다. 실험을 통해 이동체 데이터베이스에서 효율적으로 사용 가능한 색인을 도출해 낼 수 있으며, 실험 결과물의 하나인 성능 평가기를 사용하여 향후 개발할 이동체를 위한 새로운 색인에 대한 성능 평가도 수행할 수 있다.

  • PDF

A Unified Index of Moving Objects in Road Networks (도로 네트워크 기반 이동체의 통합 색인)

  • 정명호;장용일;박순영;오영환;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.4-6
    • /
    • 2004
  • 최근 이동체 관리 기술 중 물류 및 차량 관리, 응급 서비스 등 실세계에 많이 응용되는 도로 네트워크(도로, 철도 선로 등) 기반 이동체 관리에 대해 많은 연구가 진행되었다. 도로 네트워크를 따라 움직이는 이동체는 이동 영역이 한정되어 있기 때문에, 이러한 특징을 반영한 현재 위치 색인 및 과거 위치 색인이 개발되었다. 그러나 실세계 응용에서는 이동체의 과거 및 현재 위치를 모두 필요로 하는 경우가 많아서 두개의 색인을 별도로 유지하여야 하며, 이는 비효율적인 노드탐색 비용을 유발하고 색인 사이에 공통된 부분이 존재함에도 불구하고 중복된 유지를 해야 한다는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 도로 네트워크 기반 이동체의 통합 색인을 제안한다 제안 색인은 도로 네트워크 기반 이동체의 현재 위치 색인 및 과거 위치 색인의 공통된 부분인 도로 네트워크를 저장.관리하는 부분을 공유하여 색인 유지비용을 줄이며, 현재 및 과거 위치 질의에 대해 불필요한 노드 탐색 비용도 감소시킨다. 또한 과거 및 현재 위치 색인을 통합함으로써 효율적으로 과거 위치 정보를 생성.저장하는 것이 가능해진다.

  • PDF

Design of a Multi-dimensional Index Structure based on Main Memory (주기억장치 상주형 다차원 색인 구조 설계)

  • 심정민;송석일;유재수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.1-3
    • /
    • 2003
  • 최근 중앙처리장치와 주기억장치간의 병목 현상에 의한 성능 저하를 극복하기 위해 캐시를 고려한 색인 구조들이 제안되었다. 이런 색인 구조들의 궁극적인 목표는 엔트리 크기를 줄여 팬-아웃(fan-out)을 증가시키고, 캐시 접근 실패를 최소화하여 시스템의 성능을 높이는 것이다. 엔트리의 크기를 줄이는 기법에 따라 기존의 색인 구조들을 두 가지로 구분할 수 있다. 하나는 좌표 값을 고정된 비트로 양자화 함으로써, MBR 키를 압축하는 것이다. 또 다른 하나는 MBR들의 각 좌표 값 중에 그들의 부모 MBR과 같지 않은 좌표 값만을 저장하는 것이다. 본 논문에서는 두 기법의 특성들을 적절히 합한 새로운 색인 구조를 제안하고, 기존에 제시된 두 접근법을 따르는 주기억장치 상주형 다차원 색인 구조를 다양한 환경에서 성능 평가한다. 또한, 기존의 색인 구조와 비교를 통해 제안하는 색인 구조의 우수성을 보인다.

  • PDF

Acceleration of Range Query in R-tree Using GPU Parallel Processing (GPU를 이용한 R-tree의 질의처리 병렬화)

  • Kim, Min-Cheol;Choi, Won-Ik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.37-40
    • /
    • 2011
  • 계층적 색인 구조는 대용량의 다차원 데이터에 대한 범위질의를 가장 효율적으로 처리하는 색인 구조이다. 계층적 색인 구조에서 범위질의의 속도를 향상시키기 위해서 색인 구조의 구성 시 발생하는 인접노드간의 겹치는 영역을 줄이는 기법들과 다량의 데이터를 한 번에 읽어 상향식 방식으로 색인 구조의 공간 활용도를 증가시키는 벌크 로딩 기법들이 제안되었다. 하지만 CPU기반에서 개별의 노드들을 순차적으로 질의처리 하는 계층적 색인 구조는 공간 활용도의 증가와 노드 간의 중첩 영역을 줄이는 것만으로는 질의 처리 성능 향상에 한계가 있다. 따라서 본 논문에서는 기존의 CPU기반 계층적 색인 구조 중의 대표적인 예인 R-tree의 저장 구조를 GPU 메모리에 적합하도록 변경을 하였다. 또한 기존 CPU기반 계층적 색인 구조의 순차적인 노드 검색을 GPU를 이용해 병렬적으로 노드를 검사하여 성능을 향상시켰다. 이와 같은 방식으로 질의 영역의 크기에 따라서 성능 향상정도가 다르지만 최대 100배 이상의 성능을 향상시켰다.

A Spatial Indexing Scheme for Geographical Data with Skewed Access Patterns (편향 접근 패턴을 갖는 공간 데이터에 대한 공간 색인 기법)

  • 이승중;정성원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.46-48
    • /
    • 2004
  • 차량항법장치(Car Navigation System : CNS)나 지리정보시스템(Geographic Information System : CIS)에서 공간 객체를 효율적으로 다루는 색인기법에 대한 다양한 논의가 있어왔다 기존의 방법에서는 공간 객체의 인접성(cluster)과 밀집성 만을 고려해서 색인 트리를 생성하므로, 편향된 접근 빈도론 가진 공간 객체이 대해서 효과적인 탐색시간을 제공하지 못한다. 접근 빈도를 반영한 색인 기법은 공간 데이터가 갖는 특성-2개 이상의 차원에 대한 순서 할당이 불가능-에 의해서 지리적으로 인접된 객체들을 묶지 못하고, 이로 인해서 공간 객체에 대한 효율적인 색인 기법을 제공할 수 없다. 지리 데이터에 대한 위치와 접근 빈도가 주어질 매, 색인 트리는 좌표 정보뿐 아니라 공간 객체에 대한 접근 빈도도 고려해서 생성되어야 한다 본 논문에서 제안하는 기법을 전체 영역을 세부영역으로 분할하고, 각 세부 영역에 대해서 편향색인 트리를 생성한 뒤에 트리를 병합함으로써 밀집도와 접근 빈도를 반영한, 편향된(skewed) 색인 트리를 생성하도록 한다. 편향된 색인 트리는 접근 빈도가 높은 공간객체를 상위계층(level)에 위치시킴으로써 탐색비용을 줄인다.

  • PDF

High Dimensional Index Information Management for Data Availability (데이터의 가용성을 보장하는 고차원 색인 정보 관리)

  • Choi, Hyun-Hwa;Lee, Mi-Young;Lee, Kyu-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.874-877
    • /
    • 2010
  • 웹 서비스 혹은 클라우드 컴퓨팅 서비스로써 대용량의 멀티미디어 데이터에 대한 내용 기반 검색을 지원하기 위하여, 분산 고차원 색인 구조에 대한 연구가 활발하게 이뤄지고 있다. 이러한 고차원 데이터의 색인 구조에 대한 연구와 달리, 고차원 색인 데이터의 저장 및 관리에 대한 연구는 거의 전무한 것이 현실이다. 지금껏 대부분의 색인 데이터는 빠른 접근을 위하여 트랜잭션 관리 및 데이터의 복구를 제공하지 않은 파일 시스템에서 관리되어 왔다. 그러나, 파일 시스템에 저장된 색인 데이터는 이를 서비스하는 노드의 장애 발생 시에 일부 혹은 전체 데이터에 대한 검색이 이뤄지지 않는 문제점이 있다. 서비스의 가용성 여부가 중요한 요소인 웹 서비스와 클라우드 컴퓨팅 서비스를 위하여, 본 논문에서는 고차원 색인 데이터를 데이터베이스를 통해 관리하여, 안정성 및 가용성을 보장하면서, 고차원 데이터의 색인 및 검색의 성능을 보장하는 방법을 제안하고자 한다.

Understanding of Relation of Accident from Car Color (자동차 색상별 사고 관계 파악)

  • Shin, Seong-Yoon;Lee, Hyun-Chang
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.07a
    • /
    • pp.89-90
    • /
    • 2014
  • 본 논문에서는 진출색(advancing color)과 후퇴색(receding color)의 개념을 알고 자동차 사고와의 관계를 알아보았다. 실제보다 더 가까이 있는 것처럼 보이는 진출색은 사고가 적음을 알 수 있고, 멀리 있는 것처럼 보이는 후퇴색이 사고가 많이 나는 것을 알 수 있다. 진출색과 후퇴색은 같은 위치에서 어떠한 색과 배경색과의 관계로서 알 수 있다. 같은 위치에서 배경색보다 더 앞으로 튀어 나올 것 같은 느낌을 주는 색을 진출색이라 한다. 반대로 더 뒤로 물러나는 것 같은 느낌을 주는 색을 후퇴색이라고 한다.

  • PDF