• Title/Summary/Keyword: 색인시스템

검색결과 713건 처리시간 0.026초

이동체 데이터베이스를 위한 통합 색인의 성능 평가 (Evaluation of Unified Index for Moving Object Databases)

  • 정지원;안경환;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2004년도 국내 LBS 기술개발 및 표준화 동향세미나
    • /
    • pp.98-104
    • /
    • 2004
  • 이동체 데이터베이스에서 이동체의 과거 궤적을 저장하기 위해 메인 메모리 기반 색인을 이용하면 시간이 지남에 따라 데이터의 방대함으로 인해 주어진 메모리 용량이 부족하게 될 수 도 있다. 이를 해결하기 위해서는 메인 메모리에 상주하는 색인의 일부를 계속해서 디스크로 이주하는 정책이 필요하다. 이런 이주 정책을 지원하는 메인 메모리 이동체 색인이 통합 색인이다. 기존 통합 색인의 색인 이주 정책인 이동 서브트리 정책은 시간 축으로 가장 오래된 엔트리를 seed 노드로 선정하여 이동 서브트리를 구성한다. 이때 항상 시간적으로 가장 오래된 노드만을 디스크로 옮김으로써 과거에 대한 질의 시 비효율적이라는 문제점을 가진다. 본 논문에서는 이주를 위한 서브트리 구성에 필요한 seed 노드를 선택하기 위해, 질의 및 삽입 시에 참조되는 단말 노드들을 유지하는 LRU 버퍼를 이용한 색인 이주 정책을 제시한다. 이를 바탕으로 메인 메모리 기반 색인의 장점과 메모리 용량 부족의 문제를 해결한 통합색인을 구현하고, 다양한 성능 평가를 통하여 제시된 이주 정책이 기존의 이주 정책에 비해 삽입 성능뿐만 아니라 영역 질의에서도 우수함을 보인다.

  • PDF

JICCE 학술지의 국제 색인 DB 등재 지원을 위한 영문 ACOMS 활용 방안 연구 (A study for enlisting JICCE Journal in international citation index by using English ACOMS)

  • 박재원;류범종;서태설
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.924-926
    • /
    • 2012
  • 국내 과학기술분야 학회는 발행 학술지가 세계적인 학술지로 거듭나고자, 국제 색인 DB에 등재하고자 하는 노력이 점차 증가하고 있다. 학회 학술지를 국제 색인 DB에 등재하기 위해서는 해당 색인 DB를 주관하는 단체의 평가요소에 따라 학술지를 체계적으로 운영하고 관리해야 하며, 투명한 상호심사(Peer Review) 과정을 포함하는 학술지 전자 출판과정을 온라인으로 효율적으로 운영해야 한다. KISTI는 국내 학술지가 국제색인 DB에 등재 평가를 받기 위해 시스템적으로 필요한 요소들을 연구하여, 2010년도에 해당 요소들이 반영된 학술지 홈페이지를 포함하는 영문ACOMS(ACOMS Ver. 4.0)를 개발하였다. 영문 ACOMS는 2012년 현재에도 국제적인 시스템으로 거듭나기 위해 지속적인 기능개선을 추진하고 있으며, 현재 JICCE 학술지를 포함한 49종의 학술지에 대해 운영되고 있다. 이 논문에서는 국제색인 DB 등재를 위해 시스템적으로 갖추어야 할 요소들을 기술하고, 영문 ACOMS 활용을 통한 JICCE 학술지의 국제색인 DB 등재 지원 방안을 제시한다.

  • PDF

고빈도어를 이용한 복합명사 색인어 추출 방안 (The Generation Methods of Composition Noun For Efficient Index Term Extraction)

  • 김미진;박미성;장혁창;최재혁;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.121-129
    • /
    • 1998
  • 정보검색이나 자동색인 시스템에서는 정확한 색인어의 추출이 시스템의 성능을 좌우하게 된다. 따라서 정확한 색인어의 추출이 매우 중요하다. 본 논문에서는 정보 검색시에 보다 정확한 문서를 찾아줄 수 있도록, 출현 고빈도어를 이용하여 효율적인 색인어 추출을 위한 합성 명사 생성방안을 제시한다. 이를 위하여 문서 내에서 출현 빈도가 높은 명사, 즉 상위 $30%{\sim}40%$의 고빈도 명사에 합성 및 분해 규칙을 적용하여 합성명사 색인어를 추출한다. 또한 본 논문에서 제시한 상위 $30%{\sim}40%$ 고빈도 명사합성에 대한 타당성을 검증하기 위하여 적절한 명사합성 빈도를 구한다. 제안한 방법을 적용한 결과 300어절 이하의 짧은 문서는 출현빈도 상위 30%까지의 명사를 합성했을 경우 저빈도 누락이 작았고 300어절 이상의 문서는 출현빈도 40%까지 합성하면 저빈도 누락이 상당히 줄어듦을 알 수 있었다. 그리하여 전체 색인어의 개수를 줄였고 색인어의 정확률을 높였다.

  • PDF

국내 학술지 인용색인을 위한 데이터요소의 기술형태 분석: 정보관리학회지를 중심으로 (A Study on the Description of Data Elements for the Citation Index of Academic Journals in Korea: with Special Reference to the Journal of the Korean Society for Information Management)

  • 김태수;남영광;최석두
    • 정보관리학회지
    • /
    • 제16권2호
    • /
    • pp.183-199
    • /
    • 1999
  • 인용색인은 기본적으로 인용색인과 원문색인(서지부), 순열주제색인의 세 부분으로 구성된다. 이 세가지 기본색인과 다양한 참조기능을 갖는 인용색인을 작성하는 데 필요한 요소를 추출하기 위하여 한국정보관리학회의 정보관리학회지, 제 1권 제 1호(1984)부터 제 15권 제 3호(1998)까지 15년간 총 30호를 분석하였다. 인용색인에 포함되어야 할 필수요소로 저자, 소속기관명, 논문명, 서명 혹은 학술지명, 권호 및 면수, 발행년, 키워드, 본문언어, 주제분야, 참고문헌 통계 데이터 등 10가지의 기본정보를 선정하고 기술형식에 대하여 논의하였다. 또한 국내 학술지의 인용색인시스템을 개발한다는 관점에서 동 학회지의 원저논문 및 참고문헌을 분석하여 해결해야 할 문제와 수록 데이터요소를 제시하였다.

  • PDF

대용량 데이터를 위한 효율적인 다차원 색인구조 (An Efficient Multi-Dimensional Index Structure for Large Data Set)

  • 이병엽;유재수
    • 한국지리정보학회지
    • /
    • 제5권2호
    • /
    • pp.54-68
    • /
    • 2002
  • 최근 지리정보시스템, 움직임 객체관리시스템, 동영상/이미지 내용기반 검색시스템, 시계열 데이터베이스시스템과 같이 다차원 데이터를 이용하는 응용에 대한 관심이 고조되고 있다. 이 논문은 다차원의 특징벡터를 벡터 근사치로 표현한 후 색인 트리를 구성하여 검색의 효율을 높이는 VA(vector approximate)-트리를 제안한다. 이 논문에서 제안하는 VA-트리는 전체적인 색인구조의 저장공간을 줄이기 위해서 VA-파일의 벡터 근사치 개념을 이용하여 데이터량이 증가해도 검색 성능이 저하되지 않도록 하는 트리 형태의 구조를 갖는다. VA-트리는 MBR 기반의 색인구조이지만 MBR 간에 겹침이 발생하지 않는 분할방법을 사용하여 검색 효율을 높인다. 제안하는 색인구조와 기존의 여러 다차원 색인구조와의 성능 평가를 통해 제안하는 방법의 우수함을 보인다.

  • PDF

단일/다중할당 공간 색인에서 병렬 공간 조인의 성능평가 (Performance Evaluation of Parallel Spatial Join for Single/Multiple-Assignment Spatial Index)

  • 김진덕;홍봉희
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권6호
    • /
    • pp.763-779
    • /
    • 1999
  • 공간 조인을 위한 공간 색인은 단일할당 방식과 다중할당 방식으로 구분한다. 단일할당 공간색인은 하나의 공간색채를 단 하나의 노드에만 할당하고, 다중할당은 하나의 객체를 여러 노드에 할당하는 공간 색인으로서 R-tree 가 전자에 해당하고, Quad-tree가 후자에 해당한다. 지금까지 단일 할당과 다중 할당 공간 색인에서의 공간조인에 대한 직접적인 성능 비교 평가가 거의 없다. 왜냐하면 각 공간 색인의 구조가다르고 적용할 수 있는 공간 조인 기법 또한 전혀 달라 정확한 성능 평가가 매우 어렵기 때문이다. 그래서 이 논문에서는 고정 그리드 파일을 변형하여 다중 할당 공간 색인과 단일 할당 공간 색인을 각각 구성한 뒤 두 공간 색인의 병렬 공간 조인 성능을 평가하였다. 평가를 위해 4가지 병렬공간조인기법을 제안하였다. 그리고 태스크 할당을 위해 태스크의 크기와 객체의 공간 지역성을 이용한 준동적 태스크 할당 방법을 제안하였다. 실험은 MIMD 구조 및 공유디스크 방식의 병렬 시스템에서 수행되었고, 여과 단계 후 중복을 제거하는 다중할당-단일조인 방식이 우수함을 보였다.

객체지향 질의처리를 위한 다차원 중포 속성 색인구조의 최적 설계기법 (Optimal Design Method of Multidimensional Nested Attribute Indexes for Object-Oriented Query Processing)

  • 윤동하;이종학
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1863-1866
    • /
    • 2002
  • 본 논문에서는 객체지향 데이터베이스 시스템에서 중포 속성에 대한 색인구조로 다차원 색인구조를 이용하는 다차원 중포 색인구조(Multidimensional Nested Attribute Index: MD-NAI)의 최적 설계기법을 제시한다. MD-NAI는 일차원 색인구조를 이용한 중포 속성 색인구조에서 지원할 수 없는 클래스 계층상의 클래스 대치가 있는 중포 술어의 질의처리를 잘 지원할 수 있다. 그러나, MD-NAI는 사용자 질의 형태에 따라 색인검색의 성능이 매우 나빠질 수 있다. 본 논문에서는 질의 형태에 따른 MD-NAI의 성능 개선을 위하여, 먼저 중포 술어에 대한 질의 정보로서 MD-NAI의 색인 페이지 영역의 최적 모양을 결정하고, 이 최적 모양을 갖는 색인 페이지 영역의 모양이 되도록 하는 영역분할 전략을 적용한다. 성능평가의 결과에 의하면, 주어진 질의 패턴에 따라 최적의 MD-NAI를 구성할 수 있었으며, 삼차원 MD-NAI의 경우에 질의 형태에 따라 5.5배까지 성능이 향상되었다.

  • PDF

사전 정보에 기반한 효율적인 자동색인기 설계 (A Design of Efficient Automatic Indexing based on Dictionary Information)

  • 진정환;김태완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.547-550
    • /
    • 2001
  • 웹상에 공유되어진 문서의 내용을 대표하는 색인어 추출은 정보 검색 시스템의 질을 좌우한다. 한국어의 자유로운 복합명사나 띄어쓰기 규약, 사전 미등록 어휘 등으로 색인어 추출시 질의어와 색인어 사이의 형태상의 불일치(Syntactic Term Mismatch)가 발생하여 검색성능을 저하시키는 경우가 많다. 따라서 본 논문에서는 사전을 통한 형태소 해석을 통해 단위명사(Unit Noun)로 색인어를 추출하고 사전 미등륵어는 N-gram 기반 색인 방법을 이용하여 질의어와 색인어 사이의 부분 일치된 문서도 추출될 수 있는 방법을 제안하였으며, 색인어와 질의어 사이의 유사도 계산을 통해 문서의 우선순위를 정함으로써 색인기의 성능을 높이는 방법을 제안한다.

  • PDF

편향 접근 패턴을 갖는 공간 데이터에 대한 공간 색인 기법 (A Spatial Indexing Scheme for Geographical Data with Skewed Access Patterns)

  • 이승중;정성원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.46-48
    • /
    • 2004
  • 차량항법장치(Car Navigation System : CNS)나 지리정보시스템(Geographic Information System : CIS)에서 공간 객체를 효율적으로 다루는 색인기법에 대한 다양한 논의가 있어왔다 기존의 방법에서는 공간 객체의 인접성(cluster)과 밀집성 만을 고려해서 색인 트리를 생성하므로, 편향된 접근 빈도론 가진 공간 객체이 대해서 효과적인 탐색시간을 제공하지 못한다. 접근 빈도를 반영한 색인 기법은 공간 데이터가 갖는 특성-2개 이상의 차원에 대한 순서 할당이 불가능-에 의해서 지리적으로 인접된 객체들을 묶지 못하고, 이로 인해서 공간 객체에 대한 효율적인 색인 기법을 제공할 수 없다. 지리 데이터에 대한 위치와 접근 빈도가 주어질 매, 색인 트리는 좌표 정보뿐 아니라 공간 객체에 대한 접근 빈도도 고려해서 생성되어야 한다 본 논문에서 제안하는 기법을 전체 영역을 세부영역으로 분할하고, 각 세부 영역에 대해서 편향색인 트리를 생성한 뒤에 트리를 병합함으로써 밀집도와 접근 빈도를 반영한, 편향된(skewed) 색인 트리를 생성하도록 한다. 편향된 색인 트리는 접근 빈도가 높은 공간객체를 상위계층(level)에 위치시킴으로써 탐색비용을 줄인다.

  • PDF

고정 그리드를 이용한 이동객체의 위치 색인 기법 (An Indexing Method for Location of Moving Objects Using the Fixed Grid)

  • 이양구;이응재;류근호
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2004년도 국내 LBS 기술개발 및 표준화 동향세미나
    • /
    • pp.60-65
    • /
    • 2004
  • 최근 무선/이동 통신 기술과 GPS 기술의 발달은 휴대폰을 소지하고 이동하는 사람이나 GPS 수신기를 탑재한 차량과 같은 이동객체의 위치 정보와 관련된 서비스의 제공을 가능하게 하였다. 이러한 환경에서 연속적으로 변경되는 이동객체의 위치 정보는 데이터베이스에 빈번한 갱신 연산을 요구하게 되고, 이는 전체 시스템의 성능을 저하시키는 원인이 된다. 이러한 문제를 해결하기 위하여 R-Tree와 같은 공간색인 구조를 확장하여 갱신 효율을 높이기 위한 연구가 진행되어 왔지만, 시스템의 전체 성능은 오히려 저하되는 문제를 가져왔다. 이 논문에서는 이동객체의 질의 처리 성능뿐만 아니라 객체의 빈번한 위치 갱신을 효율적으로 처리할 수 있는 방법으로 고정 그리드와 R-Tree를 혼합한 형태의 색인 기법을 제안한다. 제안된 색인 기법은 R-Tree에서 색인의 재조직화로 인해 갱신 성능이 저하되는 문제를 해결하기 위하여 셀 기반 색인 기법인 고정 그리드를 이용하여 이동객체의 위치 정보를 저장하고, 고정 그리드에서 객체의 편중 분포로 인한 오버플로 문제를 처리하기 위하여 오버플로가 발생한 각각의 셀들을 R-Tree로 관리한다. 또한, 객체의 밀도가 낮은 셀들을 하나의 버켓으로 공유하여 관리함으로써 저장 공간을 효율적으로 활용한다. 제안된 방법을 다양한 평가 요소를 통해 실험한 결과, 기존의 R-Tree보다 뛰어난 갱신 성능을 보였으며, 질의 처리에 대해서도 성능이 향상되었음을 보였다.

  • PDF