• 제목/요약/키워드: 색인 구성

검색결과 970건 처리시간 0.026초

XML 데이타 색인을 위한 경로 분할 기법 (A Path Partitioning Technique for Indexing XML Data)

  • 김종익;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.320-330
    • /
    • 2004
  • XML에 대한 질의 언어는 데이타 그래프 내의 경로를 이용하여 질의를 표현한다. 특히, 경로에 패턴 (예를 들어, 정규식)을 사용함으로써, 데이타의 구조를 정확히 알지 못하더라도 질의가 가능하도록 한다. 이때, 패턴을 이용하는 질의는 데이타 그래프의 탐색범위를 크게 넓히게 된다. 기존의 XML색인 기법은 질의의 탐색범위를 줄이기 위해 데이타 그래프 내의 서로 동일한 경로들을 하나로 묶어 작은 크기의 색인 그래프를 생성하는 방법을 이용한다. 하지만 이러한 색인들은 많은 경우 색인의 크기가 데이터 그래프의 크기만큼 증가하게 되어 질의의 탐색범위를 줄이지 못하고, 따라서 효율적인 질의 처리를 보장하지 못한다. 본 논문에서는 데이타 내에 존재하는 모든 경로를 분할(partitioning)하고 질의 처리 시 질의에 맞는 분할 영역을 빠르게 찾아낼 수 있는 색인 그래프를 제안한다. 본 논문에서 제안하는 색인 그래프는 데이터 그래프의 크기와 상관없이 색인 그래프의 크기를 조절할 수 있다. 따라서 색인 그래프의 크기를 작게 구성함으로써 색인 그래프 탐색 비용을 크게 줄일 수 있다. 본 논문에서는, 실험을 통해 기존의 그래프 기반색인 기법들보다 본 논문의 색인 기법이 보다 효율적임을 보이고 색인의 크기 변화에 따른 성능 변화에 대해 알아본다.

관심 영역을 고려한 색 양자화 방법 (Color Quantization Scheme Considering Interesting Area of Image)

  • 백두원;임헌규;이지수;강정구
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권6호
    • /
    • pp.161-165
    • /
    • 2007
  • 색 양자화는 많은 수의 색으로 표현된 이미지를 최대한 유사하게 표현 할 수 있는 더 적은 수의 대표색을 찾는 문제이다. 색 양자화를 할 때, 원본 이미지의 어느 색을 보존시킬지를 결정하는 것은 결과 이미지의 품질과 직결된 중요한 문제이다. 본 연구에서는 일반적으로 이미지는 관심 영역과 비 관심영역으로 구분된다는 점에 착안하여 이미지에서 관심 영역의 색을 더 많이 보존시키는 양자화 방법을 제안한다. 본 연구에서는 이미지의 관심 영역에 대한 정보를 특정 주파수 대역의 범위로 입력받아 해당주파수 대역에 포함되는 부분을 이미지 공간에서 찾는 과정과 찾아낸 영역의 색을 더 많이 보존시켜 대표색을 구하는 과정으로 구성되는 색 양자화 방법을 제시한다. 관심 영역을 찾는 방법의 정확도를 실험을 통해 평가하였으며 본 논문이 제시하는 컬러 양자화 기법의 품질을 다른 방법의 품질과 비교하여 평가하였다.

  • PDF

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

저자 지정 색인 용어에 따른 컨퍼런스 논문 주제 및 동향 시각화 (Visualization of Conference Paper Topics and Trends According to Author-Assigned Index Terms)

  • 에런 스노버거;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.340-342
    • /
    • 2022
  • 색인 용어 또는 키워드는 가장 중요한 명사를 강조 표시하여 연구 논문 주제에 대한 빠른 개요를 제공하기 때문에 연구 논문의 중요한 구성 요소이다. 본 연구에서는 2018년 이후의 학술대회(KIICE)에 실린 논문과 2016년 이후의 국제학술 대회(ICFICE)에 실린 저자 지정 색인 용어를 추출하였다. 추출된 지표 용어는 연구 주제 동향에 대한 이해를 위해 표준화되고 분석되었다. 또한 과대하게 연구되거나 과소하게 연구된 주제를 분석하였다. 이러한 색인 용어 분석은 연구자가 자신의 연구에 대한 추가적인 주제를 선택하는 데 유용할 뿐만 아니라 연구 논문에 색인 용어를 선택할 때 빈번히 사용되는 키워드를 사용하면 도움이 될 것으로 기대된다.

  • PDF

일괄구성과 확장된 지연삭제를 이용한 B+-Tree의 동시성 제어 및 회복 (Concurrency Control and Recovery Method of B+-Tree using Bulk Loading and Extended Lazy Deletion)

  • 김대일;김성희;조숙경;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.128-130
    • /
    • 2000
  • B+-Tree는 데이트베이스 관리 시스템에서 대용량의 데이터를 관리하기 위해 가장 널리 사용되는 인덱스이다. 그런 기존의 B+-Tree는 데이터베이스의 초기 구성 및 재구성시 많은 비용이 들고, 또한 삭제 연산의 빈번한 발생시 색인 구조 변경연산의 발생빈도가 높아져 동시성이 떨어진다는 단점이 있다. 이러한 문제점을 해결하기 위해서 기존 대부분의 데이터베이스 관리시스템에서는 일괄구성과 지연삭제를 이용하고 있으나, 동시성 및 회복에 대한 처리가 미흡하여 실제 시스템에 적용하기에는 문제가 있다. 따라서 본 논문에서는 일괄구성과 지연삭제 방법을 적용한 B+-Tree에서의 동시성 및 회복기법을 제안한다. 제안된 기법은 일괄구성 시에 잠금의 부하와 연속적인 철회(Cascade Rollback)가 없고, 또한 지연 삭제기법을 확장함으로써 빈 페이지 리스트 관리에 대한 부하가 없으며, 삭제 연산에 대한 회복 시 논리적 복귀(Logical Undo)가 빨라지고 구현이 간단해진다는 장점이 있다.

  • PDF

연속적인 이동 객체의 효과적인 갱신을 위한 색인 구조 (An Index Structure for Updating Continuously Moving Objects Efficiently)

  • 복경수;윤호원;김명호;조기형;유재수
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.477-490
    • /
    • 2006
  • 기존에 제안된 색인 구조는 연속적 이동 객체를 갱신하기 위해 이동 객체의 기존 위치를 삭제하고 새로운 위치를 삽입하는 과정을 반복하기 때문에 많은 갱신 비용을 소요한다. 본 논문에서는 연속적 이동 객체의 갱신 비용을 감소시키기 위한 새로운 색인 구조를 제안한다. 제안하는 색인 구조는 이동 객체의 위치를 저장한 공간 분할 방식의 색인 구조와 이동 객체의 위치를 직접 접근하기 위한 보조 색인 구조로 구성된다. 노드의 팬아웃을 증가시키기 위해 자식 노드에 대한 정보는 실제 분할 영역을 저장하는 것이 아니라 kd-tree로 저장한다. 또한, 이동 객체의 위치 갱신을 빠르게 처리하기 위해 색인 구조 전체를 순회하지 않고 단말 노드를 직접 접근하여 상향식으로 갱신을 수행한다. 제안하는 색인 구조의 우수성을 입증하기 위해 다양한 분포 특성에 따라 이동 객체를 생성하고 이동 객체에 대한 삽입, 갱신, 검색 성능을 비교 분석한다.

웹 기반 색채 학습 시스템 설계 (The design of web-based color learning system)

  • 신지혜;고병오
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2005년도 하계학술대회
    • /
    • pp.238-245
    • /
    • 2005
  • 우리 생활 속에서 항상 존재하고 있는 색채의 중요성을 생각해 볼 때 색채 교육은 매우 중요한 일이다. 본 연구에서는 색채 지도 내용을 재구성하여 생활에서 활용할 수 있는 색채 감각을 신장시킬 수 있는 웹 형태의 색채 학습 시스템을 설계하였다. 인터넷을 이용하여 색채에 대한 지식과 함께 미적체험, 표현 감상에 관하여 학습하고 시스템에서 다양한 표현 활동 및 상호 작용 학습을 실행함으로써 효과적인 색채 학습이 가능하도록 시스템을 구성하였다. 이 시스템에서의 학습 단계는 여러 가지 색, 색의 느낌, 색의 배색, 색의 속성, 색의 이미지, 색과 생활이라는 큰 단위의 6가지 학습 단계를 가지고 있고 각 단계 별로 미적체험, 표현, 감상 의 단계를 거치면서 학습할 수 있도록 설계하였다.

  • PDF

XML 태그 분류에 따른 가중치 결정 (The eight decision which it follows in XML tag classification)

  • 정혜진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.703-706
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

  • PDF

스트림 데이터 처리를 위한 질의 색인 기법 (Query Indexing Technique for Processing Stream Data)

  • 이동규;정재두;이양구;정영진;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.381-384
    • /
    • 2006
  • 센서 네트워크 환경에서 스트림 데이터를 모니터링 하기 위해서는 스트림 데이터에 대한 연속적인 질의들을 효과적으로 처리하는 것이 필요하다. 이러한 연속적인 질의를 빠르게 검색하고 처리하기 위하여 낮은 저장 비용과 빠른 탐색 성능을 가진 질의 색인 기법이 많이 활용되고 있다. 기존 연구들은 사전에 삽입될 Interval 을 알고 트리를 구성하므로 동적인 삽입, 삭제가 불가능하거나 삽입된 Interval 수와 Interval 의 범위에 따라 높은 저장 비용이나 상대적으로 느린 탐색 속도를 보인다. 따라서 이 논문에서는 연속적인 질의 처리를 효율적으로 하기 위하여 Hashed Multiple Lists 를 제안한다. 제안된 기법은 빠른 선형 탐색 성능과 낮은 저장 비용을 요구하며 삽입, 삭제가 용이하고 다양한 범위를 표현할 수 있는 장점이 있다. 제안된 색인 기법은 센서 네트워크를 응용한 시스템과 상황 인식 시스템 등에서 연속적인 질의를 처리하는데 활용할 수 있다.

  • PDF

시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 (A Single Index Approach for Subsequence Matching that Supports Normalization Transform in Time-Series Databases)

  • 문양세;김진호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.157-159
    • /
    • 2005
  • 본 논문에서는 단일 색인을 사용하는 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 질의 시퀀스 길이가 커질수록 성능이 저하되고, 이를 해결하기 위하여 여러개의 색인을 사용하는 방법을 취하였다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 정규화 변환 지원 서브시퀀스 매칭을 수행하는 효율적인 방법을 제시한다. 이를 위하여, 본 논문에서는 정규화 변환의 정의를 확장하여 일반화 정규화 변환 개념을 제시한다. 또한, 이러한 일반화 정규화 변환 개념을 기존 서브시퀀스 매칭 방법들에 적용하는 방안에 대한 이론적 근거를 각각의 정리로서 제시하고 증명하였다. 그리고, 이들 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시하였다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있는 우수한 연구결과라 사료된다.

  • PDF