• 제목/요약/키워드: Indexing method

검색결과 532건 처리시간 0.025초

TK-Indexing : NoSQL 기반 SNS 데이터 색인 기법 (TK-Indexing : An Indexing Method for SNS Data Based on NoSQL)

  • 심형남;김정동;설광수;백두권
    • 정보처리학회논문지D
    • /
    • 제19D권4호
    • /
    • pp.271-280
    • /
    • 2012
  • 현재 소셜 네트워크 서비스(Social Network Service: SNS)의 이용자 수가 늘어나면서 SNS에서 생성되는 콘텐츠 데이터의 양도 기하급수적으로 늘어나고 있다. 이러한 SNS는 개인의 근황, 관심사를 전달하기 위해 사용하고, 친목도모, 엔터테인먼트, 제품 마케팅, 최신 뉴스 공유, 1인 미디어 등 다양한 목적으로 활용하고 있다. SNS가 스마트폰에서 사용 가능해지면서 사용자들은 언제, 어디서나 실시간으로 사회의 주요쟁점이나 사회구성원들의 주 관심사와 같은 콘텐츠를 기존 미디어 매체보다 빠르게 생성하고 확산시킨다. 기존 웹 콘텐츠 색인 기법은 색인대상이 다양하고 정확성에 중점을 두어 색인하므로 실시간으로 대량 생성되는 SNS 콘텐츠를 색인하는 기법으로 한계가 있다. 이러한 문제를 해결하기 위하여 관계형 DBMS기반 실시간 색인 기법이 있으나 색인대상의 축소와 색인 절차의 복잡성이 높다는 단점이 있다. 따라서 본 논문에서는 실시간으로 생성된 SNS콘텐츠를 색인하기 위하여 NoSQL기반 SNS 콘텐츠 생성시간과 키워드를 각각 색인하는 TK-Indexing 기법을 제안하여 기존 색인 기법의 복잡성을 개선한다.

구문 . 통계적 기법을 이용한 한국어 자동색인에 관한 연구 (An experiment in automatic indexing with korean texts : a comparison of syntactico-statistical and manual methods)

  • 서은경
    • 정보관리학회지
    • /
    • 제10권1호
    • /
    • pp.97-124
    • /
    • 1993
  • 본 논문은 자연어 형태의 한국어 텍스트 부터 주제를 대표할 수 있는 색인어를 자동으로 추출하는 실험적인 구문 . 통계적 자동색인 시스템을 구현하였다. 구문 . 통계적 자동색인 시스템은 형태소 분석과 단어 가증 기법을 이용하여 단일어와 명사구를 동시에 선택하는 자동색인 시스템을 말한다. 시스템의 성능을 측정하기 위하여, 300개의 우리말 학술 및 학위논문 초록에서 선택된 단일 . 복합어 색인어를 수작업 색인과 비교하였다. 이와 같은 실험 결과를 가지고 아직 미흡한 연구상태인 우리말 자동색인 개발에 있어서 필요한 기초자료를 제시하였다.

  • PDF

동영상 등장인물의 자동색인을 위한 효율적인 저장과 검색 방법 (Efficient Storage and Retrieval for Automatic Indexing of Persons in Videos)

  • 김진승;한용구;이영구
    • 한국멀티미디어학회논문지
    • /
    • 제14권8호
    • /
    • pp.1050-1060
    • /
    • 2011
  • 대용량 동영상을 대상으로 한 등장인물 색인에 대한 수요가 증가함에 따라, 많은 시간과 비용이 소요되는 수동 태깅의 단점을 보완할 수 있는 자동 태깅을 이용한 자동 색인이 연구되고 있다. 하지만, 자동 색인은 인물을 100% 정확하게 검출하지 못하므로 검출된 인물에 대해 정확도를 함께 표현해야 한다. 본 논문에서는 이러한 정보를 포스팅 리스트에 효율적으로 저장하는 방법과 등장인물의 검색시 관련 동영상들을 효율적으로 찾기 위한 순위 결정 방법을 제안한다. 실험을 통하여 제안하는 색인 정보 저장 방법이 포스팅 리스트의 압축에 효과적임을 입증하였다. 또한 제안한 순위 결정 방법이 관련 동영상을 찾는데 효과적임을 입증하였다.

압축영역에서 객체 움직임 맵에 의한 효율적인 비디오 인덱싱 방법에 관한 연구 (An Efficient Video Indexing Method using Object Motion Map in compresed Domain)

  • 김소연;노용만
    • 한국정보처리학회논문지
    • /
    • 제7권5호
    • /
    • pp.1570-1578
    • /
    • 2000
  • Object motion is an important feature of content in video sequences. By now, various methods to exact feature about the object motion have been reported[1,2]. However they are not suitable to index video using the motion, since a lot of bits and complex indexing parameters are needed for the indexing [3,4] In this paper, we propose object motion map which could provide efficient indexing method for object motion. The proposed object motion map has both global and local motion information during an object is moving. Furthermore, it requires small bit of memory for the indexing. to evaluate performance of proposed indexing technique, experiments are performed with video database consisting of MPEG-1 video sequence in MPEG-7 test set.

  • PDF

한글 문서의 효과적인 검색을 위한 n-gram 기반의 색인 방법 (An n-gram-based Indexing Method for Effective Retrieval of Hangul Texts)

  • 이준호;안정수;박현주;김명호
    • 정보관리학회지
    • /
    • 제13권1호
    • /
    • pp.47-63
    • /
    • 1996
  • 기존의 한글 자동 색인 방법들은 어절 단위 색인법과 형태소 단위 색인법으로 분류될 수 있다. 전자는 문서내의 어절에서 비색인 분절을 절단함으로써 색인어를 추출하는 방법으로, 문서들이 많은 복합 명사들을 포함할 경우 검색 효과가 저하된다. 후자는 형태소 해석이나 구문 해석을 이용하여 중요한 의미를 갖는 명사나 명사구를 추출하는 방법으로 단일 명사를 추출함으로써 복합 명사의 띄어쓰기 문제를 극복할 수 있다. 그러나 색인 과정에서 요구되는 많은 언어 정보를 개발하고 유지 보수해야 하는 부담을 지니고 있다. 본 논문에서는 기존의 색인 방법들의 문제점들을 완화할 수 있는 새로운 색인 방법을 제안한다. 그리고 실험을 통하여 제안하는 방법의 성능을 평가한다.

  • PDF

MLR 트리 : 다중 레벨 지리정보 데이터의 윈도우 질의를 위한 공간 인덱싱 기법 (MLR-tree : Spatial Indexing Method for Window Query of Multi-Level Geographic Data)

  • 권준희;윤용익
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.521-531
    • /
    • 2003
  • 다중 레벨 지리정보 데이타는 화면 확대와 축소와 같은 윈도우 질의를 통해 다루어질 수 있다. 다중 레벨 지리정보 데이타를 효율적으로 다루기 위해서는 이러한 윈도우 질의를 지원하는 공간 인덱싱 기법이 필요하다. 그러나, 기존의 전통적인 공간 인덱싱 기법은 다중 레벨 지리정보 데이타를 액세스하는데 비효율적이다. 이를 위해 다중 레벨 지리정보 데이타를 위한 몇 가지 공간 인덱싱 기법이 알려진다. 그러나. 이 공간 인덱싱 기법은 모든 유형의 다중 레벨 지리정보 데이타를 지원하지 못한다는 문제점을 가진다. 본 논문에서는 다중 레벨 지리정보 데이타의 윈도우 질의를 위한 공간 인덱싱 기법, MLR 트리를 제안한다. MLR 트리는 우수한 검색 성능을 보이면서도 데이타 중복성이 발생하지 않으며, 이를 실험을 통해 보인다. 이 외에도 MLR 트리는 모든 유형의 다중 레벨 지리정보 데이타를 지원한다.

An Efficient PAB-Based Query Indexing for Processing Continuous Queries on Moving Objects

  • Jang, Su-Min;Song, Seok-Il;Yoo, Jae-Soo
    • ETRI Journal
    • /
    • 제29권5호
    • /
    • pp.691-693
    • /
    • 2007
  • Existing methods to process continuous range queries are not scalable. In particular, as the number of continuous range queries on a large number of moving objects becomes larger, their performance degrades significantly. We propose a novel query indexing method called the projected attribute bit (PAB)-based query index. We project a two-dimensional continuous range query on each axis to get two one-dimensional bit lists. Since the queries are transformed to bit lists and query evaluation is performed by bit operations, the storage cost of indexing and query evaluation time are reduced significantly. Through various experiments, we show that our method outperforms the containment-encoded squares-based indexing method, which is one of the most recently proposed methods.

  • PDF

인터넷 지리정보시스템에서 단계화 된 지리정보의 효율적인 데이터 검색을 위한 공간 인덱싱 기법 (Spatial Indexing Method for Efficient Retrieval of Levelized Geometric Data in Internet-GIS)

  • 권준희;윤용익
    • 인터넷정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.1-13
    • /
    • 2002
  • 최근 인터넷 지리정보시스템에 대한 요구가 증가하면서 효율적인 공간 데이터 검색에 대한 필요성이 커지고 있다. 효율적인 공간 데이터 검색을 위해서는 단계별로 상세 화된 데이터를 검색하는 기법이 요구되며, 이러한 데이터를 효율적으로 처리하는 공간 인덱싱 기법이 필요하다. 본 논문에서는 효율적인 공간 데이터 검색을 위한 단계화 된 지리정보 데이터 검색을 지원하는 공간 인덱싱 기법을 제안한다. 기존의 공간 인덱싱 기법은 단계별 데이터를 검색하는데 비효율적이며, 단계별 데이터를 지원하는 몇 가지 공간 인덱싱 기법도 모든 종류의 단계별 데이터를 지원할 수 없는 문제점을 가진다. 제안된 구조는 모든 종류의 단계별 데이터를 지원하며, 메모리 용량과 검색 시간 모두에서 이전의 공간 인덱싱 기법보다 우수하다.

  • PDF

노드 범위와 Pre-Order List를 이용한 XML문서의 효율적 색인기법 (An Efficient Index Scheme of XML Documents Using Node Range and Pre-Order List)

  • 김영;박상호;이주홍
    • 인터넷정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.23-32
    • /
    • 2006
  • 본 논문에서는 최근 방대해지는 XML문서의 효율적인 관리를 위해서 노드 범위와 Pre-Order List를 이용한 XML문서들의 인덱싱 기법을 제안한다. 기존의 제안된 인덱싱 기법들은 크게 패스(Poth)와 넘버링(Numbering)을 기반으로 하고 있다. 그러나, 패스기반의 인덱싱 기법은 중간 노드와 최하위 노드의 검색과 조상-후손관계의 조인연산에 의해 효율이 떨어지는 단점을 가진다. 또한, 넘버링기반의 방법은 XML문서의 모든 노드에 번호를 부여하기 때문에 검색-오버헤드가 증가하는 문제를 가지며, 인덱스를 위해 많은 공간이 낭비된다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해서 모든 XML문서에 노드범위 (Node Range)와 Pre-Order List를 이용한 인덱싱 기법을 제안한다. 이 방법은 유사한 구조의 XML문서가 많을수록 인덱스의 크기를 효과적으로 줄일 수 있으며, 검색 성능을 효율적으로 높일 수 있다. 또한 XML문서의 삽입, 삭제가 용이하다.

  • PDF

교육용 문서의 텍스트분할 색인 (Text Partitioned Indexing Method for Educational Documents)

  • 강무영;이상구
    • 정보교육학회논문지
    • /
    • 제3권2호
    • /
    • pp.72-84
    • /
    • 2000
  • 정보검색시스템은 전자문서를 효율적으로 저장하고, 정보수요자들이 요구하는 자료를 검색을 통해 빠르게 제공하기 위한 시스템으로 정보화사회에 있어서 매우 중요한 역할을 하고 있다. 특히 색인은 데이터 베이스에 저장된 문서를 효과적으로 검색하기 위한 정보검색시스템의 필수 기능이다. 본 논문에서는 교육용 문서를 적은 자원으로 짧은 시간에 색인할 수 있는 텍스트분할에 의한 색인기법을 제안한다. 제안한 색인기법은 실제 검색시스템에 적용하고, 실험을 통해 우수성을 증명한다.

  • PDF