• Title/Summary/Keyword: 패턴검색

Search Result 574, Processing Time 0.028 seconds

J-Tree: An Efficient Index using User Searching Patterns for Large Scale Data (J-tree : 사용자의 검색패턴을 이용한 대용량 데이타를 위한 효율적인 색인)

  • Jang, Su-Min;Seo, Kwang-Seok;Yoo, Jae-Soo
    • Journal of KIISE:Databases
    • /
    • v.36 no.1
    • /
    • pp.44-49
    • /
    • 2009
  • In recent years, with the development of portable terminals, various searching services on large data have been provided in portable terminals. In order to search large data, most applications for information retrieval use indexes such as B-trees or R-trees. However, only a small portion of the data set is accessed by users, and the access frequencies of each data are not uniform. The existing indexes such as B-trees or R-trees do not consider the properties of the skewed access patterns. And a cache stores the frequently accessed data for fast access in memory. But the size of memory used in the cache is restricted. In this paper, we propose a new index based on disk, called J-tree, which considers user's search patterns. The proposed index is a balanced tree which guarantees uniform searching time on all data. It also supports fast searching time on the frequently accessed data. Our experiments show the effectiveness of our proposed index under various settings.

The storage structure and retrieval mechanism for korean speech database (한국어 음성 데이타베이스의 저장 구조와 검색 기법)

  • Song, Gun-Seop;Park, Yeong-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.321-330
    • /
    • 1991
  • 기존의 데이타베이스에 음성 데이타를 저장하여 음성 데이타 베이스를 구축하고자 할 경우, 음성 데이타의 특성이 가변장(variable length)이며, 튜플(음소 단위)의 길이가 매우 긴 패턴 데이타이므로 기존의 데이타베이스 시스템에서는 지원할 수 없다. 또, 현재의 음성 인식 시스템에서는 패턴 데이타를 순차적인 검색 방법으로 검색하고 있어 빠른 검색 방법이 요구된다. 본 논문에서는 음성 데이타를 음소 단위로 인식하기 위해 음소 패턴 데이타를 저장하고, 유사한 특성을 갖는 부류와 음소 길이에 의한 분류를 혼합한 방법을 이용하여 빠른 시간에 검색을 할 수 있게 하기 위한 저장 구조와 검색 알고리즘을 제시한다.

  • PDF

Structure Searching of Biological Sequence using DCG in Constraint Logic Programming Language (제한 논리 프로그래밍 언어에서 DCG를 이용한 생물학적 서열의 구조 검색)

  • 이근우;이수현;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.352-354
    • /
    • 2001
  • 생물학적 서열의 구조 검색은 생물학적 특성을 예측하는데 많은 도움을 주며, 서열에서 나타나는 구조의 패턴은 촘스키의 형식 언어로 기술 가능하다. 본 논문에서는 문맥무관문법의 확장된 표기법인 DCG를 이용하여 구조 검색을 위한 구조 패턴의 생성 규칙을 정의하였다. 또한 구조 검색의 효율향상을 위하여 구조와 관련한 제한(constraint)을 정의하였고 이를 제한 논리 프로그래밍 언어로 구현하였다. 구현된 구조 검색 엔진은 웹 인터페이스를 통하여 접근할 수 있다.

  • PDF

Text Pattern Search Based on User Profile using Prefix Tree (전위 트리를 이용한 사용자 프로파일 기반의 문서 패턴 검색 기법)

  • Woo, Ho-Jin;Lee, Won-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.533-536
    • /
    • 2005
  • 기하급수적으로 증가하는 데이터 중에서 개개인 사용자에게 적합한 정보를 추출하여 제공해야 할 필요성이 증대되고 있다. 본 논문에서는 대용량의 문서 집합으로부터 사용자가 원하는 특정 주제의 정보를 정확하게 추출해 낼 수 있는 문서 패턴 검색 방법을 제시한다. 사용자 선호도를 정확하게 반영할 수 있도록 전위 트리를 기반으로 사용자의 키워드 마이닝 프로파일을 생성하고, 이를 이용하여 문서 집합에서 매치된 패턴을 찾아내는 방법을 제안하였다. 생성된 프로파일을 이용한 검색 기법의 효용성을 실험을 통해 검증하였다.

  • PDF

Adaptive Web Search based on User Web Log (사용자 웹 로그를 이용한 적응형 웹 검색)

  • Yoon, Taebok;Lee, Jee-Hyong
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.15 no.11
    • /
    • pp.6856-6862
    • /
    • 2014
  • Web usage mining is a method to extract meaningful patterns based on the web users' log data. Most existing patterns of web usage mining, however, do not consider the users' diverse inclination but create general models. Web users' keywords can have a variety of meanings regarding their tendency and background knowledge. This study evaluated the extraction web-user's pattern after collecting and analyzing the web usage information on the users' keywords of interest. Web-user's pattern can supply a web page network with various inclination information based on the users' keywords of interest. In addition, the Web-user's pattern can be used to recommend the most appropriate web pages and the suggested method of this experiment was confirmed to be useful.

Improvement of Retrieval Convenience through the Correlation Analysis between Social Value and Query Pattern (소셜지수와 질의패턴의 상관관계 분석을 통한 검색 편의성 향상)

  • Ahn, Moo-Hyun;Park, Gun-Woo;Lee, Sang-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.391-394
    • /
    • 2009
  • 정보의 양이 폭발적으로 증가함에 따라 웹 사용자가 원하는 적합한 데이터를 찾아내는 것은 매우 어렵다. 이는 웹 사용자마다 서로 다른 검색의도와 질의의 모호성에 의한 것으로, 이와 같은 검색의 어려움을 해결하기 위해 많은 연구들이 수행되어 왔다. 질의 로그는 검색자의 검색 의도가 내포되어 있는 중요한 자료이다. 따라서 웹 사용자별 질의 로그 패턴을 분석하여 유사한 질의를 사용하는 웹 사용자들을 클러스터링 하여 검색에 적용한다면 좀 더 유용한 정보를 획득할 수 있다. 즉, 특정 카테고리와 연관된 질의를 자주 사용하는 웹 사용자들은 해당 분야에 관심이 많을 것이며, 또한 다른 카테고리에 관심이 높은 사람보다 상호간에 소셜지수가 높게 나타날 것이다. 특정 주제에 대해 검색을 할 경우 해당 분야에 관심이 높은 웹 사용자들의 질의 및 클릭한 URL 정보를 상속받을 수 있다면 찾고자 하는 정보에 보다 빨리 접근할 수 있다. 따라서 본 연구는 질의패턴 분석을 통해 카테고리별로 관심도가 높은 웹 사용자들을 클러스터링 한 후 해당 카테고리에 대한 정보 검색시 이들이 사용한 질의와 클릭한 URL 정보를 웹 사용자들에게 제공해줌으로써 정보검색의 편의성을 향상시키기 위한 방안을 제안한다.

Implementation of Reuse System based on Design Pattern Library on Web (웹 상에서 설계 패턴 라이브러리에 기반한 재사용 시스템 구현)

  • 김행곤;차정은;김지영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.551-553
    • /
    • 1999
  • 최근에는 기하학적인 www의 성장과 더불어 인터넷 서비스를 통한 정보 획득과 고유, 교환 및 원격 시스템 접속을 통한 인터넷 응용 처리 서비스에 대한 연구가 많이 이루어지고 있다. 그리고 이를 기반으로 소프트웨어 생산성과 품질 향상을 위한 재사용을 이루기 위해 명확한 해결책으로 설계 패턴 재사용이 제시되었다. 그러므로 이들 설계 패턴을 웹을 기반으로 다수의 사용자가 융통성 있는 시스템 구축시 필요로 하는 패턴을 공유할 수 있는 적절한 설계 패턴 라이브러리 시스템이 요구되어졌다. 이는 웹 상에서 설계 패턴의 효율적인 검색과 의도된 패턴의 생성을 재사용 가능하도록 패턴 구조를 다운로드하고 보다 도메인 한정적인 응용 생산을 지원하고자 한다. 따라서 본 논문에서는 웹 상에서 설계 패턴 라이브러리를 ASP(Active Server Page)를 이용하여 구현하였다. 본 시스템을 통해 설계 패턴 재사용자들은 패턴을 등록, 수정, 삭제하고 또한 패턴을 대화적으로 검색하고 이해하며, 구조를 다운 받을 수 있다. 따라서 애플리케이션 시스템 구축에서 설계 패턴 사용자의 효율적인 방법을 제공한다.

  • PDF

Query Expansion Using User Search Pattern in Information Retrieval (정보검색에서 사용자 검색 패턴을 이용한 질의 확장)

  • Chun, Woo-Kwan;Kim, Young-Do;Chung, In-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04b
    • /
    • pp.771-774
    • /
    • 2001
  • 정보검색에서 가장 많이 사용되는 불리언(Boolean)검색에서는 키워드 일치에 의해서만 검색하는 단점을 가지고 있다. 이를 보완하기 위해 다양한 정보원에서 추출한 관련 용어들을 원질의어에 첨가하여 검색의 효율을 높이기 위한 질의 확장 방법들이 모색되어 왔다. 본 논문에서는 질의 확장을 위하여 사용자가 검색에 사용하였던 질의어들의 연속성을 찾아내어 첨가할 용어를 선택하고 질의 확장을 하는 방법을 제시한다. 사용자가 입력한 질의어의 연속성을 찾아내는 방법으로는 데이터 마이닝 기법중 연관 규칙 탐사 방법을 이용한다. 실험은 현재 구축된 정보통신 기술기준 정도시스템에서 사용자들이 검색한 키워드 정보를 이용하였으며 사용자 검색 패턴(USP) 정보를 이용함으로써 사용자가 검색하고자 하는 질의어와 좀더 연관성 있는 용어로 확장하여 사용자 중심적 결과를 얻을 수 있다.

  • PDF

The Extraction of Korean Noun Phrases based on Dependency Patterns (의존관계 패턴에 기반한 한국어 명사구의 추출)

  • Seungshik Kang;Sangmo Lee;Minhaeng Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.615-617
    • /
    • 2023
  • 이 연구는 한국어 명사구를 말뭉치로부터 추출하는 방법의 하나로 의존관계 패턴에 기반한 접근방법을 제안하는 것을 목적으로 한다. 이 방법론을 활용한 경우에 명사구 추출의 정확성을 높일 수 있다. 이 논문에서는 한국어 법령 의존 말뭉치를 구축하는 단계부터 상위 명사구 목록을 생성하기 까지 거치는 5단계에 대해 상세하게 논의하는 한편, 의존구조 검색시스템을 통해 의존관계 패턴을 추출하는 절차에 대해 기술하고 이 작업을 수행하기 위한 검색식들의 특성들에 대해 검토한다.

  • PDF

A Personalized Meta-Search System based on Korean Sentence Pattern (한국어 문장 패턴 기반 개인형 메타 검색 시스템)

  • 이덕남;정혜경;박기선;이용석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.498-500
    • /
    • 2003
  • 인터넷의 급속한 팽창으로 인해 가을 정보의 양이 폭발적으로 증가하고 있다. 웹 사용자에게 이용 가치가 없는 정보 범람(information overflow)안이 발생한다면 효율적인 정보검색이 되지 못하므로 사용자가 원하는 정보만을 얻을 수 있다면 시간과 미숙한 정보의 검색을 방지 할 수 있다. 본 논문에서는 한국어 질의 생성과 관련하여 웹 사용자의 편의성과 효율성을 고려한 한국어 질의 처리 방법론과 개인형 메타 검색 모델을 제안하고자 한다. 한국어 질의를 기본으로 하여 한국어 문장 패턴 및 개인 정보 평가 구성 요소를 이용한 방법론과 모델을 제안하고자 한다.

  • PDF