• Title/Summary/Keyword: 정보의 질

Search Result 5,550, Processing Time 0.035 seconds

Cost-based Optimization of Extended Boolean Queries (확장 불리언 질의에 대한 비용 기반 최적화)

  • 박병권
    • Journal of the Korean Society for information Management
    • /
    • v.18 no.3
    • /
    • pp.29-40
    • /
    • 2001
  • In this paper, we suggest a query optimization algorithm to select the optimal processing method of an extended boolean query on inverted files. There can be a lot of methods for processing an extended boolean query according to the processing sequence oh the keywords con tamed in the query, In this sense, the problem of optimizing an extended boolean query it essentially that of optimizing the keyword sequence in the query. In this paper, we show that the problem is basically analogous to the problem of finding the optimal join order in database query optimization, and apply the ideas in the area to the problem solving. We establish the cost model for processing an extended boolean query and develop an algorithm to filled the optimal keyword-processing sequence based on the concept of keyword rank using the keyword selectivity and the access costs of inverted file. We prove that the method selected by the optimization algorithm is really optimum, and show, through experiments, that the optimal method is superior to the others in performance We believe that the suggested optimization algorithm will contribute to the significant enhancement of the information retrieval performance.

  • PDF

EJB-based Entity Component Customization (EJB 기반 엔티티 컴포넌트 커스터마이제이션)

  • 이용원;장윤정;이경환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.667-669
    • /
    • 2001
  • 최근 컴포넌트 사용과 컴포넌트 기반 개발 방법론을 이용한 전사적 자원 관리(ERP) 시스템과 정보 관리 시스템(EIS) 개발이 급속히 성장하고 있다. 그 시스템을 구성하는 엔티티 컴포넌트는 데이터베이스 질의 처리를 통해 자료의 영속성 처리를 한다. 그러나, 컴포넌트가 복잡한 질의 처리를 통해서 영속성을 유지해야 하는 경우는 데이터베이스간의 질의 처리가 호환되지 않는 문제점과 그를 해결하기 위해 모든 데이터베이스와의 연동을 지원하기에는 어려운 점을 가지고 있다. 엔티티 컴포넌트에서 각 데이터베이스 질의 연산을 추상 클래스 정의하고 이 추상 클래스와 엔티티 빈 간의 종속성 제거하고 이것을 통한 EJB 기반 엔티티 컴포넌트의 커스터마이제이션을 제시한다.

  • PDF

Query Expansion based on Knowledge Extraction and Latent Dirichlet Allocation for Clinical Decision Support (의학 문서 검색을 위한 지식 추출 및 LDA 기반 질의 확장)

  • Jo, Seung-Hyeon;Lee, Kyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.31-34
    • /
    • 2015
  • 본 논문에서는 임상 의사 결정 지원을 위한 UMLS와 위키피디아를 이용하여 지식 정보를 추출하고 질의 유형 정보를 이용한 LDA 기반 질의 확장 방법을 제안한다. 질의로는 해당 환자가 겪고 있는 증상들이 주어진다. UMLS와 위키피디아를 사용하여 병명과 병과 관련된 증상, 검사 방법, 치료 방법 정보를 추출한다. UMLS와 위키피디아를 사용하여 추출한 의학 정보를 이용하여 질의와 관련된 병명을 추출한다. 질의와 관련된 병명을 이용하여 추가 증상, 검사 방법, 치료 방법 정보를 확장 질의로 선택한다. 또한, LDA를 실행한 후, Word-Topic 클러스터에서 질의와 관련된 클러스터를 추출하고 Document-Topic 클러스터에서 초기 검색 결과와 관련이 높은 클러스터를 추출한다. 추출한 Word-Topic 클러스터와 Document-Topic 클러스터 중 같은 번호를 가지고 있는 클러스터를 찾는다. 그 후, Word-Topic 클러스터에서 의학 용어를 추출하여 확장 질의로 선택한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS) 2014 테스트 컬렉션에 대해 비교 평가한다.

  • PDF

The Design and Implementation of Automatic Query Term Refiner for Term Expansion/Restriction in Information Retrieval (정보검색에서 질의 용어 확장/한정을 위한 자동 질의 용어 정련기의 설계 및 구현)

  • Kang, Hyun-Su;Kang, Hyun-Kyu;Lee, Yong-Seok;Kim, Young-Sum
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.65-72
    • /
    • 1998
  • 인터넷 정보 검색에서 이용자들이 주로 사용하는 질의는 2-3개의 용어로 이루어진 짧은 질의이다. 또만 동음이의어를 갖는 용어를 사용하기도 한다. 짧은 질의를 처리하는 일반적인 방법은 시소러스[8]나 Wordnet[1]을 이용한 질의 확장이다. 그러나 시소러스나 Wordnet과 같은 지식 베이스는 구축하기가 용이하지 않으며, 도메인 종속적인 면과 단어의 회귀(sparseness) 문제를 극복하기 어려운 단점이 있다. 또한 동음이의어 용어로 인하여 검색의 정확성이 털어지는 문제점이 있다. 한편, 사용자의 질의를 주의 깊게 살펴보면, 질의로부터 관련 용어 분류 정보를 추출할 수 있다. 본 논문은 사용자의 질의가 관련 용어 분류 정보에 의해 유기적으로 관계를 가지고 있다는 사실에 기인하여 관련 용어 분류 정보에 따라 자동으로 용어 확장 및 한정을 수행하며 적절한 용어 가중치를 부여하는 자동 질의 용어 정련기를 제안한다. 자동 질의 용어 정련기는 용어의 확장, 한정 및 가중치 부여를 통하여 사용자의 정보 검색 요구를 명확히 하여 검색의 정확성을 향상시킨다.

  • PDF

A Cross-Cultural Study on the Mobile Competency and Quality of Life among Korea, China, and USA (한국, 중국, 미국의 모바일 정보역량과 삶의 질에 관한 비교연구)

  • Park, Cheol
    • Informatization Policy
    • /
    • v.23 no.2
    • /
    • pp.19-34
    • /
    • 2016
  • Due to the spread of smartphones, mankind has been able to access and use a variety of mobile information anywhere, anytime. Mobile competency, the capability of accessing and using mobile information is affect the quality of the individual's life. In this study, 1,290 South Korean, Chinese, and American responded on mobile competency and quality of life. As a result, Korean had highest score in mobile information accessibilty, but American in mobile information utilization. Korea showed lowest rating in improvement of quality of life due to mobile competency. These results shows that Korean do not properly utilized mobile information for higher quality of life although they use longest time of mobile internet. Also, consumer innovativeness had the greatest influence on the utilization of mobile information among individual variables.

A Refinement Strategy for Spatial Selection Queries with Generally Shaped Query Window (일반적인 다각형 모양의 질의 윈도우를 이용한 공간 선택 질의의 정제 전략)

  • 유준범;정진완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.52-54
    • /
    • 2001
  • 공간 선택 질의에 사용되는 질의 윈도우로는 직사각형이 주로 사용된다. 하지만, 최근에는 GIS 등과 같은 응용 프로그램들이 성능 향상으로 인해 보다 다양한 종류의 응용이 등장하고 있으므로, 직사각형뿐만 아니라 임의의 다각형 형태의 질의 윈도우에도 적합한 정제 단계 수행 전략에 대해 고려해 볼 필요가 있다. 이러한 전략으로는 기존의 공간 조인에서와 같이 plane-sweep 알고리즘을 이용하는 방법이 일반적이다. 하지만, 공간 데이터와 질의 위도우의 특성을 관찰해보면, 일반적으로 질의 윈도우가 공간 데이터보다 훨씬 간단한 모양으로 구성되어 있음을 알 수 있으므로, 본 논문에서는 이러한 상황에 보다 적합한 정제 단계 수행 방법을 제시하고 있으며, 실험을 통하여 제시한 방법의 우수성을 입증하고 있다.

  • PDF

A Materialized views Management Method based on Metadata for Efficient Query Processing (효과적 질의 처리를 위한, 메타데이터 기반 실체 뷰 관리 기법)

  • 이선정;문창주;박성공;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.318-320
    • /
    • 1998
  • CORBA/JAVA 기반의 멀티데이터 소스에 대한 통합 질의 환경에서 많은 사용자가 질의를 동시에 수행함으로써, 질의 처리 성능 문제가 나타난다. 이러한 문제점을 해결하기 위해서 본 논문에서는 메타데이터를 이용하여 분할된 질의에 대한 실체 뷰(Materialized view)를 관리함으로써, 질의 처리를 향상시키는 기법을 제안한다. 제안된 기법은 자주 사용되는 실체 뷰를 캐쉬에 유지시킴으로써, 재사용율을 높이고, 질의 절차를 감소시켜, 중복되는 질의의 반복 수행을 줄인다.

Effective Spatial Partitioning Technique for Query Result Size Estimation (질의 결과 크기 추정을 위한 효과적인 공간 분할 기법)

  • 김현국;김학자;황환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.55-57
    • /
    • 2002
  • 공간 데이터베이스의 규모는 매우 방대하여 질의 처리에 많은 비용이 발생한다. 따라서 효율적인 질의 처리를 위해서는 질의 수행 결과의 예측이 필요하다. 이를 위해 실제 공간 데이터의 특성을 근접하게 나타내는 요약 데이터를 생성하여 그 결과를 통해 질의 결과의 크기를 추정하게 된다. 기존의 공간 데이터 요약 기법으로는 면적 균등 분할 기법, 개수 균등 분할 기법, 인덱스 분활 기법 등이 있다. 본 논문에서는 기존에 연구된 다양한 분말 기법에 대해 알아보고, 힐버트 공간 재움 곡선 방법에 개수 균등 분말 기법을 적용시킨 새로운 공간 분할 방법을 제안하여 기존의 방법과 새로운 방법의 성능을 비교한다.

  • PDF

ORB : R-tree Packing for better query performance (ORB : 효율적인 질의 성능을 위한 R-tree 대량로딩 기법)

  • 이태원;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.743-745
    • /
    • 2003
  • R-tree는 공간 데이터나 다차원 데이터의 효율적인 질의 처리를 위한 인덱스 구조이다. 다량의 데이터로부터 빠르게 인덱스를 생성하기 위해서 많은 다량로딩 기법들이 제안되었으나 이들은 공간이용률을 극대화하는 데에 초점을 맞춰 R-tree의 목적인 효율적인 질의 처리를 위한 개선의 여지가 남아 있다. 본 논문에서는 다량로딩 과정에서 인접한 노드들간의 겹치는 영역을 감소시켜 전체적으로 질의 처리 성능을 향상시킬 수 있는 기법을 제안한다. 실험 결과에서 보이듯이 지금까지 가장 효율적이라고 알려져 있는 STR 기법보다 질의 성능이 좋게 나오는 것을 확인할 수 있다.

  • PDF

Modeling of Query Processing Cost for the LIKE Predicate (LIKE 술어의 질의 수행 비용 모델링)

  • 차명훈;성준화;박영철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.259-261
    • /
    • 2001
  • LIKE는 주어진 유형을 찾는 기능을 수행하는 연산자이다. LIKE 술어에 대하여 데이타베이스 관리시스템이 어떠한 탐색 방법을 선택하는가에 따라 질의의 수행 성능에 큰 차이를 가져올 수 있다. 질의 최적화기는 LIKE 연산자를 포함하는 질의를 최적화하는 과정에서 질의 유형과 색인의 존재 여부를 고려하여야한다. 본 논문은 질의 최적화 과정에서 LIKE 술어를 고려한 질의 수행 비용 모델과 이의 구현 사항을 제시한다.

  • PDF