• 제목/요약/키워드: 검색 연산자

검색결과 93건 처리시간 0.026초

확장된 소프트웨어 컴포넌트 서술자에 기초한 컴포넌트 저장소의 검색 (Component Retrieval using Extended Software Component Descriptor)

  • 금영욱;박병섭
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.417-426
    • /
    • 2002
  • 컴포넌트 저장소의 효율적인 검색이 컴포넌트 재사용에 매우 중요하다. 컴포넌트 저장소에 보관할 컴포넌트에 대한 정보를 얻는데 일반적으로 많은 시간과 노력이 필요하다. CORBA 3의 컴포넌트 소프트웨어 서술자는 XML을 사용하여 일반적인 컴포넌트의 특성을 서술한다. 본 논문에서 CORBA 3의 소프트웨어 컴포넌트 서술자를 확장하며 이를 사용하여 컴포넌트 저장소의 검색에 필요한 정보를 얻는다. 패싯에 기초한 새로운 검색 방법을 제안하여 기존의 패싯 방법에서 지원하지 않았던 논리 연산자를 사용한 검색이 가능하며 또한 검색의 복잡도가 향상된다.

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.

모바일 장치를 위한 내장형 시공간 DBMS (Embedded Spatio-Temporal DBMS for Mobile Devices)

  • 심희정;김정준;신인수;한기준
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.59-66
    • /
    • 2008
  • 최근 유비쿼터스 컴퓨팅 환경이 발전함에 따라 교통(u-Transport), 복지(u-Care), 문화(u-Fun), 환경(u-Green), 산업(u-Business), 행정(u-Government), 도시(u-City) 뿐만 아니라 사용자의 위치와 다양한 공간 정보를 제공하는 u-GIS가 유비쿼터스 컴퓨팅 환경의 핵심 요소 기술로 대두되고 있다. 이에 본 논문에서는 기존의 PC용 MMDBMS인 HS QLDB를 확장하여 모바일 장치에서 시공간 데이타를 효율적으로 처리 및 관리할 수 있는 내장형 시공간 DBMS를 설계 및 구현하였다. 내장형 시공간 DBMS는 OpenGIS "Simple Features Specification for SQL"에서 명시하는 공간 데이타 타입과 공간 연산자를 확장하여 시공간 데이타 타입과 시공간 연산자를 제공하며, 시공간 데이타 특성들 고려한 산술 연산 코딩 압축 기법을 제공하고, 모바일 저장 장치인 플래쉬 메모리에서 효율적인 시공간 데이타 검색을 위한 시공간 인덱스를 지원한다. 그리고, 내장형 시공간 DBMS와 U-GIS 서버 사이에서 시공간 데이타 수입/수출의 성능 향상을 위한 데이타 캐슁 기능과 DBMS의 안정성을 위한 백업/복구 기능을 지원한다.

  • PDF

이질적 색인어의 가중치 합에 기반한 수식 검색 시스템 (An Equation Retrieval System Based on Weighted Sum of Heterogenous Indexing Terms)

  • 신준수;김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.745-750
    • /
    • 2010
  • 다양한 수식을 포함하는 수학 문서들을 효과적으로 검색하기 위해서는 수식 인지 검색 엔진이 필요하다. 본 논문에서는 구조적으로 유사한 수식들을 효과적으로 찾아주는 수식 검색 시스템을 제안한다. 제안 시스템은 MathML 수식들을 연산자, 변수, 그리고 수식 구조와 같은 3가지 형태의 이질적 색인어로 분리하고 독립적으로 색인한다. 사용자가 MathML 수식을 입력하면 제안 시스템은 이질적인 색인어들을 위한 3가지 언어모델들의 가중치 합을 이용하여 수식들을 검색하고 순위화한다. 244,824개의 MathML 수식을 대상으로 한 실험에서 제안 시스템은 비공개 테스트에서 53%의 1순위 정확률, 공개 테스트에서 63%의 1순위 정확률을 보였다.

퍼지 시그너쳐 집합을 이용한 마이크로어레이 데이터 검색 (Microarray Data Retrieval Using Fuzzy Signature Sets)

  • 이선아;이건명;류근호
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.545-549
    • /
    • 2009
  • 마이크로어레이 데이터는 수천가지 유전자의 발현정보를 포함할 수 있으며, 여기에서 의미있는 패턴을 추출하여 추가적인 분석을 위한 목적으로 활용되고 있다. 다수의 샘플 또는 실험에 대해서 마이크로어레이 데이터가 수집된 경우에 분석자가 관심을 갖는 유전자들이나 샘플들을 효과적으로 검색하는 것이 필요한 경우가 있다. 이 논문에서는 단순한 조건뿐만 아니라 복잡한 조건을 정의하여 원하는 특성을 만족하는 유전자나 샘플을 추출하는 방법으로 퍼지 시그너쳐 집합을 활용하는 방법을 제안한다. 퍼지 시그너쳐는 벡터값을 값을 갖는 퍼지 집합을 확장한 것으로, 벡터의 각 요소가 다시 벡터가 되는 것을 허용하는 재귀적인 구조이다. 퍼지 시그너쳐 집합은 단말 원소가 구간 [0,1] 사이에서 정의된 퍼지집합이라는 것을 제외하면 퍼지 시그너쳐와 같은 구조를 가진다. 이 논문에서는 각 내부 노드에 대해서 명시적으로 결합 연산자를 지정하도록 하고, 결합 연산을 위해 비교연산자를 사용할 수 있도록 확장한 퍼지 시그너쳐 집합을 소개한다. 또한 확장된 퍼지 시그너쳐 집합을 마이크로어레이 데이터 검색을 위해 사용하는 방법과 이를 사용한 예를 보인다.

비공간 검색 조건이 포함된 k-최근접 질의 처리를 위한 R-트리와 시그니쳐 파일의 결합 (Combining R-trees and Signature Files for Handling k-Nearest Neighbor Queries with Non-spatial Predicates)

  • 박동주;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.651-662
    • /
    • 2000
  • 멀티미디어 데이터베이스에서 k-최근접 질의는 가장 일반적이며, 비공간 검색 조건이 포함된 경우가 많다. 현재까지 이러한 질의를 위한 여러 기법 중에서 Hjaltason과 Samet이 제안한 점증적 최근접 알고리즘에 가장 유용하다고 알려져 있다. 질의 처리를 위해 상위 연산자가 k보다 많은 객체를 요구할 때, 이 알고리즘은 처음부터 질의를 재실행하지 않고 다음 객체를 전달할 수 있기 때문이다. 그런데, 이 알고리즘에서 사용하는 R-트리는 결국에는 비공간 검색조건을 만족시키지 않을 투플 후보들을 부분적으로 제거할 수가 없기 때문에 비효율적이다. 본 논문에서 우리는 이 알고리즘을 보완한 RS-트리 기반 점증적 최근접 알고리즘을 제안한다. RS-트리는 R-트리와, 그 보조 트리로서 계층적 시스니쳐 파일을 기반으로 하는 S-트리로 구성된다. S-트리는 R-트리를 탐색하는 과정에서 많은 불필요한 투플을 제거하는 역할을 수행한다. 본 논문에서는 실험을 통해 RS-트리가 Hjaltason과 Samet의 알고리즘의 성능을 향상시킬 수 있음을 보인다.

  • PDF

정보검색 모델에서 개념적 거리를 이용한 추론 (Reasoning with Conceptual Distance in an Information Retrieval Model)

  • 김영환;김진형
    • 인지과학
    • /
    • 제2권1호
    • /
    • pp.193-204
    • /
    • 1990
  • 본 논문은 계층적 시소러스를 이용한 정보검색 추론모델을 제안하였다.제안된 모델은 계층적 시소러스를 구성하는 색인어들과 이들의 가중치로써 표현되는 사용자의 질의오와 정보요소 간의 개념적 거리를 계산한다. 사요자질의어에 부울리언 연산자를 사용할 수 있도록 하여 검색 요구의 표현력을 향상시켰고,계층적 시소러스에 에지(edge)가중치를 허용하여 색인어들간의 상관관계를 보다 정확하게 표현할 수 있도록 하였다. 제안한 모델의 성능 평가를 위한 실험 결과, 인간의 적합도 판정과 상당히 유사함을 알 수 있었다.

교육학 분야 주제전문가와 탐색전문가의 인터넷 검색엔진을 사용한 정보 탐색 행태 비교연구 (A Comparative Study about Information Searching Behaviors of Educational Researchers Using Web Search Engines -Subject Specialists vs information specialists)

  • 이명희
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.5-22
    • /
    • 1998
  • 본 연구는 인터넷을 사용하는 교육학 분야 연구자들을 주제전문가인 최종이용자와 탐색전문가 그룹으로 나누어 이들의 검색엔진을 사용한 정보탐색 행태가 어떻게 다른지를 비교하였다. 탐색과정과 탐색결과에서 밝혀진 결과는 아래와 같다. 탐색과정에서 사용된 탐색어 수와 연산자 수는 주제전문가가 탐색전문가 보다 약간 많았으며 탐색시간도 길었다. 그러나 탐색결과 주제전문가보다 탐색전문가에 의해 검색된 문헌에서 적합문헌수가 더욱 많았으며 정확률도 더욱 높은 것으로 밝혀졌다.

  • PDF

시소러스범주정보를 이용한 질의응답시스템 (A Question Answering System Using the Information of the Category Information of Thesaurus)

  • 김수민;백대호;김상범;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-183
    • /
    • 2000
  • 정보검색시스템은 사용자의 질의를 입력받아 사용자가 원하는 정보를 검색해주는 시스템을 의미한다. 그러나, 대부분의 정보검색시스템은 단어와 연산자의 조합으로 이루어진 질의를 입력받아 문서를 검색해 주고, 사용자는 그 문서들 중에서 원하는 정보를 다시 찾아내야 한다. 본 논문에서는 영어 자연어질의를 입력받아 사용자가 원하는 정보에 좀 더 근접한 형태의 답으로서 제한된 길이의 짧은 답을 제시하는 시스템을 구현한다. 시스템은 크게 질의분석단계, 문서검색 및 분석단계, 정보추출단계의 세 단계로 나눌 수 있다. 사용자 질의분석단계에서는 의문사 정보와 오토마타, 시소러스 범주정보를 이용하여 질의에 대한 정답이 될 수 있는 단어의 속성을 예측하였다. 문서분석단계에서는 정답이 될 수 있는 단어의 후보를 선정하기 위해서 시소러스의 범주정보를 사용하였고, 선정된 정답후보 중에서 정답을 추출하기 위해 각 후보단어의 질의어단어와의 평균거리가중치, 범주간유사도, 공기질의어비율을 사용하였다. 실험을 통해 평균거리가중치만을 이용하는 것 보다 범주간유사도와 공기질의어비율을 함께 이용한 것이 성능의 향상을 보였다.

  • PDF

데이터 융합을 이용한 내용기반 이미지 검색에 관한 연구 (Content-based Image Retrieval Using Data Fusion Strategy)

  • 백우진;정선은;김기영;안의근;신문선
    • 정보관리학회지
    • /
    • 제25권2호
    • /
    • pp.49-68
    • /
    • 2008
  • 지금까지의 정보검색 연구에서 데이터 융합 기법을 이용한 문서 검색은 하나의 알고리즘에 의한 검색에 비하여 많은 경우에 효율성이 높은 결과를 얻을 수 있었다. 하지만 이미지 검색에서 상이한 알고리즘을 이용한 다수의 검색 결과를 합쳐 하나의 검색결과를 얻는 데이터 융합 기법의 사용은 많지 않았다. 이 연구에서는 소벨 연산자를 이용한 윤곽선 검출과 자기조직화 지도 알고리즘에 의한 두 검색 결과를 융합하여 각각의 알고리즘에 의한 검색결과 보다 높은 효율성을 보여주는 방법을 제시하였다. 이 연구에서는 상용 클립아트 이미지를 이용하여 사람의 주관적인 적합성 판단을 배제한 검색 실험 데이터를 만들어 사용하였다.