• 제목/요약/키워드: Extended Boolean Model

검색결과 11건 처리시간 0.028초

계층적 클러스터링 기법을 이용한 확장 불리언 모델의 적합성 피드백 방법 (Relevance Feedback Method of an Extended Boolean Model using Hierarchical Clustering Techniques)

  • 최종필;김민구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1374-1385
    • /
    • 2004
  • 적합성 피드백 방법은 다음 검색 질의어와 검색 성능을 향상시키기 위해 사용자로부터 획득된 정보를 사용한다. 일반적으로 적합성 피드백 방법은 사용자로부터 획득된 정보를 새로운 질의어에 추가될 새로운 단어를 찾거나 질의어에 존재하는 단어의 가중치를 조정하는데 사용한다. 그러나 확장 불리언 검색모델에서 적합성 피드백은 이것들뿐만 아니라 질의어에 있는 단어들을 적절하게 불리언 연산자(AND/OR)로 연결시켜야 한다. Salton과 그의 동료들은 확장 불리언 모델을 위한 DNF(disjunctive normal form) 방법이라 불리는 적합성 피드백 방법을 제안하였다. 그렇지만 이 방법은 질의어를 재구성할 때 심각한 문제점을 갖고 있다. 이 논문에서는 DNF 방법의 문제점을 조사하고 이러한 문제점을 극복하기 위해 계층적 클러스터링 기법을 이용한 적합성 피드백 방법을 제안한다. 그리고 두개의 실험 데이타 집합인 TREC 1 의 DOE 컬렉션과 Web TREC 10 컬렉션을 이용하여 제안한 방법의 우수성을 보였다.

확장 불리언 질의에 대한 비용 기반 최적화 (Cost-based Optimization of Extended Boolean Queries)

  • 박병권
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.29-40
    • /
    • 2001
  • 본 논문에서는 역색인 파일을 미용하여 학장 불리언 질의를 처리할 때 최소 비용의 질의 처리 방법을 구해 주는 질의 최적화 알고리즘을 제시한다. 확장 불리언 질의를 처리하는 방법은 질의를 구성하는 키위드의 처리 순서에 따라 여러 가지가 있을 수 있으므로 확장 불리언 질의 최적화 문제는 결국 최적 키워드 처리 순서를 구하는 문제로 귀결된다. 본 논문에서는 이 문제가 데이터베이스 질의 최적화에서 최적 조인 순서를 구하는 문제와 구조적으로 유사함을 보이고 이 분야의 연구 결과를 이용하여 문제를 해결한다. 즉, 확장 불리언 질의 처리에 대한 비용 모델을 수립하고 키워드 선택률과 역색인 파일 접근 비용을 이용하여 키워드 순위 개념을 도입한 후 이를 이용하여 최적 키워드 처리 순서를 구하는 알고리즘을 도출한다. 그리고 도출한 질의 최적화 알고리즘의 최적성을 증명하고. 실험을 통하여 실제로 최소비용의 질의 처리 방법을 구함을 보이고, 질의 최적화를 하지 않을 경우와 비교하였을 때 그 성능이 월등히 우수함을 보인다. 본 논문에서 제시한 질의 최적화 알고리즘은 정보검색시스템의 질의 처리 성능 향상에 큰 기여를 하리라 믿는다.

  • PDF

Query Expansion Using Augmented Terms in an Extended Boolean Model

  • Nguyen, Tuan-Quang;Heo, Jun-Seok;Lee, Jung-Hoon;Kim, Yi-Reun;Whang, Kyu-Young
    • Journal of Computing Science and Engineering
    • /
    • 제2권1호
    • /
    • pp.26-43
    • /
    • 2008
  • We propose a new query expansion method in the extended Boolean model that improves precision without degrading recall. For improving precision, our method promotes the ranks of documents having more query terms since users typically prefer such documents. The proposed method consists of the following three steps: (1) expanding the query by adding new terms related to each term of the query, (2) further expanding the query by adding augmented terms, which are conjunctions of the terms, (3) assigning a weight on each term so that augmented terms have higher weights than the other terms. We conduct extensive experiments to show the effectiveness of the proposed method. The experimental results show that the proposed method improves precision by up to 102% for the TREC-6 data compared with the existing query expansion method using a thesaurus proposed by Kwon et al.

피드백 정보를 이용한 불논리 검색 시스템의 성능 증진에 관한 실험적 연구 (A study on improving the effectiveness of a boolean retrieval system with feedback information)

  • 신은자;정영미
    • 정보관리학회지
    • /
    • 제15권1호
    • /
    • pp.129-148
    • /
    • 1998
  • 본 연구의 목적은 기존의 불논리 검색 시스템에서 사용할 수 있는 실용적인 피드백 검색 기법을 찾아내는 것으로서, 이용자의 적합성 평가 부담을 덜어줄 수 있도록 사전에 이용자 모형을 구축하여 놓고 피드백 검색시 시스템이 자동으로 적합성 평가를 하는 이용자 모형 기반 피드백 검색 기법을 제안하고 이의 유용성을 실험적으로 입증하였다. 이를 위하여 먼저 증진된 불논리 검색 모형인 DNF 검색 모형과 P-norm 검색 모형을 사용한 피드백 검색 실험을 실시한 후, 검색효율이 높게 나온 DNF 모형을 채택하여 이용자 모형 기반 피드백 검색을 실시하였다. 실험 결과 모든 피드백 검색은 초기검색에 비해 검색효율이 크게 향상되었으며, 이용자 모형 기반 피드백 검색은 DNF 피드백 검색 결과에는 못미치지만 P-norm 피드백 검색 결과와는 거의 같은 수준의 검색효율을 보였다.

  • PDF

네트워크 취약성 분석을 위한 확장된 사이버 공격 트리에 관한 연구 (A Study on an Extended Cyber Attack Tree for an Analysis of Network Vulnerability)

  • 엄정호;박선호;정태명
    • 디지털산업정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.49-57
    • /
    • 2010
  • We extended a general attack tree to apply cyber attack model for network vulnerability analysis. We defined an extended cyber attack tree (E-CAT) which extends the general attack tree by associating each node of the tree with a transition of attack that could have contributed to the cyber attack. The E-CAT resolved the limitation that a general attack tree can not express complex and sophisticate attacks. Firstly, the Boolean expression can simply express attack scenario with symbols and codes. Secondary, An Attack Generation Probability is used to select attack method in an attack tree. A CONDITION-composition can express new and modified attack transition which a aeneral attack tree can not express. The E-CAT is possible to have attack's flexibility and improve attack success rate when it is applied to cyber attack model.

시소러스의 연관성 정보를 이용한 문서의 순위 결정 방법 (Document ranking methods using term dependencies from a thesaurus)

  • 이준호
    • 정보관리학회지
    • /
    • 제10권2호
    • /
    • pp.3-22
    • /
    • 1993
  • 최근 시소러스를 기반으로 하는 불리안 검색 시스템에서 문서의 순위 결정에 사용 될 수 있는 Relevance, R-distance, K-distance와 같은 방법들이 개발되었다. 이러한 방법들은 색인어들 사이의 연관성 정보를 이용하여 문서들의 순위를 결정함으로써 많은 경우에 높은 검색 효율을 제공할 지라도, 불리안 연산자 AND, OR, NOT에 대한 연산 방법이 문제점으로 지적되어왔다. 본 논문에서는 개선된 퍼지 집합 모델과 확장된 불리안 모델을 시소러스가 제공하는 색인어들 사이의 연관성 정보를 효율적으로 이용할 수 있도록 확장함으로써, 기존 방법들의 문제점을 극복하는 새로운 순위 결정 방법 KB-FSM과 KB-EBM을 제안한다. 또한 KB-FSM과 KB-EBM이 Relevance, R-distance, K-distance보다 문서들의 순위를 보다 정확하게 결정함을 성능 비교를 통하여 입증한다.

  • PDF

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.

객체지향 시스템을 이용한 버전제어에서 효율적인 형상 형성 제어 모델링에 관한 연구 (A Study on the Efficient Configuration Thread Control Modeling in Version Control using Object Oriented System)

  • 오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.123-132
    • /
    • 2005
  • 버전 제어 시스템은 급속한 환경의 변화나 개발 환경이 복잡한 프로그래밍 환경에서 사용되고 있으며, 형상 형성 (configuration thread) 정보의 제공과 이의 처리 방법은 버전 제어에서 중요한 역할을 하고 있다. DSEE에서의 시스템 모형, ClearCase의 뷰, SourceSafe의 레이블, CCC/Harvest의 패키지 등의 형상 형성도구들은 정형화된 형상 규칙을 사용자가 적용하여 필요한 버전에 대한 형상 정보를 얻고 있다. 그러나, 이들 방법에서는 정의된 형상 규칙 정보를 정확하게 알지 못하는 경우나 미리 정의되지 않은 정보에 대해서는 형상 형성 정보 제공 문제가 발생한다. 또한, 이들 정보는 세부적으로 연계된 정의되지 않은 관련 버전이나 메타 정보를 제공하지 못하는 단점을 가지고 있다. 본 논문에서는 이러한 문제를 해결하고 효율적인 형상 형성제어를 위한 시스템을 모델링하고 구현하였다. 이 시스템에서는 형상 형성 정보를 효율적으로 제공하기 위해 부울리언 검색 모델과 벡터 검색 모델을 결합한 혼합 검색 모델을 제안하였으며, 라이브러리는 확장 facet 방법을 응용하여 설계하였다.

  • PDF

Material feature representation and identification with composite surfacelets

  • Huang, Wei;Wang, Yan;Rosen, David W.
    • Journal of Computational Design and Engineering
    • /
    • 제3권4호
    • /
    • pp.370-384
    • /
    • 2016
  • Computer-aided materials design requires new modeling approaches to characterize and represent fine-grained geometric structures and material compositions at multiple scales. Recently, a dual-Rep approach was developed to model materials microstructures based on a new basis function, called surfacelet. As a combination of implicit surface and wavelets, surfacelets can efficiently identify and represent planar, cylindrical, and ellipsoidal geometries in material microstructures and describe the distribution of compositions and properties. In this paper, these primitive surfacelets are extended and composite surfacelets are proposed to model more complex geometries. Composite surfacelets are constructed by Boolean operations on the primitives. The surfacelet transform is applied to match geometric features in three-dimensional images. The composition of the material near the identified features can then be modeled. A cubic surfacelet and a v-joint surfacelet are developed to demonstrate the reverse engineering process of retrieving material compositions from material images.

Three-Dimensional Digital-Mold Modeling and Sand-Printing for Replication of Bronze Mirror

  • Jo, Young Hoon;Lee, Jungmin
    • 보존과학회지
    • /
    • 제37권1호
    • /
    • pp.25-33
    • /
    • 2021
  • To extend the application of digital technology to the replication of artifacts, meticulous details of the process and the diversity of three-dimensional (3D) printing output materials need to be supplemented. Thus, in this study, a bronze mirror with Hwangbichangcheon inscription was digitalized by 3D scanning, converted into a voxel model, and virtual conservation treatment was performed using a haptic device. Furthermore, the digital mold of the bronze mirror completed by Boolean modeling was printed using a 3D sand-printer. Such contactless replication based on digital technology reflects the stability, precision, expressivity, collectivity, durability, and economic feasibility of artifacts. Its application can be further extended to cultural products as well as such areas as education, exhibition, and research. It is expected to be in high demand for metal artifacts that require casting. If empirical studies through experimental research on casting are supplemented in the future, it could extend the application of digital technology-based contactless replication methods.