• 제목/요약/키워드: similarity ranking

검색결과 76건 처리시간 0.028초

확장된 질의 처리를 위해 경로간 의미적 유사도를 고려한 XML 문서 순위화 기법 (A Ranking Technique of XML Documents using Path Similarity for Expanded Query Processing)

  • 김현주;박소미;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권2호
    • /
    • pp.113-120
    • /
    • 2010
  • 정보기술의 표준으로 사용되고 있는 XML환경에서 방대한 양의 데이터에 대한 사용자의 질의를 효율적이고 정확하게 처리하기 위한 연구가 이슈화되고, 특히 웹 환경에서의 XML문서들은 용어적, 구조적인 측면에서 다양한 형태로 존재하고 있다. 이러한 특성을 갖는 XML 문서들을 대상으로 사용자가 특정한 정보를 얻고자 한다면, 사용자의 질의가 가진 용어 및 구조적 특성과 정확히 일치하지 않는 문서의 정보에 대해서 추가적인 기법이 필요하다. 본 논문은 이와 같은 경우에도 동일한 용어 및 구조를 사용하던 환경에서와 마찬가지로 최상위 순위로 정보를 검색할 수 있는 기법을 제시한다. 또한 정확히 일치하지 않는 문서의 경우에 대해서도 사용자 질의 측과의 경로간 의미적 유사성을 측정하여 사용자 질의와 의미적으로 유사한 경로를 가진 순으로 문서들을 순위화하여 제공한다. 제안된 기법은 실험을 통하여 기존의 기법보다 세밀하고 정확한 검색 결과를 도출함을 보인다.

An Integrated Multicriteria Decision-Making Approach for Evaluating Nuclear Fuel Cycle Systems for Long-term Sustainability on the Basis of an Equilibrium Model: Technique for Order of Preference by Similarity to Ideal Solution, Preference Ranking Organization Method for Enrichment Evaluation, and Multiattribute Utility Theory Combined with Analytic Hierarchy Process

  • Yoon, Saerom;Choi, Sungyeol;Ko, Wonil
    • Nuclear Engineering and Technology
    • /
    • 제49권1호
    • /
    • pp.148-164
    • /
    • 2017
  • The focus on the issues surrounding spent nuclear fuel and lifetime extension of old nuclear power plants continues to grow nowadays. A transparent decision-making process to identify the best suitable nuclear fuel cycle (NFC) is considered to be the key task in the current situation. Through this study, an attempt is made to develop an equilibrium model for the NFC to calculate the material flows based on 1 TWh of electricity production, and to perform integrated multicriteria decision-making method analyses via the analytic hierarchy process technique for order of preference by similarity to ideal solution, preference ranking organization method for enrichment evaluation, and multiattribute utility theory methods. This comparative study is aimed at screening and ranking the three selected NFC options against five aspects: sustainability, environmental friendliness, economics, proliferation resistance, and technical feasibility. The selected fuel cycle options include pressurized water reactor (PWR) once-through cycle, PWR mixed oxide cycle, or pyroprocessing sodium-cooled fast reactor cycle. A sensitivity analysis was performed to prove the robustness of the results and explore the influence of criteria on the obtained ranking. As a result of the comparative analysis, the pyroprocessing sodium-cooled fast reactor cycle is determined to be the most competitive option among the NFC scenarios.

Relevancy contemplation in medical data analytics and ranking of feature selection algorithms

  • P. Antony Seba;J. V. Bibal Benifa
    • ETRI Journal
    • /
    • 제45권3호
    • /
    • pp.448-461
    • /
    • 2023
  • This article performs a detailed data scrutiny on a chronic kidney disease (CKD) dataset to select efficient instances and relevant features. Data relevancy is investigated using feature extraction, hybrid outlier detection, and handling of missing values. Data instances that do not influence the target are removed using data envelopment analysis to enable reduction of rows. Column reduction is achieved by ranking the attributes through feature selection methodologies, namely, extra-trees classifier, recursive feature elimination, chi-squared test, analysis of variance, and mutual information. These methodologies are ranked via Technique for Order of Preference by Similarity to Ideal Solution (TOPSIS) using weight optimization to identify the optimal features for model building from the CKD dataset to facilitate better prediction while diagnosing the severity of the disease. An efficient hybrid ensemble and novel similarity-based classifiers are built using the pruned dataset, and the results are thereafter compared with random forest, AdaBoost, naive Bayes, k-nearest neighbors, and support vector machines. The hybrid ensemble classifier yields a better prediction accuracy of 98.31% for the features selected by extra tree classifier (ETC), which is ranked as the best by TOPSIS.

밝기순위 특징을 이용한 적외선 정지영상 내 물체검출기법 (Object Detection in a Still FLIR Image using Intensity Ranking Feature)

  • 박재희;최학훈;김성대
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.37-48
    • /
    • 2005
  • 본 논문에서는 적외선 영상에서 밝기변화를 예측하기 어려운 일정한 크기의 관심 물체를 검출하기 위하여, 밝기순위 특징과 이론 이용한 물체식별기법을 제안한다. 제안하는 밝기순위 특징은 밝기값의 분포가 균일하도록 영상을 정규화하여 나타낸 것으로, 적외선 영상과 같이 검출대상 물체의 밝기분포를 쉽게 예측하기 어려운 경우에 적합한 특징이다. 제안하는 식별기법은 주어진 후보영역이 검출대상 물체의 학습영상들에 대해 밝기순위가 부합하는 정도를 수치화하여 각각의 후보영역을 물체와 비물체로 식별한다 제안하는 기법을 통하여 별도의 후보영역 선정과정 없이도 일정한 크기의 관심 물체에 대해 화소단위의 검출결과를 획득할 수 있다. 실험에서는 적외선 자동차 영상을 이용하여 밝기순위특징이 적외선 영상 내 물체식별에 적합함을 보이고, 잡음 및 물체의 크기변화, 기울어짐이 존재하는 상황에서의 검출결과를 보인다.

연관 웹 페이지 검색을 위한 e-아크 랭킹 메저 (e-Cohesive Keyword based Arc Ranking Measure for Web Navigation)

  • 이우기;이병수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.22-29
    • /
    • 2009
  • 웹은 사용자에게 제품이나 정보를 제공할 수 있는 가장 커다란 매체로 성장하였으며, 또한 사용자에게는 필요 이상의 정보를 얻게 해주고 있다. 웹은 다량의 관련 정보들을 여러 웹 페이지들을 통해 표현하고 있으며, 현재 검색엔진들은 키워드들에 관련된 단일 페이지들만을 리스트화하여 보여주고 있다. 근본적으로 이러한 방법들로는 관련된 정보를 가지고 있는 페이지들의 쌍 및 연관된 뭔 페이지들의 집합을 구조화하여 제공할 수 없다. 웹은 하나의 웹 페이지에 모든 관련 정보를 담는 범위를 넘어 관련된 정보 페이지들을 하이퍼링크로 서로 연결한 일련의 정보로 인식되고 있다. 따라서 본 논문에서는 새로운 링크 가중치 기반 검색 기법으로서 e-아크 메저에 관하여 제안하고자 하며, 이는 사용자가 입력한 키워드들과 관련된 페이지의 집합을 웹 사이트 안에서 찾아내는 연관 검색에 효과적이라는 것을 보이고, 실험을 통해 기존의 메저들 보다 그 효과성을 우월하다는 점을 입증하였다.

Cross-architecture Binary Function Similarity Detection based on Composite Feature Model

  • Xiaonan Li;Guimin Zhang;Qingbao Li;Ping Zhang;Zhifeng Chen;Jinjin Liu;Shudan Yue
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권8호
    • /
    • pp.2101-2123
    • /
    • 2023
  • Recent studies have shown that the neural network-based binary code similarity detection technology performs well in vulnerability mining, plagiarism detection, and malicious code analysis. However, existing cross-architecture methods still suffer from insufficient feature characterization and low discrimination accuracy. To address these issues, this paper proposes a cross-architecture binary function similarity detection method based on composite feature model (SDCFM). Firstly, the binary function is converted into vector representation according to the proposed composite feature model, which is composed of instruction statistical features, control flow graph structural features, and application program interface calling behavioral features. Then, the composite features are embedded by the proposed hierarchical embedding network based on a graph neural network. In which, the block-level features and the function-level features are processed separately and finally fused into the embedding. In addition, to make the trained model more accurate and stable, our method utilizes the embeddings of predecessor nodes to modify the node embedding in the iterative updating process of the graph neural network. To assess the effectiveness of composite feature model, we contrast SDCFM with the state of art method on benchmark datasets. The experimental results show that SDCFM has good performance both on the area under the curve in the binary function similarity detection task and the vulnerable candidate function ranking in vulnerability search task.

2단계 퍼지 지식베이스를 이용한 질의 처리 모델 (Query Processing Model Using Two-level Fuzzy Knowledge Base)

  • 이기영;김영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-16
    • /
    • 2005
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 따라서 본 논문에서는 문서 지식 구조를 파악하여 사용자 질의 용어와 색인어 사이의 내용 기반 유사도를 반영한 순위 재조정 모델을 제안한다. 이를 위해 전자는 시소러스 및 유사관계 행렬을 구축하여 주제 분석 메커니즘을 제공하고, 후자는 사용자 요구를 분석하기 위해 질의 확장 등의 탐색 모형을 수립하는 알고리즘을 제안한다. 따라서 본 논문에서 제안한 알고리즘은 검색 시스템의 정보 구조를 활용한 검색으로 재현율을 유지하면서 동시에 기존 퍼지 검색 모델의 단점인 정확률을 향상시키는 2단계 탐색모형을 수립하는 내용 기반검색 기법이라 할 수 있다.

  • PDF

Optimal monitoring instruments selection using innovative decision support system framework

  • Masoumi, Isa;Ahangari, Kaveh;Noorzad, Ali
    • Smart Structures and Systems
    • /
    • 제21권1호
    • /
    • pp.123-137
    • /
    • 2018
  • Structural monitoring is the most important part of the construction and operation of the embankment dams. Appropriate instruments selection for dams is vital, as inappropriate selection causes irreparable loss in critical condition. Due to the lack of a systematic approach to determine adequate instruments, a framework based on three comparable Multi-Attribute Decision Making (MADM) methods, which are VIKOR, technique of order preference by similarity to ideal solution (TOPSIS) and Preference ranking organization method for enrichment evaluation (PROMETHEE), has been developed. MADM techniques have been widely used for optimizing priorities and determination of the most suitable alternatives. However, the results of the different methods of MADM have indicated inconsistency in ranking alternatives due to closeness of judgements from decision makers. In this study, 9 criteria and 42 geotechnical instruments have been applied. A new method has been developed to determine the decision makers' importance weights and an aggregation method has been introduced to optimally select the most suitable instruments. Consequently, the outcomes of the aggregation ranking correlate about 94% with TOPSIS and VIKOR, and 83% with PROMETHEE methods' results providing remarkably appropriate prioritisation of instruments for embankment dams.

XML 웹 서비스 검색 엔진의 개발 (Development of a XML Web Services Retrieval Engine)

  • 손승범;오일진;황윤영;이경하;이규철
    • Journal of Information Technology Applications and Management
    • /
    • 제13권4호
    • /
    • pp.121-140
    • /
    • 2006
  • UDDI (Universal Discovery Description and Integration) Registry is used for Web Services registration and search. UDDI offers the search result to the keyword-based query. UDDI supports WSDL registration but it does not supports WSDL search. So it is required that contents based search and ranking using name and description in UDDI registration information and WSDL. This paper proposes a retrieval engine considering contents of services registered in the UDDI and WSDL. It uses Vector Space Model for similarity comparison between contents of those. UDDI registry information hierarchy and WSDL hierarchy are considered during searching process. This engine suppports two discovery methods. One is Keyword-based search and the other is template-based search supporting ranking for user's query. Template-based search offers how service interfaces correspond to the query for WSDL documents. Proposed retrieval engine can offer search result more accurately than one which UDDI offers and it can retrieve WSDL which is registered in UDDI in detail.

  • PDF

키워드를 기반으로 마이너와 코사인 유사도를 이용한 컴퓨터 네트워크 관련 컨퍼런스 분석 (The Analysis of the Conferences for the Computer Network Using the Miner and the Cosine Similarity based upon Keywords)

  • 권영빈;이승도;양현;주요한
    • 한국IT서비스학회지
    • /
    • 제11권1호
    • /
    • pp.223-238
    • /
    • 2012
  • We have been provided with a plenty of information about IT through the conferences. However, it is hard to find enough information or the latest trends from conferences because there are too many conferences. In this situation, we analyzed the latest trends related to the field of IT by exploiting the Netminer which is one of the software for analysis of social networks and measuring the Cosine Similarity between conferences, based upon keywords which are included in the conferences. We analyzed keywords of 24 conferences related to the computer network part of the IEEE (Institute of Electrical and Electronics Engineers) in the case of foreign conferences. We also analyze keywords of the KIISE (Korean Institute of Information Scientists and Engineers) conferences in the case of domestic conferences, during 2009-2010. We identified the trends through the frequency of keywords, the change of top 10 keywords ranking and the similarity between conferences.