• 제목/요약/키워드: Probabilistic relevance model

검색결과 10건 처리시간 0.027초

커버곡 검색 정확도 향상을 위한 적합도 기반 크로마그램 쌍별 유사도 (A relevance-based pairwise chromagram similarity for improving cover song retrieval accuracy)

  • 서진수
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.200-206
    • /
    • 2024
  • 음악 유사도 계산은 음악 검색 서비스 구현에서 중요한 구성 요소 중 하나이다. 본 논문은 커버곡 검색 성능을 제고하기 위해서, 크로마그램 벡터 별로 커버곡 검색 적합도를 구하여 음악 유사도 계산 시 가중치로 활용한다. 커버곡 검색 적합도는 확률 적합도 모델을 이용하여 구한다. 커버곡 검색에 도움이 될 수 있는 분별도가 높은 벡터에 높은 가중치를 부여하고, 흔하게 존재하여 분별도가 떨어지는 벡터에 낮은 가중치를 부여하는 방식으로 음악 유사도 함수를 유도한다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여 제안한 음악 유사도 함수가 커버곡 검색 성능을 개선시킬 수 있음을 보였다.

용어간 종속성을 이용한 문서 순위 매기기에 의한 확률적 정보 검색 (A probabilistic information retrieval model by document ranking using term dependencies)

  • 유현조;이정진
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.763-782
    • /
    • 2019
  • 텍스트 문서 집합에 대한 정보검색에서는 주어진 질의에 부합하는 각 문서의 적합도 확률을 계산하고 이 확률이 높은 것부터 낮은 순으로 문서 순위를 정하여 사용자에게 제공한다, 각 문서의 적합도 확률 계산에 많이 사용되는 모형은 단어들이 확률적으로 독립이라는 가정 하에 확률을 추정한다. 이 모형은 단어들의 결합 확률을 계산하는 것이 현실적으로 어렵다는 점에서 많이 이용되고 있지만 질의에 사용되는 단어들이 대개 서로 관련성을 가지고 있다는 사실을 고려하고 있지 않다. 본 논문에서는 단어 자질들의 의존 구조를 고려하여 문서의 적합도 확률을 계산하기 위하여 단어들의 결합 패턴의 확률을 다항분포 모형으로 가정하고, 최대 엔트로피 방법으로 확률을 추정하여 문서 순위를 매기는 정보검색 모형을 제안한다. 여러 가지 다항분포 상황에서 시뮬레이션 실험을 한 결과 변수들의 독립을 가정한 모형보다 더 우수한 추정 결과를 보여 준다. 실제 LETOR OHSUMED 데이터 이용한 문서 순위 매기기 실험의 결과도 더 나은 검색 결과를 보여 준다.

검색효율 측정척도에 관한 연구 (A Study on measuring techniques of retrieval effectiveness)

  • 윤구호
    • 한국문헌정보학회지
    • /
    • 제16권
    • /
    • pp.177-205
    • /
    • 1989
  • Retrieval effectiveness is the principal criteria for measuring the performance of an information retrieval system. This paper deals with the characteristics of 'relevance' of information and various measuring techniques of retrieval effectivess. The outlines of this study are as follows: 1) Relevance decision for evaluation should be devided into the user-oriented and the system-oriented decisions. 2) The recall-precision measure seems to be user-oriented, and the recall-fallout measure to be system-oriented. 3) Many of composite measures can not be justified III any rational manner unfortunately. 4) The Swets model has demonstrated that it yields, in general, a straight line instead of a curve of varying curvature and emphasized the fundamentally probabilistic nature of information retrieval. 5) The Cooper model seems to be a good substitute for precision and a useful measure for systems which ranked documents. 6) The Rocchio model were proposed for the evaluation of retreval systems which ranked documents, and were designed to be independent of cut-off. 7) The Cawkell model suggested that the Shannon's equation for entropy can be applied to measuring of retrieval effectiveness.

  • PDF

Relevance vector based approach for the prediction of stress intensity factor for the pipe with circumferential crack under cyclic loading

  • Ramachandra Murthy, A.;Vishnuvardhan, S.;Saravanan, M.;Gandhic, P.
    • Structural Engineering and Mechanics
    • /
    • 제72권1호
    • /
    • pp.31-41
    • /
    • 2019
  • Structural integrity assessment of piping components is of paramount important for remaining life prediction, residual strength evaluation and for in-service inspection planning. For accurate prediction of these, a reliable fracture parameter is essential. One of the fracture parameters is stress intensity factor (SIF), which is generally preferred for high strength materials, can be evaluated by using linear elastic fracture mechanics principles. To employ available analytical and numerical procedures for fracture analysis of piping components, it takes considerable amount of time and effort. In view of this, an alternative approach to analytical and finite element analysis, a model based on relevance vector machine (RVM) is developed to predict SIF of part through crack of a piping component under fatigue loading. RVM is based on probabilistic approach and regression and it is established based on Bayesian formulation of a linear model with an appropriate prior that results in a sparse representation. Model for SIF prediction is developed by using MATLAB software wherein 70% of the data has been used for the development of RVM model and rest of the data is used for validation. The predicted SIF is found to be in good agreement with the corresponding analytical solution, and can be used for damage tolerant analysis of structural components.

Online railway wheel defect detection under varying running-speed conditions by multi-kernel relevance vector machine

  • Wei, Yuan-Hao;Wang, You-Wu;Ni, Yi-Qing
    • Smart Structures and Systems
    • /
    • 제30권3호
    • /
    • pp.303-315
    • /
    • 2022
  • The degradation of wheel tread may result in serious hazards in the railway operation system. Therefore, timely wheel defect diagnosis of in-service trains to avoid tragic events is of particular importance. The focus of this study is to develop a novel wheel defect detection approach based on the relevance vector machine (RVM) which enables online detection of potentially defective wheels with trackside monitoring data acquired under different running-speed conditions. With the dynamic strain responses collected by a trackside monitoring system, the cumulative Fourier amplitudes (CFA) characterizing the effect of individual wheels are extracted to formulate multiple probabilistic regression models (MPRMs) in terms of multi-kernel RVM, which accommodate both variables of vibration frequency and running speed. Compared with the general single-kernel RVM-based model, the proposed multi-kernel MPRM approach bears better local and global representation ability and generalization performance, which are prerequisite for reliable wheel defect detection by means of data acquired under different running-speed conditions. After formulating the MPRMs, we adopt a Bayesian null hypothesis indicator for wheel defect identification and quantification, and the proposed method is demonstrated by utilizing real-world monitoring data acquired by an FBG-based trackside monitoring system deployed on a high-speed trial railway. The results testify the validity of the proposed method for wheel defect detection under different running-speed conditions.

Prediction of compressive strength of GGBS based concrete using RVM

  • Prasanna, P.K.;Ramachandra Murthy, A.;Srinivasu, K.
    • Structural Engineering and Mechanics
    • /
    • 제68권6호
    • /
    • pp.691-700
    • /
    • 2018
  • Ground granulated blast furnace slag (GGBS) is a by product obtained from iron and steel industries, useful in the design and development of high quality cement paste/mortar and concrete. This paper investigates the applicability of relevance vector machine (RVM) based regression model to predict the compressive strength of various GGBS based concrete mixes. Compressive strength data for various GGBS based concrete mixes has been obtained by considering the effect of water binder ratio and steel fibres. RVM is a machine learning technique which employs Bayesian inference to obtain parsimonious solutions for regression and classification. The RVM is an extension of support vector machine which couples probabilistic classification and regression. RVM is established based on a Bayesian formulation of a linear model with an appropriate prior that results in a sparse representation. Compressive strength model has been developed by using MATLAB software for training and prediction. About 70% of the data has been used for development of RVM model and 30% of the data is used for validation. The predicted compressive strength for GGBS based concrete mixes is found to be in very good agreement with those of the corresponding experimental observations.

중등학교 지구과학 교사들의 과학적 설명: 논리적 형식과 담화적 특징 분석 (Scientific Explanations by Earth Science Teachers in Secondary Schools: Analyses of the Logical Forms and Discursive Features)

  • 오필석
    • 한국과학교육학회지
    • /
    • 제27권1호
    • /
    • pp.37-49
    • /
    • 2007
  • 본 연구의 목적은 우리나라 중등학교 지구과학 수업에서 교사들이 제공하는 과학적 설명을 논리적 형식에 따라 분류하고, 서로 다른 형식의 과학적 설명이 지니는 특징과 과학적 설명을 위한 담화 행위에서 교사와 학생들의 역할을 분석하는 것이었다. 연구를 위한 자료는 2003년과 2004년에 해외 단기 연수 프로그램에 참여한 지구과학 교사들로부터 수집되었으며, 총18차시에 해당하는 지구과학 수업 녹화 자료와 전사본을 분석하였다. 분석된 지구과학 수업에서는 연역-법칙적 설명이 가장 빈번히 발생하였고, 연역-법칙적 모형은 과학적 설명을 구성하는 데 필요한 과학 법칙이나 상위의 원리가 잘 정립된 문제에 알맞은 것임을 알 수 있었다. 하지만, 지구과학의 후진적 추론 과제를 다루는 상황에서는 귀추적 설명이 제공되었고, 일기 속담이나 기상 이변과 같이 지구과학에 특징적인 대상을 설명할 때에는 각각 통계-확률적 모형과 통계-유관성 모형에 부합하는 설명이 활용되었다. 지구과학수업에서 과학적 설명은 주로 교사의 단독적인 발화를 통해 이루어졌으며, 학생들은 과학적 설명을 구성하기 위한 담화 행위에서 주로 소극적인 역할을 담당하였다. 이상과 같은 연구 결과가 과학 수업과 과학교육 연구에 시사하는 점들을 논의하였다.

확률적 정보 검색 모델에서의 유사 적합성 피드백 실험 (Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model)

  • 조봉현;이창기;안주희;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

확률적 부울(Boolean) 모델과 연관성 학습을 통한 내용기반 영상 검색 성능 향상 (Performance Improvement For Content-Based Image Retrieval Using Probabilistic Bollean Model And Relevance Learning)

  • 고병철;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.556-558
    • /
    • 2001
  • 전체 영상을 이용하지 않고 영상 안에 포함된 특정 객체 혹은 영역만을 이용하는 "영역에 의한 질의(query-by-region)" 방법은 내용기반 영상 검색 중 상위개념의 방법 이지만, 영상 분할의 한계, 여러개로 분할된 영역을 모두 검색하기 위한 인덱싱 문제, 유사성 측정 시 선형적으로 분리되지 않는 특징 값들에 대한 무리한 선형 조합으로 인한 검색 오류와 같은 많은 문제점을 안고 있다. 따라서 본 논문에서는 영역 기반 영상 검색 시스템인 FRIP에 대하여 영상 분할의 한계를 극복하고, 사용자의 주관성을 영상 검색에 적용하기 위해 확률적 연관성 학습 모델(MPFRL)을 유사성 측정 단계에서 적용 하였고, 아울러 검색 모델로는 기존에 일반적으로 사용되어 오던, 선형 모델을 사용하지 않고 선형 모델보다 유연한 검색 결과를 보여주는 확률적 이접 부울 모델(PDB)을 사용하였다. 또한, 검색 시간을 단축 시키기 위해, 선형 검색 방법에 부울 AND 연산자를 적용 시킴으로써, 검색 시간을 상당부분 단축 할 수 있었다. 실험 결과, 본 논문에서 제안하는 방법(MPFRL+PDB)을 사용할 경우 검색 결과가 선형 조합 보다 향상되는 것을 알 수 있었다. 아울러 사용자 피드백을 통해 사용자가 특징 가중치를 일일이 조절하지 않더라도 단순한 몇 번의 클릭만으로 사용자의 주관성을 반영하고 보다 정확한 검색 결과를 보여 줄 수 있는 시스템을 설계 할 수 있었다.

  • PDF

Secure and Robust Clustering for Quantized Target Tracking in Wireless Sensor Networks

  • Mansouri, Majdi;Khoukhi, Lyes;Nounou, Hazem;Nounou, Mohamed
    • Journal of Communications and Networks
    • /
    • 제15권2호
    • /
    • pp.164-172
    • /
    • 2013
  • We consider the problem of secure and robust clustering for quantized target tracking in wireless sensor networks (WSN) where the observed system is assumed to evolve according to a probabilistic state space model. We propose a new method for jointly activating the best group of candidate sensors that participate in data aggregation, detecting the malicious sensors and estimating the target position. Firstly, we select the appropriate group in order to balance the energy dissipation and to provide the required data of the target in the WSN. This selection is also based on the transmission power between a sensor node and a cluster head. Secondly, we detect the malicious sensor nodes based on the information relevance of their measurements. Then, we estimate the target position using quantized variational filtering (QVF) algorithm. The selection of the candidate sensors group is based on multi-criteria function, which is computed by using the predicted target position provided by the QVF algorithm, while the malicious sensor nodes detection is based on Kullback-Leibler distance between the current target position distribution and the predicted sensor observation. The performance of the proposed method is validated by simulation results in target tracking for WSN.