• 제목/요약/키워드: similarity ranking

검색결과 76건 처리시간 0.027초

Collaborative Similarity Metric Learning for Semantic Image Annotation and Retrieval

  • Wang, Bin;Liu, Yuncai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권5호
    • /
    • pp.1252-1271
    • /
    • 2013
  • Automatic image annotation has become an increasingly important research topic owing to its key role in image retrieval. Simultaneously, it is highly challenging when facing to large-scale dataset with large variance. Practical approaches generally rely on similarity measures defined over images and multi-label prediction methods. More specifically, those approaches usually 1) leverage similarity measures predefined or learned by optimizing for ranking or annotation, which might be not adaptive enough to datasets; and 2) predict labels separately without taking the correlation of labels into account. In this paper, we propose a method for image annotation through collaborative similarity metric learning from dataset and modeling the label correlation of the dataset. The similarity metric is learned by simultaneously optimizing the 1) image ranking using structural SVM (SSVM), and 2) image annotation using correlated label propagation, with respect to the similarity metric. The learned similarity metric, fully exploiting the available information of datasets, would improve the two collaborative components, ranking and annotation, and sequentially the retrieval system itself. We evaluated the proposed method on Corel5k, Corel30k and EspGame databases. The results for annotation and retrieval show the competitive performance of the proposed method.

이미지 데이터베이스 유사도 순위 매김 알고리즘 (A Similarity Ranking Algorithm for Image Databases)

  • 차광호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권5호
    • /
    • pp.366-373
    • /
    • 2009
  • 이 논문은 이미지 데이터베이스를 위한 유사도 순위 매김 알고리즘을 제시한다. 이미지 검색의 문제점 중 하나가 이미지로부터 자동적으로 계산한 하위 레벨 특성과 인간 지각과의 의미 차이이며, 검색시에 이미지 유사도 측정을 위해 많은 알고리즘에서는 민코프스키 측정법($L_p$-norm)을 사용하고 있다. 그러나 민코프스키 측정법은 인간 시각 시스템의 비선형적 특성과 문맥 정보를 반영하지 못한다. 본 알고리즘에서는 인간 지각의 비선형성과 문맥 정보를 반영하는 유사도와 탐색 알고리즘을 통해 이 문제를 해결한다. 본 알고리즘을 필기체 숫자 이미지 데이터베이스에 적용하여 성능의 우수성과 효과를 증명하였다.

태그쌍의 의미유사도 기반 태그 랭킹 시스템 (Tag Ranking System based on Semantic Similarity of Tag-pair)

  • 이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제16권11호
    • /
    • pp.1305-1314
    • /
    • 2013
  • 기존의 태그 기반 시스템들은 콘텐츠에 태깅된 태그들을 활용한 단일 태그 매칭을 통해 검색결과를 제공함에 따라 정확도가 낮은 검색결과를 제공하고 있으며, 또한 사용자들이 콘텐츠에 태깅 시 태그간의 연관관계 및 우선순위는 고려하지 않아 태그가 가지고 있는 콘텐츠와 관련된 정보들을 효율적으로 제공하지 못하고 있다. 이에 본 논문에서는 위의 문제점을 해결하기 위해 태그 기반 시스템에 적합한 태그간 의미 유사도를 추출하여 콘텐츠에 태깅된 태그들을 재 랭킹하기 위한 태그 랭킹 시스템을 제안하였다. 제안 시스템의 성능 평가는 이미지에 태깅된 태그(baseline)와 태그 동시출현 빈도수 기법을 적용한 랭킹(frequency) 결과를 본 논문에서 제안한 태그 랭킹 시스템에 의해 추출된 랭킹 결과와 비교 실험하였다.

사용자 선호도 기반의 퍼지 랭킹모델에 관한 연구 (A Study on Fuzzy Ranking Model based on User Preference)

  • 김대원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.94-95
    • /
    • 2006
  • A great deal of research has been made to model the vagueness and uncertainty in information retrieval. One such research is fuzzy ranking models, which have been showing their superior performance in handling the uncertainty involved in the retrieval process. In this study we develop a new fuzzy ranking model based on the user preference. Through the experiments on the TREC-2 collection of Wall Street Journal documents, we show that the proposed method outperforms the conventional fuzzy ranking models.

  • PDF

A Study on Fuzzy Ranking Model based on User Preference

  • Kim Dae-Won
    • 한국지능시스템학회논문지
    • /
    • 제16권3호
    • /
    • pp.326-331
    • /
    • 2006
  • A great deal of research has been made to model the vagueness and uncertainty in information retrieval. One such research is fuzzy ranking models, which have been showing their superior performance in handling the uncertainty involved in the retrieval process. In this study we develop a new fuzzy ranking model based on the user preference. Through the experiments on the TREC-2 collection of Wall Street Journal documents, we show that the proposed method outperforms the conventional fuzzy ranking models.

2단계 유사관계 행렬을 기반으로 한 순위 재조정 검색 모델 (A Re-Ranking Retrieval Model based on Two-Level Similarity Relation Matrices)

  • 이기영;은희주;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1519-1533
    • /
    • 2004
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 본 논문에서는 용어의 상대적인 중요 정도를 축소용어 집합으로 구성하여 검색 시스템의 높은 시간 복잡도를 해결할 수 있도록 퍼지 검색 모델을 적용하였다. 또한 퍼지 호환관계의 특성을 만족하는 유사관계 행렬을 통해 사용자 질의를 정확하게 반영할 수 있도록 클러스터 검색을 수행하였다. 본 논문에서 제안한 퍼지 검색과 문서 클러스터 검색의 유사도 결합을 통한 순위 재조정 검색 모델은 검색 성능을 표현하는 정확률과 재현율 척도에서 향상됨을 입증하였다.

의미적 유사성에 기반한 온톨로지 선택 랭킹 모델 (Ontology Selection Ranking Model based on Semantic Similarity Approach)

  • 오선주;안중호;박진수
    • 한국전자거래학회지
    • /
    • 제14권2호
    • /
    • pp.95-116
    • /
    • 2009
  • 지식 재사용 측면에서 기존의 온톨로지를 재사용할 수 있다면 많은 자원을 절약할 수 있을 것이다. 그러나 기존의 온톨로지를 활용하기 위해서는 보다 발전된 온톨로지 검색 기능이 요구된다. 현재까지 이루어진 관련 연구들에서는 주로 렉시컬 매칭기법을 사용하여 온톨로지를 검색하였다. 그러나 의미적 측면에서 문제점이 있으므로 본 연구에서는 관계의 의미적 유사성에 기반한 온톨로지 선택 랭킹 모델을 제안한다. 본 연구는 개념간 계층 구조와 관계를 온톨로지 검색에 이용함으로써 온톨로지의 선택 랭킹을 효과적이며 실질적으로 개선하였다. 또한 실험을 통해 연구 모델의 결과와 선행 연구의 결과, 온톨로지 전문가의 랭킹 결과를 비교 분석하고 연구 모델의 타당성을 검증하였다. 본 연구 결과는 온톨로지 검색 연구를 이론적으로 발전시켰을 뿐 아니라 실무적인 측면에서 실무자들이 온톨로지를 쉽게 찾아 재사용할 수 있도록 한다.

  • PDF

글꼴 유사도 판단을 위한 한글 형태소의 글자 크기별 영향력 검증 및 분석 (Verification and Analysis of the Influence of Hangul Stroke Elements by Character Size for Font Similarity)

  • 윤지애;송유정;전자연;안병학;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제25권8호
    • /
    • pp.1059-1068
    • /
    • 2022
  • Recently, research using image-based deep learning is being conducted to determine similar fonts or recommend fonts. In order to increase the accuracy in judging the similarity of Hangul fonts, a previous study was conducted to calculate the similarity according to the combination of stroke elements. In this study, we tried to solve this problem by designing an integrated model that reflects the weights for each stroke element. By comparing the results of the user's font similarity calculation conducted in the previous study and the weighted model, it was confirmed that there was no difference in the ranking of the influence of the stroke elements. However, as a result of comparison by letter sizes, it was confirmed that there was a difference in the ranking of the influence of stroke elements. Accordingly, we proposed a weighted model set separately for each font size.

다중 정보 여과 방법을 이용한 동적 정보 우선 순위 결정 (dynamic Information Ranking using Multiple Information filtering)

  • 김진;윤정섭;조근식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.323-332
    • /
    • 2000
  • 인터넷을 등장으로, 끊임없이 늘어나는 정보의 양은 오히려 사용자의 정보 습득을 어렵게 만들었다. 이를 해결하기 위한 방법으로 검색된 정보에 우선 순위를 부여함으로써 사용자가 원하는 정보를 선별할 수 있는 방법이 등장하였다. 하지만, 이는 사용자의 일시적인 질의만을 가지고 정보의 우선 순위를 결정하기 때문에 사용자가 다시 판단해야 하는 부담을 안게 되었다. 이러한 문제점을 해결하기 위해, 본 논문에서는 내용 기반의 정보 검색(Content-Based Information Retrieval) 방법과 더불어 사용자의 기호를 반영하는 사용자 선호도 기반의 정보 여과(Information Filtering) 방법, 그룹 선호도 기반의 협동적 정보 여과(Collaborative Filtering) 방법을 사용하여 사용자의 요구에 선결조건으로 하며, 구축된 선호도는 벡터로써 표현되어 정보와의 유사도(degree of similarity) 계산에 사용된다. 제안된 방법을 실험하기 위해 MFC(Microsoft Foundation Class) 관련 학습 사이트를 구현하여 사용자 등록을 받았다. 이 과정에서 사용자에게 여러 가지 프로파일을 요구하였으며, 변화하는 사용자의 기호를 반영하기 위해 지속적으로 사용자의 행동을 관찰하였다. 이렇게 구축된 사용자 선호도를 바탕으로 제안된 방법을 실험하고 사용자의 feedback을 통해 결과에 대한 평가를 받아, 논문에서 제안된 방법의 타당성을 입증하였다.

  • PDF

Ranking Translation Word Selection Using a Bilingual Dictionary and WordNet

  • Kim, Kweon-Yang;Park, Se-Young
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.124-129
    • /
    • 2006
  • This parer presents a method of ranking translation word selection for Korean verbs based on lexical knowledge contained in a bilingual Korean-English dictionary and WordNet that are easily obtainable knowledge resources. We focus on deciding which translation of the target word is the most appropriate using the measure of semantic relatedness through the 45 extended relations between possible translations of target word and some indicative clue words that play a role of predicate-arguments in source language text. In order to reduce the weight of application of possibly unwanted senses, we rank the possible word senses for each translation word by measuring semantic similarity between the translation word and its near synonyms. We report an average accuracy of $51\%$ with ten Korean ambiguous verbs. The evaluation suggests that our approach outperforms the default baseline performance and previous works.