• 제목/요약/키워드: Precision-recall

검색결과 710건 처리시간 0.039초

컴포넌트 검색에서 퍼지 시소러스를 이용한 효율적인 질의확장 방법 (Efficient Query Expansion Method using Fuzzy Thesaurus in Component Retrieval)

  • 김귀정;한정수
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.76-82
    • /
    • 2004
  • 본 논문은 사용자 질의가 가지는 특정 클래스로부터 개념적으로 서로 연관있는 컴포넌트를 검색하기 위하여 퍼지 시소러스를 통한 질의 확장 방법을 제안하였다. 사용자 질의는 퍼지 불리언 형태로 표현되며, 퍼지 시소러스에 의한 유의어 테이블에 의해 질의 확장된다. 시소러스에 의한 사용자 질의확장은 용어 불일치 문제를 해결함으로써 검색에 대한 일정한 정확도를 보장하면서 재현율을 향상시킬 수 있게 한다. 질의 확장과정의 효율성을 평가하기 위하여 시뮬레이션을 통한 최적의 검색 효율을 나타내는 임계치를 설정하고 재현율 과 정확도를 비교하였다.

  • PDF

웨이브렛 특징과 순위 기반 인식을 이용한 한글 문서 영상 검색 시스템 (A Hangul Document Image Retrieval System Using Rank-based Recognition)

  • 이득용;김우연;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.229-242
    • /
    • 2005
  • 우리는 스캔된 한글 문서 영상에 대한 전문(full-text) 검색 시스템을 구축하였다. 이 시스템은 크게 전처리부, 인식부, 그리고 검색부로 구성되어 있다 검색 알고리즘은 k순위까지의 인식 결과를 이용한다. 이 방법은 검색 성능이 인식 오류에 둔감할 뿐만 아니라, 재현률과 정확률을 사용자가 조절할 수 있는 장점을 갖는다. 객관적인 성능 평가를 위해 KISTI가 제공하는 정보과학회 논문지 영상을 실험에 사용하였다. 인식과 검색 성능을 통하여 시스템이 실용적임을 보였다.

  • PDF

명도와 에지정보의 상관계수를 이용한 비디오샷 경계검출 (Video Shot Boundary Detection Using Correlation of Luminance and Edge Information)

  • 유헌우;정동식;나윤균
    • 제어로봇시스템학회논문지
    • /
    • 제7권4호
    • /
    • pp.304-308
    • /
    • 2001
  • The increase of video data makes the demand of efficient retrieval, storing, and browsing technologies necessary. In this paper, a video segmentation method (scene change detection method, or shot boundary detection method) for the development of such systems is proposed. For abrupt cut detection, inter-frame similarities are computed using luminance and edge histograms and a cut is declared when the similarities are under th predetermined threshold values. A gradual scene change detection is based on the similarities between the current frame and the previous shot boundary frame. A correlation method is used to obtain universal threshold values, which are applied to various video data. Experimental results show that propose method provides 90% precision and 98% recall rates for abrupt cut, and 59% precision and 79% recall rates for gradual change.

  • PDF

축구 동영상 분석을 위한 배경 분리 알고리즘들의 정량적 비교 평가에 관한 연구 (Objective Evaluation of Background Subtraction Algorithms for Soccer Video Analysis: An Experimental Comparative Study)

  • 정찬호
    • 한국통신학회논문지
    • /
    • 제42권1호
    • /
    • pp.42-45
    • /
    • 2017
  • 본 논문에서는 "축구 동영상" 분석을 위한 "최적의" 배경 분리 알고리즘을 결정하기 위하여 정량적인 비교 평가 연구를 수행하였다. 이를 위해 본 논문에서는 다섯 가지 서로 다른 배경 분리 알고리즘을 동일한 실험 환경에서 비교 평가하였다. 정량적인 비교 평가를 위해 Precision, Recall 및 F-measure를 이용하였다. 본 논문에서 제시된 정량적 비교 평가 결과는 지능형 축구 동영상 분석 시스템 개발을 위해 배경 분리 기술을 이용하거나 축구 동영상에 특화된 배경 분리 기술을 연구하고자 하는 연구자 및 개발자들에게 실질적인 도움이 될 것으로 예상된다.

Comparative Study of Various Persian Stemmers in the Field of Information Retrieval

  • Moghadam, Fatemeh Momenipour;Keyvanpour, MohammadReza
    • Journal of Information Processing Systems
    • /
    • 제11권3호
    • /
    • pp.450-464
    • /
    • 2015
  • In linguistics, stemming is the operation of reducing words to their more general form, which is called the 'stem'. Stemming is an important step in information retrieval systems, natural language processing, and text mining. Information retrieval systems are evaluated by metrics like precision and recall and the fundamental superiority of an information retrieval system over another one is measured by them. Stemmers decrease the indexed file, increase the speed of information retrieval systems, and improve the performance of these systems by boosting precision and recall. There are few Persian stemmers and most of them work based on morphological rules. In this paper we carefully study Persian stemmers, which are classified into three main classes: structural stemmers, lookup table stemmers, and statistical stemmers. We describe the algorithms of each class carefully and present the weaknesses and strengths of each Persian stemmer. We also propose some metrics to compare and evaluate each stemmer by them.

협업 필터링 알고리즘에 관한 비교연구 (A Comparative Study on Collaborative Filtering Algorithm)

  • 이가베;이효맹;이현창;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.151-153
    • /
    • 2017
  • 추천시스템 증 가장 대표적인 협업 필터링은 여러 아이템에 대한 사용자 평가 데이터를 이용하여 공통적 패턴을 찾고 특정 사용자이 대한 성호 아이템을 에상하여 추천하는 기법이다. 분 논문에서는 모두 5가지 알고리즘을 사용하였다. Recall-Precision, FPR-TPR, RMSE, MSE, MAE등 지표를 측정하였다. 실험 결과를 보면 MovieLens 데이터를 이용해 사용자에 기반 협업 필터링 알고리즘을 적용해 영화를 추천하는 것이 좋은 효과를 얻고 있다.

  • PDF

검색효율 측정척도에 관한 연구 (A Study on measuring techniques of retrieval effectiveness)

  • 윤구호
    • 한국문헌정보학회지
    • /
    • 제16권
    • /
    • pp.177-205
    • /
    • 1989
  • Retrieval effectiveness is the principal criteria for measuring the performance of an information retrieval system. This paper deals with the characteristics of 'relevance' of information and various measuring techniques of retrieval effectivess. The outlines of this study are as follows: 1) Relevance decision for evaluation should be devided into the user-oriented and the system-oriented decisions. 2) The recall-precision measure seems to be user-oriented, and the recall-fallout measure to be system-oriented. 3) Many of composite measures can not be justified III any rational manner unfortunately. 4) The Swets model has demonstrated that it yields, in general, a straight line instead of a curve of varying curvature and emphasized the fundamentally probabilistic nature of information retrieval. 5) The Cooper model seems to be a good substitute for precision and a useful measure for systems which ranked documents. 6) The Rocchio model were proposed for the evaluation of retreval systems which ranked documents, and were designed to be independent of cut-off. 7) The Cawkell model suggested that the Shannon's equation for entropy can be applied to measuring of retrieval effectiveness.

  • PDF

Development of Ontology for Thai Country Songs

  • Thunyaluk, Jaitiang;Malee, Kabmala;Wirapong, Chansanam
    • Journal of Information Science Theory and Practice
    • /
    • 제11권1호
    • /
    • pp.79-88
    • /
    • 2023
  • This study aimed to develop an ontology for Thai country songs by using the seven steps of an ontology development process. Hozo-Ontology Editor software and Ontology Application Management Framework were tools used in this study. Nine classes of ontology were identified: song, singer, emotion, author, language used, language type, song style, original, and content, and it was found that the song class had a relationship with all of the other classes. The developed ontology was evaluated by seeking opinions from experts in the field of Thai country songs, who agreed that the ontology was highly effective. Additionally, the evaluation employed the knowledge retrieval concept, and the precision, recall, and overall effectiveness were measured, with a precision of 92.59%, a recall of 86.21%, and an overall effectiveness (F-measure) of 89.28%. These results indicate that the developed ontology is highly effective in describing the scope of knowledge of Thai country songs.

통합적 제약완화 방식을 통한 한국어 문맥의존 철자오류 교정규칙의 재현율 향상 (Improving Recall for Context-Sensitive Spelling Correction Rules Through Integrated Constraint Loosening Method)

  • 최현수;윤애선;권혁철
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권6호
    • /
    • pp.412-417
    • /
    • 2015
  • 문맥의존 철자오류는 단독으로 사용하면 정확한 어절이지만, 문맥을 고려했을 때 오류인 유형이다. 이를 검색하고 교정하기가 매우 어려우며, 고품질 맞춤법 검사기의 성능을 크게 좌우한다. 한국어 맞춤법 검사기에서의 문맥의존 철자오류는 언어 전문가에 의해 수작업으로 구축된 교정규칙을 사용하는 것이 가장 일반적이다. 이때 규칙을 이용한 방법은 그 특성상 교정 정확도는 매우 높지만, 재현율은 매우 낮다. 본 논문에서는 기존에 연구되었던 교정규칙에서의 선택제약 명사 확장 방식과 조사 제약조건을 완화하는 방법을 통합하여 정확도를 유지하거나 거의 낮추지 않으면서, 재현율을 향상시키는 방법을 제안한다. 또한, 두 방식을 단순하게 통합하지 않고 수의적 부사 삽입과 활용형, 관형형을 고려하여 단계별로 통합하는 방식을 제안하여 평균적으로 정확도를 거의 낮추지 않고 재현율을 약 13% 향상시킨다.

FRBR 모형 기반 서지검색시스템의 검색 효율성 평가 연구 (An Experimental Study on the Retrieval Efficiency of the FRBR Based Bibliographic Retrieval System)

  • 김현희
    • 한국도서관정보학회지
    • /
    • 제38권3호
    • /
    • pp.223-246
    • /
    • 2007
  • 본 연구에서는 FRBR 모형 기반 서지검색시스템의 검색 효율성을 평가하기 위해서 두 개의 실험 시스템을 구축하였다. 즉, FRBR화 알고리즘을 적용한 FRBR 기반 시스템과 일반 OPAC 기반 시스템을 387건의 KORMARC 기반 음악 자료를 데이터베이스로 활용하여 구성하였다. 그런 다음, 6개의 연구 가설을 세우고 28명의 피조사자와 표현형 질문 6개와 구현형질문 6개로 구성된 총 12개의 검색 질문을 이용하여 이 두 시스템을 재현율, 정확률 및 검색 시간을 측정 기준으로 하여 비교, 분석하였다. 중다변량분석과 t-검증을 이용하여 실험 결과를 분석한 결과, FRBR 시스템이 질문의 유형을 가리지 않고 평균 재현율이 OPAC 시스템 보다 단연 앞서는 것으로 나타났고, 구현형 질문의 경우 OPAC 기반 시스템이 FRBR 기반 실험시스템보다 평균 정확률이 조금 높았고 평균 검색 시간이 더 짧게 나타났다. 현 검색 환경에 FRBR 기반 시스템을 적용시키기 위해서는 우선 서지적 연관성이 높은 분야에 활용될 수 있으며 이러한 분야에 적용될 때 OPAC 시스템을 대체하기보다는 이를 보완하면서 FRBR 시스템의 특성을 살려 질의 유형이 표현형인 경우 또는 높은 재현율을 요하는 경우 특히 효율적으로 적용될 수 있음을 제안하였다.

  • PDF