• Title/Summary/Keyword: Precision-recall

Search Result 711, Processing Time 0.034 seconds

Performance Evaluation of Fuzzy Thesaurus for Component Retrieval (컴포넌트 검색을 위한 퍼지 시소러스의 성능 평가)

  • 채은주;한정수;김귀정
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2003.05a
    • /
    • pp.411-415
    • /
    • 2003
  • This paper compared fuzzy thesaurus through query extension with existent thesaurus and direct matching retrieval etc. Performance of fuzzy thesaurus is evaluated by the recall and precision through simulation. An experiment did through assessment that use critical value, query extension, and reusability satisfaction. As a result of the experiment, we knew component retrieval efficiency of fuzzy thesaurus excels.

  • PDF

Automatic Detection of Anchorperson Shots for News Video Abstraction (뉴스 동영상 요약을 위한 앵커 장면 자동 추출 알고리즘)

  • 정진국;이태연;낭종호;김경수;하명환;정병희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.274-276
    • /
    • 2001
  • 최근 많이 사용되는 대용량의 뉴스 비디오의 편리한 검색 및 관리 방법이 필요하게 되면서 뉴스 비디오 데이터를 자동으로 분석하여 저급 수준의 정보로부터 고급 수준의 내용 정보를 자동으로 추출하는 기술이 필요하게 되었다. 특히 뉴스를 요약하는데 있어서는 이런 기술이 더 유용하게 쓰일 수 있다. 앵커, 그래픽, 인터뷰, 기자보도, 회견/연설 장면 등이 뉴스 비디오의 고급 수준 내용 정보가 될 수 있는데 그 중에서도 앵커 장면은 뉴스의 기사를 나누는 고급 수준의 정보로서 중요한 의미를 갖게 된다. 본 논문에서는 이러한 앵커 장면을 자동으로 추출하는 방법을 제안한다. 앵커 장면의 공통된 특징을 이용하여 검출하게 되는데 첫 번째 특징은 한 뉴스 프로그램을 진행하는 앵커는 동일하다는 점이고 두 번째 특징은 동일한 스튜디오 안이라는 점이다. 본 논문에서는 앵커를 판별하는 방법으로 얼굴의 검출방법과 옷 색깔의 히스토그램 비교방법을 이용한다. 본 논문의 알고리즘을 여러 개의 KBS 9시 뉴스 비디오 데이터에 적용하여 실험한 결과 Recall과 Precision 모두 96% 이상 나오는 것을 알 수 있었다.

  • PDF

Content-Based Image Retrieval System using Keyword Mapping and Color Features (키워드 매핑과 칼라 특징을 이용한 내용기반 화상 검색 시스템의 구현)

  • Choi, Ki-Ho;Choi, Hyun-Sub
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.10
    • /
    • pp.2498-2511
    • /
    • 1998
  • 본 논문에서는 질의화상을 위한 칼라의 위치묘사 키워드와 칼라 키워드를 칼라특징으로 매핑하여 검색할 수 있는 내용기반 화상 검색 방법을 제안하고 이를 구현하였다. 칼라 키워드는 화상의 칼라 특징을 사용하여 칼라 세그먼트 프리미티브로부터 정의되고, 위치 묘사 키워드는 칼라 영역 정보를 사용하여 위치 세그먼트 프리미티브로부터 정의된다. 정의된 각 칼라 키워드 프리미티브는 화상의 칼라특징으로 매핑되어 저장된 참조화상의 6x6 블록의 칼라 특징과 비교하게 되고 유사도 순치 묘사 키워드와 칼라 키워드 검색의 정확도를 측정하였고, 화상검색 실험결과, 평균 recall/precision이 0.72/0.80를 보임으로써 내용기반 화상 데이터 검색에 제안된 방법이 유용함을 보였다.

  • PDF

Optimization of Domain-Independent Classification Framework for Mood Classification

  • Choi, Sung-Pil;Jung, Yu-Chul;Myaeng, Sung-Hyon
    • Journal of Information Processing Systems
    • /
    • v.3 no.2
    • /
    • pp.73-81
    • /
    • 2007
  • In this paper, we introduce a domain-independent classification framework based on both k-nearest neighbor and Naive Bayesian classification algorithms. The architecture of our system is simple and modularized in that each sub-module of the system could be changed or improved efficiently. Moreover, it provides various feature selection mechanisms to be applied to optimize the general-purpose classifiers for a specific domain. As for the enhanced classification performance, our system provides conditional probability boosting (CPB) mechanism which could be used in various domains. In the mood classification domain, our optimized framework using the CPB algorithm showed 1% of improvement in precision and 2% in recall compared with the baseline.

Discriminative Models for Automatic Acquisition of Translation Equivalences

  • Zhang, Chun-Xiang;Li, Sheng;Zhao, Tie-Jun
    • International Journal of Control, Automation, and Systems
    • /
    • v.5 no.1
    • /
    • pp.99-103
    • /
    • 2007
  • Translation equivalence is very important for bilingual lexicography, machine translation system and cross-lingual information retrieval. Extraction of equivalences from bilingual sentence pairs belongs to data mining problem. In this paper, discriminative learning methods are employed to filter translation equivalences. Discriminative features including translation literality, phrase alignment probability, and phrase length ratio are used to evaluate equivalences. 1000 equivalences randomly selected are filtered and then evaluated. Experimental results indicate that its precision is 87.8% and recall is 89.8% for support vector machine.

Ternary Decomposition and Dictionary Extension for Khmer Word Segmentation

  • Sung, Thaileang;Hwang, Insoo
    • Journal of Information Technology Applications and Management
    • /
    • v.23 no.2
    • /
    • pp.11-28
    • /
    • 2016
  • In this paper, we proposed a dictionary extension and a ternary decomposition technique to improve the effectiveness of Khmer word segmentation. Most word segmentation approaches depend on a dictionary. However, the dictionary being used is not fully reliable and cannot cover all the words of the Khmer language. This causes an issue of unknown words or out-of-vocabulary words. Our approach is to extend the original dictionary to be more reliable with new words. In addition, we use ternary decomposition for the segmentation process. In this research, we also introduced the invisible space of the Khmer Unicode (char\u200B) in order to segment our training corpus. With our segmentation algorithm, based on ternary decomposition and invisible space, we can extract new words from our training text and then input the new words into the dictionary. We used an extended wordlist and a segmentation algorithm regardless of the invisible space to test an unannotated text. Our results remarkably outperformed other approaches. We have achieved 88.8%, 91.8% and 90.6% rates of precision, recall and F-measurement.

Video Segmentation Using Luminance and Edge Histogram (명도와 에지히스토그램을 이용한 비디오분할)

  • 유헌우;장동식;박진형;이법섭;송광섭
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.207-210
    • /
    • 2000
  • 비디오데이터의 증가에 따른 효율적 검색, 저장, 브라우징을 위한 방법론이 필요하게 되었다. 본 논문에서는 이러한 시스템을 구축하기 위한 첫 번째 단계인 비디오 분할기법을 제안하고자 한다. 이러한 비디오 분할은 샷경계검출 혹은 장면전환검출이라고 하는데 본 논문에서는 밝기 히스토그램과 에지갯수를 이용하여 프레임간의 유사도를 구별하고 이 유사도가 일정 임계값을 넘지 못하면 장면전환이 있는 것으로 간주한다. 점진적 장면전환검출은 현재프레임과 이전의 샷경계 프레임과의 유사도를 비교하여 검출한다. 다양한 비디오데이터에 공통적으로 적용할 수 있는 임계값을 설정하기 위해 상관관계(correlation)기법을 사용한다. 실험결과 급진적 장면전한은 각각 90%, 98%의 정확도(precision)와 회수율(recall)을 나타내었고 점진적 장면전환은 59%, 75%의 정확도와 회수율을 나타내었다.

  • PDF

A Study on the Retrieval Effectiveness in the Search Engines Using Data Mining Techiniques (데이터마이닝기법을 이용한 검색엔진의 검색효율성 측정에 관한 연구)

  • 김성희;이수연
    • Journal of Korean Library and Information Science Society
    • /
    • v.31 no.4
    • /
    • pp.191-212
    • /
    • 2000
  • This study is intlded to ampre the effectiveness of the Northemlight and Google, which are based on Datamining kdmique with a Metacrawler, one of metasearch engines. As a result, searches responding to queries in the Northemlight and Google produced a higher precision and recall as comparrd with searches nspcdhg to queries in the metacrawler. The results show that the Datamining techniques can help improve information retrieval effectinveness.

  • PDF

Design of Big Data Preference Analysis System (빅데이터 선호도 분석 시스템 설계)

  • Son, Sung Il;Park, Chan Khon
    • Journal of Korea Multimedia Society
    • /
    • v.17 no.11
    • /
    • pp.1286-1295
    • /
    • 2014
  • This paper suggests the way that it could improve the reliability about preference of user's feedback by adding weighting factor on sentiment analysis, and efficiently make a sentiment analysis of users' emotional perspective on the big data massively generated on twitter. To solve errors on earlier studies, this paper has improved recall and precision of sensibility determination by using sensibility dictionary subdivided sentiment polarity based on the level of sensibility and given impotance to sensibility determination by populating slang, new words, emoticons and idiomatic expressions not in the system dictionary. It has considered the context through conjunctive adverbs fixed in korean characteristics which are free to the word order. It also recognize sensibility words such as TF(Term Frequency), RT(Retweet), Follower which are weighting factors of preference and has increased reliability of preference analysis considering weight on 'a very emotional tweet', 'a recognised tweet from users' and 'a tweeter influencer'

Camera Motion Detection Using Estimation of Motion Vector's Angle (모션 벡터의 각도 성분 추정을 통한 카메라 움직임 검출)

  • Kim, Jae Ho;Lee, Jang Hoon;Jang, Soeun
    • Journal of Korea Multimedia Society
    • /
    • v.21 no.9
    • /
    • pp.1052-1061
    • /
    • 2018
  • In this paper, we propose a new algorithm that is robust against the effects of objects that are relatively unaffected by camera motion and can accurately detect camera motion even in high resolution images. First, for more accurate camera motion detection, a global motion filter based on entropy of a motion vector is used to distinguish the background and the object. A block matching algorithm is used to find exact motion vectors. In addition, a matched filter with the angle of the ideal motion vector of each block is used. Motion vectors including 4 kinds of diagonal direction, zoom in, and zoom out are added additionally. The experiment shows that the precision, recall, and accuracy of camera motion detection compared to the recent results is improved by 12.5%, 8.6% and 9.5%, respectively.