• 제목/요약/키워드: Precision-recall

검색결과 706건 처리시간 0.03초

새마을운동 기록물의 개체기반 온톨로지 검색시스템 설계 및 평가 (Design and Evaluation of an Individual Instance-based Ontology Retrieval System for Archival Records of the "Saemaul Movement")

  • 이병길;김희섭
    • 한국기록관리학회지
    • /
    • 제13권3호
    • /
    • pp.67-97
    • /
    • 2013
  • 본 연구의 목적은 새마을운동 기록물을 위한 개체기반 온톨로지 검색시스템의 설계와 그 성능평가이다. 개체기반 온톨로지 설계를 위하여 Protege editor4.1을 사용하였고, 새롭게 구현된 검색시스템의 성능은 단문5개, 장문10개의 질의유형으로 기존 나라기록의 키워드 기반 검색시스템과 정확률과 재현율을 비교하여 분석하였다. 분석결과 개체기반 온톨로지 검색시스템이 정확률과 재현율 모두 키워드 기반 시스템보다 우수한 성능을 보였다.

MPEG 압축된 비디오의 자동 분할 기법 (Automatic Parsing of MPEG-Compressed Video)

  • 김가현;문영식
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.868-876
    • /
    • 1999
  • 본 논문에서는 MPEG으로 압축된 비디오(MPEG-compressed video)를 대상으로 내용기반 색인(content-based indexing)에 기초가 될 동영상 자도 d분할에 관한 효과적인 방법을 제안한다. 제안하는 방법은 MPEG 시퀀스의Ⅰ(Intra), P(Predictive), B(bidirectional) 픽쳐 구성에 구애받지 않고 장면 전환점(scene change)을 검출해 낸다. 컷(cut) 검출을 위해서는 Ⅰ픽쳐의 dc 계수와 P, B 픽쳐의 매크로 블록 참조 특성을 이용하여 차이 측도(difference measure)를 설정한다. 그리고 점진적인 (gradual)장면 전환에서는 p, B 픽쳐의 참조 블록 비율을 이용하여 정확하게 장면 전환 지점을 검출한다. 이때 MPEG 시퀀스를 완전히 복원하지 않고 필요한 데이터만을 추출해 내어 전체 데이터 처리 과정을 좀 더 효율적으로 구성한다. 차이 척도의 성능과 검출 결과는 정확도(precision)와 완전추출도(recall)를 기준으로 비교분석하고, 제안한 방법을 다양한 MPEG 시퀀스에 적용시켜 검출 결과와 수행 시간 측면에서 그 효율성을 확인하였다.

  • PDF

가버 필터에 기반한 관심 객체 검출 (Object of Interest Extraction Using Gabor Filters)

  • 김성영
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.87-94
    • /
    • 2008
  • 본 논문에서는 칼라 영상으로부터 관심 객체를 효과적으로 추출할 수 있는 방법을 제안한다. 본 논문에서 제안한 방법은 추출할 객체에 대한사전 지식이 필요 없으며 단순한 배경뿐만 아니라 복잡한 배경에서도 영상에 포함된 관심 객체를 추출하는 것이 가능하도록 한다. 이를 위해 가버 필터 사전을 사용하여 객체의 대략적인 형상을 포함하는 가버 영상을 생성한다. 이를 기반으로 객체 추출에 필요한 특징 정보의 추출 기준이 되는 관심 창(attention window)의 초기 위치를 설정한다. 객체 추출 단계는 기존 연구에서 제안한 방법을 일부 수정하여 적용한다. 제안된 방법의 추출 성능을 평가하기 위해 제안된 방법으로 추출된 결과를 수작업으로 추출된 객체와 비교하여 Precision, Recall 및 F-measure를 계산한다. 이를 통해 제안된 방법의 성능을 확인하였다. 또한 기존 방법과의 추출 결과 비교를 통해 제안된 방법의 우수성을 검증하였다.

  • PDF

퍼지개념을 적용한 질의식의 분석과 문헌정보 검색에 관한 연구 (An Experimental Study on Fuzzy Document Retrieval System)

  • 이승채
    • 한국문헌정보학회지
    • /
    • 제21권
    • /
    • pp.249-290
    • /
    • 1991
  • Theoretical developments in the information retrieval have offered a number of alternatives to traditional Boolean retrieval. Probability theory and fuzzy set theory have played prominent roles here. Fuzzy set theory is an attempt to generalize traditional set theory by permitting partial membership in a set and this means recognizing different degrees to which a document can match a request. In this study, an experimentation of a document retrieval system using the fuzzy relation matrix of the keywords is described and the results are offered. The queries composed of keywords and Boolean operaters AND, OR, NOT were processed in the retrieval method, and the method was implemented on the PC of 32bit level (30 MHz) in an experimental system. The measurement of the recall ratio and precision ratio verified the effectiveness of the proposed fuzzy relation matrix of keywords and retrieval method. Compared to traditional crisp method in the same document database, the recall ratio increased $10\%$ high although the precision ratio decreased slightly. The problems, in this experiment, to be resolved are first, the design of the automatic data input and fuzzy indexing modules, through which the system . can have the ability of competition and usefulness. Second, devising a systematic procedure for assigning fuzzy weights to keywords in documents and in queries.

  • PDF

히스토그램 인터섹션과 오토코릴로그램을 이용한 내용기반 영상검색 시스템 (Content Based Image Retrieval System using Histogram Intersection and Autocorrelogram)

  • 송석진;김효성;이희봉;남기곤
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.1-7
    • /
    • 2002
  • 본 논문에서는 사용자가 질의영상을 선택할 때 영상전체 뿐만 아니라 영상내의 다양한 물체에 대해 질의를 원하는 물체영역만을 간단히 선택, 추출하여 그와 유사한 물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상으로부터 개선된 HSV변환을 통해 히스토그램을 구한 뒤 질의영상의 대표색상을 이용한 컬러 히스토그램 인터섹션방법으로 신속하게 1차 유사도 측정을 하여 후보영상들을 검색한다. 그리고 밴디드 컬러 오토코릴로그램을 이용한 2차 유사도 측정을 수행하여 최종 검색된 영상을 구하였는데 각각의 단점을 보완할 수 있는 2개의 검색방법들을 결합함으로써 소환성(recall) 및 정확성(precision)을 개선하였다. 또한 영상데이터베이스내의 영상들을 특성 라이브러리내에 자통 색인화하여 이를 통해 빠른 영상검색이 가능하였다.

  • PDF

클러스터와 온톨로지 정보를 이용한 웹 서비스 매칭 알고리즘 (Web Service Matching Algorithm using Cluster and Ontology Information)

  • 이용주
    • 인터넷정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.59-69
    • /
    • 2010
  • 웹 서비스들의 수가 급격하게 증가함에 따라 사용자가 적합한 웹 서비스를 찾는 것은 매우 중요한 문제로 대두되고 있다. 그러나 전통적인 키워드 탐색 방법은 다음의 두 가지 이유 때문에 문제가 있다: (1) 웹 서비스에 대한 의미적인 정보들을 활용하지 못한다. (2) 사용자의 요구사항을 정확하게 표현하지 못한다. 이러한 키워드 기반 탐색 방법의 한계를 극복하기 위해 본 논문에서는 하나의 새로운 구문 분석 및 온톨로지 학습 방법을 제안한다. 구문 분석 방법은 키워드를 일반화하여 검색 범위를 넓혀주고, 온톨로지 학습 방법은 상관관계를 표현하여 깊이 있는 탐색을 유도한다. 이러한 두 방법을 결합함으로써 재현율과 정확률 둘 다 향상 시킬 수 있는 기법이 될 수 있다. 제안된 방법은 508개의 웹 서비스 집합에 대한 실험을 수행하여 그 성능의 우수함을 보인다.

Classification of Characters in Movie by Correlation Analysis of Genre and Linguistic Style

  • You, Eun-Soon;Song, Jae-Won;Park, Seung-Bo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.49-55
    • /
    • 2019
  • The character dialogue created by AI is unnatural when compared with human-made dialogue, and it can not reveal the character's personality properly in spite of remarkable development of AI. The purpose of this paper is to classify characters through the linguistic style and to investigate the relation of the specific linguistic style with the personality. We analyzed the dialogues of 92 characters selected from total 60 movies categorized four movie genres, such as romantic comedy, action, comedy and horror/thriller, using Linguistic Inquiry and Word Count (LIWC), a text analysis software. As a result, we confirmed that there is a unique language style according to genre. Especially, we could find that the emotional tone than analytical thinking are two important features to classify. They were analyzed as very important features for classification as the precision and recall is over 78% for romantic comedy and action. However, the precision and recall were 66% and 50% for comedy and horror/thriller. Their impact on classification was less than romantic comedy and action genre. The characters of romantic comedy deal with the affection between men and women using a very high value of emotional tone than analytical thinking. The characters of action genre who need rational judgment to perform mission have much greater analytical thinking than emotional tone. Additionally, in the case of comedy and horror/thriller, we analyzed that they have many kinds of characters and that characters often change their personalities in the story.

칼라특징공간별 SLIC기반 슈퍼픽셀의 특성비교 (A Comparison of Superpixel Characteristics based on SLIC(Simple Linear Iterative Clustering) for Color Feature Spaces)

  • 이정환
    • 디지털산업정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.151-160
    • /
    • 2014
  • In this paper, a comparison of superpixel characteristics based on SLIC(simple linear iterative clustering) for several color feature spaces is presented. Computer vision applications have come to rely increasingly on superpixels in recent years. Superpixel algorithms group pixels into perceptually meaningful atomic regions, which can be used to replace the rigid structure of the pixel grid. A superpixel is consist of pixels with similar features such as luminance, color, textures etc. Thus superpixels are more efficient than pixels in case of large scale image processing. Generally superpixel characteristics are described by uniformity, boundary precision and recall, compactness. However previous methods only generate superpixels a special color space but lack researches on superpixel characteristics. Therefore we present superpixel characteristics based on SLIC as known popular. In this paper, Lab, Luv, LCH, HSV, YIQ and RGB color feature spaces are used. Uniformity, compactness, boundary precision and recall are measured for comparing characteristics of superpixel. For computer simulation, Berkeley image database(BSD300) is used and Lab color space is superior to the others by the experimental results.

An Efficient Machine Learning-based Text Summarization in the Malayalam Language

  • P Haroon, Rosna;Gafur M, Abdul;Nisha U, Barakkath
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권6호
    • /
    • pp.1778-1799
    • /
    • 2022
  • Automatic text summarization is a procedure that packs enormous content into a more limited book that incorporates significant data. Malayalam is one of the toughest languages utilized in certain areas of India, most normally in Kerala and in Lakshadweep. Natural language processing in the Malayalam language is relatively low due to the complexity of the language as well as the scarcity of available resources. In this paper, a way is proposed to deal with the text summarization process in Malayalam documents by training a model based on the Support Vector Machine classification algorithm. Different features of the text are taken into account for training the machine so that the system can output the most important data from the input text. The classifier can classify the most important, important, average, and least significant sentences into separate classes and based on this, the machine will be able to create a summary of the input document. The user can select a compression ratio so that the system will output that much fraction of the summary. The model performance is measured by using different genres of Malayalam documents as well as documents from the same domain. The model is evaluated by considering content evaluation measures precision, recall, F score, and relative utility. Obtained precision and recall value shows that the model is trustable and found to be more relevant compared to the other summarizers.

Classification method for failure modes of RC columns based on key characteristic parameters

  • Yu, Bo;Yu, Zecheng;Li, Qiming;Li, Bing
    • Structural Engineering and Mechanics
    • /
    • 제84권1호
    • /
    • pp.1-16
    • /
    • 2022
  • An efficient and accurate classification method for failure modes of reinforced concrete (RC) columns was proposed based on key characteristic parameters. The weight coefficients of seven characteristic parameters for failure modes of RC columns were determined first based on the support vector machine-recursive feature elimination. Then key characteristic parameters for classifying flexure, flexure-shear and shear failure modes of RC columns were selected respectively. Subsequently, a support vector machine with key characteristic parameters (SVM-K) was proposed to classify three types of failure modes of RC columns. The optimal parameters of SVM-K were determined by using the ten-fold cross-validation and the grid-search algorithm based on 270 sets of available experimental data. Results indicate that the proposed SVM-K has high overall accuracy, recall and precision (e.g., accuracy>95%, recall>90%, precision>90%), which means that the proposed SVM-K has superior performance for classification of failure modes of RC columns. Based on the selected key characteristic parameters for different types of failure modes of RC columns, the accuracy of SVM-K is improved and the decision function of SVM-K is simplified by reducing the dimensions and number of support vectors.