• 제목/요약/키워드: Precision-recall

검색결과 716건 처리시간 0.025초

동적 연결 그래프를 이용한 자동 문서 요약 시스템 (A Document Summarization System Using Dynamic Connection Graph)

  • 송원문;김영진;김은주;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.62-69
    • /
    • 2009
  • 문서 요약은 쉽고 빠르게 문서의 내용을 파악할 수 있도록 방대한 내용을 가지는 다양한 형태의 문서로부터 핵심 내용만을 추출하거나 생성하여 제공하는 것을 목적으로 한다. 본 논문에서는 효율적 문서 요약을 위해 주어진 문서의 평균 문장 길이(핵심어 개수)를 고려하여 문장 간의 핵심어 유사도를 나타내는 연결 그래프를 생성하고 분석하여 요약을 생성하는 기법을 제안한다. 또한 이러한 기법을 이용하여 응용 프로그램 문서로부터 자동으로 요약을 생성하는 자동 문서 요약 시스템을 개발한다. 제안한 방법의 객관적인 요약 성능 측정을 위해 정확한 요약문이 실린 20개의 테스트 문서를 이용하여 생성된 요약에 대해 precision(정확률)과 recall(재현율), F-measure를 측정하였으며, 실험 결과를 통해 기존 기법에 비해 우수한 요약 성능을 보임을 증명하였다.

문제 은행에서 연상학습을 지원하는 퍼지 검색 시스템 (A Fuzzy Retrieval System to Facilitate Associated Learning in Problem Banks)

  • 최재훈;김지숙;조기환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.278-288
    • /
    • 2002
  • 본 논문에서는 사용자 질의가 가지는 특정한 의미로부터 개념적으로 서로 연관된 문제들을 문제 은행에서 검색해 줌으로써 학습자의 연상학습을 지원할 수 있는 퍼지 검색 시스템을 설계하고 구현하였다. 특히, 연상학습의 특성인 검색의 일정한 정확률과 높은 재현율을 유지하기 위해 이 검색 시스템은 퍼지 시소러스를 이용하였다. 여기서, 도메인 종속적인 개념들 사이의 관계를 퍼지 정도로 표현하는 시소러스는 질의에 기술된 탐색어와 문제를 대표하는 색인어 사이의 용어 불일치 문제를 해결해 줌으로써 연상학습에 적합한 검색 성능을 나타낼 수 있게 한다. 따라서, 본 논문에서는 퍼지 시소러스를 이용한 문제검색 시스템의 연상학습에 대한 적합성을 검색의 정확률과 재현율을 통해 평가하였다.

FusionScan: accurate prediction of fusion genes from RNA-Seq data

  • Kim, Pora;Jang, Ye Eun;Lee, Sanghyuk
    • Genomics & Informatics
    • /
    • 제17권3호
    • /
    • pp.26.1-26.12
    • /
    • 2019
  • Identification of fusion gene is of prominent importance in cancer research field because of their potential as carcinogenic drivers. RNA sequencing (RNA-Seq) data have been the most useful source for identification of fusion transcripts. Although a number of algorithms have been developed thus far, most programs produce too many false-positives, thus making experimental confirmation almost impossible. We still lack a reliable program that achieves high precision with reasonable recall rate. Here, we present FusionScan, a highly optimized tool for predicting fusion transcripts from RNA-Seq data. We specifically search for split reads composed of intact exons at the fusion boundaries. Using 269 known fusion cases as the reference, we have implemented various mapping and filtering strategies to remove false-positives without discarding genuine fusions. In the performance test using three cell line datasets with validated fusion cases (NCI-H660, K562, and MCF-7), FusionScan outperformed other existing programs by a considerable margin, achieving the precision and recall rates of 60% and 79%, respectively. Simulation test also demonstrated that FusionScan recovered most of true positives without producing an overwhelming number of false-positives regardless of sequencing depth and read length. The computation time was comparable to other leading tools. We also provide several curative means to help users investigate the details of fusion candidates easily. We believe that FusionScan would be a reliable, efficient and convenient program for detecting fusion transcripts that meet the requirements in the clinical and experimental community. FusionScan is freely available at http://fusionscan.ewha.ac.kr/.

로드뷰 영상에서 번호판 영역의 저해상도 특징을 이용한 원거리 자동차 번호판 영역 검출 (Long Distance Vehicle License Plate Region Detection Using Low Resolution Feature of License Plate Region in Road View Images)

  • 오명관;박종천
    • 디지털융복합연구
    • /
    • 제15권1호
    • /
    • pp.239-245
    • /
    • 2017
  • 본 논문은 포털 사이트에서 서비스 되고 있는 로드뷰 영상에서 개인정보 보호를 위해 자동차 번호판 영역을 검출하는 방법을 제안한다. 로드뷰 영상에서 번호판 영역은 거리에 따라 서로 다른 특징을 갖고 있으며, 특히 원거리의 번호판 영역은 저해상도 특징으로 인해 번호판 영역을 검출하는데 어려움이 있다. 따라서 본 연구에서는 근거리에 있는 번호판 영역은 에지 특징을 이용하고 원거리에 있는 번호판 영역은 MSER 특징을 이용하여 번호판 영역을 검출하는 기법을 제안하였다. 각각의 방법으로 검출된 영역을 번호판 후보 영역으로 선정하고, 자동차 번호판의 숫자는 구조적 특징을 갖기 때문에 이를 이용하여 최종적인 번호판 영역을 검출하였다. 실험결과, 다양한 로드뷰 영상에서 precision 75%, recall 93%, 그리고 F-Score 80%의 성능평가 결과를 얻었다.

신경망을 이용한 자막 크기에 무관한 연결 객체 기반의 자막 추출 (Connected Component-Based and Size-Independent Caption Extraction with Neural Networks)

  • 정제희;윤태복;김동문;이지형
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.924-929
    • /
    • 2007
  • 영상에 나타나는 자막은 영상과 관계가 있는 정보를 포함한다. 이러한 영상과 관련 있는 정보를 이용하기 위해 영상으로부터 자막을 추출하는 연구는 근래에 들어 활발히 진행되고 있다. 기존의 연구는 일정한 높이의 자막이나 획의 두께를 지닌 자막에서만 정상적인 작동을 한다. 본 논문에서는 일정 크기 이상의 자막에 대해서 적용할 수 있는 크기에 무관한 자막 추출 방법을 제안한다. 먼저, 자막 연결 객체의 패턴 추출을 위해서 자막이 포함된 영상을 수집하고, 신경망을 이용해서 자막의 패턴을 분석한다. 그 후로는 사전에 추출한 패턴을 이용하여 입력 영상에서 자막을 추출한다. 실험에 사용된 영상은 뉴스, 다큐멘터리, 쇼 프로그램과 같은 대중 방송에서 수집하였다. 실험 결과는 다양한 크기의 자막을 포함한 영상을 사용하여 실험하였고, 자막 추출의 결과는 찾아진 연결객체 중에 자막의 비율과 자막 중에 찾아진 자막의 비율로 분석하였다. 실험 결과를 보면 제안한 방법에 의해 다양한 크기의 자막을 추출할 수 있음을 보여준다.

신경회로망 제어기와 동적 베이시안 네트워크를 이용한 시변 및 비정치 확률시스템의 제어 (Control of Time-varying and Nonstationary Stochastic Systems using a Neural Network Controller and Dynamic Bayesian Network Modeling)

  • 조현철;이진우;이영진;이권순
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.930-938
    • /
    • 2007
  • 영상에 나타나는 자막은 영상과 관계가 있는 정보를 포함한다. 이러한 영상과 관련 있는 정보를 이용하기 위해 영상으로부터 자막을 추출하는 연구는 근래에 들어 활발히 진행되고 있다. 기존의 연구는 일정한 높이의 자막이나 획의 두께를 지닌 자막에서만 정상적인 작동을 한다. 본 논문에서는 일정 크기 이상의 자막에 대해서 적용할 수 있는 크기에 무관한 자막 추출 방법을 제안한다. 먼저, 자막 연결 객체의 패턴 추출을 위해서 자막이 포함된 영상을 수집하고, 신경망을 이용해서 자막의 패턴을 분석한다. 그 후로는 사전에 추출한 패턴을 이용하여 입력 영상에서 자막을 추출한다. 실험에 사용된 영상은 뉴스, 다큐멘터리, 쇼 프로그램과 같은 대중 방송에서 수집하였다. 실험 결과는 다양한 크기의 자막을 포함한 영상을 사용하여 실험하였고, 자막 추출의 결과는 찾아진 연결객체 중에 자막의 비율과 자막 중에 찾아진 자막의 비율로 분석하였다. 실험 결과를 보면 제안한 방법에 의해 다양한 크기의 자막을 추출할 수 있음을 보여준다.

한글 형태소 및 키워드 분석에 기반한 웹 문서 분류 (Web Document Classification Based on Hangeul Morpheme and Keyword Analyses)

  • 박단호;최원식;김홍조;이석룡
    • 정보처리학회논문지D
    • /
    • 제19D권4호
    • /
    • pp.263-270
    • /
    • 2012
  • 최근 초고속 인터넷과 대용량 데이터베이스 기술의 발전으로 웹 문서의 양이 크게 증가하였으며, 이를 효과적으로 관리하기 위하여 문서의 주제별 자동 분류가 중요한 문제로 대두되고 있다. 본 연구에서는 한글 형태소 및 키워드 분석에 기초한 문서 특성 추출 방법을 제안하고, 이를 이용하여 웹 문서와 같은 비구조적 문서의 주제를 예측하여 문서를 자동으로 분류하는 방법을 제시한다. 먼저, 문서 특성 추출을 위하여 한글 형태소 분석기를 사용하여 용어를 선별하고, 각 용어의 빈도와 주제 분별력을 기초로 주제 분별 용어인 키워드 집합을 생성한 후, 각 키워드에 대하여 주제 분별력에 따라 점수화한다. 다음으로, 추출된 문서 특성을 기초로 상용 소프트웨어를 사용하여 의사 결정 트리, 신경망 및 SVM의 세 가지 분류 모델을 생성하였다. 실험 결과, 제안한 특성 추출 방법을 이용한 문서 분류는 의사 결정 트리 모델의 경우 평균 Precision 0.90 및 Recall 0.84 로 상당한 정도의 분류 성능을 보여 주었다.

개선된 k-means 알고리즘을 적용한 사용자 특성 선호도 추천 시스템 (User's Individuality Preference Recommendation System using Improved k-means Algorithm)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권8호
    • /
    • pp.141-148
    • /
    • 2010
  • 모바일 단말기에서 사용자의 상황을 고려하고 사용자의 취향이나 특성을 반영하여 정보를 찾아주거나 추천하는 서비스 시스템은 개념적인 정보만을 제한적으로 추천한다. 또한 사용자의 특성에 따른 정보 선호도를 제공하지 않으므로 정확한 정보 추천의 어려운 단점이 있다. 따라서 본 논문에서는 사용자 특성에 따른 선호도를 고려하여 정확한 상황 정보를 추천 할 수 있는 개선된 k-means 알고리즘을 적용하여 사용자 특성에 따른 선호도 추천 시스템을 제안하였다. 본 연구에서는 사용자 특성에 따른 선호도를 상관 계수를 이용하여 구하고 사용자의 특성 선호도를 개선된 k-means 알고리즘을 이용하여 추천하였다. 제한적인 개념의 정보만을 제공하던 시스템에서 사용자의 특성에 따른 정보 선호도를 제공하여 정확한 정보를 추천하므로 제한된 정보 추천의 단점을 해결하였다. 성능 실험은 기존의 서비스 시스템들과 비교하여 정확도와 재현율로 대변되는 효과성을 측정하였으며, 성능 실험 결과 정확도는 85%, 재현율은 68%로 나타났다.

사이드 스캔 소나 영상에서 수중물체 자동 탐지를 위한 컨볼루션 신경망 기법 적용 (The application of convolutional neural networks for automatic detection of underwater object in side scan sonar images)

  • 김정문;최지웅;권혁종;오래근;손수욱
    • 한국음향학회지
    • /
    • 제37권2호
    • /
    • pp.118-128
    • /
    • 2018
  • 본 논문은 사이드 스캔 소나 영상을 컨볼루션 신경망으로 학습하여 수중물체를 탐색하는 방법을 다루었다. 사이드 스캔 소나 영상을 사람이 직접 분석하던 방법에서 컨볼루션 신경망 알고리즘이 보강되면 분석의 효율성을 높일 수 있다. 연구에 사용한 사이드 스캔 소나의 영상 데이터는 미 해군 수상전센터에서 공개한 자료이고 4종류의 합성수중물체로 구성되었다. 컨볼루션 신경망 알고리즘은 관심영역 기반으로 학습하는 Faster R-CNN(Region based Convolutional Neural Networks)을 기본으로 하며 신경망의 세부사항을 보유한 데이터에 적합하도록 구성하였다. 연구의 결과를 정밀도-재현율 곡선으로 비교하였고 소나 영상 데이터에 지정한 관심영역의 변경이 탐지성능에 미치는 영향을 검토함으로써 컨볼루션 신경망의 수중물체 탐지 적용성에 대해 살펴보았다.

대역별 웨이블릿 계수특성을 이용한 장면전환점 검출기법 (Cut Detection Algorithm Using the Characteristic Of Wavelet Coefficients in Each Subband)

  • 문영호;노정진;유지상
    • 한국통신학회논문지
    • /
    • 제29권10C호
    • /
    • pp.1414-1424
    • /
    • 2004
  • 본 논문에서는 동영상의 장면전환점 중 급진적인 장면전환점인 컷(cut)과 점진적인 장면전환점인 페이드(fade)와 디졸브(dissolve) 구간을 웨이블릿 변환영역에서 검출하는 알고리즘을 제안한다. 웨이블렷 변환을 이용한 기존의 연구들은 공간영역과 변환영역 각각의 특징을 이용하여 장면전환점을 검출한다. 그러나 본 논문은 입력된 컬러영상을 먼저 YW 공간으로 변환하고, Y 성분에 대해 리프팅기법을 적용하여 2 레벨 웨이블릿 변환 후, 변환영역에서 공간영역의 특징이 유지되는 저주파 부대역을 히스토그램 비교하고, 나머지 고주파 부대역에서 추출된 에지 정보를 전체(global), 부분(semi-global), 국부(local) 영역으로 정의하여 웨이블릿 에지 히스토그램 비교를 한다. 모의실험 결과 기존의 방법보다 recall에서는 약 17%, precision에서는 약 18%의 성능향상을 보였으며 점진적인 장면 전환점인 페이드와 디졸브 구간 검출에도 좋은 성능을 나타내었다.