• 제목/요약/키워드: features extraction

검색결과 1,467건 처리시간 0.025초

감정 분류를 위한 한국어 감정 자질 추출 기법과 감정 자질의 유용성 평가 (A Korean Emotion Features Extraction Method and Their Availability Evaluation for Sentiment Classification)

  • 황재원;고영중
    • 인지과학
    • /
    • 제19권4호
    • /
    • pp.499-517
    • /
    • 2008
  • 본 논문에서는 한국어 감정 분류에 기반이 되는 감정 자질 추출의 효과적인 추출 방법을 제안하고 평가하여, 그 유용성을 보인다. 한국어 감정 자질 추출은 감정을 지닌 대표적인 어휘로부터 시작하여 확장할 수 있으며, 이와 같이 추출된 감정 자질들은 문서의 감정을 분류하는데 중요한 역할을 한다. 문서 감정 분류에 핵심이 되는 감정 자질의 추출을 위해서는 영어 단어 시소러스 유의어 정보를 이용하여 자질들을 확장하고, 영한사전을 이용하여 확장된 자질들을 번역하여 감정 자질들을 추출하였다. 추출된 한국어 감정 자질들을 평가하기 위하여, 이진 분류 기법인 지지 벡터 기계(Support Vector Machine)를 사용해서 한국어 감정 자질로 표현된 입력문서의 감정을 분류하였다. 실험 결과, 추출된 감정 자질을 사용한 경우가 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 약 14.1%의 성능 향상을 보였다.

  • PDF

A Study of Facial Organs Classification System Based on Fusion of CNN Features and Haar-CNN Features

  • Hao, Biao;Lim, Hye-Youn;Kang, Dae-Seong
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.105-113
    • /
    • 2018
  • 본 논문에서는 사람 얼굴의 눈, 코, 입을 효과적으로 분류하는 방법을 제안한다. 최근 대부분의 이미지 분류는 CNN(Convolutional Neural Network)을 이용한다. 그러나 CNN으로 추출한 특징은 충분하지 않아 분류 효과가 낮은 경우가 있다. 분류 효과를 더 높이기 위해 새로운 알고리즘을 제안한다. 제안하는 방법은 크게 세 부분으로 나눌 수 있다. 첫 번째는 Haar 특징추출 알고리즘을 사용하여 얼굴의 눈, 코, 입 데이터?을 구성한다. 두번째는 CNN 구조 중 하나인 AlexNet을 사용하여 이미지의 CNN 특징을 추출한다. 마지막으로 Haar 특징 추출 뒤에 합성(Convolution) 연산을 수행하여 Haar-CNN 특징을 추출한다. 그 후 CNN 특징과 Haar-CNN을 혼합하여 Softmax를 이용해 분류한다. 혼합한 특징을 사용한 인식률은 기존의 CNN 특징 보다 약 4% 향상되었다. 실험을 통해 제안하는 방법의 성능을 증명하였다.

Hybrid Pattern Recognition Using a Combination of Different Features

  • Choi, Sang-Il
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권11호
    • /
    • pp.9-16
    • /
    • 2015
  • We propose a hybrid pattern recognition method that effectively combines two different features for improving data classification. We first extract the PCA (Principal Component Analysis) and LDA (Linear Discriminant Analysis) features, both of which are widely used in pattern recognition, to construct a set of basic features, and then evaluate the separability of each basic feature. According to the results of evaluation, we select only the basic features that contain a large amount of discriminative information for construction of the combined features. The experimental results for the various data sets in the UCI machine learning repository show that using the proposed combined features give better recognition rates than when solely using the PCA or LDA features.

언어 모델 기반 음성 특징 추출을 활용한 생성 음성 탐지 (Voice Synthesis Detection Using Language Model-Based Speech Feature Extraction)

  • 김승민;박소희;최대선
    • 정보보호학회논문지
    • /
    • 제34권3호
    • /
    • pp.439-449
    • /
    • 2024
  • 최근 음성 생성 기술의 급격한 발전으로, 텍스트만으로도 자연스러운 음성 합성이 가능해졌다. 이러한 발전은 타인의 음성을 생성하여 범죄에 이용하는 보이스피싱과 같은 악용 사례를 증가시키는 결과를 낳고 있다. 음성 생성 여부를 탐지하는 모델은 많이 개발되고 있으며, 일반적으로 음성의 특징을 추출하고 이러한 특징을 기반으로 음성 생성 여부를 탐지한다. 본 논문은 생성 음성으로 인한 악용 사례에 대응하기 위해 새로운 음성 특징 추출 모델을 제안한다. 오디오를 입력으로 받는 딥러닝 기반 오디오 코덱 모델과 사전 학습된 자연어 처리 모델인 BERT를 사용하여 새로운 음성 특징 추출 모델을 제안하였다. 본 논문이 제안한 음성 특징 추출 모델이 음성 탐지에 적합한지 확인하기 위해 추출된 특징을 활용하여 4가지 생성 음성 탐지 모델을 만들어 성능평가를 진행하였다. 성능 비교를 위해 기존 논문에서 제안한 Deepfeature 기반의 음성 탐지 모델 3개와 그 외 모델과 정확도 및 EER을 비교하였다. 제안한 모델은 88.08%로 기존 모델보다 높은 정확도와 11.79%의 낮은 EER을 보였다. 이를 통해 본 논문에서 제안한 음성 특징 추출 방법이 생성 음성과 실제 음성을 판별하는 효과적인 도구로 사용될 수 있음을 확인하였다.

고해상도 위성 영상데이터를 이용한 지형요소 추출에 관한 연구 (A Study on Feature Extraction Using High-Resolution Satellite Image Data)

  • 김상철;신석효;안기원;이건기;서두천
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2003년도 춘계학술발표회 논문집
    • /
    • pp.181-185
    • /
    • 2003
  • Recently, in accordance with supplying high-resolution satellite images which as IKONOS, KVR-1000, and Quick Bird, the use of satellite images have increased in the study which extraction of features from high-resolution satellite images is becoming a new research focus. In this study, using generally involves such as image segmentation, filtering and sobel operator and thinning in image processing for extraction of feature from satellite image. We apply this method to extraction of feature which need to the revision of map from high-resolution IKONOS satellite image data, we verified the capability of extraction of feature and application using satellite image and proposed a plan for the study in the future.

  • PDF

유방 종양 세포 조직 영상의 분류 (Classification of Breast Tumor Cell Tissue Section Images)

  • 황해길;최현주;윤혜경;남상희;최흥국
    • 융합신호처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.22-30
    • /
    • 2001
  • 본 논문은 유방질환 중에서 유관(duct )에 발생하는 유방종양을 Benign, DCIS(ductal carcinoma in situ) NOS (invasive ductal carcinoma)로 분류하기 위해 3가지 분류기 (classifier) 를 생성한 후, 비교 분석하였다. 분류기 생성에서 가장 중요한 단계인 특징 추출 단계에서 세포핵의 기하학적 특징을 형태학적 특징을 추출하여 분류기를 생성하고 염색질 패턴의 내부적 변화를 나타내는 질감 특징을 추출하여 2가지 배율(100/400배)에서 2개의 분류기를 생성하였다. 400배 배율의 유방질환 영상에서 세포핵을 추출하여 핵의 형태학적 특징값인 핵의 면적, 둘레. 가로, 세로(장. 단축) 의 길이, 원형성의 비율을 구한 후 이 특징값들을 조합하여 판별분석에 의해 분류기를 생생하고, 분류 정확도를 검증하였다. 100배 배율과 400배의 배율의 유방질환 영상에서 1, 2, 3, 4 단계(level)의 wavelet 변환를 적용한 후, 분할된 서브밴드에서 GLCM(Gray Level Co-occurrence Matrix)을 이용하여 질감 특징(entropy Energy, Contrast, Homogeneity)를 추출하고, 이 특징값들을 조합하여 판변 분석에 의해 분류기를 생성한 후 분류 정확도를 검증하였다. 이 세 분류기를 비교 분석 하였을때 현민경 100배 배율의 영상을 3단계 wavelet 변환을 적용하고 질감 특징을 추출하여 생성한 분류기가 다른 두 분류기보다 유방 질환 Benign, DCIS; NOS를 분류하는데 더 나은 결과를 보였다.

  • PDF

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

SVM을 이용한 유방 종양 조직 영상의 분류 (A Classification of Breast Tumor Tissue Images Using SVM)

  • 황해길;최현주;윤혜경;최흥국
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2005년도 추계학술대회 논문집
    • /
    • pp.178-181
    • /
    • 2005
  • Support vector machines is a powerful learning algorithm and attempt to separate belonging to two given sets in N-dimensional real space by a nonlinear surface, often only implicitly dened by a kernel function. We described breast tissue images analyses using texture features from Haar wavelet transformed images to classify breast lesion of ductal organ Benign, DCIS and CA. The approach for creating a classifier is composed of 2 steps: feature extraction and classification. Therefore, in the feature extraction step, we extracted texture features from wavelet transformed images with $10{\times}$ magnification. In the classification step, we created four classifiers from each image of extracted features using SVM(Support Vector Machines). In this study, we conclude that the best classifier in histological sections of breast tissue in the texture features from second-level wavelet transformed images used in Polynomial function.

  • PDF

Extracting of Features in Code Changes of Existing System for Reengineering to Product Line

  • Yoon, Seonghye;Park, Sooyong;Hwang, Mansoo
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.119-126
    • /
    • 2016
  • Software maintenance becomes extremely difficult, especially caused by multiple versions in project-based or customer-oriented software development methodology. For reducing the maintenance cost, reengineering to software product line can be a solution to the software which either is a family of products nevertheless little different functionalities or are customized for each different customer's requirement. At an initial stage of the reengineering, the most important activity in software product line is feature extraction with respect to commonality and variability from the existing system due to verifying functional coverage. Several researchers have studied to extract features. They considered only a single version in a single product. However, this is an obstacle to classify the commonality and variability of features. Therefore, we propose a method for systematically extracting features from source code and its change history considering several versions of the existing system. It enables us to represent functionalities reflecting developer's intention, and to clarify the rationale of variation.

개선된 스네이크를 이용한 얼굴 특징요소의 윤곽 추출 (Contour Extraction of Facial Features Based on the Enhanced Snake)

  • 이성수;장종환
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권8호
    • /
    • pp.309-314
    • /
    • 2015
  • 얼굴 요소의 윤곽을 추출하는 대표적인 방법 중의 하나는 스네이크다. 스네이크는 간단하고 빠르지만 초기 윤곽 및 개체 형태에 따라 성능이 결정된다. 본 논문에서는 이러한 문제를 해결하기 위해 스네이크 세그먼트의 중간 위치에 스네이크 포인트를 추가하는 방법으로 윤곽을 더 정확하게 추출할 수 있는 개선된 스네이크를 제안한다. 제안한 방법은 6개의 입과 눈 실험 영상에 적용하여 Greedy 스네이크보다 RSD가 2.8%에서 5.8% 정도 감소하였다. 특히 RSD 감소는 대부분 심한 굴곡이 갖는 윤곽 영역에서 얻음으로써 더 정확한 윤곽 추출을 실험을 통해 확인하였다.