• 제목/요약/키워드: Feature Classification

검색결과 2,155건 처리시간 0.032초

특징, 색상 및 텍스처 정보의 가공을 이용한 Bag of Visual Words 이미지 자동 분류 (Improved Bag of Visual Words Image Classification Using the Process of Feature, Color and Texture Information)

  • 박찬혁;권혁신;강석훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.79-82
    • /
    • 2015
  • 이미지를 분류하고 검색하는 기술(Image retrieval)중 하나인 Bag of visual words(BoVW)는 특징점(feature point)을 이용하는 방법으로 데이터베이스의 이미지 특징벡터들의 분포를 통해 쿼리 이미지를 자동으로 분류하고 검색해주는 시스템이다. Words를 구성하는데 특징벡터만을 이용하는 기존의 방법은 이용자가 원하지 않는 이미지를 검색하거나 분류할 수 있다. 이러한 단점을 해결하기 위해 특징벡터뿐만 아니라 이미지의 전체적인 분위기를 표현할 수 있는 색상정보나 반복되는 패턴 정보를 표현할 수 있는 텍스처 정보를 Words를 구성하는데 포함시킴으로서 다양한 검색을 가능하게 한다. 실험 부분에서는 특징정보만을 가진 words를 이용해 이미지를 분류한 결과와 색상정보와 텍스처 정보가 추가된 words를 가지고 이미지를 분류한 결과를 비교하였고 새로운 방법은 80~90%의 정확도를 나타내었다.

  • PDF

명암도 분포 및 형태 분석을 이용한 효과적인 TFT-LCD 필름 결함 영상 분류 기법 (An effective classification method for TFT-LCD film defect images using intensity distribution and shape analysis)

  • 노충호;이석룡;조문신
    • 한국멀티미디어학회논문지
    • /
    • 제13권8호
    • /
    • pp.1115-1127
    • /
    • 2010
  • TFT-LCD 생산 과정에서 발생하는 결함을 정확하게 분류하여 결함 유형에 따라 폐기, 사용가능 등의 의사결정을 적절하게 내리는 것은 수율 증가 및 생산성 향상에 필수적인 요소이다. 본 논문에서는 TFT-LCD 생산 라인에서 획득한 결함 영상에 대하여 명암도 분포(intensity distribution) 및 결함 영상의 형태 특징(shape feature)을 분석하여 효과적으로 필름 결함 유형을 분류하는 기법을 제시한다. 본 연구에서는 먼저 필름 결함 영상을 결함 영역과 결함이 아닌 배경 영역으로 이진화하고, 결함 영역에서 결함의 선형성(linearity), 명암도 분포를 고려한 형태 특징 등의 여러 가지 특징을 분석하여 기준 영상(referential image) 데이터베이스를 구축하였으며, 분류하고자 하는 결함 영상과 데이터베이스에 저장된 기준 영상과의 매칭 비용 함수(matching cost function)를 정의하여 적절히 매칭시킴으로써 결함의 유형을 결정하였다. 제시한 기법의 성능을 검증하기 위하여 실제 TFT-LCD 생산 라인에서 획득한 결함 영상들을 대상으로 분류 실험을 수행하였으며, 실험 결과 생산 라인에서 이용할 수 있을 정도의 상당한 수준의 분류 정확도를 달성하였음을 보여주었다.

지지벡터기계와 적응적 특징을 이용한 강인한 지문분류 (A Robust Fingerprint Classification using SVMs with Adaptive Features)

  • 민준기;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권1호
    • /
    • pp.41-49
    • /
    • 2008
  • 지문분류는 지문을 전역특징에 따라 미리 정의된 클래스로 분류하여 대규모 지문식별시스템의 매칭시간을 감소시키는데 유용하다. 그런데, 지문의 고유성으로 인해 전역특징이 다양하게 분포함에도 불구하고, 기존의 지문분류 방법들은 모든 지문에 대해 고정된 영역으로부터 비적응적으로 전역특징을 추출하였다. 본 논문에서는 다양한 지문을 효과적으로 분류하기 위해 각 지문에 적응적으로 특징을 추출하는 방법을 제안한다. 이는 각 지문의 융선 방향의 변화량을 계산하여 적응적으로 특징영역을 탐색한 후, 특징영역내의 융선 방향 값을 특징벡터로 추출하고 지지벡터기계(Support Vector Machines)를 이용해 분류한다. 본 논문에서는 NIST4 데이타베이스를 이용하여 실험을 수행하였다. 그 결과 5클래스 분류에 대해 90.3%, 4클래스 분류에 대해 93.7%의 분류성능을 얻었으며, 비적응적으로 추출한 특징벡터와의 비교실험을 통해 제안하는 적응적 특징추출방법의 유용성을 입증하였다.

A Novel Two-Stage Training Method for Unbiased Scene Graph Generation via Distribution Alignment

  • Dongdong Jia;Meili Zhou;Wei WEI;Dong Wang;Zongwen Bai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권12호
    • /
    • pp.3383-3397
    • /
    • 2023
  • Scene graphs serve as semantic abstractions of images and play a crucial role in enhancing visual comprehension and reasoning. However, the performance of Scene Graph Generation is often compromised when working with biased data in real-world situations. While many existing systems focus on a single stage of learning for both feature extraction and classification, some employ Class-Balancing strategies, such as Re-weighting, Data Resampling, and Transfer Learning from head to tail. In this paper, we propose a novel approach that decouples the feature extraction and classification phases of the scene graph generation process. For feature extraction, we leverage a transformer-based architecture and design an adaptive calibration function specifically for predicate classification. This function enables us to dynamically adjust the classification scores for each predicate category. Additionally, we introduce a Distribution Alignment technique that effectively balances the class distribution after the feature extraction phase reaches a stable state, thereby facilitating the retraining of the classification head. Importantly, our Distribution Alignment strategy is model-independent and does not require additional supervision, making it applicable to a wide range of SGG models. Using the scene graph diagnostic toolkit on Visual Genome and several popular models, we achieved significant improvements over the previous state-of-the-art methods with our model. Compared to the TDE model, our model improved mR@100 by 70.5% for PredCls, by 84.0% for SGCls, and by 97.6% for SGDet tasks.

SVM음성인식기 구현을 위한 강인한 특징 파라메터 (Robust Feature Parameter for Implementation of Speech Recognizer Using Support Vector Machines)

  • 김창근;박정원;허강인
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.195-200
    • /
    • 2004
  • 본 논문은 두 가지 비교 실험을 통하여 효과적 음성인식 시스템을 제안한다. 분별적 이진 패턴 분류기인 SVM(Support Vector Machines)은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 적은 학습 데이터에서도 좋은 분류 성능을 나타낸다고 알려져 있다. 본 논문에서는 학습데이터 수에 따른 HMM(Hidden Markov Model)과 SVM의 인식 성능을 비교하고, 최적의 특징 파라메터를 선택하기 위해 SVM을 이용하여 주성분해석과 독립성분분석을 적용하여 MFCC(Mel Frequency Cepstrum Coefficient)의 특징 공간을 변화시키면서 각각의 인식 성능을 비교 검토하였다. 실험 결과 SVM은 HMM에 비해 적은 학습데이터에서도 높은 인식 성능을 보여주었고, 독립성분분석에 의한 특징 파라메터가 특징 공간상에서의 높은 선형 분별성에 의해 다른 특징 파라메터보다 인식 성능에서 우수함을 확인 할 수 있었다.

회색도 변환 행렬 특징과 SVM을 이용한 흑색종 분류 알고리즘 (Melanoma Classification Algorithm using Gray-level Conversion Matrix Feature and Support Vector Machine)

  • 구정모;나승대;조진호;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제21권2호
    • /
    • pp.130-137
    • /
    • 2018
  • Recently, human life is getting longer due to change of living environment and development of medical technology, and silver medical technology has been in the limelight. Geriatric skin disease is difficult to detect early, and when it is missed, it becomes a malignant disease and is difficult to treatment. Melanoma is one of the most common diseases of geriatric skin disease and initially has a similar modality with the nevus. In order to overcome this problem, we attempted to perform a feature analysis in order to attempt automatic detection of melanoma-like lesions. In this paper, one is first order analysis using information of pixels in radiomic feature. The other is a gray-level co-occurrence matrix and a gray level run length matrix, which are feature extraction methods for converting image information into a matrix. The features were extracted through these analyses. And classification is implemented by SVM.

웨이브렛 영역에서의 질감 유사성을 이용한 차량검지 및 차종분류 (Vehicle Detection and Classification Using Textural Similarity in Wavelet Domain)

  • 임채환;박종선;이창섭;김남철
    • 한국통신학회논문지
    • /
    • 제24권6B호
    • /
    • pp.1191-1202
    • /
    • 1999
  • 본 논문에서는 간단히 한국통신학회본 논문에서는 웨이브렛 영역에서의 질감 유사성을 특징으로 사용함으로써 프레임간의 급격한 밝기변화에 강건한 특성을 가지는 툴게이트 과금을 위한 차량검지 및 차종분류 알고리듬을 제안하였다. 질감의 유사성을 나타내는 특징으로는 웨이브렛 변환된 입력영상과 배경영상 간의 국부상관계수를 이용하였다. 기존의 차량검지에서 사용되었던 특징인 차영상에 대한 분산과 비교하여 제안된 특징의 유용성을 정상적으로 분석하였으며, 실제 테스트 영상에 대하여 차량과 그림자가 관측되거나 관측되지 않는 도로와의 구분 용이성 정도를 측정함으로써 제안된 특징의 우수성을 보인다. 현장 테스트에 대한 실험 결과는 제안된 차량검지 및 차종분류 알고리듬이 센서의 특성과 그림자의 발생에 의한 프레임 간의 급격한 밝기 변화와 같은 상황하에서도 매우 안정적이며 우수한 성능을 보이는 것을 확인할 수 있다.

  • PDF

Robust Facial Expression Recognition Based on Local Directional Pattern

  • Jabid, Taskeed;Kabir, Md. Hasanul;Chae, Oksam
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.784-794
    • /
    • 2010
  • Automatic facial expression recognition has many potential applications in different areas of human computer interaction. However, they are not yet fully realized due to the lack of an effective facial feature descriptor. In this paper, we present a new appearance-based feature descriptor, the local directional pattern (LDP), to represent facial geometry and analyze its performance in expression recognition. An LDP feature is obtained by computing the edge response values in 8 directions at each pixel and encoding them into an 8 bit binary number using the relative strength of these edge responses. The LDP descriptor, a distribution of LDP codes within an image or image patch, is used to describe each expression image. The effectiveness of dimensionality reduction techniques, such as principal component analysis and AdaBoost, is also analyzed in terms of computational cost saving and classification accuracy. Two well-known machine learning methods, template matching and support vector machine, are used for classification using the Cohn-Kanade and Japanese female facial expression databases. Better classification accuracy shows the superiority of LDP descriptor against other appearance-based feature descriptors.

Framework for Content-Based Image Identification with Standardized Multiview Features

  • Das, Rik;Thepade, Sudeep;Ghosh, Saurav
    • ETRI Journal
    • /
    • 제38권1호
    • /
    • pp.174-184
    • /
    • 2016
  • Information identification with image data by means of low-level visual features has evolved as a challenging research domain. Conventional text-based mapping of image data has been gradually replaced by content-based techniques of image identification. Feature extraction from image content plays a crucial role in facilitating content-based detection processes. In this paper, the authors have proposed four different techniques for multiview feature extraction from images. The efficiency of extracted feature vectors for content-based image classification and retrieval is evaluated by means of fusion-based and data standardization-based techniques. It is observed that the latter surpasses the former. The proposed methods outclass state-of-the-art techniques for content-based image identification and show an average increase in precision of 17.71% and 22.78% for classification and retrieval, respectively. Three public datasets - Wang; Oliva and Torralba (OT-Scene); and Corel - are used for verification purposes. The research findings are statistically validated by conducting a paired t-test.

심층학습 기법을 활용한 효과적인 타이어 마모도 분류 및 손상 부위 검출 알고리즘 (Efficient Tire Wear and Defect Detection Algorithm Based on Deep Learning)

  • 박혜진;이영운;김병규
    • 한국멀티미디어학회논문지
    • /
    • 제24권8호
    • /
    • pp.1026-1034
    • /
    • 2021
  • Tire wear and defect are important factors for safe driving condition. These defects are generally inspected by some specialized experts or very expensive equipments such as stereo depth camera and depth gauge. In this paper, we propose tire safety vision inspector based on deep neural network (DNN). The status of tire wear is categorized into three: 'safety', 'warning', and 'danger' based on depth of tire tread. We propose an attention mechanism for emphasizing the feature of tread area. The attention-based feature is concatenated to output feature maps of the last convolution layer of ResNet-101 to extract more robust feature. Through experiments, the proposed tire wear classification model improves 1.8% of accuracy compared to the existing ResNet-101 model. For detecting the tire defections, the developed tire defect detection model shows up-to 91% of accuracy using the Mask R-CNN model. From these results, we can see that the suggested models are useful for checking on the safety condition of working tire in real environment.