• 제목/요약/키워드: classification model

검색결과 4,101건 처리시간 0.027초

Doc2Vec과 Word2Vec을 활용한 Convolutional Neural Network 기반 한국어 신문 기사 분류 (Categorization of Korean News Articles Based on Convolutional Neural Network Using Doc2Vec and Word2Vec)

  • 김도우;구명완
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.742-747
    • /
    • 2017
  • 본 논문에서는 문장의 분류에 있어 성능이 입증된 word2vec을 활용한 Convolutional Neural Network(CNN) 모델을 기반으로 하여 문서 분류에 적용 시 성능을 향상시키기 위해 doc2vec을 함께 CNN에 적용하고 기반 모델의 구조를 개선한 문서 분류 방안을 제안한다. 먼저 토큰화 방법을 선정하기 위한 초보적인 실험을 통하여, 어절 단위, 형태소 분석, Word Piece Model(WPM) 적용의 3가지 방법 중 WPM이 분류율 79.5%를 산출하여 문서 분류에 유용함을 실증적으로 확인하였다. 다음으로 WPM을 활용하여 생성한 단어 및 문서의 벡터 표현을 기반 모델과 제안 모델에 입력하여 범주 10개의 한국어 신문 기사 분류에 적용한 실험을 수행하였다. 실험 결과, 제안 모델이 분류율 89.88%를 산출하여 기반 모델의 분류율 86.89%보다 2.99% 향상되고 22.80%의 개선 효과를 보였다. 본 연구를 통하여, doc2vec이 동일한 범주에 속한 문서들에 대하여 유사한 문서 벡터 표현을 생성하기 때문에 문서의 분류에 doc2vec을 함께 활용하는 것이 효과적임을 검증하였다.

음향 장면 분류를 위한 경량화 모형 연구 (Light weight architecture for acoustic scene classification)

  • 임소영;곽일엽
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.979-993
    • /
    • 2021
  • 음향 장면 분류는 오디오 파일이 녹음된 환경이 어디인지 분류하는 문제이다. 이는 음향 장면 분류와 관련한 대회인 DCASE 대회에서 꾸준하게 연구되었던 분야이다. 실제 응용 분야에 음향 장면 분류 문제를 적용할 때, 모델의 복잡도를 고려하여야 한다. 특히 경량 기기에 적용하기 위해서는 경량 딥러닝 모델이 필요하다. 우리는 경량 기술이 적용된 여러 모델을 비교하였다. 먼저 log mel-spectrogram, deltas, delta-deltas 피쳐를 사용한 합성곱 신경망(CNN) 기반의 기본 모델을 제안하였다. 그리고 원래의 합성곱 층을 depthwise separable convolution block, linear bottleneck inverted residual block과 같은 효율적인 합성곱 블록으로 대체하고, 각 모델에 대하여 Quantization를 적용하여 경량 모델을 제안하였다. 경량화 기술을 고려한 모델은 기본 모델에 대비하여 성능이 비슷하거나 조금 낮은 성능을 보였지만, 모델 사이즈는 503KB에서 42.76KB로 작아진 것을 확인하였다.

딥러닝 모델 기반 위성영상 데이터세트 공간 해상도에 따른 수종분류 정확도 평가 (The Accuracy Assessment of Species Classification according to Spatial Resolution of Satellite Image Dataset Based on Deep Learning Model)

  • 박정묵;심우담;김경민;임중빈;이정수
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1407-1422
    • /
    • 2022
  • 본 연구는 분류(classification)기반 딥러닝 모델(deep learning model)인 Inception과 SENet을 결합한 SE-Inception을 활용하여 수종분류를 수행하고 분류정확도를 평가하였다. 데이터세트의 입력 이미지는 Worldview-3와 GeoEye-1 영상을 활용하였으며, 입력 이미지의 크기는 10 × 10 m, 30 × 30 m, 50 × 50 m로 분할하여 수종 분류정확도를 비교·평가하였다. 라벨(label)자료는 분할된 영상을 시각적으로 해석하여 5개의 수종(소나무, 잣나무, 낙엽송, 전나무, 참나무류)으로 구분한 후, 수동으로 라벨링 작업을 수행하였다. 데이터세트는 총 2,429개의 이미지를 구축하였으며, 그중약 85%는 학습자료로, 약 15%는 검증자료로 활용하였다. 딥러닝 모델을 활용한 수종분류 결과, Worldview-3 영상을 활용하였을 때 최대 약 78%의 전체 정확도를 달성하였으며, GeoEye-1영상을 활용할 때 최대 약 84%의 정확도를 보여 수종분류에 우수한 성능을 보였다. 특히, 참나무류는 입력 이미지크기에 관계없이 F1은 약 85% 이상의 높은 정확도를 보였으나, 소나무, 잣나무와 같이 분광특성이 유사한 수종은 오분류가 다수 발생하였다. 특정 수종에서 위성영상의 분광정보 만으로는 특징량 추출에 한계가 있을 수 있으며, 식생지수, Gray-Level Co-occurrence Matrix (GLCM) 등 다양한 패턴정보가 포함된 이미지를 활용한다면 분류 정확도를 개선할 수 있을 것으로 판단된다.

콘관입시험결과를 이용한 새로운 흙분류 방법의 개발 (New Soil Classification System Using Cone Penetration Test)

  • 김찬홍;임종철;김영상;주노아
    • 한국지반공학회논문집
    • /
    • 제24권10호
    • /
    • pp.57-70
    • /
    • 2008
  • 피에조콘 관입시험의 장점은 연속적인 데이터의 취득이 보장되며 결국 대상지반의 신뢰성 있는 분석이 가능하다는 점이다. 따라서 지난 수십년간 국내외에서 콘 관입시험결과로부터 흙분류를 수행하는 많은 연구가 진행되었으며 차트나 도표 등의 형태로 흙분류 방법들이 제안되었다. 그러나 대부분의 차트 또는 방법들은 한국을 제외한 세계 각국의 자료들을 바탕으로 제안되어 국내 지반의 적용성에 대한 검증이 이루어져야 한다. 뿐만 아니라 기존 방법들에서는 사용된 입력자료에 따라 흙분류 결과가 상이한 경우가 있어 적용과 판단에 어려움이 있다. 그러나 불행히도 이러한 차트 형태로 제안된 기존 도표의 경우 지역성 등이 반영되어 수정 또는 보완이 필요하나 수정에 어려움이 있거나 거의 불가능하다. 이에 본 연구에서는 국내 17개 현장에서 수행된 피에조콘 관입시험결과와 채취된 시료에 대한 주상도 및 흙분류결과를 바탕으로 클러스터링 기법과 뉴로-퍼지 이론을 이용한 흙분류 모델을 제안하였다. 제안된 모델을 검증하기 위해 모델 학습 시 사용되지 않는 새로운 피에조콘 관입시험 데이터에 대한 흙분류 결과를 실제 시추결과와 비교하였다. 또한 기존의 소프트컴퓨팅 모델과 Robertson 방법에 의한 흙분류 결과와 제안된 모델의 흙분류 결과를 비교하여 제안된 모델의 효율성을 검토하였다.

A Study on BMS by BDS for Distribution-Business: Business Model System by Buyer's Decision Step

  • Lim, Heon-Wook;Seo, Dae-Sung
    • 유통과학연구
    • /
    • 제17권4호
    • /
    • pp.27-32
    • /
    • 2019
  • Purpose - The business model is a method of creating corporate value, in existing "classification of business model", limitations and redundancy phenomena are applied when a new type flows in, and as consumer's purchasing decision of consumer behavior 5 steps. The classification schemes can be used for more accurate data analysis by proposing a new mapping technique in the fourth industry. Research design, data, and methodology - It was far more classified on the business model (BMS by BDS), and so on. Designing the new horizons of logistics, marketing, methodology by reclassifying these existing data to new useful data with the old methods, in order to analyze the areas where the problem has been raised for the point that the existing methods are not suitable configured. This will be applicable to the system of quaternary industry from the perspective of the buyer. Results - The mapping results of the consumer purchase decision were as follows,the 1st stage (interest) was 23.73%, 2nd stages (publicity) 33.90%, 3rd stages (sales) 13.56%, 4th stages (decision) 11.86%, 5th stages (repurchaser) 16.95%. This verified that "the business model can be classified through "BMS by BDS". Conclusions - This structural classification is the basis of logistics marketing in the 4th industry, and proposes a innovative and effective model of constructing theory.

Learning-Based Multiple Pooling Fusion in Multi-View Convolutional Neural Network for 3D Model Classification and Retrieval

  • Zeng, Hui;Wang, Qi;Li, Chen;Song, Wei
    • Journal of Information Processing Systems
    • /
    • 제15권5호
    • /
    • pp.1179-1191
    • /
    • 2019
  • We design an ingenious view-pooling method named learning-based multiple pooling fusion (LMPF), and apply it to multi-view convolutional neural network (MVCNN) for 3D model classification or retrieval. By this means, multi-view feature maps projected from a 3D model can be compiled as a simple and effective feature descriptor. The LMPF method fuses the max pooling method and the mean pooling method by learning a set of optimal weights. Compared with the hand-crafted approaches such as max pooling and mean pooling, the LMPF method can decrease the information loss effectively because of its "learning" ability. Experiments on ModelNet40 dataset and McGill dataset are presented and the results verify that LMPF can outperform those previous methods to a great extent.

A model-free soft classification with a functional predictor

  • Lee, Eugene;Shin, Seung Jun
    • Communications for Statistical Applications and Methods
    • /
    • 제26권6호
    • /
    • pp.635-644
    • /
    • 2019
  • Class probability is a fundamental target in classification that contains complete classification information. In this article, we propose a class probability estimation method when the predictor is functional. Motivated by Wang et al. (Biometrika, 95, 149-167, 2007), our estimator is obtained by training a sequence of functional weighted support vector machines (FWSVM) with different weights, which can be justified by the Fisher consistency of the hinge loss. The proposed method can be extended to multiclass classification via pairwise coupling proposed by Wu et al. (Journal of Machine Learning Research, 5, 975-1005, 2004). The use of FWSVM makes our method model-free as well as computationally efficient due to the piecewise linearity of the FWSVM solutions as functions of the weight. Numerical investigation to both synthetic and real data show the advantageous performance of the proposed method.

AN ANOMALY DETECTION METHOD BY ASSOCIATIVE CLASSIFICATION

  • Lee, Bum-Ju;Lee, Heon-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.301-304
    • /
    • 2005
  • For detecting an intrusion based on the anomaly of a user's activities, previous works are concentrated on statistical techniques or frequent episode mining in order to analyze an audit data. But, since they mainly analyze the average behaviour of user's activities, some anomalies can be detected inaccurately. Therefore, we propose an anomaly detection method that utilizes an associative classification for modelling intrusion detection. Finally, we proof that a prediction model built from associative classification method yields better accuracy than a prediction model built from a traditional methods by experimental results.

  • PDF

뇌파 분류에 유용한 주성분 특징 (On Useful Principal Component Features for EEG Classification)

  • Park, Sungcheol;Lee, Hyekyoung;Park, Seungjin
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.178-180
    • /
    • 2003
  • EEG-based brain computer interface(BCI) provides a new communication channel between human brain and computer. EEG data is a multivariate time series so that hidden Markov model (HMM) might be a good choice for classification. However EEG is very noisy data and contains artifacts, so useful features mr expected to improve the performance of HMM. In this paper we addresses the usefulness of principal component features with Hidden Markov model (HHM). We show that some selected principal component features can suppress small noises and artifacts, hence improves classification performance. Experimental study for the classification of EEG data during imagination of a left, right up or down hand movement confirms the validity of our proposed method.

  • PDF

문서 범주화를 이용한 지식관리시스템에서의 전문가 분류 자동화 (Automation of Expert Classification in Knowledge Management Systems Using Text Categorization Technique)

  • 양근우;허순영
    • Asia pacific journal of information systems
    • /
    • 제14권2호
    • /
    • pp.115-130
    • /
    • 2004
  • This paper proposes how to build an expert profile database in KMS, which provides the information of expertise that each expert possesses in the organization. To manage tacit knowledge in a knowledge management system, recent researches in this field have shown that it is more applicable in many ways to provide expert search mechanisms in KMS to pinpoint experts in the organizations with searched expertise so that users can contact them for help. In this paper, we develop a framework to automate expert classification using a text categorization technique called Vector Space Model, through which an expert database composed of all the compiled profile information is built. This approach minimizes the maintenance cost of manual expert profiling while eliminating the possibility of incorrectness and obsolescence resulted from subjective manual processing. Also, we define the structure of expertise so that we can implement the expert classification framework to build an expert database in KMS. The developed prototype system, "Knowledge Portal for Researchers in Science and Technology," is introduced to show the applicability of the proposed framework.