• 제목/요약/키워드: SVMs

검색결과 128건 처리시간 0.027초

Enhancing Gene Expression Classification of Support Vector Machines with Generative Adversarial Networks

  • Huynh, Phuoc-Hai;Nguyen, Van Hoa;Do, Thanh-Nghi
    • Journal of information and communication convergence engineering
    • /
    • 제17권1호
    • /
    • pp.14-20
    • /
    • 2019
  • Currently, microarray gene expression data take advantage of the sufficient classification of cancers, which addresses the problems relating to cancer causes and treatment regimens. However, the sample size of gene expression data is often restricted, because the price of microarray technology on studies in humans is high. We propose enhancing the gene expression classification of support vector machines with generative adversarial networks (GAN-SVMs). A GAN that generates new data from original training datasets was implemented. The GAN was used in conjunction with nonlinear SVMs that efficiently classify gene expression data. Numerical test results on 20 low-sample-size and very high-dimensional microarray gene expression datasets from the Kent Ridge Biomedical and Array Expression repositories indicate that the model is more accurate than state-of-the-art classifying models.

Levenshtein 거리를 이용한 영화평 감성 분류 (Sentiment Classification of Movie Reviews using Levenshtein Distance)

  • 안광모;김윤석;김영훈;서영훈
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권4호
    • /
    • pp.581-587
    • /
    • 2013
  • 본 논문에서는 레빈쉬타인 거리(Levenshtein distance)를 이용한 감성 분류 방법을 제안한다. 감성 자질에 레빈쉬타인 거리를 적용하여 BOW(Back-Of-Word)를 생성하고 이를 학습 자질로 사용한다. 학습 모델은 지지벡터기계(support vector machines, SVMs)와 나이브 베이즈(Naive Bayes)를 이용하였다. 실험 데이터로는 다음 영화 사이트로부터 영화평을 수집하였으며, 수집한 영화평은 총 2,385건이다. 수집된 영화평으로부터 감성 어휘를 수작업을 통해 수집하였으며 총 778개 어휘가 선별되었다. 실험에서는 감성 어휘에 레빈쉬타인 거리를 적용한 BOW를 이용하여 기계학습을 수행하였으며, 10-fold-cross validation 방식으로 분류기의 성능을 평가하였다. 평가 결과는 레빈쉬타인 거리가 3일 때 다항 나이브 베이즈(Muitinomial Naive Bayes) 분류기에서 85.46%의 가장 높은 정확도를 보였다. 실험을 통하여 본 논문에서 제안하는 방법이 문서 내의 철자 오류에 대해서도 분류 성능에 영향을 적게 받음을 알 수 있었다.

An Application of Support Vector Machines to Customer Loyalty Classification of Korean Retailing Company Using R Language

  • 응위엔푸티엔;이영찬
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제26권4호
    • /
    • pp.17-37
    • /
    • 2017
  • Purpose Customer Loyalty is the most important factor of customer relationship management (CRM). Especially in retailing industry, where customers have many options of where to spend their money. Classifying loyal customers through customers' data can help retailing companies build more efficient marketing strategies and gain competitive advantages. This study aims to construct classification models of distinguishing the loyal customers within a Korean retailing company using data mining techniques with R language. Design/methodology/approach In order to classify retailing customers, we used combination of support vector machines (SVMs) and other classification algorithms of machine learning (ML) with the support of recursive feature elimination (RFE). In particular, we first clean the dataset to remove outlier and impute the missing value. Then we used a RFE framework for electing most significant predictors. Finally, we construct models with classification algorithms, tune the best parameters and compare the performances among them. Findings The results reveal that ML classification techniques can work well with CRM data in Korean retailing industry. Moreover, customer loyalty is impacted by not only unique factor such as net promoter score but also other purchase habits such as expensive goods preferring or multi-branch visiting and so on. We also prove that with retailing customer's dataset the model constructed by SVMs algorithm has given better performance than others. We expect that the models in this study can be used by other retailing companies to classify their customers, then they can focus on giving services to these potential vip group. We also hope that the results of this ML algorithm using R language could be useful to other researchers for selecting appropriate ML algorithms.

Support Vector Machine을 이용한 Reactive ion Etching의 Run-to-Run 오류검출 및 분석 (Run-to-Run Fault Detection of Reactive Ion Etching Using Support Vector Machine)

  • 박영국;홍상진;한승수
    • 한국정보통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.962-969
    • /
    • 2006
  • 현재 고밀도 반도체제작 환경에서는 반작용적인 이온 식각 과정(reactive ion etching)에서의 생산성을 극대화하기 위해서 비정상적인 공정장비를 발견하는 것이 매우 중요하다. 생산과정에서 오류발견의 중요성을 설명하기 위해 Support Vector Machine (SVM)은 실시간으로 공정오류에 대한 판단을 위해 사용되었다. 반작용적인 이온 식각도구 데이터는 59개 변수들로 구성된 반도체 공정장비로부터 얻는다. 각각의 변수들은 초당 10개의 데이터로 구성되어있다. 식각 런의 11개의 파라미터에 대한 모델을 만들기 위해 baseline런으로부터 얻은 데이터로 SVM모델을 구성하고 정상 런데이터와 비정상 런데이터로 SVM모델을 검증한다. 통계적 공정제어에서 흔히 이용되는 관리한계를 도입하여 정상데이터가 내재하고 있는 램덤변화율이 반영된 SVM 모델 기반의 관리 한계를 수립하고, 그 관리 한계를 바탕으로 오류발견을 실행한다. SVM을 이용함으로써 RIE의 오류발견은 run to run 기반에 정상 런데이터는 0% 오류율이 증명되었다.

굴(Crassostrea gigas)의 패각운동을 이용한 생물모니터링시스템 연구 -I. 홀 소자를 이용한 저염분하에서 비정상적인 패각운동 측정 (Bio-Monitoring System Using Shell Valve Movements of Pacific Oyster (Crassostrea gigas) -I. Detecting Abnormal Shell Valve Movements Under Low Salinity Using a Hall Element Sensor)

  • 오석진;이준호;김석윤
    • 한국해양환경ㆍ에너지학회지
    • /
    • 제16권2호
    • /
    • pp.138-142
    • /
    • 2013
  • 저염분에 따른 양식생물의 피해를 줄이기 위한 조기경보 방안으로 염분에 따른 굴(Crassostrea gigas) 패각운동 특성을 홀 소자를 이용하여 측정하는 생물모니터링시스템의 적용 가능성을 조사하였다. 염분농도 27 psu에서 굴의 패각운동은 평균 10-15 mm 정도의 개각상태를 유지하다가, 비교적 빠른 폐각상태를 지시하는 큰 파형이 보였으며, 다시 개각상태로 돌아가나, 그 속도는 폐각상태로 진행되는 속도보다 느리게 나타났다. 20 psu까지 저염분의 농도에서는 27 psu의 패각 운동과 큰 변화가 없었다. 하지만 17 psu 이하의 염분농도부터 이상 패각운동이 지시되었으며, 10 psu에서는 패각운동이 없이 폐각상태를 유지하였다. 이와 같은 생물모니터링시스템을 패류 양식에 활용하여 해양환경의 이상변동을 신속히 감지할 수 있다면, 어업피해를 감소시킬 활동으로 연결될 것으로 기대된다.

Time Series Support Vector Machine을 이용한 Reactive Ion Etching의 오류검출 및 분석 (Fault Detection of Reactive Ion Etching Using Time Series Support Vector Machine)

  • 박영국;한승수;홍상진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.247-250
    • /
    • 2006
  • 현재 고밀도 반도체제작 환경에서는 Reactive ion Etching (RIE) 과정에서의 생산성을 극대화하기 위해서 비이상적인 공정장비를 발견하는 것이 매우 중요하다. 생산과정에서 오류발견의 중요성을 설명하기 위해 Support Vector Machine (SVM)은 실시간으로 공정오류에 대한 판단에 대한 도움을 주기 위해 사용되었다. baseline run으로부터 얻은 데이터로 SVM 모델을 구성하고 정상인 run 데이터와 비정상 run 데이터로 SVM 모델을 검증한다. 통계적 공정제어에서 흔히 이용되는 control limits를 도입하여 정상데이터가 내재하고 있는 램덤 변화율이 반영된 SVM 모델 기반의 control limits를 수립하고, 그 control limits를 바탕으로 오류발견을 실행한다. SVM을 이용함으로써 RIE의 오류발견은 run to run 기반에 정상인 run데이터는 0% 오류율이 증명되었다.

  • PDF

SVM을 이용한 버터플라이 밸브의 캐비테이션 상태감시 (Cavitation Condition Monitoring of Butterfly Valve Using Support Vector Machine)

  • 황원우;고명환;양보석
    • 한국소음진동공학회논문집
    • /
    • 제14권2호
    • /
    • pp.119-127
    • /
    • 2004
  • Butterfly valves are popularly used in service in the industrial and water works pipeline systems with large diameter because of its lightweight, simple structure and the rapidity of its manipulation. Sometimes cavitation can occur. resulting in noise, vibration and rapid deterioration of the valve trim, and do not allow further operation. Thus, the monitoring of cavitation is of economic interest and is very importance in industry. This paper proposes a condition monitoring scheme using statistical feature evaluation and support vector machine (SVM) to detect the cavitation conditions of butterfly valve which used as a flow control valve at the pumping stations. The stationary features of vibration signals are extracted from statistical moments. The SVMs are trained, and then classify normal and cavitation conditions of control valves. The SVMs with the reorganized feature vectors can distinguish the class of the untrained and untested data. The classification validity of this method is examined by various signals that are acquired from butterfly valves in the pumping stations and compared the classification success rate with those of self-organizing feature map neural network.

Using Estimated Probability from Support Vector Machines for Credit Rating in IT Industry

  • 홍태호;신택수
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.509-515
    • /
    • 2005
  • Recently, support vector machines (SVMs) are being recognized as competitive tools as compared with other data mining techniques for solving pattern recognition or classification decision problems. Furthermore, many researches, in particular, have proved it more powerful than traditional artificial neural networks (ANNs)(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al, 2005; Kim, 2003). The classification decision, such as a binary or multi-class decision problem, used by any classifier, i.e. data mining techniques is cost-sensitive. Therefore, it is necessary to convert the output of the classifier into well-calibrated posterior probabilities. However, SVMs basically do not provide such probabilities. So it required to use any method to create probabilities (Platt, 1999; Drish, 2001). This study applies a method to estimate the probability of outputs of SVM to bankruptcy prediction and then suggests credit scoring methods using the estimated probability for bank's loan decision making.

  • PDF

Support Vector Machines에 의한 음소 분할 및 인식 (Phoneme segmentation and Recognition using Support Vector Machines)

  • 이광석;김현덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.981-984
    • /
    • 2010
  • 우리는 본 연구에서 학습방법으로서 연속음성을 초성, 중성, 종성의 음소단위로 분할하기 위하여 인공 신경회로망의 하나인 SVMs을 사용하였으며 분할한 음소단위의 음성으로 연속음성인식에 적용하여 그 성능을 살펴보았다. 음소경계는 단 구간에서의 최대 주파수를 가진 알고리듬에 의하여 결정되며 또한 음성인식처리는 CHMM에 의하여 이루어지며 목측에 의한 분할결과와도 비교하여 살펴보았다. 시뮬레이션 결과로부터 초성의 분할성능에서 제안한 SVMs를 적용한 결과가 GMMs보다 효율적인을 알 수 있었다.

  • PDF

ESTIMATION OF THE POWER PEAKING FACTOR IN A NUCLEAR REACTOR USING SUPPORT VECTOR MACHINES AND UNCERTAINTY ANALYSIS

  • Bae, In-Ho;Na, Man-Gyun;Lee, Yoon-Joon;Park, Goon-Cherl
    • Nuclear Engineering and Technology
    • /
    • 제41권9호
    • /
    • pp.1181-1190
    • /
    • 2009
  • Knowing more about the Local Power Density (LPD) at the hottest part of a nuclear reactor core can provide more important information than knowledge of the LPD at any other position. The LPD at the hottest part needs to be estimated accurately in order to prevent the fuel rod from melting in a nuclear reactor. Support Vector Machines (SVMs) have successfully been applied in classification and regression problems. Therefore, in this paper, the power peaking factor, which is defined as the highest LPD to the average power density in a reactor core, was estimated by SVMs which use numerous measured signals of the reactor coolant system. The SVM models were developed by using a training data set and validated by an independent test data set. The SVM models' uncertainty was analyzed by using 100 sampled training data sets and verification data sets. The prediction intervals were very small, which means that the predicted values were very accurate. The predicted values were then applied to the first fuel cycle of the Yonggwang Nuclear Power Plant Unit 3. The root mean squared error was approximately 0.15%, which is accurate enough for use in LPD monitoring and for core protection that uses LPD estimation.