• 제목/요약/키워드: support vector machine(SVM)

검색결과 1,260건 처리시간 0.025초

New Normalization Methods using Support Vector Machine Regression Approach in cDNA Microarray Analysis

  • Sohn, In-Suk;Kim, Su-Jong;Hwang, Chang-Ha;Lee, Jae-Won
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2005년도 BIOINFO 2005
    • /
    • pp.51-56
    • /
    • 2005
  • There are many sources of systematic variations in cDNA microarray experiments which affect the measured gene expression levels like differences in labeling efficiency between the two fluorescent dyes. Print-tip lowess normalization is used in situations where dye biases can depend on spot overall intensity and/or spatial location within the array. However, print-tip lowess normalization performs poorly in situation where error variability for each gene is heterogeneous over intensity ranges. We proposed the new print-tip normalization methods based on support vector machine regression(SVMR) and support vector machine quantile regression(SVMQR). SVMQR was derived by employing the basic principle of support vector machine (SVM) for the estimation of the linear and nonlinear quantile regressions. We applied our proposed methods to previous cDNA micro array data of apolipoprotein-AI-knockout (apoAI-KO) mice, diet-induced obese mice, and genistein-fed obese mice. From our statistical analysis, we found that the proposed methods perform better than the existing print-tip lowess normalization method.

  • PDF

최소제곱 서포트벡터기계를 이용한 시장점유율 자료 분석 (Analysis of market share attraction data using LS-SVM)

  • 박혜정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.879-886
    • /
    • 2009
  • 본 논문에서는 시장점유율을 추정할 때 최소제곱 서포트벡터기계를 적용하여 보통최소제곱과 최소제곱 서포트벡터기계의 성능을 비교하고자 한다. 최소제곱 서포트벡터기계는 커널 함수를 사용함으로 고차원의 특징 공간에서 선형회귀로 재구성함으로 비선형 회귀문제까지도 해결할 수 있는 장점을 가지고 있다. 그래서 본 논문에서는 비모수 기법인 최소제곱 서포트벡터기계를 이용하여 시장점유율 모형을 추정하고자 한다. 최소제곱 서포트벡터기계를 기반으로 한 모형 추정은 시장점유율 유인모형을 해결하기 위한 좋은 대안이 된다. 최소제곱 서포트벡터기계의 성능을 평가하기 위해 비교 실험에서는 한국 자동차 시장에서 차량 판매량을 이용하여 브랜드별 시장점유율 모형을 추정하였다.

  • PDF

Expected shortfall estimation using kernel machines

  • Shim, Jooyong;Hwang, Changha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권3호
    • /
    • pp.625-636
    • /
    • 2013
  • In this paper we study four kernel machines for estimating expected shortfall, which are constructed through combinations of support vector quantile regression (SVQR), restricted SVQR (RSVQR), least squares support vector machine (LS-SVM) and support vector expectile regression (SVER). These kernel machines have obvious advantages such that they achieve nonlinear model but they do not require the explicit form of nonlinear mapping function. Moreover they need no assumption about the underlying probability distribution of errors. Through numerical studies on two artificial an two real data sets we show their effectiveness on the estimation performance at various confidence levels.

A Hybrid Mod K-Means Clustering with Mod SVM Algorithm to Enhance the Cancer Prediction

  • Kumar, Rethina;Ganapathy, Gopinath;Kang, Jeong-Jin
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권2호
    • /
    • pp.231-243
    • /
    • 2021
  • In Recent years the way we analyze the breast cancer has changed dramatically. Breast cancer is the most common and complex disease diagnosed among women. There are several subtypes of breast cancer and many options are there for the treatment. The most important is to educate the patients. As the research continues to expand, the understanding of the disease and its current treatments types, the researchers are constantly being updated with new researching techniques. Breast cancer survival rates have been increased with the use of new advanced treatments, largely due to the factors such as earlier detection, a new personalized approach to treatment and a better understanding of the disease. Many machine learning classification models have been adopted and modified to diagnose the breast cancer disease. In order to enhance the performance of classification model, our research proposes a model using A Hybrid Modified K-Means Clustering with Modified SVM (Support Vector Machine) Machine learning algorithm to create a new method which can highly improve the performance and prediction. The proposed Machine Learning model is to improve the performance of machine learning classifier. The Proposed Model rectifies the irregularity in the dataset and they can create a new high quality dataset with high accuracy performance and prediction. The recognized datasets Wisconsin Diagnostic Breast Cancer (WDBC) Dataset have been used to perform our research. Using the Wisconsin Diagnostic Breast Cancer (WDBC) Dataset, We have created our Model that can help to diagnose the patients and predict the probability of the breast cancer. A few machine learning classifiers will be explored in this research and compared with our Proposed Model "A Hybrid Modified K-Means with Modified SVM Machine Learning Algorithm to Enhance the Cancer Prediction" to implement and evaluated. Our research results show that our Proposed Model has a significant performance compared to other previous research and with high accuracy level of 99% which will enhance the Cancer Prediction.

Vector space based augmented structural kinematic feature descriptor for human activity recognition in videos

  • Dharmalingam, Sowmiya;Palanisamy, Anandhakumar
    • ETRI Journal
    • /
    • 제40권4호
    • /
    • pp.499-510
    • /
    • 2018
  • A vector space based augmented structural kinematic (VSASK) feature descriptor is proposed for human activity recognition. An action descriptor is built by integrating the structural and kinematic properties of the actor using vector space based augmented matrix representation. Using the local or global information separately may not provide sufficient action characteristics. The proposed action descriptor combines both the local (pose) and global (position and velocity) features using augmented matrix schema and thereby increases the robustness of the descriptor. A multiclass support vector machine (SVM) is used to learn each action descriptor for the corresponding activity classification and understanding. The performance of the proposed descriptor is experimentally analyzed using the Weizmann and KTH datasets. The average recognition rate for the Weizmann and KTH datasets is 100% and 99.89%, respectively. The computational time for the proposed descriptor learning is 0.003 seconds, which is an improvement of approximately 1.4% over the existing methods.

출력 코딩 기반 다중 클래스 서포트 벡터 머신을 위한 특징 선택 기법 (A Novel Feature Selection Method for Output Coding based Multiclass SVM)

  • 이영주;이정진
    • 한국멀티미디어학회논문지
    • /
    • 제16권7호
    • /
    • pp.795-801
    • /
    • 2013
  • 서포트 벡터 머신은 뛰어난 일반화 성능에 힘입어 다양한 분야에서 의사 결정 나무나 인공 신경망에 비해 더 좋은 분류 성능을 보이고 있기 때문에 최근 널리 사용되고 있다. 서포트 벡터 머신은 기본적으로 이진 분류 문제를 위하여 설계되었기 때문에 서포트 벡터 머신을 다중 클래스 문제에 적용하기 위한 방법으로 다중 이진 분류기의 출력 결과를 이용하는 출력 코딩 방법이 주로 사용되고 있다. 그러나 출력 코딩 기반 서포트 벡터 머신에 사용된 기존 특징 선택 기법은 각 분류기의 정확도 향상을 위한 특징이 아니라 전체 분류 정확도 향상을 위한 특징을 선택하고 있다. 본 논문에서는 출력 코딩 기반 서포트 벡터 머신의 각 이진 분류기의 분류 정확도를 최대화하는 특징을 각각 선택하여 사용함으로써, 전체 분류 정확도를 향상시키는 특징 선택 기법을 제안한다. 실험 결과는 제안 기법이 기존 특징 선택 기법에 비하여 통계적으로 유의미한 분류 정확도 향상이 있었음을 보여주었다.

Support Vector Machine 기반 TCP/IP 헤더의 은닉채널 탐지에 관한 연구 (A Study on the Covert Channel Detection in the TCP/IP Header based on the Support Vector Machine)

  • 손태식;서정우;서정택;문종섭;최홍민
    • 정보보호학회논문지
    • /
    • 제14권1호
    • /
    • pp.35-45
    • /
    • 2004
  • 폭발적으로 증가하는 인터넷 환경에서 정보보호는 가장 중요한 고려사항 중의 하나이다. 현재 이에 대한 대응방안으로 IDS, 방화벽, VPN 등 여러 보안 솔루션들이 사용되고 있지만 TCP/IP를 근간으로 하는 인터넷 환경은 기본적으로 프로토콜 자체의 취약성을 가지고 있다. 그 중에서도, TCP/IP 헤더 중 ICMP Payload. Identification(ID), Sequence Number(SEQ), Acknowledge(ACK). Timestamp의 필드 내용을 조작함으로써 특정 정보를 전송할 수 있는 은닉채널이 가능하다고 이미 알려져 있다. 특히 본 논문에서는 TCP/IP 헤더의 여러 필드들 중에서도 IP 헤더의 ID 필드, TCP 헤더의 SEQ 필드를 이용한 은닉채널 탐지에 초점을 맞추었으며, 이러한 은닉채널의 탐지를 위하여, 패턴분류 문제 있어서 우수한 성능을 보이는 것으로 알려져 있는 Support Vector Machine(SVM)을 사용하였다. 본 논문의 실험결과에서는 제안된 탐지방안이 정상 TCP/IP 트래픽으로부터 은닉채널이 포함된 TCP/IP 패킷을 구분할 수 있음을 보여주었다.

주성분 분석과 서포트 백터 머신을 이용한 효과적인 얼굴 검출 시스템 (Effective Face Detection Using Principle Component Analysis and Support Vector Machine)

  • 강병두;권오화;성치영;전재덕;엄재성;김종호;이재원;김상균
    • 한국멀티미디어학회논문지
    • /
    • 제9권11호
    • /
    • pp.1435-1444
    • /
    • 2006
  • 본 논문은 얼굴 영상에서 추출된 특징 값들을 주성분 분석(Principle Component Analysis; 이하 PCA)을 이용하여 재해석하고, 서포트 벡터 머신(Support Vector Machine; 이하 SVM)을 이용한 이진 분류를 통하여 효과적이면서 실시간으로 얼굴을 검출할 수 있는 방법론을 제안한다. 얼굴과 얼굴이 아닌 영상들로 학습데이터를 구성하여, 이 영상들로부터 Haar-like 특징값들을 추출한다. 추출된 다량의 특징 값들 중에 얼굴과 얼굴이 아닌 영역에 대하여 판별 능력이 우수한 특징값들은 PCA를 이용하여 재해석되고 유용한 특징들을 선별한다. 선별된 특징들을 SVM의 입력 차원으로 사용하여 최종 분류기를 학습 및 구성한다. 제안하는 분류기는 학습데이터 집단의 구성에 크게 영향을 받지 않고, 소량의 학습데이터만으로도 90.1%의 만족할만한 얼굴 검출률을 보여주며, $320{\times}240$ 크기의 영상에 대하여 실시간 얼굴 검출에 사용 가능한 초당 8프레임의 처리속도를 보여주었다.

  • PDF

SVM을 이용한 3차원 해마의 지능적 형상 분석 (Intelligent Shape Analysis of the 3D Hippocampus Using Support Vector Machines)

  • 김정식;김용국;최수미
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1387-1392
    • /
    • 2006
  • 본 논문에서는 SVM (Support Vector Machine)을 기반으로 하여 인체의 뇌 하부구조인 해마에 대한 지능적 형상분석 방법을 제공한다. 일반적으로 의료 영상으로부터 해마의 형상 분석을 하기 위해서는 충분한 임상 데이터를 필요로 한다. 하지만 현실적으로 많은 양의 표본들을 얻는 것이 쉽지 않기 때문에 전문가의 지식을 기반으로 한 작업이 수반되어야 한다. 결국 이러한 요소들이 분석 작업을 어렵게 한다. 의학 기술이 복잡해 지면서 최근의 형상 분석 연구는 점차 통계적 모델을 기반으로 진행되고 있다. 본 연구에서는 해마로부터 고해상도의 매개변수형 모델을 만들어 형상 표현으로 이용하고, 집단간 분류 작업에 SVM 알고리즘을 적용하는 지능적 분석 방법을 구현한다. 우선 메쉬 데이터로부터 물리변형모델 기반의 매개변수 모델을 구축하고, PDM (point distribution model) 방법을 적용하여 두 집단을 대표하는 평균 모델을 생성한다. 마지막으로 SVM 기반의 이진 분류기를 구축하여 집단간 분류 작업을 수행한다. 구현한 모델링 방법과 분류기의 성능을 평가하기 위하여 본 연구에서는 네 가지 커널 함수 (linear, radial basis function, polynomial, sigmoid)들을 적용한다. 본 논문에서 제시한 매개변수형 모델은 다양한 형태의 의료 데이터로부터 보편적인 3차원 모델을 생성하고, 또한 모델의 전역적, 국부적인 특징들을 복합적으로 표현할 수 있기 때문에 통계적 형상분석에 적합하다. 그리고 SVM 기반의 분류기는 적은 수의 학습 데이터로부터 정상인 해마 집단과 간질 환자 집단간의 정확한 분류를 가능하게 한다.

  • PDF

SVM을 이용한 음성채팅시스템의 성능 향상 방법 (Performance Improvement Methods of a Spoken Chatting System Using SVM)

  • 안혁주;이성희;송영길;김학수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권6호
    • /
    • pp.261-268
    • /
    • 2015
  • 음성채팅시스템에서 사용자의 음성 질의는 자동음성인식기를 통하여 텍스트 질의로 변환된다. 만약 자동음성인식기의 1순위 결과가 틀린다면 이 오류는 그대로 음성채팅시스템에 전파된다. 자동음성인식기의 1순위 정밀도를 향상시키기 위하여 본 논문에서는 RankSVM을 이용하여 자동음성인식기의 n개 결과를 재순위화하는 후처리 모델을 제안한다. 채팅시스템을 학습하기 위해서는 대용량의 채팅 문장들이 필요하다. 만약 새로운 채팅 문장들이 학습데이터에 자주 추가되지 않는다면 채팅시스템의 응답은 금방 진부해질 것이다. 이러한 문제를 해결하기 위하여 본 논문에서는 SVM을 이용하여 TV와 영화 시나리오로부터 채팅 문장들을 자동으로 선택하는 데이터 수집 모델을 제안한다. 실험에서 제안된 후처리 모델은 후처리를 하지 않은 모델보다 정확률에서 4.4%, 재현율에서 6.4% 더 좋은 결과를 보였다. 그리고 제안된 데이터 수집 모델은 98.95%의 높은 정확률과 57.14%의 재현율을 보였다.