• 제목/요약/키워드: vector data

검색결과 3,288건 처리시간 0.031초

GACV for partially linear support vector regression

  • Shim, Jooyong;Seok, Kyungha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.391-399
    • /
    • 2013
  • Partially linear regression is capable of providing more complete description of the linear and nonlinear relationships among random variables. In support vector regression (SVR) the hyper-parameters are known to affect the performance of regression. In this paper we propose an iterative reweighted least squares (IRWLS) procedure to solve the quadratic problem of partially linear support vector regression with a modified loss function, which enables us to use the generalized approximate cross validation function to select the hyper-parameters. Experimental results are then presented which illustrate the performance of the partially linear SVR using IRWLS procedure.

KMSVDD: K-means Clustering을 이용한 Support Vector Data Description (KMSVOD: Support Vector Data Description using K-means Clustering)

  • 김표재;장형진;송동성;최진영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.90-92
    • /
    • 2006
  • 기존의 Support Vector Data Description (SVDD) 방법은 학습 데이터의 개수가 증가함에 따라 학습 시간이 지수 함수적으로 증가하므로, 대량의 데이터를 학습하는 데에는 한계가 있었다. 본 논문에서는 학습 속도를 빠르게 하기 위해 K-means clustering 알고리즘을 이용하는 SVDD 알고리즘을 제안하고자 한다. 제안된 알고리즘은 기존의 decomposition 방법과 유사하게 K-means clustering 알고리즘을 이용하여 학습 데이터 영역을 sub-grouping한 후 각각의 sub-group들을 개별적으로 학습함으로써 계산량 감소 효과를 얻는다. 이러한 sub-grouping 과정은 hypersphere를 이용하여 학습 데이터를 둘러싸는 SVDD의 학습 특성을 훼손시키지 않으면서 중심점으로 모여진 작은 영역의 학습 데이터를 학습하도록 함으로써, 기존의 SVDD와 비교하여 학습 정확도의 차이 없이 빠른 학습을 가능하게 한다. 다양한 데이터들을 이용한 모의실험을 통하여 그 효과를 검증하도록 한다.

  • PDF

Support Vector Machine based on Stratified Sampling

  • Jun, Sung-Hae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제9권2호
    • /
    • pp.141-146
    • /
    • 2009
  • Support vector machine is a classification algorithm based on statistical learning theory. It has shown many results with good performances in the data mining fields. But there are some problems in the algorithm. One of the problems is its heavy computing cost. So we have been difficult to use the support vector machine in the dynamic and online systems. To overcome this problem we propose to use stratified sampling of statistical sampling theory. The usage of stratified sampling supports to reduce the size of training data. In our paper, though the size of data is small, the performance accuracy is maintained. We verify our improved performance by experimental results using data sets from UCI machine learning repository.

PLDA 모델 적응과 데이터 증강을 이용한 짧은 발화 화자검증 (Short utterance speaker verification using PLDA model adaptation and data augmentation)

  • 윤성욱;권오욱
    • 말소리와 음성과학
    • /
    • 제9권2호
    • /
    • pp.85-94
    • /
    • 2017
  • Conventional speaker verification systems using time delay neural network, identity vector and probabilistic linear discriminant analysis (TDNN-Ivector-PLDA) are known to be very effective for verifying long-duration speech utterances. However, when test utterances are of short duration, duration mismatch between enrollment and test utterances significantly degrades the performance of TDNN-Ivector-PLDA systems. To compensate for the I-vector mismatch between long and short utterances, this paper proposes to use probabilistic linear discriminant analysis (PLDA) model adaptation with augmented data. A PLDA model is trained on vast amount of speech data, most of which have long duration. Then, the PLDA model is adapted with the I-vectors obtained from short-utterance data which are augmented by using vocal tract length perturbation (VTLP). In computer experiments using the NIST SRE 2008 database, the proposed method is shown to achieve significantly better performance than the conventional TDNN-Ivector-PLDA systems when there exists duration mismatch between enrollment and test utterances.

Two-step LS-SVR for censored regression

  • Bae, Jong-Sig;Hwang, Chang-Ha;Shim, Joo-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.393-401
    • /
    • 2012
  • This paper deals with the estimations of the least squares support vector regression when the responses are subject to randomly right censoring. The estimation is performed via two steps - the ordinary least squares support vector regression and the least squares support vector regression with censored data. We use the empirical fact that the estimated regression functions subject to randomly right censoring are close to the true regression functions than the observed failure times subject to randomly right censoring. The hyper-parameters of model which affect the performance of the proposed procedure are selected by a generalized cross validation function. Experimental results are then presented which indicate the performance of the proposed procedure.

화상데이터 압축을 위한 프레임내/프레임간 벡터양자화된 블록절단부호화에 관한 연구 (A Study on Intra/Interframe Vector Quantized Block Truncation Coding for Image Data Compression)

  • 고형화;이충웅
    • 대한전자공학회논문지
    • /
    • 제23권5호
    • /
    • pp.732-736
    • /
    • 1986
  • This paper propose a novel vector-quantized block truncation coder for image data compression. A data compression ratio of about 3-6 times larger than that of the BTC can be achieved by utilizign a vector quantizer with the BTC. A vector quantizer was realized by computer simulation. The compressed data rate of 0.7~1.0 bit/pel with intraframe coder and that of 0.3~0.5 bit/pel with interframe coder gives a good performance.

  • PDF

Vector Map Simplification Using Poyline Curvature

  • Pham, Ngoc-Giao;Lee, Suk-Hwan;Kwon, Ki-Ryong
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.249-254
    • /
    • 2017
  • Digital vector maps must be compressed effectively for transmission or storage in Web GIS (geographic information system) and mobile GIS applications. This paper presents a polyline compression method that consists of polyline feature-based hybrid simplification and second derivative-based data compression. Experimental results verify that our method has higher simplification and compression efficiency than conventional methods and produces good quality compressed maps.

센서 네트워크에서 비트 벡터를 이용한 효율적인 레코드 필터링 인-네트워크 조인 전략 (Efficient Record Filtering In-network Join Strategy using Bit-Vector in Sensor Networks)

  • 송임영;김경창
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.27-36
    • /
    • 2010
  • 본 논문에서는 센서 네트워크에서 효율적인 조인 처리를 수행하여 통신비용을 최소화할 수있는인-네트워크 조인 전략인 RFB(Record Filtering using Bit-vector) 조인 전략을 제안하였다. 제안하는 조인 전략은 통신비용을 감소하기 위하여 데이터의 크기를 줄이기 위해 비트 벡터(Bit-vector)를 이용한다. 또한, 센서 네트워크의 특성상 조인을 위해 중앙의 서버로 모든 데이터를 전송하기가 어렵기 때문에 본 논문의 조인 전략은 조인 처리의 이른 단계에서 조인 결과에 해당되지 않는 데이터를 제거하여 불필요한 통신비용을 감소시켜 통신비용을 최소화하기 위한 네트워크 내에서 효율적인 조인 질의 수행 전략이다. 본 논문에서는 시뮬레이션을 통하여 기존의 대표적인 조인 전략인 시놉시스를 전송하여 조인을 수행하는 시놉시스 조인(Synopsis Join, SNJ)과 비교하여 통신비용 효율적임을 보였다.

야간 보행자인식을 위한 적외선 동영상의 형상특징벡터 생성기법 (Method of Generating Shape Feature Vector Using Infrared Video for Night Pedestrian Recognition)

  • 송병탁;김태석
    • 한국멀티미디어학회논문지
    • /
    • 제21권7호
    • /
    • pp.755-763
    • /
    • 2018
  • In this paper, for recognize a night pedestrian from an infrared video, a new method differentiated from the existing feature vector is proposed and experimented. The new approach focuses on the shape feature vector of the structure and shape of the pedestrian image divided by the human body seven split ratio. The pedestrian images are divided into 7 square blocks from the still image of the preprocessing process. And to reduce the dimension, the square block is converted into a mosaic block. The scalar and direction of the shape feature vector is calculated by the brightness and position of the element in the mosaic. For practicality of infrared video system, the proposed method simplifies the data to be processed by reducing the amount of data in the preprocessing in order to continuously batch process the entire system in real time. Through the experiments, we verified the validity of the proposed shape feature vector. In comparison to the existing method, we propose a new shape feature vector generation method as the feature vector for night pedestrian recognition.

인터넷을 통한 벡터 공간 데이타의 효율적 전송을 위한 최적화 기법 (An Optimization Strategy for Vector Spatial Data Transmission onover the Internet)

  • Liang Chen;Chung-Ho Lee;Hae-Young Bae
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.273-285
    • /
    • 2003
  • 일반적으로 공간 벡터 데이타는 래스터 데이타에 비해 많은 정보를 포함하고 있으므로, 좀 더 융통적이고 효율적으로 데이타에 대한 처리가 가능하다. 그러나 인터넷을 통한 공간 벡터 데이타의 조작 시 해결해야 할 문제로 좁은 대역폭을 갖는 인터넷에서 크기가 크고 복잡한 벡터 데이타를 어떻게 효율적으로 전송하는가 라는 문제이다. 본 논문은 좁은 대역폭을 갖는 인터넷을 통한 공간 벡터 데이타를 효율적으로 전송하기 위한 새로운 전송 기법인 스케일에 기반한 전송 기법을 제안한다. 제안된 기법의 아이디어는 보여질수 있는 것만을 전송하는 것이다. 특정 스케일에서 일부 피쳐만이 사용자에게 보여지므로, 자연히 스케일은 공간 피쳐와 연관된 요소이다. 제안된 기법은 웨이블릿에 기반한 지도 일반화 알고리즘을 통해 공간 객체 중에서 출력되는 스케일에 따라 보여질 필요가 없는 피쳐들을 필터링하고, 보여지는 피쳐만을 최종적으로 전송한다. 본 논문에서는 실험을 통해 제안된 기법을 사용하는 경우, 개개의 공간 연산들에 대한 응답 시간이 대체적으로 향상됨을 보인다.