• 제목/요약/키워드: Binary Data

검색결과 1,673건 처리시간 0.053초

데이터마이닝을 활용한 한국프로야구 승패예측모형 수립에 관한 연구 (Using Data Mining Techniques to Predict Win-Loss in Korean Professional Baseball Games)

  • 오윤학;김한;윤재섭;이종석
    • 대한산업공학회지
    • /
    • 제40권1호
    • /
    • pp.8-17
    • /
    • 2014
  • In this research, we employed various data mining techniques to build predictive models for win-loss prediction in Korean professional baseball games. The historical data containing information about players and teams was obtained from the official materials that are provided by the KBO website. Using the collected raw data, we additionally prepared two more types of dataset, which are in ratio and binary format respectively. Dividing away-team's records by the records of the corresponding home-team generated the ratio dataset, while the binary dataset was obtained by comparing the record values. We applied seven classification techniques to three (raw, ratio, and binary) datasets. The employed data mining techniques are decision tree, random forest, logistic regression, neural network, support vector machine, linear discriminant analysis, and quadratic discriminant analysis. Among 21(= 3 datasets${\times}$7 techniques) prediction scenarios, the most accurate model was obtained from the random forest technique based on the binary dataset, which prediction accuracy was 84.14%. It was also observed that using the ratio and the binary dataset helped to build better prediction models than using the raw data. From the capability of variable selection in decision tree, random forest, and stepwise logistic regression, we found that annual salary, earned run, strikeout, pitcher's winning percentage, and four balls are important winning factors of a game. This research is distinct from existing studies in that we used three different types of data and various data mining techniques for win-loss prediction in Korean professional baseball games.

이진 PSO를 이용한 Multiple Bad Data 검출에 관한 연구 (A Study on Multiple Bad Data Detection using Binary PSO)

  • 정희명;박준호;이화석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2009년도 제40회 하계학술대회
    • /
    • pp.270_271
    • /
    • 2009
  • The identification of multiple bad data, especially when mutually interacting, may be difficult to handle, since the well known procedures based on the normalized or weighted residuals may become faulty. In such a case, successive elimination of the measurement with the largest normalized residual may result in the suppression of correct measurements instead of the bad data. Then the problem of identifying bad data is considered as a combinatorial decision procedure. In this paper, binary PSO is used for the identification of multiple bad data in the power system state estimation. The proposed binary PSO based procedures behave satisfactorily in the identifying multiple bad data. The test is carried out with reference to the IEEE-14 bus system.

  • PDF

다중 사용자 CDMA 통신 시스템에서 프리코딩 기법을 사용한 2진 정진폭 시스템 설계 (Design of Binary Constant Envelope System using the Pre-Coding Scheme in the Multi-User CDMA Communication System)

  • 김상우;유흥균;정순기;이상태
    • 한국전자파학회논문지
    • /
    • 제15권5호
    • /
    • pp.486-492
    • /
    • 2004
  • 본 논문에서는 기존의 CDMA 시스템에서 다중사용자 데이터 전송에 의해 발생하는 높은 PAPR 문제를 해결하기 위하여 pre-coding 기법을 이용한 2진 constant amplitude CDMA(CA-CDMA) 방식을 새롭게 제안한다. 제안하는 CA-CDMA의 기초인 4-user CA-CDMA 기법은 4명의 사용자에 대해 binary 크기의 신호를 출력하는 시스템이며, 이는 parity 신호를 이용하여 항상 $\pm$2의 크기를 갖고 길이가 4인 신호를 출력한다. Parity 신호는 입력되는 4명의 사용자 신호를 XOR한 신호로써 사용자들의 신호와 함께 전송되므로 별도의 부가채널을 필요로 하지 않으며, 수신단에서 쉽게 복원될 수 있다. 한편, 시스템 사용자 수의 확장은 4-user CA-CDMA를 반복 사용함으로써 이루어질 수 있다. 예로써 16-user의 경우, 4개의 4-user CA-CDMA를 병렬로 배치하고 각각의 4-user CA-CDMA에서 출력되는 신호를 다시 하나의 4-user CA-CDMA에 입력함으로써 쉽게 구현될 수 있다. 이는 각 4-user CA-CDMA의 출력 신호 역시 binary 신호이기에 가능하며, 동일한 방법으로 64-user, 256-user에 대해서도 2진 constant amplitude를 만족하는 출력 신호를 얻을 수 있다. 결국, 본 논문에서 제안하는 CA-CDMA는 코드율이 1이므로 전송속도나 대역폭 변화가 없으며, 항상 constant한 즉, PAPR이 항상 0 ㏈인 신호의 출력하여, 다중 사용자 전송에서도 비선형 HPA에 의한 왜곡을 방지하고 전력효율을 최대화 할 수 있다. 시뮬레이션 성능확인 결과, 기존의 CDMA가 다중 레벨의 크기를 갖는 신호를 출력하는데 반해, 제안된 2진 CA-CDMA는 항상 binary 레벨로서 신호를 출력함을 알 수 있으며, 비선형 HPA를 고려하였을 때 BER(bit error rate)이 크게 증가하는 일반 CDMA와 달리, 제안된 2진 CA-CDMA의 BER은 전혀 변하지 않음을 알 수 있다.

Analyzing the binary system using standard stellar models: HIP 20916 and HIP 101769

  • Beom, Minje;Kim, Yong Cheol
    • 천문학회보
    • /
    • 제38권2호
    • /
    • pp.71.2-71.2
    • /
    • 2013
  • The standard stellar models for HIP 20916 and HIP 101769 have been constructed to determine the properties of the binary system. Augmented with speckle data which is the magnitude difference between stars of the binary system, the previously determined parameters, such as [Fe/H], distance, total mass, and etc, are used to construct the standard stellar models. And the Green table is used to convert L and $T_{eff}$ into $M_v$ and color for comparison between models and observational data. We present the constructed stellar models of the system.

  • PDF

Binary Image의 효율적인 데이타 압축 Algorithm에 관한 연구 (An Efficient Data Compression Algorithm For Binary Image)

  • 강호갑;이근영
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(II)
    • /
    • pp.1375-1378
    • /
    • 1987
  • In this paper, an efficient data compression algorithm for binary image is proposed. This algorithm makes use of the fact that boundaries contain all the information about such images. The compression efficiency is then further increased by efficient coding of Boundary Information Matrix. The comparison of performance with modified Huffman coding was made by a computer simulation with some images. The results of simulation showed that the proposed algorithm was more efficient than modified Huffman code.

  • PDF

BINARY RANDOM POWER APPROACH TO MODELING ASYMMETRIC CONDITIONAL HETEROSCEDASTICITY

  • KIM S.;HWANG S.Y.
    • Journal of the Korean Statistical Society
    • /
    • 제34권1호
    • /
    • pp.61-71
    • /
    • 2005
  • A class of asymmetric ARCH processes is proposed via binary random power transformations. This class accommodates traditional nonlinear models such as threshold ARCH (Rabemanjara and Zacoian (1993)) and Box-Cox type ARCH models(Higgins and Bera (1992)). Stationarity condition of the model is addressed. Iterative least squares(ILS) and pseudo maximum like-lihood(PML) methods are discussed for estimating parameters and related algorithms are presented. Illustrative analysis for Korea Stock Prices Index (KOSPI) data is conducted.

Eigenvoice를 이용한 이진 마스크 분류 모델 적응 방법 (Eigenvoice Adaptation of Classification Model for Binary Mask Estimation)

  • 김기백
    • 방송공학회논문지
    • /
    • 제20권1호
    • /
    • pp.164-170
    • /
    • 2015
  • 본 논문에서는 잡음 환경에서 취득된 음성 신호에서 잡음을 제거하기 위한 방법으로 사용되는 이진 마스크 분류 모델의 적응과정에 대해 다루고자 한다. 기존 연구결과에 의하면, 잡음 환경 데이터에 이진 마스크 기법을 적용하면 음성 명료도를 향상시킬 수 있다고 알려져 있다. 하지만 이진 마스크 분류 모델 학습 시 테스트 환경 데이터가 포함되어야 한다는 단점을 안고 있다. 본 논문에서는 새로운 잡음 환경에서 이진 마스크 분류 모델을 적응하기 위해, 음성 인식에서 널리 사용되는 화자 적응 기법인 eigenvoice 방법을 적용하고자 한다. 실험결과에서는 모델 적응에 사용되는 데이터량에 따른 성능을 정검출율과 오검출율 관점에서 평가하였고, 그 결과 새로운 잡음 환경에서 데이터량을 증가시켜 모델을 적응함으로써 향상된 성능을 나타냄을 확인할 수 있었다.

Comparison of Binary Discretization Algorithms for Data Mining

  • Na, Jong-Hwa;Kim, Jeong-Mi;Cho, Wan-Sup
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.769-780
    • /
    • 2005
  • Recently, the discretization algorithms for continuous data have been actively studied. But there are few articles to compare the efficiency of these algorithms. In this paper we introduce the principles of some binary discretization algorithms including C4.5, CART and QUEST and investigate the efficiency of these algorithms through numerical study. For various underlying distribution, we compare these algorithms in view of misclassification rate and MSE. Real data examples are also included.

  • PDF

Binary CDMA 기반 차량용 카메라 시스템의 무선 영상전송기 개발 (Development of a Wireless Video Transmitter for Automobile Camera System based on the Binary-CDMA Technology)

  • 최재원
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1571-1578
    • /
    • 2014
  • Binary CDMA는 음성 영상 등의 멀티미디어 데이터를 초고속으로 우수한 전송품질로 통신할 수 있는 우리나라가 개발한 새로운 표준 무선통신 기술이다. 본 논문에서는 유선의 제약 없이 자유롭게 설치 가능한 차량용 무선 카메라 시스템의 개발을 위해 이의 핵심 장치인 Binary CDMA 무선 영상전송기와 중계기의 설계와 구현에 관해 연구하였다.

Binary classification on compositional data

  • Joo, Jae Yun;Lee, Seokho
    • Communications for Statistical Applications and Methods
    • /
    • 제28권1호
    • /
    • pp.89-97
    • /
    • 2021
  • Due to boundedness and sum constraint, compositional data are often transformed by logratio transformation and their transformed data are put into traditional binary classification or discriminant analysis. However, it may be problematic to directly apply traditional multivariate approaches to the transformed data because class distributions are not Gaussian and Bayes decision boundary are not polynomial on the transformed space. In this study, we propose to use flexible classification approaches to transformed data for compositional data classification. Empirical studies using synthetic and real examples demonstrate that flexible approaches outperform traditional multivariate classification or discriminant analysis.