• 제목/요약/키워드: Machine learning algorithm

검색결과 1,480건 처리시간 0.027초

Comparison of three boosting methods in parent-offspring trios for genotype imputation using simulation study

  • Mikhchi, Abbas;Honarvar, Mahmood;Kashan, Nasser Emam Jomeh;Zerehdaran, Saeed;Aminafshar, Mehdi
    • Journal of Animal Science and Technology
    • /
    • 제58권1호
    • /
    • pp.1.1-1.6
    • /
    • 2016
  • Background: Genotype imputation is an important process of predicting unknown genotypes, which uses reference population with dense genotypes to predict missing genotypes for both human and animal genetic variations at a low cost. Machine learning methods specially boosting methods have been used in genetic studies to explore the underlying genetic profile of disease and build models capable of predicting missing values of a marker. Methods: In this study strategies and factors affecting the imputation accuracy of parent-offspring trios compared from lower-density SNP panels (5 K) to high density (10 K) SNP panel using three different Boosting methods namely TotalBoost (TB), LogitBoost (LB) and AdaBoost (AB). The methods employed using simulated data to impute the un-typed SNPs in parent-offspring trios. Four different datasets of G1 (100 trios with 5 k SNPs), G2 (100 trios with 10 k SNPs), G3 (500 trios with 5 k SNPs), and G4 (500 trio with 10 k SNPs) were simulated. In four datasets all parents were genotyped completely, and offspring genotyped with a lower density panel. Results: Comparison of the three methods for imputation showed that the LB outperformed AB and TB for imputation accuracy. The time of computation were different between methods. The AB was the fastest algorithm. The higher SNP densities resulted the increase of the accuracy of imputation. Larger trios (i.e. 500) was better for performance of LB and TB. Conclusions: The conclusion is that the three methods do well in terms of imputation accuracy also the dense chip is recommended for imputation of parent-offspring trios.

A Gaussian process-based response surface method for structural reliability analysis

  • Su, Guoshao;Jiang, Jianqing;Yu, Bo;Xiao, Yilong
    • Structural Engineering and Mechanics
    • /
    • 제56권4호
    • /
    • pp.549-567
    • /
    • 2015
  • A first-order moment method (FORM) reliability analysis is commonly used for structural stability analysis. It requires the values and partial derivatives of the performance to function with respect to the random variables for the design. These calculations can be cumbersome when the performance functions are implicit. A Gaussian process (GP)-based response surface is adopted in this study to approximate the limit state function. By using a trained GP model, a large number of values and partial derivatives of the performance functions can be obtained for conventional reliability analysis with a FORM, thereby reducing the number of stability analysis calculations. This dynamic renewed knowledge source can provide great assistance in improving the predictive capacity of GP during the iterative process, particularly from the view of machine learning. An iterative algorithm is therefore proposed to improve the precision of GP approximation around the design point by constantly adding new design points to the initial training set. Examples are provided to illustrate the GP-based response surface for both structural and non-structural reliability analyses. The results show that the proposed approach is applicable to structural reliability analyses that involve implicit performance functions and structural response evaluations that entail time-consuming finite element analyses.

SDN 환경에서 효율적 Flow 전송을 위한 전송 지연 평가 기반 부하 분산 기법 연구 (Transmission Delay Estimation-based Forwarding Strategy for Load Distribution in Software-Defined Network)

  • 김도현;홍충선
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.310-315
    • /
    • 2017
  • Software-Defined Network의 등장은 하드웨어적인 네트워크 기능들을 소프트웨어적인 형태의 모듈로 Controller에 보다 유연하게 적용시키도록 함으로써 전통적인 네트워크의 구조를 변화시키고 있다. 이러한 환경 속에서 최근 네트워크 트래픽에 대한 Quality of Service 및 자원관리와 같은 다양한 관점에서의 네트워크 관리정책에 대한 연구개발이 진행되고 있고, 이러한 관리정책을 뒷받침 할 수 있는 네트워크 모니터링에 대한 기법들 또한 제시되어 왔다. 이에 본 논문에서는 기계 학습 기법인 Naive Bayesian Classification을 통하여 Flow를 분류한 후, 전송 지연 측정 모듈을 통하여 효율적인 전송경로를 선정하는 기법을 제안한다. 이는 다양한 대역폭을 갖는 여러 경로들로 이루어진 네트워크상에서 효율적인 경로 분배 역할을 할 수 있고, 부하를 분산시킴으로써 보다 원활한 네트워크 환경 및 서비스 품질을 제공할 수 있다.

외국인 투자자의 비정상적 중·장기매도성향패턴예측을 위한 지능형 조기경보시스템 구축 (An intelligent early warning system for forecasting abnormal investment trends of foreign investors)

  • 오경주;김영민
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.223-233
    • /
    • 2013
  • 본 연구는 외국인 투자자의 대량매도구간을 서포트 벡터 머신 알고리즘을 통해 모형을 구축하여 발생 가능한 대량매도기간을 사전에 방지할 수 있는 지능형 조기경보시스템을 구축하였다. 이러한 방법은 기존의 Son 등 (2009), Ahn 등 (2011)이 제시한 방법을 토대로 지능형 조기경보시스템에 대한 예측성과를 개선시켰으며, 더 나아가 최근까지 예측성과를 살펴봄으로써 조기경보시스템의 역할을 수행할 수 있는지를 살펴보았다. 또한 구축된 EWSFI는 국내주식시장뿐만 아니라 환율 및 원유시장 등 다양한 경제 분야에서 활용될 수 있는 가능성을 시사하고 있으며, 시장상황의 위기를 사전에 예측하여 예상되는 충격을 줄일 수 있을 것이다.

실시간 범죄 예측을 위한 랜덤포레스트 알고리즘 기반의 범죄 유형 분류모델 및 모니터링 인터페이스 디자인 요소 제안 (Classification Model of Types of Crime based on Random-Forest Algorithms and Monitoring Interface Design Factors for Real-time Crime Prediction)

  • 박준영;채명수;정성관
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권9호
    • /
    • pp.455-460
    • /
    • 2016
  • 최근 강도, 성폭력과 같은 중범죄들의 수위가 높아짐에 따라 범죄 예측 및 예방에 대한 중요성이 강조되고 있다. 정확한 범죄예측을 위해서는 과거 범죄기록 데이터를 기반으로 정확도 높은 범죄분류모델을 만드는 작업이 필요하며, 신속한 범죄 대응을 위한 시스템 인터페이스가 요구된다. 그러나 기존의 범죄 요소 분석 연구는 데이터 전처리에 대한 난해함으로 인해 정확도 측면에서 한계를 보이며, 범죄 모니터링 시스템은 방대한 양의 범죄 사건기록 분석 결과를 단순 제공함으로써 사용자에게 효과적인 모니터링 기능을 제공하지 못하고 있다. 따라서 본 연구는 실시간 범죄 예측을 위한 랜덤 포레스트 알고리즘 기반의 범죄 유형 분류모델 및 시스템 인터페이스 디자인 요소를 제안한다. 실험을 통해 본 연구는 제안하는 모델이 단순히 범죄기록 데이터만으로 범죄유형을 분류하는 모델 보다 우수함을 입증하였고, 기존의 범죄 모니터링 시스템 분석을 통해 실시간 범죄 모니터링을 위한 시스템 인터페이스를 설계 및 구현하였다.

인터넷 감정기호를 이용한 긍정/부정 말뭉치 구축 및 감정분류 자동화 (Automatic Construction of a Negative/positive Corpus and Emotional Classification using the Internet Emotional Sign)

  • 장경애;박상현;김우제
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.512-521
    • /
    • 2015
  • 네티즌은 인터넷을 통해서 상품을 구매하고 상품에 대한 감정을 긍정 혹은 부정으로 상품평에 표현한다. 상품평에 대한 분석은 잠재적 소비자뿐만 아니라 기업의 의사결정에 중요한 자료가 된다. 따라서 인터넷의 대량 리뷰에서 의미 있는 정보를 분석하여 의견을 도출하는 오피니언 마이닝 기술의 중요성이 증대되고 있다. 기존의 연구는 대부분이 영어를 기반으로 진행되었고 아직 한글에 대한 상품평 분석은 활발히 이루어 지지 않고 있다. 또한 한글은 영어와 달라 꾸미는 말과 어미가 복잡한 특성을 갖고 있다. 그리고 기존의 연구는 통계적 기법, 사전 기법, 기계학습 기법 등을 사용하여 연구되었으나 인터넷 언어의 특성을 감안하지는 못하였다. 본 연구에서는 감정이 포함된 인터넷 언어의 특성을 분석하여 감정분석의 정확률을 높이는 감정분류 방법을 제안한다. 이를 통해 데이터에 독립적인 인터넷 감정기호를 이용해서 자동으로 긍정 및 부정 상품평을 분류할 수 있었고 높은 정확률, 재현율, Coverage 결과를 통해서 제안 알고리즘의 유효성을 확인할 수 있었다.

Evaluating the bond strength of FRP in concrete samples using machine learning methods

  • Gao, Juncheng;Koopialipoor, Mohammadreza;Armaghani, Danial Jahed;Ghabussi, Aria;Baharom, Shahrizan;Morasaei, Armin;Shariati, Ali;Khorami, Majid;Zhou, Jian
    • Smart Structures and Systems
    • /
    • 제26권4호
    • /
    • pp.403-418
    • /
    • 2020
  • In recent years, the use of Fiber Reinforced Polymers (FRPs) as one of the most common ways to increase the strength of concrete samples, has been introduced. Evaluation of the final strength of these specimens is performed with different experimental methods. In this research, due to the variety of models, the low accuracy and impact of different parameters, the use of new intelligence methods is considered. Therefore, using artificial intelligent-based models, a new solution for evaluating the bond strength of FRP is presented in this paper. 150 experimental samples were collected from previous studies, and then two new hybrid models of Imperialist Competitive Algorithm (ICA)-Artificial Neural Network (ANN) and Artificial Bee Colony (ABC)-ANN were developed. These models were evaluated using different performance indices and then, a comparison was made between the developed models. The results showed that the ICA-ANN model's ability to predict the bond strength of FRP is higher than the ABC-ANN model. Finally, to demonstrate the capabilities of this new model, a comparison was made between the five experimental models and the results were presented for all data. This comparison showed that the new model could offer better performance. It is concluded that the proposed hybrid models can be utilized in the field of this study as a suitable substitute for empirical models.

퍼지 매핑을 이용한 퍼지 패턴 분류기의 Feature Selection (Feature Selection of Fuzzy Pattern Classifier by using Fuzzy Mapping)

  • 노석범;김용수;안태천
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.646-650
    • /
    • 2014
  • 본 논문에서는 다차원 문제로 인하여 발생하는 패턴 분류 성능의 저하를 방지 하여 퍼지 패턴 분류기의 성능을 개선하기 위하여 다수의 Feature들 중에서 패턴 분류 성능 향상에 기여하는 Feature를 선택하기 위한 새로운 Feature Selection 방법을 제안 한다. 새로운 Feature Selection 방법은 각각의 Feature 들을 퍼지 클러스터링 기법을 이용하여 클러스터링 한 후 각 클러스터가 임의의 class에 속하는 정도를 계산하고 얻어진 값을 이용하여 해당 feature 가 fuzzy pattern classifier에 적용될 경우 패턴 분류 성능 개선 가능성을 평가한다. 평가된 성능 개선 가능성을 기반으로 이미 정해진 개수만큼의 Feature를 선택하는 Feature Selection을 수행한다. 본 논문에서는 제안된 방법의 성능을 평가, 비교하기 위하여 다수의 머신 러닝 데이터 집합에 적용한다.

중요한 이벤트만을 검색함으로써 분류기의 최적 성능을 찾는 방법 (A method of searching the optimum performance of a classifier by testing only the significant events)

  • 김동희;이원돈
    • 한국정보통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1275-1282
    • /
    • 2014
  • 유비쿼터스 환경에서는 수많은 정보들이 존재한다. 하지만 이 정보들은 너무 광범위하기 때문에 이로부터 필요에 따라 적절하게 사용 할 수 있는 정보를 얻기란 쉽지가 않다. 이로 인해 의사 결정 트리 알고리즘은 데이터 마이닝 분야 또는 기계 학습 시스템 분야에서 매우 유용하게 사용된다. 왜냐하면 빠르고 정확하게 정보를 분류하여 좋은 결과를 도출하기 때문이다. 하지만 때때로 의사 결정 트리가 매우 작은 데이터나 노이즈 데이터로 구성된 리프 노드들로 인해 좋은 정보를 제공하지 못하는 경우가 있다. 이 논문은 이러한 분류 문제를 해결하기 위해 분류기, UChoo를 사용할 것이고 노이즈 또는 노이즈 형태로 보이는 리프들을 제외하고 오직 중요한 리프들만을 검사하는 효과적인 방법을 제안한다. 그리고 실험을 통하여 의사 결정시 오직 중요한 리프들만을 의사 결정 트리에서 선택함으로써 효과적으로 에러가 줄어드는 것을 보일 것이다.

선박 탑승자를 위한 다중 센서 기반의 스마트폰을 이용한 활동 인식 시스템 (Activity Recognition of Workers and Passengers onboard Ships Using Multimodal Sensors in a Smartphone)

  • 라지브 쿠마 피야레;이성로
    • 한국통신학회논문지
    • /
    • 제39C권9호
    • /
    • pp.811-819
    • /
    • 2014
  • 상황 인식은 유비쿼터스컴퓨팅 환경에 대한 진화를 변화시켰고 무선 센서네트워크 기술은 많은 응용기기에 대한 새로운 방법을 제시하였다. 특히, 행동 인식은 사람의 응용서비스를 제공하는데 있어 특정 사용자의 상황을 인식하는 핵심 요소로 의학, 취미, 군사 분야에서 폭넓은 응용분야를 갖고 있고 사용반경의 확대에서도 효율과 정확도를 높이는 방법에 크게 기여한다. 스마트폰 센서로부터 나오는 데이터로부터 프레임이 512인셈플 데이터를 얻어, 프레임간50%의 오버랩을 갖도록 하고 Machine Learning Algorithm 인 WEKA Experimenter (University of Waikato, Version 3.6.10)을 써서 데이더로부터 시간영역 특징값을 추출함으로써 행동 인식에 대한 99.33%의 정확도를 얻을 수 있었다. 또한, WEKA Experimenter의 사용기법인 C4.5 Decision Tree과 다른 방법인 BN, NB, SMO or Logistic Regression간의 비교실험을 하였다.