• 제목/요약/키워드: Machine Learning Procedure

검색결과 116건 처리시간 0.024초

인간공학적 방법을 이용한 사이클 선수의 경기력 평가 (우수선수의 경기력 벤치마킹을 중심으로...) (Cyclist's Performance Evaluation Using Ergonomic Method (Focus to Benchmarking Elite Cyclist's Performance))

  • 하종규;장영관;기재석
    • 대한안전경영과학회지
    • /
    • 제12권1호
    • /
    • pp.51-57
    • /
    • 2010
  • Cycling that transform human energy into mechanical energy is one of the man-machine systems out of sports fields. Benchmarking means "improving ourselves by learning from others', therefore benchmarking toward dominant cyclist is necessary on field. The goals of this study were to provide important factors on multi-disciplines (kinematics, physiology, power, psychology) for a tailored-training program that is suitable to individual characteristics. Two cyclists participated in this study and gave consent to the experimental procedure. One was dominant cyclist (years: 21 yrs, height: 177 cm, mass: 70 kg), and the other was non-dominant cyclist (years: 21, height: 176, mass: 70). Kinematic data were recorded using six infrared cameras (240Hz) and QTM (software). Physiological data (VO2max, AT) were acquired according to graded exercising test with cycle ergometer and power with Wingate test used by Bar-Or et. al (1977) and to evaluate muscle function with Cybex. Psychological data were collected with competitive state anxiety inventory (CSAI-2) that was devised by Martens et. al (1990) and athletes' self-management questionnaire (ASMQ) of Huh (2003). It appears that the dominant's CV of ankle joint angle was higher than non-dominant's CV and dominant's pedaling pattern was consistent in biomechanics domain, which the dominant's values for all factors ware higher than non-dominant's values in physical, and physiological domain, and their values between cognitive anxiety and somatic anxiety were contrary to each other in psychology. Further research on multi-disciplines may lead to the development of tailored-optimal training programs applicable with key factors to enhance athletic performance by means of research including athlete, coach and parents.

한국산업경영시스템학회지 연구 주제의 토픽모델링 분석 비교: 1978년~99년 논문을 중심으로 (Topic Modeling Analysis Comparison for Research Topic in Korean Society of Industrial and Systems Engineering: Concentrated on Research Papers from 1978~1999)

  • 박동준;오형술;김호균;윤민
    • 산업경영시스템학회지
    • /
    • 제44권4호
    • /
    • pp.113-127
    • /
    • 2021
  • Topic modeling has been receiving much attention in academic disciplines in recent years. Topic modeling is one of the applications in machine learning and natural language processing. It is a statistical modeling procedure to discover topics in the collection of documents. Recently, there have been many attempts to find out topics in diverse fields of academic research. Although the first Department of Industrial Engineering (I.E.) was established in Hanyang university in 1958, Korean Institute of Industrial Engineers (KIIE) which is truly the most academic society was first founded to contribute to research for I.E. and promote industrial techniques in 1974. Korean Society of Industrial and Systems Engineering (KSIE) was established four years later. However, the research topics for KSIE journal have not been deeply examined up until now. Using topic modeling algorithms, we cautiously aim to detect the research topics of KSIE journal for the first half of the society history, from 1978 to 1999. We made use of titles and abstracts in research papers to find out topics in KSIE journal by conducting four algorithms, LSA, HDP, LDA, and LDA Mallet. Topic analysis results obtained by the algorithms were compared. We tried to show the whole procedure of topic analysis in detail for further practical use in future. We employed visualization techniques by using analysis result obtained from LDA. As a result of thorough analysis of topic modeling, eight major research topics were discovered including Production/Logistics/Inventory, Reliability, Quality, Probability/Statistics, Management Engineering/Industry, Engineering Economy, Human Factor/Safety/Computer/Information Technology, and Heuristics/Optimization.

가우시안 혼합모델을 이용한 공항 접근 패턴 추출 및 패턴 별 과이탈 확률 분석 (Extracting Patterns of Airport Approach Using Gaussian Mixture Models and Analyzing the Overshoot Probabilities)

  • 류재영;한성민;이학태
    • 한국항행학회논문지
    • /
    • 제27권6호
    • /
    • pp.888-896
    • /
    • 2023
  • 항공기 착륙 시에는 정해진 절차에 따라 접근이 이루어진 다음, 활주로 중심선과 정렬하여 착륙하게 된다. 하지만 공항의 상황, 주변 항공기의 상황, 또는 관제사의 지시 등에 따라 빈번한 레이더 벡터링이 일어나기 때문에, 교통 흐름을 파악하거나, 비행 안전성을 파악하기 위해서는 항공기의 접근 패턴을 인지할 필요가 있다. 또한 최종 접근 시 활주로 중심선과 정렬하는 과정에서 과이탈이 발생하는 경우가 있는 데, 이는 이후 불안정 접근 등과 같이 보다 위험한 상황을 초래할 수 있다. 본 논문에서는 클러스터링 기법을 이용하여 접근 구간에서의 항공기 궤적들의 패턴을 추출하였다. GMM (Gaussian Mixture Model)을 이용하여 김해공항 접근 항공기 궤적에 대한 클러스터링을 진행하였으며, 2019년 1년간 김해공항으로 착륙한 항공기의 데이터를 이용하였다. 클러스터 별 centroid 값을 이용하여, 총 86개의 접근 궤적 패턴을 추출하였다. 그 후 각 클러스터 내 항공기 중 최종 접근시 과이탈하는 항공기를 탐지하여 확률 분포를 계산하였다.

불완전한 데이터를 처리할수 있는 분류기 (A Classifier Capable of Handling Incomplete Data Set)

  • 이종찬;이원돈
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.53-62
    • /
    • 2010
  • 본 논문은 변수 값들이나 부류 값을 손실한, 불완전한 데이터를 포함하는 데이터 집합을 가지고 학습하는 문제에 적용될 수 있는 분류 알고리즘을 소개한다. 이 알고리즘은 가중치 값과 확률 기법들을 이용하는 데이터 확장 방법을 사용한다. 이는 휘셔(Fisher)의 식을 기반으로 최적의 투사 면이 되도록 고려된 분류기를 확장함으로써 수행한다. 이를 위해, 데이터 확장에 적용되는 과정으로 부터 몇몇 식들이 유도된다. 제안한 알고리즘의 성능평가를 위해, 데이터에서 하나의 변수를 선택하고 이 선택된 변수에 소실 값과 소실되지 않은 값들의 비율을 변형함에 의해 다른 측정값들의 결과들이 반복적으로 비교된다. 또한 데이터 집합의 객관적인 평가를 위해 기계학습에서 지식 습득 도구로 널리 쓰이는 C4.5의 결과와 비교한다.

Decision based uncertainty model to predict rockburst in underground engineering structures using gradient boosting algorithms

  • Kidega, Richard;Ondiaka, Mary Nelima;Maina, Duncan;Jonah, Kiptanui Arap Too;Kamran, Muhammad
    • Geomechanics and Engineering
    • /
    • 제30권3호
    • /
    • pp.259-272
    • /
    • 2022
  • Rockburst is a dynamic, multivariate, and non-linear phenomenon that occurs in underground mining and civil engineering structures. Predicting rockburst is challenging since conventional models are not standardized. Hence, machine learning techniques would improve the prediction accuracies. This study describes decision based uncertainty models to predict rockburst in underground engineering structures using gradient boosting algorithms (GBM). The model input variables were uniaxial compressive strength (UCS), uniaxial tensile strength (UTS), maximum tangential stress (MTS), excavation depth (D), stress ratio (SR), and brittleness coefficient (BC). Several models were trained using different combinations of the input variables and a 3-fold cross-validation resampling procedure. The hyperparameters comprising learning rate, number of boosting iterations, tree depth, and number of minimum observations were tuned to attain the optimum models. The performance of the models was tested using classification accuracy, Cohen's kappa coefficient (k), sensitivity and specificity. The best-performing model showed a classification accuracy, k, sensitivity and specificity values of 98%, 93%, 1.00 and 0.957 respectively by optimizing model ROC metrics. The most and least influential input variables were MTS and BC, respectively. The partial dependence plots revealed the relationship between the changes in the input variables and model predictions. The findings reveal that GBM can be used to anticipate rockburst and guide decisions about support requirements before mining development.

웨어러블 디바이스 서비스 향상을 위한 개인 맞춤형 데이터 복원 알고리즘 (Personalized Data Restoration Algorithm to Improve Wearable Device Service)

  • 박기군;배혜림
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.51-60
    • /
    • 2021
  • 웨어러블 디바이스의 시장규모는 매년 가파르게 성장하고 있으며, 그 슈요에 발맞춰 전세계 제조업체들은 각자만의 특성을 살린 제품들을 선보이고 있다. 그중 스마트워치는 판매량 지분이 매우 높은 웨어러블 디바이스이며, 실시간으로 수집하는 정보를 활용해 사용자들에게 다양한 서비스를 제공하고 있다. 서비스의 품질은 스마트워치가 수집하는 데이터의 정확성에 의존하게 되는데, 상황에 따라 데이터 측정이 되지 않는 경우가 발생한다. 본 논문은 스마트워치가 수집하지 못한 데이터를 복원하는 방법을 소개한다. 데이터 복원을 위해 시간의 흐름에 따라 측정되는 운동궤적(Trajectory) 정보의 유사도 계산 방법을 다루며, 유사도에 따라 결측 구간을 복원하는 절차를 소개한다. 제안된 방법의 성능을 입증하기 위해 기계학습 알고리즘과의 비교실험을 진행하였으며 마지막으로 본 연구의 기대효과와 향후 연구 방향에 대해 다룬다.

2D-QSAR방법을 이용한 농약류의 무지개 송어 급성 어독성 분석 및 예측 (Prediction and analysis of acute fish toxicity of pesticides to the rainbow trout using 2D-QSAR)

  • 송인식;차지영;이성광
    • 분석과학
    • /
    • 제24권6호
    • /
    • pp.544-555
    • /
    • 2011
  • 본 연구는 농약류에 대하여 구조-활성의 정량적 관계(QSAR)를 이용하여 무지개 송어(학명: Oncorhynchus mykiss)의 급성 독성을 예측-분석하는 과정을 수행하였다. 모델 구현을 위해 사용된 275종의 농약류에 대한 수중 독성(96h $LC_{50}$) 값은 DEMETRA프로젝트의 데이터를 사용하였다. 예측 모델에 사용된 2차원 분자 표현자는 PreADMET프로그램으로부터 계산을 하였고, 선형 (다중 선형 회귀 방법)모델과 비선형(서포트 벡터 머신, 인공 신경망) 학습 방법들은 실험값과 예측값의 적합도를 고려하여 최적화 되었다. 데이터 전처리 과정을 거친 뒤에, 5묶음 교차 검증과정을 포함한 모집단 기반 전진 선택법을 통해서 각 학습 방법의 최적의 표현자 집합을 결정하였다. 가장 좋은 결과는 SVM 방법 ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) 이었고, EU의 규제 기준에 따른 분류에서는 87%의 정확도를 나타내었다. MLR방법을 통해서는 무지개 송어의 급성 독성에 대하여 독성을 나타내는 농약류의 구조적 특징과 지질 층과의 상호작용을 설명할 수 있었다. 개발된 모든 모델들은 5묶음 교차 검증과 Y-scrambling test을 통해 검증되었다.

P2P 플랫폼에서의 대출자 신용분석 사례연구: 8퍼센트, 렌딧, 어니스트 펀드 (A Case Study on Credit Analysis System in P2P: 8Percent, Lendit, Honest Fund)

  • 최수만;전동화;오경주
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.229-247
    • /
    • 2020
  • 지식경영 분야의 P2P금융 플랫폼의 성장속에서 빅데이터 및 머신러닝(Machine Learning) 기술을 보유한 회사만이 치열한 경쟁 속에서 생존할 가능성이 높을 것으로 예상된다. 그럼에도 불구하고 관련 서비스를 제공하는 온라인 P2P대출 플랫폼 업체들은 투자자와 대출을 신청하는 중개자로서의 역할을 수행할 뿐이며 투자와 관련된 위험은 모두 투자자에게 귀속시키고 있다. 이러한 이유로, 투자자 입장에서는 투자상품의 안전성을 확인할 수 있는 유일한 방법이 신문이나 온라인 웹사이트를 통한 P2P대출 플랫폼 업체의 평판에만 의존할 수 밖에 없는 실정이다. 또한, 한국의 P2P대출 플랫폼 업체들이 대출자의 개별 신용분석을 체계적으로 실시하여 연체율 등의 시계열 정보를 정확히 파악하기에는 시간적, 경제적 여건이 매우 열악한 상황이다. 그러나, 최근 몇몇 P2P대출 플랫폼 업체들이 업체별 대출자 신용분석에 대한 역량을 가장 중요한 영업자산으로 인식함으로써 빅데이터 및 머신러닝 기술을 바탕으로 인공지능(AI)에 기반한 새로운 신용평가 시스템을 구축하고 시행에 들어가고 있음은 매우 긍정적으로 평가된다. 따라서, 본 연구에서는 신용대출 시장에 주력하고 있으며 인공지능 활용으로 잘 알려진 상위 3개 업체를 대상으로 사례분석 방식을 통해 인공지능을 활용한 대출자 신용분석 절차 및 사용하는 정보 데이터의 종류 등을 분석하고자 한다. 이를 통하여 현 상황에서 P2P 플랫폼 업체들의 인공지능을 통한 신용분석 기법을 이해하고 현 시점에서 국내 인공지능을 활용한 신용분석 방식의 한계점과 개선방안 등을 함께 고찰하고자 한다.

Random Forest 기법을 이용한 산사태 취약성 평가 시 훈련 데이터 선택이 결과 정확도에 미치는 영향 (Study on the Effect of Training Data Sampling Strategy on the Accuracy of the Landslide Susceptibility Analysis Using Random Forest Method)

  • 강경희;박혁진
    • 자원환경지질
    • /
    • 제52권2호
    • /
    • pp.199-212
    • /
    • 2019
  • 머신러닝 기법을 활용한 분석에서 훈련 데이터의 샘플링 전략은 예측 정확도 뿐 만 아니라 일반화 능력에도 많은 영향을 미친다. 특히, 산사태 취약성 분석의 경우, 산사태 발생부에 대한 정보에 비해 산사태 미발생부에 대한 정보가 과도하게 많은 데이터 불균형 현상이 발생하며, 이에 따라 분석 모델의 훈련 데이터 설계 시 데이터 샘플링 과정이 필수적이다. 그러나 기존의 연구들은 대부분 산사태 미발생부 선택 시 발생부 데이터와 1:1의 비율을 갖도록 무작위로 선택하는 방법을 적용하였을 뿐, 특정한 선택 기준에 따라 분석을 수행하지 않았다. 따라서 본 연구에서는 훈련 데이터의 샘플링 전략이 모델의 예측 성능에 미치는 결과를 확인하기 위하여 산사태 발생부와 미발생부의 샘플링 전략기준에 따라 서로 다른 6개의 시나리오를 만들어 Random Forest 모델의 훈련에 사용하였다. 또한 Random Forest의 결과 중 하나인 변수 중요도를 각 산사태 유발인자들에 가중치로 곱하여 줌으로써 산사태 취약지수 값을 산정하였으며, 취약지수 값을 이용해 산사태 취약성도를 제작하고 각 결과 지도의 정확도를 비교 분석하였다. 분석 결과, 훈련데이터의 샘플링 방법에 상관없이 두 지역의 산사태 취약성 분석 결과는 모두 70~80%의 정확도를 보였다. 이를 통해 Random Forest 기법의 산사태 취약성 분석기법으로서의 적용 가능성을 확인하였으며, Random Forest 모델이 제공하는 입력변수의 중요도를 산사태 유발인자 가중치로 활용할 수 있음을 확인하였다. 또한 훈련 시나리오 간의 정확도를 비교한 결과, 특정한 기준에 의해 훈련 데이터를 설계하는 것이 기존의 랜덤 선택 방법보다 높은 예측 정확도를 기대할 수 있음을 확인하였다.

로지스틱 회귀분석을 이용한 도로비탈면관리시스템 데이터 활용 검토 연구 (The Study for Utilizing Data of Cut-Slope Management System by Using Logistic Regression)

  • 우용훈;김승현;양인철;이세혁
    • 지질공학
    • /
    • 제30권4호
    • /
    • pp.649-661
    • /
    • 2020
  • 도로비탈면관리시스템은 전국 도로 비탈면 현황을 파악하고 위험등급을 산정하여 유지대책 선정 및 사전에 비탈면 붕괴를 차단하여 국민의 안전을 도모하기 위해 만들어졌다. 이를 위해 전국 국도에 위치한 깎기비탈면에 대해 기초·정밀조사를 수행하여 데이터베이스를 구축하고 매년 갱신되고 있다. 수집된 데이터는 수치형과 문자형으로 구성되어 있으며, 사면에 대한 객관적인 정보와 전문가의 판단에 의해 결정된 주관적인 정보로 구성되어 있다. 본 연구에서는 도로비탈면관리시스템에서 관리하는 데이터 활용 가능성을 검토하기 위해, 기계학습인 로지스틱 회귀분석을 이용하여 독립적인 정보를 이용한 주관적 정보 예측 모델을 구축하고 검증하였다. 수행결과, 구축된 확률모델을 이용하여 높은 정확도로 주관적 판단이 필요한 정보들을 예측할 수 있음을 확인하였다. 또한, 구축된 모델을 활용하여 새로 수집된 정보와 모델로부터의 예측값을 비교 ? 검토를 통해 고품질의 데이터를 구축할 수 있을 것으로 기대된다.