• 제목/요약/키워드: 10-fold Validation

검색결과 239건 처리시간 0.027초

확산 텐서 영상과 뇌척수액을 이용한 파킨슨병의 조기 진단 모델 개발 (Development of a model for early detection of Parkinson's disease using diffusion tensor imaging and cerebrospinal fluid)

  • 강신태;이욱;박병규;한경숙
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.753-756
    • /
    • 2014
  • 파킨슨병은 도파민계 신경이 파괴되는 질병으로 알츠하이머병과 함께 대표적인 퇴행성 뇌 질환으로 병의 진행을 완화시킬 수 있는 치료법이 존재하기 때문에 병의 진단이 굉장히 중요하다. 파킨슨병을 진단하기 위한 과거의 연구는 대부분 단일 생체지표를 이용하는 것이었지만 이러한 방법에는 한계성이 존재한다. 따라서 본 연구에서는 생화학적 생체지표인 뇌척수액 내의 ${\alpha}-synuclein$ 단백질 수치와 영상학적 생체지표인 확산 텐서 영상의 여러 모수들을 결합한 융합 생체지표를 특징으로 사용하는 파킨슨병 진단 모델을 개발하고 성능을 평가하였다. 10-fold cross validation 에서 모든 성능지표에 대해 최고 100%를 보였으며, cross validation 의 과적합을 감안하더라도 파킨슨병의 조기진단에 유용하게 사용될 수 있는 가능성을 제시하였다.

A Pragmatic Framework for Predicting Change Prone Files Using Machine Learning Techniques with Java-based Software

  • Loveleen Kaur;Ashutosh Mishra
    • Asia pacific journal of information systems
    • /
    • 제30권3호
    • /
    • pp.457-496
    • /
    • 2020
  • This study aims to extensively analyze the performance of various Machine Learning (ML) techniques for predicting version to version change-proneness of source code Java files. 17 object-oriented metrics have been utilized in this work for predicting change-prone files using 31 ML techniques and the framework proposed has been implemented on various consecutive releases of two Java-based software projects available as plug-ins. 10-fold and inter-release validation methods have been employed to validate the models and statistical tests provide supplementary information regarding the reliability and significance of the results. The results of experiments conducted in this article indicate that the ML techniques perform differently under the different validation settings. The results also confirm the proficiency of the selected ML techniques in lieu of developing change-proneness prediction models which could aid the software engineers in the initial stages of software development for classifying change-prone Java files of a software, in turn aiding in the trend estimation of change-proneness over future versions.

A Deep Learning Approach for Classification of Cloud Image Patches on Small Datasets

  • Phung, Van Hiep;Rhee, Eun Joo
    • Journal of information and communication convergence engineering
    • /
    • 제16권3호
    • /
    • pp.173-178
    • /
    • 2018
  • Accurate classification of cloud images is a challenging task. Almost all the existing methods rely on hand-crafted feature extraction. Their limitation is low discriminative power. In the recent years, deep learning with convolution neural networks (CNNs), which can auto extract features, has achieved promising results in many computer vision and image understanding fields. However, deep learning approaches usually need large datasets. This paper proposes a deep learning approach for classification of cloud image patches on small datasets. First, we design a suitable deep learning model for small datasets using a CNN, and then we apply data augmentation and dropout regularization techniques to increase the generalization of the model. The experiments for the proposed approach were performed on SWIMCAT small dataset with k-fold cross-validation. The experimental results demonstrated perfect classification accuracy for most classes on every fold, and confirmed both the high accuracy and the robustness of the proposed model.

데이터마이닝을 이용한 박스오피스 예측 (Prediction of box office using data mining)

  • 전성현;손영숙
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1257-1270
    • /
    • 2016
  • 본 연구는 영화 흥행의 척도로서 총 관객수의 예측을 다루었다. 의사결정나무, MLP 신경망모형, 다항로짓모형, support vector machine과 같은 데이터마이닝 분류 기법들을 사용하여 개봉 전, 개봉 일, 개봉 1주 후, 그리고 개봉 2주 후 시점 별로 예측이 이루어진다. 국적, 등급, 개봉 월, 개봉 계절, 감독, 배우, 배급사, 관객수, 그리고 스크린 수와 같은 영화의 내재적인 속성을 나타내는 변수 뿐만 아니라 포털의 평점과 평가자 수, 블로그 수, 뉴스 수와 같은 온라인 구전 변수들이 예측변수로 사용되었다. 10-중 교차 검증에서 신경망모형의 정확도는 개봉 전 시점에서도 90% 이상의 높은 예측력을 보였다. 또한 최종 온라인 구전 변수의 추정치를 예측변수로 추가함으로서 예측의 정확도가 더 높아짐을 볼 수 있다.

트위터 사용자정보의 유사성을 기반으로 한 팔로어 분류시스템 (Follower classification system based on the similarity of Twitter node information)

  • 계용선;윤영미
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.111-118
    • /
    • 2014
  • 현재 트위터에서 제공되는 친구추천 시스템은 영향력이 높은 사용자를 우선적으로 추천해준다. 하지만 사용자정보의 유사성이 높은 다른 사용자는 추천되지 않는 단점을 가지고 있다. 사용자들은 정보의 유사성이 높은 사용자 추천을 원하기 때문에 이러한 단점을 극복하기 위하여 본 논문에서는 사용자정보의 유사성을 기반으로 팔로어 추천 시스템을 구현하였다. 본 논문에서 사용된 데이터는 SNAP(Stanford Network Analysis Platform)에서 제공하는 데이터로, 팔로어의 수가 10,000명이상인 트위터의 사용자정보와 노드간 연결 데이터로 구성된다. 이 데이터를 트레이닝 데이터로 활용하여 팔로어간의 관계를 분류해줄 수 있는 분류자를 생성하고, 10-Fold Cross Validation을 활용하여, 분류자의 정확도를 판단한다. 두 트위터의 정보가 주어지면 그들 사이에 친구 관계, 팔로우 관계, 비연결 관계를 추천한다.

두 가지 유형의 바이오마커를 이용한 파킨슨병의 진단과 신경섬유 경로의 특징 분석 (Diagnosis of Parkinson's Disease Using Two Types of Biomarkers and Characterization of Fiber Pathways)

  • 강신태;이욱;박병규;한경숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권10호
    • /
    • pp.421-428
    • /
    • 2014
  • 파킨슨병은 뇌의 흑질 영역에서 도파민계 신경이 파괴되는 질병으로 알츠하이머병과 함께 대표적인 퇴행성 뇌 질환이다. 현재까지 병을 완치시킬 수 있는 치료법은 없지만 병의 진행을 완화시킬 수 있는 치료법이 존재하기 때문에 병의 진단이 굉장히 중요하다. 파킨슨병을 진단하기 위한 과거의 연구는 대부분 단일 바이오마커를 이용한 것으로 이러한 방법은 파킨슨병 환자를 높은 정확도로 진단할 수 있지만 정상인에 대한 진단은 상대적으로 낮은 성능의 한계성이 존재한다. 따라서 본 연구에서는 생화학적 바이오마커인 뇌척수액 내의 ${\alpha}$-synuclein 단백질 수치와 영상학적 바이오마커인 확산 텐서 영상의 여러 모수들을 결합하여 특징으로 사용하는 파킨슨병 진단 모델을 개발하고 성능을 평가하였다. 진단을 위해 개발된 모든 모델은 10-fold cross validation 성능평가에서 정확도가 최고 91.3%의 높은 성능을 보였으며, test 성능평가에서는 확산 텐서 영상의 모수들 중 FA와 ${\alpha}$-synuclein 단백질 수치가 결합된 모델, MO와 ${\alpha}$-synuclein 단백질 수치가 결합된 두 모델에서 최고 72%의 정확도 성능을 보여 파킨슨병의 진단에 유용하게 사용될 수 있는 가능성을 제시하였다. 파킨슨병의 진단을 위해 개발된 모델의 영상학적 특징 벡터를 통하여 파킨슨병 환자와 정상인의 신경섬유 경로의 특징을 분석하였다.

인공지능을 활용한 기계학습 앙상블 모델 개발 (Development of Machine Learning Ensemble Model using Artificial Intelligence)

  • 이근원;원윤정;송영범;조기섭
    • 열처리공학회지
    • /
    • 제34권5호
    • /
    • pp.211-217
    • /
    • 2021
  • To predict mechanical properties of secondary hardening martensitic steels, a machine learning ensemble model was established. Based on ANN(Artificial Neural Network) architecture, some kinds of methods was considered to optimize the model. In particular, interaction features, which can reflect interactions between chemical compositions and processing conditions of real alloy system, was considered by means of feature engineering, and then K-Fold cross validation coupled with bagging ensemble were investigated to reduce R2_score and a factor indicating average learning errors owing to biased experimental database.

오류 분석을 통한 파서의 성능향상 (Performance Improvement of Parser through Error Analysts)

  • 오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.213-218
    • /
    • 2009
  • 본 논문에서는 무제한 텍스트 입력이 가능한 파서에서 오류분석을 통한 성능 향상을 이루고자 한다. 우선 코퍼스로부터 자동학습에 의해서 구문 분석 모델을 만들고 이를 평가하여 발생하는 오류를 분석한다. 오류를 감소시킬 수 있는 언어 특성이 반영된 자질을 추가하여 성능을 향상시키고자 한다. 세종 코퍼스를 10-fold cross validation으로 평가할 때, 한국어의 특성을 반영한 자질 추가로 1%이상의 성능 향상을 이루었다.

  • PDF

생체모방공학을 이용한 고속철도 차간 공간에 적용한 부엉이 깃 형상 크기에 따른 공력소음 저감 연구 (The Effect of Scaling of Owl's Flight Feather on Aerodynamic Noise at Inter-coach Space of High Speed Trains based on Biomimetic Analogy)

  • 한재현;김태민;김정수
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2012년도 춘계학술대회 논문집
    • /
    • pp.606-611
    • /
    • 2012
  • An analysis and design method for reducing aerodynamic noise in high-speed trains based on biomimetics of noiseless flight of owl is proposed. Wind tunnel testing and numerical CFD (Computational Fluid Dynamics) simulation for the basic inter-coach spacing model are carried out, and their results compared. To determine the effect of scaling of the owl's flight feather on the noise reduction, two-fold and a four-fold scaled up model of the feather are constructed, and the numerical simulations are carried out to obtain the aerodynamic noise levels for each scale. Original model is found to reduce the noise level by 10 dB, while two-fold increase in length dimensions reduces the noise by 12 dB. Validation of numerical solution using wind tunnel experimental measurements are presented as well.

  • PDF

The Effect of Scaling of Owl's Flight Feather on Aerodynamic Noise at Inter-coach Space of High Speed Trains based on Biomimetic Analogy

  • Han, Jae-Hyun;Kim, Tae-Min;Kim, Jung-Soo
    • International Journal of Railway
    • /
    • 제4권4호
    • /
    • pp.109-115
    • /
    • 2011
  • An analysis and design method for reducing aerodynamic noise in high-speed trains based on biomimetics of noiseless flight of owl is proposed. Five factors related to the morphology of the flight feather have been selected, and the candidate optimal shape of the flight feather is determined. The turbulent flow field analysis demonstrates that the optimal shape leads to diminished vortex formation by causing separation of the flow as well as allowing the fluid to climb up along the surface of the flight feather. To determine the effect of scaling of the owl's flight feather on the noise reduction, a two-fold and a four-fold scaled up model of the feather are constructed, and the numerical simulations are carried out to obtain the aerodynamic noise levels for each scale. Original model is found to reduce the noise level by 10 dBA, while two-fold increase in length dimensions reduces the noise by 12 dBA. Validation of numerical solution using wind tunnel experimental measurements is presented as well.

  • PDF