• 제목/요약/키워드: NN Model

검색결과 280건 처리시간 0.033초

Default Prediction for Real Estate Companies with Imbalanced Dataset

  • Dong, Yuan-Xiang;Xiao, Zhi;Xiao, Xue
    • Journal of Information Processing Systems
    • /
    • 제10권2호
    • /
    • pp.314-333
    • /
    • 2014
  • When analyzing default predictions in real estate companies, the number of non-defaulted cases always greatly exceeds the defaulted ones, which creates the two-class imbalance problem. This lowers the ability of prediction models to distinguish the default sample. In order to avoid this sample selection bias and to improve the prediction model, this paper applies a minority sample generation approach to create new minority samples. The logistic regression, support vector machine (SVM) classification, and neural network (NN) classification use an imbalanced dataset. They were used as benchmarks with a single prediction model that used a balanced dataset corrected by the minority samples generation approach. Instead of using prediction-oriented tests and the overall accuracy, the true positive rate (TPR), the true negative rate (TNR), G-mean, and F-score are used to measure the performance of default prediction models for imbalanced dataset. In this paper, we describe an empirical experiment that used a sampling of 14 default and 315 non-default listed real estate companies in China and report that most results using single prediction models with a balanced dataset generated better results than an imbalanced dataset.

분류 알고리즘과 NCA를 활용한 기계학습 기반 구조건전성 모니터링 시스템 (Machine Learning Based Structural Health Monitoring System using Classification and NCA)

  • 신창교;권현석;박유림;김천곤
    • 한국항행학회논문지
    • /
    • 제23권1호
    • /
    • pp.84-89
    • /
    • 2019
  • 본 연구는 복합재 항공기의 비행 데이터를 활용한 기계학습 기반 구조건전성 모니터링 시스템 연구의 예비 연구이다. 본 연구에서는 구조건전성 모니터링에 이용되기에 가장 적합한 기계학습 알고리즘을 선별하고, 실 기체 데이터에 대한 적용을 위해 차원 축소를 수행하였다. 이를 위해 외팔보를 통해 모사된 항공기 날개 구조와 부가 질량을 통해 손상 모사 실험을 진행하고, 분류 알고리즘을 통해 데이터를 손상의 위치와 정도에 따라 구분하였다. 이를 위해 FBG (fiber bragg grating) 센서를 부착한 외팔보의 진동 실험을 통해 정상상태와 12개의 손상상태에 대한 데이터를 취득하고, MATLAB 환경에서 tree, discriminant, SVM (support vector machine), kNN, ensemble 알고리즘의 비교와 파라미터 튜닝을 통해 가장 적합한 알고리즘을 도출하였다. 또한 NCA (neighborhood component analysis)를 이용한 특징 선택을 통해, 실 기체에서 나올 수 있는 고차원 데이터의 관리를 위해 필요한 차원 축소를 수행하였다. 그 결과, quadratic SVM이 NCA를 적용하지 않은 모델에서 98.7%, NCA를 적용한 모델에서 95.9%로 가장 높은 정답률을 보였다. 또한 NCA 적용 후 모델의 예측 속도, 학습 시간, 용량이 모두 향상되었다.

Multi-dimensional Analysis and Prediction Model for Tourist Satisfaction

  • Shrestha, Deepanjal;Wenan, Tan;Gaudel, Bijay;Rajkarnikar, Neesha;Jeong, Seung Ryul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.480-502
    • /
    • 2022
  • This work assesses the degree of satisfaction tourists receive as final recipients in a tourism destination based on the fact that satisfied tourists can make a significant contribution to the growth and continuous improvement of a tourism business. The work considers Pokhara, the tourism capital of Nepal as a prefecture of study. A stratified sampling methodology with open-ended survey questions is used as a primary source of data for a sample size of 1019 for both international and domestic tourists. The data collected through a survey is processed using a data mining tool to perform multi-dimensional analysis to discover information patterns and visualize clusters. Further, supervised machine learning algorithms, kNN, Decision tree, Support vector machine, Random forest, Neural network, Naive Bayes, and Gradient boost are used to develop models for training and prediction purposes for the survey data. To find the best model for prediction purposes, different performance matrices are used to evaluate a model for performance, accuracy, and robustness. The best model is used in constructing a learning-enabled model for predicting tourists as satisfied, neutral, and unsatisfied visitors. This work is very important for tourism business personnel, government agencies, and tourism stakeholders to find information on tourist satisfaction and factors that influence it. Though this work was carried out for Pokhara city of Nepal, the study is equally relevant to any other tourism destination of similar nature.

임상도와 Landsat TM 위성영상을 이용한 산림탄소저장량 추정 방법 비교 연구 (Comparison of Forest Carbon Stocks Estimation Methods Using Forest Type Map and Landsat TM Satellite Imagery)

  • 김경민;이정빈;정재훈
    • 대한원격탐사학회지
    • /
    • 제31권5호
    • /
    • pp.449-459
    • /
    • 2015
  • 기존의 국가산림자원조사(National Forest Inventory, NFI)에 의한 산림탄소저장량 추정 방법은 국가 규모의 평균 탄소저장량 추정에는 충분하지만 표본점 개수가 부족한 시 군 단위의 세밀한 추정은 어렵다. 본 연구에서는 시 군별 산림탄소저장량 추정을 위해 공간 자료를 보조 자료로 이용하고 2가지 업스케일링 방법을 적용하여 격자별 산림탄소저장량 정보를 가진 산림탄소지도를 제작하였다. 대상지역은 충청남도로 2가지 방법 모두 제 5차 NFI(2006~2009) 자료를 활용하였다. 방법 1은 임상도를 보조 자료로 선택하고 NFI 기반 산림탄소저장량 회귀모델을 이용하였다. 방법 2는 위성영상을 보조 자료로 선택하고 k-NN을 이용하여 산림탄소저장량을 추정하였다. 불확실성을 고려하기 위해 200회 몬테카를로 시뮬레이션을 수행하여 최종 AGB 탄소지도를 산출하였다. 방법 1에서는 충청남도의 총 산림탄소저장량이 22,948,151 tonC으로 기존의 현지조사표본 기반 추정치(21,136,911 tonC)에 비해 과대추정을, 방법 2에서는 19,750,315 tonC로 과소추정되는 경향을 나타내었다. 독립검증 지점(n=186)의 탄소저장량에 대한 대응표본 T-검정 결과, 방법 2의 평균 추정치와 NFI 표본 기반 평균 추정치는 통계적으로 유의한 차이가 있는 반면(p<0.01), 방법 1의 평균 추정치는 NFI 표본 기반 평균 추정치와 통계적으로 유의한 차이가 없는 것으로 평가되었다(p>0.01). 특히, 방법 2의 경우 k-NN의 스무딩 효과 및 몬테카를로 시뮬레이션을 통해 위성영상과 표본점의 mis-registration 오차가 추정오차에 큰 영향을 미칠 수 있음이 발견되었다. 임상도를 활용한 방법 1이 임분 구조가 복잡한 우리나라 산림의 탄소량 추정에 효과적일 수 있지만, 미조사 지점의 주기적인 갱신 및 대면적 추정에 유리한 위성영상의 활용은 여전히 필수적이다, 따라서 시공간적인 확장과 함께 보다 신뢰할 수 있는 산림탄소저장량 추정을 위해 다양한 위성영상 자료 및 활용 기법에 관한 연구가 필요할 것으로 사료된다.

Fuzzy neural network controller of interconnected method for civil structures

  • Chen, Z.Y.;Meng, Yahui;Wang, Ruei-yuan;Chen, Timothy
    • Advances in concrete construction
    • /
    • 제13권5호
    • /
    • pp.385-394
    • /
    • 2022
  • Recently, an increasing number of cutting-edged studies have shown that designing a smart active control for real-time implementation requires piles of hard-work criteria in the design process, including performance controllers to reduce the tracking errors and tolerance to external interference and measure system disturbed perturbations. This article proposes an effective artificial-intelligence method using these rigorous criteria, which can be translated into general control plants for the management of civil engineering installations. To facilitate the calculation, an efficient solution process based on linear matrix (LMI) inequality has been introduced to verify the relevance of the proposed method, and extensive simulators have been carried out for the numerical constructive model in the seismic stimulation of the active rigidity. Additionally, a fuzzy model of the neural network based system (NN) is developed using an interconnected method for LDI (linear differential) representation determined for arbitrary dynamics. This expression is constructed with a nonlinear sector which converts the nonlinear model into a multiple linear deformation of the linear model and a new state sufficient to guarantee the asymptomatic stability of the Lyapunov function of the linear matrix inequality. In the control design, we incorporated H Infinity optimized development algorithm and performance analysis stability. Finally, there is a numerical practical example with simulations to show the results. The implication results in the RMS response with as well as without tuned mass damper (TMD) of the benchmark building under the external excitation, the El-Centro Earthquake, in which it also showed the simulation using evolved bat algorithmic LMI fuzzy controllers in term of RMS in acceleration and displacement of the building.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

기후변화 시나리오를 활용한 미래 한반도 물수급 전망 (Water Balance Projection Using Climate Change Scenarios in the Korean Peninsula)

  • 김초롱;김영오;서승범;최수웅
    • 한국수자원학회논문집
    • /
    • 제46권8호
    • /
    • pp.807-819
    • /
    • 2013
  • 본 연구에서는 기존의 기후변화를 고려한 물수급 분석 방법론의 문제점을 개선하기 위해 GCM 미래 유량 시나리오를 물수급 모형에 직접 입력하는 대신 과거 유량 시나리오의 가중값(재현확률)을 부여하는 새로운 물수급 전망기법을 제안하고자 한다. GCM 미래 기후자료를 TANK 모형에 입력하여 중권역별 미래 유량을 모의하였으며 모의결과에 대한 편이보정을 위해 Quantile Mapping 기법을 적용하였다. 이러한 미래 유량 전망결과를 반영하여 각각의 입력자료에 대한 가중값(재현확률)을 새롭게 산정함으로써 미래 목표 전망구간에 대한 물부족량을 산정하였다. 물수급 모형의 입력자료에 대한 가중값 산정을 위해K-nn 알고리즘을 적용하였으며 비홍수기(10~6월) 유량을 가중값 산정을 위한 기준유량으로 결정하였다. 기후 변화의 불확실성을 고려하고자 4개의 GCM과 3개의 AR4 SRES 온실가스 배출 시나리오를 앙상블 조합하여 생성한 기후변화 시나리오를 활용하였다. 본 연구에서제시한 방법론을 한반도 4대강 유역에 적용한 결과, 기후변화를 고려한 한반도 미래 평균 물부족량은 2020s (2010~2039년)에는 과거에 비해 10~32% 정도 증가할 것으로 전망되었다. 또한, 한반도 4대강 유역의 경우 먼 미래로 갈수록 비홍수기 유량이 점차 감소할 것으로 전망됨에 따라 2080s (2070~2099년)에는 과거 대비 평균 물부족량이 최대 97%(약 516.5백만 $m^3$/년) 증가할 것으로 전망되었다. 기존의 기후변화 연구 방법론의 전망결과를 비교분석한 결과, 기존 방법론은 매우 극적인 물부족량 증가를 전망하고 있는 반면 본 연구에서 제안한 기법은 상대적으로 보수적인 변화를 전망하였다. 본 연구는 물수급 분석시기 후 변화를 고려하되 기존 국가계획 방법론의 틀을 최대한 유지하고 있다는 점에서 국가수자원계획 수립에 있어 정책결정권자들의 혼돈을 줄여줄 수 있는 방법론이 될 수 있다고 판단된다.

주급수 유량의 형상 분류 및 추정 모델에 대한 연구 (A Study of the Feature Classification and the Predictive Model of Main Feed-Water Flow for Turbine Cycle)

  • 양학진;김성근;최광희
    • 에너지공학
    • /
    • 제23권4호
    • /
    • pp.263-271
    • /
    • 2014
  • 터빈 사이클의 성능 상태량을 결정하기 위한 보정 열 성능 분석은 발전소의 향상된 경제성 운전을 위해 요구된다. 본 연구에서는 유용하고 정확한 성능 분석을 위해서 산업 표준인 ASME PTC를 기분으로 하여 성능 데이터를 사용하여 주급수 유량의 영역별 판정 알고리듬을 개발하고 각 영역별 추정 알고리즘을 개발하였다. 추정 알고리즘은 측정 상태량의 상관관계를 기반으로 형상 분류를 제시하고, 이를 기반으로 서포트 벡터 머신 모델링을 이용하여 추정 모델을 구성하였으며, 서포트 벡터 머신 모델링의 우수성을 검증하기 위하여 신경 회로망 모델, 커널 회귀 모델과 비교하였다. 주급수 유량의 형상 분류 및 추정 모델은 터빈 사이클에서 정확한 보정 열 성능 분석을 제공함으로써 향상된 성능 분석에 기여할 것이다.

Discriminant Metric Learning Approach for Face Verification

  • Chen, Ju-Chin;Wu, Pei-Hsun;Lien, Jenn-Jier James
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권2호
    • /
    • pp.742-762
    • /
    • 2015
  • In this study, we propose a distance metric learning approach called discriminant metric learning (DML) for face verification, which addresses a binary-class problem for classifying whether or not two input images are of the same subject. The critical issue for solving this problem is determining the method to be used for measuring the distance between two images. Among various methods, the large margin nearest neighbor (LMNN) method is a state-of-the-art algorithm. However, to compensate the LMNN's entangled data distribution due to high levels of appearance variations in unconstrained environments, DML's goal is to penalize violations of the negative pair distance relationship, i.e., the images with different labels, while being integrated with LMNN to model the distance relation between positive pairs, i.e., the images with the same label. The likelihoods of the input images, estimated using DML and LMNN metrics, are then weighted and combined for further analysis. Additionally, rather than using the k-nearest neighbor (k-NN) classification mechanism, we propose a verification mechanism that measures the correlation of the class label distribution of neighbors to reduce the false negative rate of positive pairs. From the experimental results, we see that DML can modify the relation of negative pairs in the original LMNN space and compensate for LMNN's performance on faces with large variances, such as pose and expression.

진화프로그래밍을 이용한 퍼지 신경망 지능 제어기 설계에 관한 연구 (A Study on design of Fuzzy neural network Intelligence controller using Evolution Programming)

  • 이상부;임영도
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 추계학술대회 학술발표 논문집
    • /
    • pp.143-153
    • /
    • 1997
  • At the on-line control method FLC(Fuzzy Logic Controller) is stronger to the disturbance than a classical controller and its overshoot of the initialized value is excellent. The fuzzy controller can do a proper control, though it doesn't know the mathematical model of the system or the parameter value. But to make the control rule of the fuzzy controller through an expert's experiance has a changes of the control system, the control rule is fixed, it can't adjust to the environment changes of the control system, the controller output value has a minute error and it can't convergence correctly to the desired value[1][2]. There are many ways to eliminate the minute error[3][4][5], but in this paper suggests EP-FNNIC(Fuzzy Neurla Network Intelligence Controller) intelligence controller which combines FLC with NN(Neural Network) and EP(Evolution Programming). The output characteristics of EP-FNNIC controller will be compared and analyzed with FLC. It will be showed that this EP-FN IC controller converge correctly to the desirable value without any error. The convergence speed, overshoot, rising time, error of steady state of controller of these two kinds also will be compared.

  • PDF