• 제목/요약/키워드: Neural network models

검색결과 1,819건 처리시간 0.024초

다중 기계학습 방법을 이용한 한국어 커뮤니티 기반 질의-응답 시스템 (A Korean Community-based Question Answering System Using Multiple Machine Learning Methods)

  • 권순재;김주애;강상우;서정연
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1085-1093
    • /
    • 2016
  • 커뮤니티 기반 질의 응답 시스템은 사용자 질의에 대한 정답을 인터넷 커뮤니티에 사용자들이 게시했던 문서 중에서 선택하여 제공하는 시스템이다. 기존 방법들은 질의 분석의 성능 향상을 위하여 목적 영역에 적합한 규칙을 구축하거나 일부 처리 과정에 기계 학습을 적용하였다. 하지만 기존 방법들은 적용 영역을 확장하거나 수정하는 경우 많은 비용이 소요되며 경우에 따라서는 시스템이 특정 영역에 과적합되는 경우가 발생한다. 본 논문에서는 커뮤니티 기반 질의-응답 시스템의 효과적인 처리를 위해서 시스템의 각 과정에 적합한 기계 학습 방법을 적용하여 전체 과정을 자동화하는 다중 기계학습 방법을 제안한다. 제안 시스템은 사용자 질의를 분석하는 부분과 정답 문서를 선택하는 부분으로 나눌 수 있다. 질의 분석 과정은 질의의 초점 구문을 분석하는 질의 핵심부 추출기와 질의의 주제를 분류하는 질의 유형 분류기로 구성하였으며, 전자는 조건부 무작위장을 사용하고 후자는 지지 벡터 기계를 사용한다. 정답 문서 선택에서는 유사도 측정에서 사용하는 가중치를 인공 신경망으로 학습한다. 또한 인터넷에 커뮤니티에 게시된 데이터는 형태소 분석 결과를 신뢰할 수 없는 경우가 많이 발생한다. 따라서 음절 자질을 사용하여 질의를 분석 단계에서 형태소 분석의 영향을 최소화하는 방법을 제안한다. 제안하는 시스템은 Mean Average Precision 기준으로 0.765, R-Precision 기준으로 0.872의 성능을 보여 기존 시스템보다 성능이 우수하다.

심부 석탄광산의 환기시스템 최적화 연구 (A Study on Optimum Ventilation System in the Deep Coal Mine)

  • 권준욱;김선명;김윤광;장윤호
    • 터널과지하공간
    • /
    • 제25권2호
    • /
    • pp.186-198
    • /
    • 2015
  • 본 연구에서는 적정 소요환기량의 확보를 통한 갱내 환경의 최적화를 위한 기초연구로 갱내 소요환기량을 추정하였다. 채굴의 심부화 및 운행갱도의 증가로 인한 온도상승으로 작업환경이 점차 악화되는 광산에서 작업환경의 개선을 위하여 J광업소를 대상으로 환기평가를 하였으며 갱내의 환기효율을 증가시키기 위하여 갱도의 길이에 따른 온도에 대한 효과를 수치 해석하였다. 연구결과 J광업소의 소요환기량은 $17,831m^3/min$으로 산출되었으며, 실제 총 입기량은 $16,474m^3/min$로 환기량이 $1,357m^3/min$ 부족한 것으로 나타났다. 개발된 프로그램을 이용하여 J 광업소의 두 가지 개발모델에 관하여 온도 예측을 하였으며 온도계산의 기본 인자인 환기량 예측을 위해서 수치해석 프로그램인 VnetPC를 사용하였다. 실험 결과 첫 번째 개발모델인 -425ML을 전체 개발할 경우의 C 생산부 주운반갱도 9X의 온도는 $29.30^{\circ}C$로 예측되었으며 두 번째 모델인, A 생산부를 제외한 일부 지역만 개발할 경우의 온도는 $27.45^{\circ}C$로 예측되었다.

ANFIS를 이용한 상수도 1일 급수량 예측에 관한 연구 (A Study of Prediction of Daily Water Supply Usion ANFIS)

  • 이경훈;문병석;강일환
    • 한국수자원학회논문집
    • /
    • 제31권6호
    • /
    • pp.821-832
    • /
    • 1998
  • 본 논문에서는 상수도시설을 효율적으로 운영하는 데 필요한 1일 급수량 수요를 예측하는 방식에 대하여 인공지능(Artificial Inteligence)이라 불리는 퍼지 뉴론(fuzzy neuron)을 이용하여 연구하였다. 퍼지뉴론이란 퍼지정보(fuzzy information)를 입력으로 받아들이고 처리하는 퍼지 신경망을 일컫는 말이다. 본 연구에서는 소속함수와 퍼지규칙을 신경망으로 학습하는 기능인 적응식 학습방법을 통하여 1일 급수량을 예측하였으며 연구대상 지역으로는 광주광역시를 선정하였다. 또한 1일 급수량 예측에 있어서 필요한 변수 선택을 위해 입력자료를 상관분석, 자기상관, 부분자기상관, 교차상관 분석 등을 하였으며 동정된 입력변수는 급수량, 평균기온, 급수인구이다. 먼저 급수량, 평균기온, 급수인구로 모델을 구성하였고, 한편으론 기상청의 기후예보자료를 신뢰할 수 없는 경우에는 급수량을 예측할 수 있도록 급수량 자료만으로 모델을 구성하여 그 유효성을 검증하였다. 제안된 모형식은 사고 등의 인위적인 조작(단수 등)이 가해지는 시기를 포함하고도 실측치와 모형의 예측치와의 오차율이 최대 18.46%, 평균2.36% 이내로 나타나, 모형의 결과는 상수도 시설의 운용 및 급·배수관망의 실시간 제어에 많은 도움을 주리라 생각된다.

  • PDF

기계학습을 활용한 오리사 바닥재 수분 발생량 분석 (Estimation of Duck House Litter Evaporation Rate Using Machine Learning)

  • 김다인;이인복;여욱현;이상연;박세준;크리스티나;김준규;최영배;조정화;정효혁;강솔뫼
    • 한국농공학회논문집
    • /
    • 제63권6호
    • /
    • pp.77-88
    • /
    • 2021
  • Duck industry had a rapid growth in recent years. Nevertheless, researches to improve duck house environment are still not sufficient enough. Moisture generation of duck house litter is an important factor because it may cause severe illness and low productivity. However, the measuring process is difficult because it could be disturbed with animal excrements and other factors. Therefore, it has to be calculated according to the environmental data around the duck house litter. To cut through all these procedures, we built several machine learning regression model forecasting moisture generation of litter by measured environment data (air temperature, relative humidity, wind velocity and water contents). 5 models (Multi Linear Regression, k-Nearest Neighbors, Support Vector Regression, Random Forest and Deep Neural Network). have been selected for regression. By using R-Square, RMSE and MAE as evaluation metrics, the best accurate model was estimated according to the variables for each machine learning model. In addition, to address the small amount of data acquired through lab experiments, bootstrapping method, a technique utilized in statistics, was used. As a result, the most accurate model selected was Random Forest, with parameters of n-estimator 200 by bootstrapping the original data nine times.

시뮬레이티드 어니일링 기반의 랜덤 포레스트를 이용한 기업부도예측 (Predicting Corporate Bankruptcy using Simulated Annealing-based Random Fores)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.155-170
    • /
    • 2018
  • 기업의 금융 부도를 예측하는 것은 전통적으로 비즈니스 분석에서 가장 중요한 예측문제 중 하나이다. 선행연구에서 예측모델은 통계 및 기계학습 기반의 기법을 적용하거나 결합하는 방식으로 제안되었다. 본 논문에서는 잘 알려진 최적화기법 중 하나인 시뮬레이티드 어니일링에 기반한 새로운 지능형 예측모델을 제안한다. 시뮬레이티드 어니일링은 유전자알고리즘과 유사한 최적화 성능을 가진 것으로 알려져 있다. 그럼에도 불구하고, 시뮬레이티드 어니일링을 사용한 비즈니스 의사결정 문제의 예측과 분류에 관한 연구가 거의 없었기 때문에, 비즈니스 분석에서의 유용성을 확인하는 것은 의미가 있다. 본 연구에서는 시뮬레이티드 어니일링과 기계학습의 결합 모델을 사용하여 부도예측모델의 입력 특징을 선정한다. 최적화 기법과 기계학습기법을 결합하는 대표적인 유형은 특징 선택, 특징 가중치 및 사례 선택이다. 이 연구에서는 선행연구에서 가장 많이 연구된 특징 선택을 위한 결합모델을 제안한다. 제안하는 모델의 우수성을 확인하기 위하여 본 연구에서는 한국 기업의 실제 재무데이터를 이용하여 그 결과를 분석한다. 분석결과는 제안된 모델의 예측 정확도가 단순한 모델의 예측 정확성보다 우수하다는 것을 보여준다. 특히 기존의 의사결정나무, 랜덤포레스트, 인공신경망, SVM 및 로지스틱 회귀분석에 비해 분류성능이 향상되었다.

해수 이용 LNG 재기화 공정의 딥러닝과 AutoML을 이용한 동적모델링 (AutoML and Artificial Neural Network Modeling of Process Dynamics of LNG Regasification Using Seawater)

  • 신용범;유상우;곽동호;이나경;신동일
    • Korean Chemical Engineering Research
    • /
    • 제59권2호
    • /
    • pp.209-218
    • /
    • 2021
  • ORV의 열교환 효율 향상 및 운전 최적화를 위한, first principle 기반 모델링 연구들이 수행되어왔지만, ORV의 열 전달 계수는 시간, 위치에 따라 불규칙한 시스템으로, 복잡한 모델링 과정을 거친다. 본 연구는 복잡한 시스템에 대한 데이터 기반 모델링의 실효성을 확인하고자, LNG 재기화 공정의 실제 운전데이터를 이용해, ORV의 해수 유량, 해수온도, LNG 유량 변화에 따른 토출 NG 온도 및 토출 해수 온도의 동적 변화 예측이 가능한, FNN, LSTM 및 AutoML 기반 모델링을 진행하였다. 예측 정확도는 MSE 기준 LSTM > AutoML > FNN 순으로 좋은 성능을 보였다. 기계학습 모델의 자동설계 방법인 AutoML의 성능은 개발된 FNN보다 뛰어났으며, 모델 개발 전체소요시간은 복잡한 모델인 LSTM 대비 1/15로 크게 차이를 보여 AutoML의 활용 가능성을 보였다. LSTM과 AutoML을 이용한 토출 NG 및 토출 해수 온도의 예측은 0.5 K 미만의 오차를 보였다. 예측모델을 활용해, 겨울철 ORV를 이용해 처리 가능한 LNG 기화량의 실시간 최적화를 수행하여, 기존 대비 최대 23.5%의 LNG를 추가 처리 가능함을 확인하였고, 개발된 동적 예측모델 기반의 ORV 최적 운전 가이드라인을 제시하였다.

스킵연결이 적용된 오토인코더 모델의 클러스터링 성능 분석 (Clustering Performance Analysis of Autoencoder with Skip Connection)

  • 조인수;강윤희;최동빈;박용범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.403-410
    • /
    • 2020
  • 오토인코더의 데이터 복원(Output result) 기능을 이용한 노이즈 제거 및 초해상도와 같은 연구가 진행되는 가운데 오토인코더의 차원 축소 기능을 이용한 클러스터링의 성능 향상에 대한 연구도 활발히 진행되고 있다. 오토인코더를 이용한 클러스터링 기능과 데이터 복원 기능은 모두 동일한 학습을 통해 성능을 향상시킨다는 공통점이 있다. 본 논문은 이런 특징을 토대로, 데이터 복원 성능이 뛰어나도록 설계된 오토인코더 모델이 클러스터링 성능 또한 뛰어난지 알아보기 위한 실험을 진행했다. 데이터 복원 성능이 뛰어난 오토인코더를 설계하기 위해서 스킵연결(Skip connection) 기법을 사용했다. 스킵연결 기법은 기울기 소실(Vanishing gradient)현상을 해소해주고 모델의 학습 효율을 높인다는 장점을 가지고 있을 뿐만 아니라, 데이터 복원 시 손실된 정보를 보완해 줌으로써 데이터 복원 성능을 높이는 효과도 가지고 있다. 스킵연결이 적용된 오토인코더 모델과 적용되지 않은 모델의 데이터 복원 성능과 클러스터링 성능을 그래프와 시각적 추출물을 통해 결과를 비교해 보니, 데이터 복원 성능은 올랐지만 클러스터링 성능은 떨어지는 결과를 확인했다. 이 결과는 오토인코더와 같은 신경망 모델이 출력된 결과 성능이 좋다고 해서 각 레이어들이 데이터의 특징을 모두 잘 학습했다고 확신할 수 없음을 알려준다. 마지막으로 클러스터링의 성능을 좌우하는 잠재변수(latent code)와 스킵연결의 관계를 분석하여 실험 결과의 원인에 대해 파악하였고, 파악한 결과를 통해 잠재변수와 스킵연결의 특징정보를 이용해 클러스터링의 성능저하 현상을 보완할 수 있다는 사실을 보였다. 이 연구는 한자 유니코드 문제를 클러스터링 기법을 이용해 해결하고자 클러스터링 성능 향상을 위한 선행연구이다.

장기요양 필요 발생의 고위험 대상자 발굴을 위한 예측모형 개발 (Development of prediction model identifying high-risk older persons in need of long-term care)

  • 송미경;박영우;한은정
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.457-468
    • /
    • 2022
  • 고령인구가 증가함에 따라 국가차원에서 노인의 건강노화 실현을 위한 장기요양 필요 발생의 예방 방안을 마련하는 것은 매우 중요하며, 정책적 효과를 극대화하기 위해서는 적절한 대상자의 선정이 선행되어야 한다. 이에 본 연구는 국민건강보험공단의 국민건강정보를 활용하여, 장기요양 필요를 야기하는 기능장애 발생 가능성이 높은 대상자를 발굴하기 위한 예측모형을 개발하고자 한다. 본 연구는 연구대상자의 과거 수집된 자료를 활용하는 후향적 연구로, 본 연구의 연구대상자는 만 65세 이상 의료보장등록인구이다(총 7,724,101명). 예측모형 개발을 위해 고유 방법인 로지스틱 회귀모형, 머신러닝 방법인 의사결정나무와 랜덤포레스트, 딥러닝 방법인 다층퍼셉트론 신경망을 분석하였다. 체계적 분석절차를 통해 각 분석방법별 모형을 적합하였고, 내적 타당성 및 외적 타당성 평가 결과를 기반으로 최종 예측모형을 랜덤포레스트로 선정하였다. 랜덤포레스트는 모집단에서의 4.50%밖에 되지 않는 장기요양 필요 대상자의 약 90%를 장기요양 필요 발생 고위험 대상자로 예측할 수 있다. 본 연구의 예측모형 및 고위험군 기준은 노인의 욕구 중심에서 예방 서비스가 필요한 대상자를 선제적으로 발굴하는데 기여할 것으로 기대된다.

Model Inversion Attack: Analysis under Gray-box Scenario on Deep Learning based Face Recognition System

  • Khosravy, Mahdi;Nakamura, Kazuaki;Hirose, Yuki;Nitta, Naoko;Babaguchi, Noboru
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권3호
    • /
    • pp.1100-1118
    • /
    • 2021
  • In a wide range of ML applications, the training data contains privacy-sensitive information that should be kept secure. Training the ML systems by privacy-sensitive data makes the ML model inherent to the data. As the structure of the model has been fine-tuned by training data, the model can be abused for accessing the data by the estimation in a reverse process called model inversion attack (MIA). Although, MIA has been applied to shallow neural network models of recognizers in literature and its threat in privacy violation has been approved, in the case of a deep learning (DL) model, its efficiency was under question. It was due to the complexity of a DL model structure, big number of DL model parameters, the huge size of training data, big number of registered users to a DL model and thereof big number of class labels. This research work first analyses the possibility of MIA on a deep learning model of a recognition system, namely a face recognizer. Second, despite the conventional MIA under the white box scenario of having partial access to the users' non-sensitive information in addition to the model structure, the MIA is implemented on a deep face recognition system by just having the model structure and parameters but not any user information. In this aspect, it is under a semi-white box scenario or in other words a gray-box scenario. The experimental results in targeting five registered users of a CNN-based face recognition system approve the possibility of regeneration of users' face images even for a deep model by MIA under a gray box scenario. Although, for some images the evaluation recognition score is low and the generated images are not easily recognizable, but for some other images the score is high and facial features of the targeted identities are observable. The objective and subjective evaluations demonstrate that privacy cyber-attack by MIA on a deep recognition system not only is feasible but also is a serious threat with increasing alert state in the future as there is considerable potential for integration more advanced ML techniques to MIA.

무장 선택을 위한 딥러닝 기반의 비행체 식별 기법 연구 (A Study on Deep Learning based Aerial Vehicle Classification for Armament Selection)

  • 차은영;김정창
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.936-939
    • /
    • 2022
  • 최근 공중 전투체계 기술들이 발전함에 따라 대공방어 시스템의 발전이 요구되고 있다. 대공 방어 시스템의 운용개념에 있어, 표적에 적합한 무장을 선택하는 것은 제한된 대공 전력을 사용하여 위협체에 대해 효율적으로 대응한다는 측면에서 체계에 요구되는 능력 중 하나이다. 비행 위협체의 식별에 있어 많은 부분이 운용자의 육안 식별에 의존하는데 고속으로 기동하고 원거리에 위치한 비행체를 육안으로 판별하는 것은 많은 한계가 있다. 뿐만 아니라, 현대 전장에서 무인화 및 지능화된 무기체계의 수요가 증가함에 따라 운용자의 육안 식별 대신 체계가 자동으로 비행체를 식별하고 분류하는 기술의 개발이 필수적이다. 영상자료를 수집해 딥러닝 기반의 모델을 이용하여 무기체계를 식별한 사례로는 전차와 함정 등이 있지만 비행체의 식별에 대한 연구는 아직 많이 부족한 상황이다. 따라서 본 논문에서는 합성곱 신경망 모델을 이용하여 전투기, 헬기, 드론을 분류하는 모델을 제시하고 제시하는 모델의 성능을 분석한다. 본 논문에서 제시하는 모델은 시험세트에 대해 95% 이상의 정확도를 보이고, precision 0.9579, recall 0.9558, F1-socre 0.9568의 값을 나타내는 것을 확인할 수 있다.