• 제목/요약/키워드: Machine Learning & Training

검색결과 789건 처리시간 0.03초

글꼴 유사도 판단을 위한 Faster R-CNN 기반 한글 글꼴 획 요소 자동 추출 (Automatic Extraction of Hangul Stroke Element Using Faster R-CNN for Font Similarity)

  • 전자연;박동연;임서영;지영서;임순범
    • 한국멀티미디어학회논문지
    • /
    • 제23권8호
    • /
    • pp.953-964
    • /
    • 2020
  • Ever since media contents took over the world, the importance of typography has increased, and the influence of fonts has be n recognized. Nevertheless, the current Hangul font system is very poor and is provided passively, so it is practically impossible to understand and utilize all the shape characteristics of more than six thousand Hangul fonts. In this paper, the characteristics of Hangul font shapes were selected based on the Hangul structure of similar fonts. The stroke element detection training was performed by fine tuning Faster R-CNN Inception v2, one of the deep learning object detection models. We also propose a system that automatically extracts the stroke element characteristics from characters by introducing an automatic extraction algorithm. In comparison to the previous research which showed poor accuracy while using SVM(Support Vector Machine) and Sliding Window Algorithm, the proposed system in this paper has shown the result of 10 % accuracy to properly detect and extract stroke elements from various fonts. In conclusion, if the stroke element characteristics based on the Hangul structural information extracted through the system are used for similar classification, problems such as copyright will be solved in an era when typography's competitiveness becomes stronger, and an automated process will be provided to users for more convenience.

심층신경망을 활용한 Cochlodinium polykrikoides 적조 발생 예측 연구 (Study on Cochlodinium polykrikoides Red tide Prediction using Deep Neural Network under Imbalanced Data)

  • 박수호;정민지;황도현;엥흐자리갈 운자야;김나경;윤홍주
    • 한국전자통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1161-1170
    • /
    • 2019
  • 본 연구에서는 심층 신경망을 이용하여 Cochlodinium polykrikoides 적조 발생을 예측하는 모델을 제안한다. 적조 발생 예측을 위해 8개의 은닉층을 가진 심층 신경망을 구축하였다. 위성 재분석 자료와 기상수치모델 자료를 이용하여 과거 적조 발생해역의 해양 및 기상인자 총 59개를 추출하여 신경망 모델 학습에 활용하였다. 전체 데이터셋 중 적조 발생 사례는 적조 미발생 사례에 비해 매우 적어 불균형 데이터 문제가 발생하였다. 본 연구에서는 이를 해결하기 위해 과표집화(Over sampling) 기반 데이터 증식(Data augmentation) 기법을 적용하였다. 과거자료를 활용하여 모형의 정확도를 평가한 결과 약 97%의 정확도를 보였다.

Dynamic Time Warping 기반의 특징 강조형 제스처 인식 모델 (Feature-Strengthened Gesture Recognition Model based on Dynamic Time Warping)

  • 권혁태;이석균
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권3호
    • /
    • pp.143-150
    • /
    • 2015
  • 스마트 디바이스가 보편화되면서 이에 내장된 가속도 센서를 사용한 제스처의 인식에 관한 연구가 주목받고 있다. 최근 가속도 센서 데이터 시컨스를 통한 제스처 인식에 Dynamic Time Warping(DTW) 기법이 사용되는데, 본 논문에서는 DTW 사용 시 제스처의 인식률을 높이기 위한 특징 강조형 제스처 인식(FsGr) 모델을 제안한다. FsGr 모델은 잘못 인식될 가능성이 높은 유사 제스처들의 집합에 대해 특징이 강조되는 데이터 시컨스의 부분들을 정의하고 이들에 대해 추가적인 DTW를 실행하여 인식률을 높인다. FsGr 모델의 훈련 과정에서는 유사 제스처들의 집합들을 정의하고 유사 제스처들의 특징들을 분석한다. 인식 과정에서는 DTW를 사용한 1차 인식 시도의 결과 제스처가 유사 제스처 집합에 속한 경우, 특징 분석 결과를 기반으로 한 추가적인 인식을 시도하여 인식률을 높인다. 알파베트 소문자에 대한 인식 실험을 통해 FsGr 모델의 성능 평가 결과를 보인다.

A Gaussian process-based response surface method for structural reliability analysis

  • Su, Guoshao;Jiang, Jianqing;Yu, Bo;Xiao, Yilong
    • Structural Engineering and Mechanics
    • /
    • 제56권4호
    • /
    • pp.549-567
    • /
    • 2015
  • A first-order moment method (FORM) reliability analysis is commonly used for structural stability analysis. It requires the values and partial derivatives of the performance to function with respect to the random variables for the design. These calculations can be cumbersome when the performance functions are implicit. A Gaussian process (GP)-based response surface is adopted in this study to approximate the limit state function. By using a trained GP model, a large number of values and partial derivatives of the performance functions can be obtained for conventional reliability analysis with a FORM, thereby reducing the number of stability analysis calculations. This dynamic renewed knowledge source can provide great assistance in improving the predictive capacity of GP during the iterative process, particularly from the view of machine learning. An iterative algorithm is therefore proposed to improve the precision of GP approximation around the design point by constantly adding new design points to the initial training set. Examples are provided to illustrate the GP-based response surface for both structural and non-structural reliability analyses. The results show that the proposed approach is applicable to structural reliability analyses that involve implicit performance functions and structural response evaluations that entail time-consuming finite element analyses.

폐 결절 검출을 위한 합성곱 신경망의 성능 개선 (Performance Improvement of Convolutional Neural Network for Pulmonary Nodule Detection)

  • 김한웅;김병남;이지은;장원석;유선국
    • 대한의용생체공학회:의공학회지
    • /
    • 제38권5호
    • /
    • pp.237-241
    • /
    • 2017
  • Early detection of the pulmonary nodule is important for diagnosis and treatment of lung cancer. Recently, CT has been used as a screening tool for lung nodule detection. And, it has been reported that computer aided detection(CAD) systems can improve the accuracy of the radiologist in detection nodules on CT scan. The previous study has been proposed a method using Convolutional Neural Network(CNN) in Lung CAD system. But the proposed model has a limitation in accuracy due to its sparse layer structure. Therefore, we propose a Deep Convolutional Neural Network to overcome this limitation. The model proposed in this work is consist of 14 layers including 8 convolutional layers and 4 fully connected layers. The CNN model is trained and tested with 61,404 regions-of-interest (ROIs) patches of lung image including 39,760 nodules and 21,644 non-nodules extracted from the Lung Image Database Consortium(LIDC) dataset. We could obtain the classification accuracy of 91.79% with the CNN model presented in this work. To prevent overfitting, we trained the model with Augmented Dataset and regularization term in the cost function. With L1, L2 regularization at Training process, we obtained 92.39%, 92.52% of accuracy respectively. And we obtained 93.52% with data augmentation. In conclusion, we could obtain the accuracy of 93.75% with L2 Regularization and Data Augmentation.

Volumetric-Modulated Arc Radiotherapy Using Knowledge-Based Planning: Application to Spine Stereotactic Body Radiotherapy

  • Jeong, Chiyoung;Park, Jae Won;Kwak, Jungwon;Song, Si Yeol;Cho, Byungchul
    • 한국의학물리학회지:의학물리
    • /
    • 제30권4호
    • /
    • pp.94-103
    • /
    • 2019
  • Purpose: To evaluate the clinical feasibility of knowledge-based planning (KBP) for volumetric-modulated arc radiotherapy (VMAT) in spine stereotactic body radiotherapy (SBRT). Methods: Forty-eight VMAT plans for spine SBRT was studied. Two planning target volumes (PTVs) were defined for simultaneous integrated boost: PTV for boost (PTV-B: 27 Gy/3fractions) and PTV elective (PTV-E: 24 Gy/3fractions). The expert VMAT plans were manually generated by experienced planners. Twenty-six plans were used to train the KBP model using Varian RapidPlan. With the trained KBP model each KBP plan was automatically generated by an individual with little experience and compared with the expert plan (closed-loop validation). Twenty-two plans that had not been used for KBP model training were also compared with the KBP results (open-loop validation). Results: Although the minimal dose of PTV-B and PTV-E was lower and the maximal dose was higher than those of the expert plan, the difference was no larger than 0.7 Gy. In the closed-loop validation, D1.2cc, D0.35cc, and Dmean of the spinal cord was decreased by 0.9 Gy, 0.6 Gy, and 0.9 Gy, respectively, in the KBP plans (P<0.05). In the open-loop validation, only Dmean of the spinal cord was significantly decreased, by 0.5 Gy (P<0.05). Conclusions: The dose coverage and uniformity for PTV was slightly worse in the KBP for spine SBRT while the dose to the spinal cord was reduced, but the differences were small. Thus, inexperienced planners could easily generate a clinically feasible plan for spine SBRT by using KBP.

객체검출을 위한 빠르고 효율적인 Haar-Like 피쳐 선택 알고리즘 (A Fast and Efficient Haar-Like Feature Selection Algorithm for Object Detection)

  • 정병우;박기영;황선영
    • 한국통신학회논문지
    • /
    • 제38A권6호
    • /
    • pp.486-491
    • /
    • 2013
  • 본 논문은 객체검출(object detection)에 사용되는 분류기의 학습을 위한 빠르고 효율적인 Haar-like feature 선택 알고리듬을 제안한다. 기존 AdaBoost를 이용한 Haar-like feature 선택 알고리듬은 학습 샘플들에 대한 피쳐의 에러만을 고려하여 형태적으로 유사하거나 중복되는 피쳐가 선택되는 경우가 많았다. 제안하는 알고리듬은 피쳐의 형태와 피쳐간의 거리로부터 피쳐의 유사도를 계산하고 이미 선택된 피쳐와 유사도가 큰 피쳐들을 피쳐 세트에서 제거하여 빠르고 효율적인 피쳐 선택이 이루어지도록 하였다. FERET 얼굴 데이터베이스를 사용하여 제안된 알고리듬을 사용하여 학습시킨 분류기와 기존 알고리듬을 사용한 분류기의 성능을 비교하였다. 실험 결과 제안한 피쳐 선택 방법을 사용하여 학습시킨 분류기가 기존 방법을 사용한 분류기보다 향상된 성능을 보였으며, 동일한 성능을 갖도록 학습시켰을 경우 분류기의 피쳐 수가 20% 감소하였다.

하이브리드 드롭아웃 (Hybrid dropout)

  • 박종선;이명규
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.899-908
    • /
    • 2019
  • 수 많은 모수들을 가지고 있는 방대한 심층신경망은 매우 강력한 기계학습 방법이지만 모형의 과도한 융통성으로 인하여 과적합문제를 내포하고 있다. 드롭아웃 방법은 크기가 큰 신경망의 과적합 문제를 해결하는 다양한 방법들 중 하나이며 매우 효과적인 방법으로 알려져 있다. 드롭아웃 방법은 훈련과정에서 각각의 표본에 다른 모형을 적용하는데 이들 모형은 입력과 은닉층의 노드들을 무작위로 제거한 모형들 중에 임의로 선택된다. 본 연구에서는 임의로 선택된 모형에 둘 이상의 표본을 적용하여 모형의 가중치들에 대한 추정치의 안정성을 높이는 하이브리드 드롭아웃 방법을 제시하였다. 실제 자료를 이용한 시뮬레이션 결과 노드의 선택확률과 모형의 적합에 사용되는 표본의 수를 적절하게 선택하여 기존의 방법에 비하여 추정치의 변동성이 감소시킬 수 있었으며 동시에 검증자료에 대한 최저오차도 줄일 수 있음을 보였다.

질의응답 시스템에서 처음 보는 단어의 역문헌빈도 기반 단어 임베딩 기법 (Inverse Document Frequency-Based Word Embedding of Unseen Words for Question Answering Systems)

  • 이우인;송광호;심규석
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.902-909
    • /
    • 2016
  • 질의응답 시스템은 사용자의 질문에 대한 답을 찾아주는 시스템으로, 기존의 검색엔진이 사용자의 질의에 대해 관련된 문서의 링크만을 찾아주는 반면 질문에 대한 최종적인 답을 찾아준다는 차이점이 있다. 특정 분야에 국한되지 않고 다양한 질문을 처리해주는 오픈 도메인 질의응답 시스템에 필요한 연구들이 최근 자연어 처리, 인공지능, 데이터 마이닝 등 학계의 다양한 분야들에서 뜨거운 관심을 받고 있다. 하지만 관련 연구에서는 학습 데이터에는 없었던 단어들이 질문에 대한 정확한 답과 유사한 오답을 구별해내는데 결정적인 역할을 할 수 있음에도, 이러한 처음 보는 단어들을 모두 단일 토큰으로 치환해버리는 문제가 있다. 본 논문에서는 문맥 정보를 통해 이러한 모르는 단어에 대한 벡터를 계산하는 방법을 제안한다. 그리고 역문헌빈도 가중치를 활용하여 문맥정보를 더 효율적으로 처리하는 모델을 제안한다. 또한 풍부한 실험을 통해 질의응답 시스템의 모델 학습 속도 및 정확성이 기존 연구에 비해 향상됨을 확인하였다.

의학문서 질의응답을 위한 정답 스닛핏 검색 (Answer Snippet Retrieval for Question Answering of Medical Documents)

  • 이현구;김민경;김학수
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.927-932
    • /
    • 2016
  • 온라인 의학 문서의 폭발적 증가와 함께 질의응답 시스템에 대한 필요성이 늘어나고 있다. 최근에는 기계학습에 기반 한 질의응답 모델들이 다양한 영역에서 좋은 결과를 보여 왔다. 그러나 의학 영역에서 질의응답 모델들은 학습 데이터의 부족으로 인해 여전히 정보 검색 기술에 기반을 두고 있다. 본 논문에서는 다양한 정보검색 기술에 기반 한 의학문서 질의응답용 정답 스닛핏 검색 모델을 제안한다. 제안 모델은 먼저 클러스터 기반 검색 기술을 이용하여 의학 문서로부터 많은 정답 후보 문장을 검색한다. 그리고 다양한 문장 검색 기술들에 기반 한 정답 후보 문장 재순위화 모델을 사용하여 신뢰성 있는 정답 스닛핏을 생성한다. BioASQ 4b 데이터를 이용한 실험에서 제안 모델은 기존 모델보다 좋은 성능(MAP 0.0604)을 보였다.