• 제목/요약/키워드: 개선된 신경망

검색결과 723건 처리시간 0.026초

관계형 강화 학습을 위한 도메인 지식의 효과적인 활용 (Effective Utilization of Domain Knowledge for Relational Reinforcement Learning)

  • 강민교;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.141-148
    • /
    • 2022
  • 최근 들어 강화 학습은 심층 신경망 기술과 결합되어 바둑, 체스와 같은 보드 게임, Atari, StartCraft와 같은 컴퓨터 게임, 로봇 물체 조작 작업 등과 같은 다양한 분야에서 매우 놀라운 성공을 거두었다. 하지만 이러한 심층 강화 학습은 행동, 상태, 정책 등을 모두 벡터 형태로 표현한다. 따라서 기존의 심층 강화 학습은 학습된 정책의 해석 가능성과 일반성에 제한이 있고, 도메인 지식을 학습에 효과적으로 활용하기도 어렵다는 한계성이 있다. 이러한 한계점들을 해결하기 위해 제안된 새로운 관계형 강화 학습 프레임워크인 dNL-RRL은 센서 입력 데이터와 행동 실행 제어는 기존의 심층 강화 학습과 마찬가지로 벡터 표현을 이용하지만, 행동, 상태, 그리고 학습된 정책은 모두 논리 서술자와 규칙들로 나타내는 관계형 표현을 이용한다. 본 논문에서는 dNL-RRL 관계형 강화 학습 프레임워크를 이용하여 제조 환경 내에서 운송용 모바일 로봇을 위한 행동 정책 학습을 수행하는 효과적인 방법을 제시한다. 특히 본 연구에서는 관계형 강화 학습의 효율성을 높이기 위해, 인간 전문가의 사전 도메인 지식을 활용하는 방안들을 제안한다. 여러 가지 실험들을 통해, 본 논문에서 제안하는 도메인 지식을 활용한 관계형 강화 학습 프레임워크의 성능 개선 효과를 입증한다.

Hellinger 거리 IoU와 Objectron 적용을 기반으로 하는 객체 감지 (Object Detection Based on Hellinger Distance IoU and Objectron Application)

  • 김용길;문경일
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.63-70
    • /
    • 2022
  • 2D 객체 감지 시스템은 최근 몇 년 동안 심층 신경망과 대규모 이미지 데이터세트의 사용으로 크게 개선되었지만, 아직도 범주 내에서 데이터 부족, 다양한 외관 및 객체 형상 때문에 자율 탐색 등과 같은 로봇 공학과 관련된 응용에서 2D 물체 감지 시스템은 적절하지 않다. 최근에 소개되고 있는 구글 Objectron 또한 증강 현실 세션 데이터를 사용하는 새로운 데이터 파이프라인이라는 점에서 도약이라 할 수 있지만, 3D 공간에서 2D 객체 이해라는 측면에서 마찬가지로 한계가 있다. 이에 본 연구에서는 더 성숙한 2D 물체 감지 방법을 Objectron에 도입하는 3D 물체 감지 시스템을 나타낸다. 대부분의 객체 감지 방법은 경계 상자를 사용하여 객체 모양과 위치를 인코딩한다. 본 작업에서는 가우스 분포를 사용하여 객체 영역의 확률적 표현을 탐색하는데, 일종의 확률적 IoU라 할 수 있는 Hellinger 거리를 기반으로 하는 가우스 분포에 대한 유사성 측도를 제시한다. 이러한 2D 표현은 모든 객체 감지기에 원활하게 통합할 수 있으며, 실험 결과 데이터 집합에서 주석이 달린 분할 영역에 더 가까워서 Objectron의 단점이라 할 수 있는 3D 감지 정확도를 높일 수 있다.

인공 신경망 알고리즘을 활용한 플라이애시 콘크리트의 염해 내구성능 예측 (The Prediction of Durability Performance for Chloride Ingress in Fly Ash Concrete by Artificial Neural Network Algorithm)

  • 권성준;윤용식
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제26권5호
    • /
    • pp.127-134
    • /
    • 2022
  • 본 연구에서는 장기재령(4~6년)으로 양생된 플라이애시 콘크리트를 대상으로 촉진 염화물 이온 통과 시험을 수행하였다. 콘크리트 배합은 3수준의 물-결합재 비(0.37, 0.42, 0.47)와 2수준의 플라이애시 치환율(0, 30 %)을 가지고 있었으며, 시간 의존적으로 개선되는 통과 전하량을 정량적으로 분석하였다. 또한 실험결과를 GRU 알고리즘을 고려한 단별량 시계열 모델을 적용하여 학습하였으며, 그 예측값을 평가하였다. 통과전하량 실험 결과, 플라이애시 콘크리트는 물-결합재 비에 의한 통과 전하량의 변화가 재령이 증가함에 따라 점차 감소하였으며 OPC 콘크리트에 비하여 우수한 염해저항성을 나타내었다. 최종 평가일인 6년에서 플라이애시 콘크리트는 모든 물 결합재 비 조건에서 'Very low' 등급에 해당되는 통과 전하량이 평가되었지만, OPC 콘크리트의 경우 가장 높은 물-결합재 비를 갖는 조건에서 'Moderate' 등급을 나타내었다. 메인 알고리즘으로서 사용한 GRU 알고리즘은 시계열 데이터를 분석할 수 있고 연산 속도가 빠른 장점을 갖고 있다. 4개의 은닉층을 갖는 딥-러닝 모델이 고려되었으며 결과값은 실험값을 합리적으로 예측하고 있었다. 본 연구의 딥-러닝 모델은 단변량 시계열 특성만을 고려할 수 있는 한계점이 존재하지만 추가 연구를 통해 콘크리트의 강도 및 확산계수와 같은 다양한 특성을 고려할 수 있는 모델이 개발 중에 있다.

DNN 기법을 활용한 지하공동 데이터기반의 지반침하 위험 지도 작성 (Verification of Ground Subsidence Risk Map Based on Underground Cavity Data Using DNN Technique)

  • 김한응;김창헌;김태건;박정준
    • 한국재난정보학회 논문집
    • /
    • 제19권2호
    • /
    • pp.334-343
    • /
    • 2023
  • 연구목적: 본 연구에서는 지반공동탐사로 발견된 공동자료를 지하시설물과의 원인별 상관관계로 분석하고, AI 알고리즘 기반으로 지반침하 예측지도를 검증하여 시민에게 안전한 도로 환경을 제공하고자한다. 연구방법: 위험도 평가 관련 데이터조사와 빅데이터 수집, AI분석을 위한 데이터 전처리, 그리고 AI 알고리즘을 이용하여 지반침하 위험도 예측지도 검증 등 3가지 단계로 연구를 수행하였다. 연구결과:작성한 지반침하 위험 예측지도를 분석하여 부산시 부산진구와 사하구에 대해 긴급, 우선, 일반 3단계의 공동관리 위험등급 분포를 확인 할 수 있었다. 또한, 지반침하 위험 등급 예측 값을 도로노선의 구간별로 정리하여 긴급 등급이 포함된 도로가 부산진구는 총 61개구간 중 3개소, 사하구는 총 68개구간 중 7개소임을 확인하였으며 각 도로노선별 지반침하 위험 예측 순위를 파악하였다. 결론: 도출된 지반침하 위험 예측지도를 바탕으로 효율적으로 탐사구간을 설정하여 우선 조사, 선제 조치함으로써 시민들의 불안을 해소하고 효율적인 도로유지관리 및 보수, 제도의 개선 등의 부수적인 효과를 얻을 수 있다.

누적 가중치 변화의 시각화를 통한 심층 신경망 분석시스템 (Deep Neural Network Analysis System by Visualizing Accumulated Weight Changes)

  • 양태린;박진호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.85-92
    • /
    • 2023
  • 최근 ChatGPT나 자율주행 자동차 등의 인공지능 분야의 급속한 발전으로 인해 인공지능에 대한 관심이 높아졌다. 그러나 아직 인공지능은 학습 과정에서 알 수 없는 요소가 많이 존재하여 모델을 개선하거나 최적화하기 위해서 필요 이상의 시간과 노력을 들여야 하는 경우가 많다. 따라서, 인공지능 모델의 학습 과정에서 가중치 변화를 명확하게 이해하고 해당 변화를 효과적으로 분석할 수 있는 도구 또는 방법론이 절실하게 요구되고 있다. 본 연구에서는 이러한 점을 해결하기 위해 누적 가중치 변화량을 시각화해주는 시스템을 제안한다. 시스템은 학습의 일정한 기간마다 가중치를 구하고 가중치의 변화를 누적시켜서 누적 가중치로 저장하여 3차원 공간상에 나타내게 된다. 이로 인해 보는 이로 하여금 한눈에 레이어의 구조와 현재의 가중치 변화량이 이해되기 쉽게 구성하였다. 이러한 연구를 통해 인공지능 모델의 학습 과정이 어떻게 진행되는지에 대한 이해와 모델의 성능 향상에 도움이 되는 방향으로 하이퍼 파라미터를 변경할 수 있는 지표를 얻게 되는 등 인공지능 학습 과정의 다양한 측면을 탐구할 수 있을 것이다. 이러한 시도를 통해 아직 미지의 영역으로 여겨지는 인공지능 학습 과정의 일부를 보다 효과적으로 탐색하고 인공지능 모델의 발전과 적용에 기여할 수 있을 것으로 기대된다.

A Comparative Study on Data Augmentation Using Generative Models for Robust Solar Irradiance Prediction

  • Jinyeong Oh;Jimin Lee;Daesungjin Kim;Bo-Young Kim;Jihoon Moon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.29-42
    • /
    • 2023
  • 본 논문은 서울, 부산, 인천과 같은 대한민국의 주요 도시들을 대상으로 일사량 예측 정확도를 향상하기 위한 방법론을 제안한다. 제안한 방법론은 먼저 GAN, CTGAN, Copula GAN, WGANGP, TVAE 등 다섯 가지 생성 모델을 이용하여 기존 학습 데이터와 유사한 독립 변수들을 생성한다. 다음으로 모델 학습에서의 데이터 편향성을 개선하고자, 생성한 독립 변수들에서 각각 랜덤 포레스트와 심층 신경망을 통해 종속 변숫값을 도출하여 학습 데이터 셋을 구축하고, 이를 기존 학습데이터 셋과 결합하여 예측 모델을 구성한다. 실험 결과, 증강된 데이터 셋으로 학습한 모델들은 기존 데이터 셋으로 학습한 모델들보다 향상된 성능을 나타내었다. 특히 CTGAN은 복잡한 다변량 데이터 관계를 효과적으로 다루는 메커니즘으로 인해 우수한 결과를 도출하였으며, 생성된 데이터는 일사량의 다양한 변화와 실제 변동성과 효과적으로 반영하였다. 제안한 방법론은 고품질의 생성 데이터로 학습 데이터를 증강함으로써, 데이터 부족 현상 문제를 다룰 수 있을 뿐만 아니라 지속 가능한 발전을 위한 태양광 발전 시스템 운영에도 이바지할 수 있을 것으로 기대한다.

배깅 및 스태킹 기반 앙상블 기계학습법을 이용한 고성능 콘크리트 압축강도 예측모델 개발 (Development of a High-Performance Concrete Compressive-Strength Prediction Model Using an Ensemble Machine-Learning Method Based on Bagging and Stacking)

  • 곽윤지;고채연;곽신영;임승현
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.9-18
    • /
    • 2023
  • 고성능 콘크리트(HPC) 압축강도는 추가적인 시멘트질 재료의 사용으로 인해 예측하기 어렵고, 개선된 예측 모델의 개발이 필수적이다. 따라서, 본 연구의 목적은 배깅과 스태킹을 결합한 앙상블 기법을 사용하여 HPC 압축강도 예측 모델을 개발하는 것이다. 이 논문의 핵심적 기여는 기존 앙상블 기법인 배깅과 스태킹을 통합하여 새로운 앙상블 기법을 제시하고, 단일 기계학습 모델의 문제점을 해결하여 모델 예측 성능을 높이고자 한다. 단일 기계학습법으로 비선형 회귀분석, 서포트 벡터 머신, 인공신경망, 가우시안 프로세스 회귀를 사용하고, 앙상블 기법으로 배깅, 스태킹을 이용하였다. 결과적으로 본 연구에서 제안된 모델이 단일 기계학습 모델, 배깅 및 스태킹 모델보다 높은 정확도를 보였다. 이는 대표적인 4가지 성능 지표 비교를 통해 확인하였고, 제안된 방법의 유효성을 검증하였다.

집단 따돌림 희생자 관리 개선을 위한 모빙 지수 알고리즘 - 소셜 네트워크 기반 군 조직을 중심으로 - (Mobbing Value Algorithm for Improvement Victims Management - based on Social Network in Military -)

  • 김국진;박건우;이상훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권11호
    • /
    • pp.1-12
    • /
    • 2009
  • 집단따돌림(모빙: Mobbing, 이하 '모빙')은 사회 전반에 걸쳐 빠르게 확산되고 있으며 군 조직도 예외가 될 수 없다. 군 조직에서의 모빙 현상은 성인사회 따돌림의 형태인 심리적 배제뿐만 아니라 때로는 심리적, 신체적 괴롭힘까지 나타나기 때문에 자살이나 난동 같은 심각한 군기 사고로 이어지기도 한다. 특히 군 조직에서는 집단 따돌림 예방을 위한 여러 가지 제도 및 관리방안의 시행에도 불구하고 그 피해자가 계속 발생하므로 문제 해결을 위한 어떤 제도와 관리방안을 마련하는 것 보다 그 희생 대상자와 잠정적 희생 대상자를 파악하는 것이 보다 효율적이라는 것을 말해준다. 따라서 본 논문에서는 이러한 문제 해결을 위해 모빙 현상에 관련된 7개의 요소(Factor)와 그 하위에 포함된 50개의 속성 (Attribute)들을 선정한다. 이후 자체 개발한 Gunwoo's 소셜 네트워크 서비스를 이용하여 나와 커뮤니티를 형성한 그룹들에 대해 연관성 유무에 따라 관계가 있으면 '1', 관계가 없으면 '0'으로 표현하여 지수화 한다. 그리고 나와 사용자들 간의 유사도 산정을 위해 유사도 함수(Dice 계수)를 적용한다. 다음으로 SPSS 클레멘타인의 인공신경망(ANN: Artificial Neural Network) 알고리즘을 통해 7개 요소들에 대한 최적의 가중치를 산출하고, 이 값들의 총합으로 Mobbing Value(이하 '모빙 지수')를 산정하기 위한 알고리즘을 제안한다. 이 알고리즘은 현재의 모빙 희생자와 잠정적인 희생자를 파악하여 희생자 관리 개선에 도움이 될 것이다.

Transfer Learning based DNN-SVM Hybrid Model for Breast Cancer Classification

  • Gui Rae Jo;Beomsu Baek;Young Soon Kim;Dong Hoon Lim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권11호
    • /
    • pp.1-11
    • /
    • 2023
  • 유방암은 전 세계적으로 여성들 대다수에게 가장 두려워하는 질환이다. 오늘날 데이터의 증가와 컴퓨팅 기술의 향상으로 머신러닝(machine learning)의 효율성이 증대되어 암 검출 및 진단 등에 중요한 역할을 하고 있다. 딥러닝(deep learning)은 인공신경망(artificial neural network, ANN)을 기반으로 하는 머신러닝 기술의 한 분야로 최근 여러 분야에서 성능이 급속도로 개선되어 활용 범위가 확대되고 있다. 본 연구에서는 유방암 분류를 위해 전이학습(transfer learning) 기반 DNN(Deep Neural Network)과 SVM(support vector machine)의 구조를 결합한 DNN-SVM Hybrid 모형을 제안한다. 전이학습 기반 제안된 모형은 적은 학습 데이터에도 효과적이고, 학습 속도도 빠르며, 단일모형, 즉 DNN과 SVM이 가지는 장점을 모두 활용 가능토록 결합함으로써 모형 성능이 개선되었다. 제안된 DNN-SVM Hybrid 모형의 성능평가를 위해 UCI 머신러닝 저장소에서 제공하는 WOBC와 WDBC 유방암 자료를 가지고 성능실험 결과, 제안된 모형은 여러 가지 성능 척도 면에서 단일모형인 로지스틱회귀 모형, DNN, SVM 그리고 앙상블 모형인 랜덤 포레스트보다 우수함을 보였다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.