• 제목/요약/키워드: hyperparameters

검색결과 158건 처리시간 0.024초

움직임 인식응용을 위한 커널 밀도 추정 기반 학습용 데이터 증폭 기법 (Data Augmentation using a Kernel Density Estimation for Motion Recognition Applications)

  • 정우순;이형규
    • 한국산업정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.19-27
    • /
    • 2022
  • 머신러닝(ML, Machine Learning)기반 응용에서의 인식성능은 적용된 모델의 종류와 크기, 학습환경 및 학습에 사용되는 데이터 등 다양한 요인에 따라 결정된다. 특히 학습에 사용되는 데이터가 충분치 않을 경우 인식성능이 저하되거나 과적합(Overfitting)등의 문제가 발생하기도 한다. 이미지 인식을 주요 대상으로 하는 기존 연구들은 학습을 위한 데이터셋이 풍부하고 검증된 데이터셋을 사용하여 학습 및 인식성능을 평가할 수 있다. 하지만 사용된 센서, 인식의 대상, 인식 상황이 다른 특정 응용들의 경우 데이터셋을 직접 구축해야 한다. 이런 경우, ML모델의 성능은 데이터의 양과 품질에 따라 달라진다. 본 논문에서는 이용 가능한 학습용 데이터가 충분치 않은 움직임 인식응용에 효율적으로 사용될 수 있는 비모수 추정 방식의 일종인 커널 밀도 추정 알고리즘을 사용하여 학습용 데이터를 증폭한 후, 사용된 커널의 종류에 따라, 원본 데이터의 수 및 증폭 비율에 따라 증폭된 데이터가 원본 데이터의 특징을 잘 반영하는지 인식 정확도 변화를 토대로 비교 분석한다. 실험결과, 본 연구에서 사용한 움직임 인식응용에서는 좁은 대역폭을 가진 Tophat 커널로 증폭된 데이터셋에서 최대 14.31%의 인식 정확도 향상을 확인하였다.

하중유형 분석을 통한 좌굴에 강한 복합재료 사각관 설계에 관한 연구 (Enhancement of Buckling Characteristics for Composite Square Tube by Load Type Analysis)

  • 함석우;지승민;전성식
    • Composites Research
    • /
    • 제36권1호
    • /
    • pp.53-58
    • /
    • 2023
  • PIC 설계 방법은 선행 유한요소해석을 통해 하중 유형을 나누어, 각 구간마다 하중 유형에 강한 복합재료의 적층 각도 순서를 배치하는 방법이다. 기존 연구에서는 효율적으로 구간을 나누기 위하여 PIC 설계 방법에 머신 러닝이 적용되었으며, 학습 데이터는 선행 유한요소해석 결과 값을 통해 전체 요소의 일부인 참조 요소에서의 인장, 압축 그리고 전단과 같은 하중 유형으로 나누어 라벨링 되었다. 하지만 좌굴에 대해 고려되지 않아서 좌굴 발생 시, 적절한 하중 유형으로 나눌 수 없기 때문에 이를 해결하기 위한 방법이 필요하다. 본 연구에서는 좌굴이 고려되기 위한 새로운 하중 유형 분석 방법을 기존의 PIC 설계에 적용하는 기법(PIC-NTL)이 제안되었다. 좌굴의 하중 분석은 각 플라이(Ply)별 응력 3축 특성을 통해 진행되었으며, 요소의 두께 방향으로 동일한 크기의 두 영역으로 나누어진 판단 영역 내에서 결정된 하중 유형을 통해 대표 하중 유형이 지정되었다. 학습 데이터의 특성 값은 참조 요소의 좌표, 라벨(Label)은 각 판단 영역의 대표 하중 유형으로 구성되었으며, 이 데이터를 통해 머신 러닝 모델이 학습되었다. 머신 러닝 모델의 성능에 영향을 미치는 하이퍼파라미터는 베이지안 알고리즘을 통하여 최적 값으로 튜닝되었다. 튜닝 된 머신 러닝 모델의 중 SVM 모델이 가장 높은 예측률과 ROC-AUC로 나타났으며, 해당 모델을 통해 예측된 데이터가 유한요소 모델에 매핑되었다. 기존에 제안된 PIC 설계 방법과 비교하기 위하여 사각관 형태의 모델을 압축시키는 유한요소해석이 진행되었으며, 본 연구에서 제안된 설계 방법이 강도와 에너지 흡수율에서 더 우수함이 검증되었다.

순환 아키텍쳐 및 하이퍼파라미터 최적화를 이용한 데이터 기반 군사 동작 판별 알고리즘 (A Data-driven Classifier for Motion Detection of Soldiers on the Battlefield using Recurrent Architectures and Hyperparameter Optimization)

  • 김준호;채건주;박재민;박경원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.107-119
    • /
    • 2023
  • 군인의 동작 및 운동 상태를 인식하는 기술은 웨어러블 테크놀로지와 인공지능의 결합으로 최근 대두되어 병력 관리의 패러다임을 바꿀 기술로 주목받고 있다. 이때 훈련 상황에서의 평가 및 솔루션 제공, 전투 상황에서의 효율적 모니터링 기능을 의도한대로 제공하기 위해서는 상태 판별의 정확도가 매우 높은 수준으로 유지되어야만 한다. 하지만 입력 데이터가 시계열 또는 시퀀스로 주어지는 경우, 기존의 피드포워드 신경망으로는 분류 성능을 극대화하는데 한계가 발생한다. 전장에서의 군사 동작 인식을 위해 다뤄지는 인간의 행동양식 데이터(3축 가속도 및 3축 각속도)는 시의존적 특성의 분석이 요구되기 때문에, 본 논문은 순환 신경망인 LSTM(Long-short Term Memory) 네트워크를 활용하여 취득 데이터의 이동 양상 및 순서 의존성을 파악하고 여덟 가지의 대표적 군사 동작(Sitting, Standing, Walking, Running, Ascending, Descending, Low Crawl, High Crawl)을 분류하는 고성능 인공지능 모델을 제안한다. 이때, 학습 조건 및 모델 변수는 그 정확도에 결정적인 영향을 끼치지만 인간의 수동적 조정이 필요해 비용 비효율적이고 최적의 값을 보장하지 못한다. 본 논문은 기계 스스로 일반화 성능이 극대화된 조건들을 취득할 수 있도록 베이지안 최적화를 활용해 하이퍼파라미터를 최적화한다. 그 결과, 최종 아키텍쳐는 학습 가능한 파라미터의 개수가 유사한 기존의 인공 신경망과 비교해서 오차율이 62.56% 감소할 수 있었으며, 최종적으로 98.39%의 정확도로 군사 동작 인식 기능을 구현할 수 있었다.

AI를 활용한 비정형 문서정보의 공간정보화 (Spatialization of Unstructured Document Information Using AI)

  • 윤상원;박정우;남광우
    • 한국지리정보학회지
    • /
    • 제26권3호
    • /
    • pp.37-51
    • /
    • 2023
  • 도시현상의 해석을 위해 공간정보는 필수적이다. 위치정보가 부족한 도시정보를 공간정보로 변환하기 위한 공간정보화 방법론이 꾸준히 개발되어왔다. 정형화된 주소정보나 지명 등을 이용한 Geocoding이나 이미 위치정보가 있는 공간정보와의 공간결합, 참조데이터를 활용한 수작업 형태 등이 대표적이다. 그러나 아직도 행정기관에서 작성되는 수많은 문서정보들은 비정형화된 문서형태로 인해 공간정보화의 수요가 있음에도 그동안 깊이 있게 다루어지지 못하였다. 본 연구는 자연어 처리 모델인 BERT를 활용하여 도시계획과 관련된 공개문서의 공간정보화를 진행한다. 주소가 포함된 문장 요소를 문서로부터 추출하고, 이를 정형화된 데이터로 변환하는 과정을 중점적으로 다룬다. 18년 동안의 도시계획 고시공고문을 학습 데이터로 사용하여 BERT 모델을 학습시켰으며, 모델의 하이퍼파라미터를 직접 조정하여 성능을 향상시켰다. 모델 학습 후의 테스트 결과, 도시계획시설의 유형을 분류하는 모델은 96.6%, 주소 인식 모델은 98.5%, 주소 정제 모델은 93.1%의 정확도를 보였다. 결과 데이터를 GIS 상에 맵핑하였을 때, 특정 지점의 도시계획시설에 관한 변경 이력을 효과적으로 표출할 수 있었다. 본 연구로 도시계획 문서의 공간적 맥락에 대한 깊은 이해를 제공하며, 이를 통해 이해관계자들이 더욱 효과적인 의사결정을 할 수 있게 지원하기를 기대한다.

센서드리프트 판별을 위한 통계적 탐지기술 고찰 (Statistical Techniques to Detect Sensor Drifts)

  • 서인용;신호철;박문규;김성준
    • 한국시뮬레이션학회논문지
    • /
    • 제18권3호
    • /
    • pp.103-112
    • /
    • 2009
  • 원자력발전소에서 센서의 주기적 교정은 안전운전을 위해 꼭 필요하다. 그러나 실제 드리프트가 발생하여 교정을 요하는 센서는 약 2% 미만이다. 또한, 센서의 작동 상태를 매 핵연료 주기마다 수행하는 것은 고장 혹은 드리프트가 발생한 센서를 최대 18개월까지 감지하지 못한 채 운전할 위험이 있다. 원전의 안전운전 및 불필요한 교정을 줄이기 위해 센서의 상시 교정 감시가 필요하다. 이를 위해 주성분 분석과 Support Vector Regression(SVR)을 이용한 PCSVR 알고리즘을 개발하였고, 고리원전 3호기의 출력증발 데이터를 이용하여 검증하였다. 주성분분석은 선형변환을 통한 입력공간의 축소 및 노이즈 제거 효과를 나타내며, AASVR은 해석학적 및 기계학적 모델로 모델링하기 힘든 복잡계를 쉽게 나타낼 수 있는 장점이 있다. SVR의 세가지 파라미터는 반응표면분석법에 의해 최적화하였다. 센서의 고장탐지를 위해 모델 출력의 잔차를 슈하르트 관리도, EWMA, CUSUM 및 일반화우도비검정(GLRT)을 통해 그 결과를 비교하였다. 미세한 드리프트에 대해 CUSUM과 GLRT가 우수한 결과를 보였다. 개발된 알고리즘은 수출형 원전 APR1000 설계시 적용가능 할 것으로 판단된다.

A Study on Deep Learning Model for Discrimination of Illegal Financial Advertisements on the Internet

  • Kil-Sang Yoo; Jin-Hee Jang;Seong-Ju Kim;Kwang-Yong Gim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.21-30
    • /
    • 2023
  • 인터넷 불법금융광고는 인터넷 카페, 블로그 등을 통해 통장매매, 신용카드·휴대폰결제현금화 및 개인신용정보매매 등 불법금융행위를 목적으로 한다. 금융감독당국의 노력에도 불구하고 불법금융행위는 줄어들지 않고 있다. 본 연구는 인터넷 불법금융광고 게시글에 파이썬 딥러닝 기반 텍스트 분류기법을 적용해 불법여부를 탐지하는 모델을 제안한다. 텍스트 분류기법으로 주로 사용되는 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit)을 활용한다. 그동안 수작업으로 심사한 불법확인 결과를 기초 데이터로 이용한다. 한국어 자연어처리와 딥러닝 모델의 하이퍼파라미터 조절을 통해 최적의 성능을 보이는 모델을 완성하였다. 본 연구는 그동안 이뤄지지 않았던 인터넷 불법금융광고 판별을 위한 딥러닝 모델을 제시하였다는데 큰 의미가 있다. 또한 딥러닝 모델에서 91.3~93.4% 수준의 정확도를 보임으로써 불법금융광고 탐지에 딥러닝 모델을 실제 적용하여 불법금융광고 근절에 기여할 수 있기를 기대해 본다.

토양에 살포된 축산 분뇨로부터 암모니아 방출량 예측을 위한 인공신경망의 초매개변수 최적화와 데이터 증식 (Hyperparameter Optimization and Data Augmentation of Artificial Neural Networks for Prediction of Ammonia Emission Amount from Field-applied Manure)

  • 정평곤;임영일
    • Korean Chemical Engineering Research
    • /
    • 제61권1호
    • /
    • pp.123-141
    • /
    • 2023
  • 인공신경망을 이용한 모델 개발에서 데이터의 품질은 모델 성능에 큰 영향을 주고, 양질의 충분한 데이터가 인공신경망 훈련을 위해 필요하다. 하지만, 공학 분야에서는 적은 양의 데이터로 모델을 개발해야 하는 경우가 자주 발생한다. 본 논문은 토양에 살포된 축산 분뇨로부터 암모니아 방출량에 대한 적은 수의 데이터(83 개)를 사용하여 인공신경망 모델의 예측 성능을 향상할 수 있는 방안을 제시하였다. Michaelis-Menten 식으로 표현되는 암모니아 방출량 문제는 11개 입력변수에 대하여 2개 출력변수로 구성되었다. 출력변수는 최대 질소 발생량(Nmax, kg/ha)과 Nmax의 절반에 도달하는 시간(Km, h) 이다. 범주형 입력변수에 대해 다차원 등간격 기법인 one-hot encoding 을 이용하여 데이터 전처리를 수행하였고, 훈련데이터 66개에 대하여 generative adversarial network (GAN)을 이용하여 13개 데이터를 추가로 보강하였다. 또한, 인공신경망의 초매개변수인 은닉층 수, 각 은닉층 내 뉴런 수, 활성화 함수의 최적 조합을 찾기 위하여 Gaussian process (GP)를 사용하였다. 기존의 인공신경망 구조(Lim et al., 2007) 는 17개 평가데이터에 대하여 mean absolute error (MAE)는 Km에서 0.0668, Nmax에서 0.1860이었다. 본 연구에서 제시된 인공신경망 모델은 Km에서 0.0414, Nmax에서 0.0818로 MAE 가 기존 모델 대비 각각 38%, 56% 감소하였다. 본 연구에서 제시된 방법은 적은 양의 데이터를 갖는 문제에서 인공신경망 성능을 향상하기 위하여 활용할 수 있을 것이다.

실시간 총유사량 모니터링을 위한 H-ADCP 연계 수정 아인슈타인 방법의 의사 SVR 모형 (A SVR Based-Pseudo Modified Einstein Procedure Incorporating H-ADCP Model for Real-Time Total Sediment Discharge Monitoring)

  • 노효섭;손근수;김동수;박용성
    • 대한토목학회논문집
    • /
    • 제43권3호
    • /
    • pp.321-335
    • /
    • 2023
  • 자연하천에서의 유사량 계측은 하천공학적으로 중요한 의미를 가지지만 계측 방법의 비용 문제로 유사량 실측에 어려움이 따른다. 특히 소류사량 계측의 어려움으로 인해 주기적인 유사량 모니터링의 대부분이 부유사 농도 계측에만 제한되어 있는 실정이다. 본 연구에는 자동유량관측소에 설치된 횡방향 도플러 유속계(H-ADCP)의 후방산란값과 부유사 농도의 상관관계를 이용해 실시간으로 부유사 농도를 산정하고 총유사량을 산정하는 서포트벡터회귀 모형을 제안한다. 제안하는 실시간 총유사량 모니터링 시스템은 부유사 농도 모형과 수정 아인슈타인 방법을 모사하는 총유사량 산정 모형으로 구성된다. 각 모형의 매개변수와 입력변수는 K겹 교차검증 기반 격자검색 방법과 재귀적 특징 제거법을 이용해 결정되었다. 교차검증에서 부유사 농도 모형과 총유사량 산정 모형의 R2가 각각 0.885와 0.860으로 유사량-유량 관계곡선에 비해 정확한 것으로 나타났다. 시계열 유사량 관측을 통해 새로 제시되는 실시간 총유사량 관측 시스템이 자연하천에서 발달하는 유사량-유량 이력관계와 미세한 유량 변화에서 나타나는 유사량 변화를 성공적으로 관측할 수 있음을 확인했다. 본 연구에서 제안하는 방법은 마찰경사나 부유사 입도 등의 수리 조건을 가정할 필요 없이 H-ADCP의 원시자료만으로 부유사 농도와 총유사량을 산정할 수 있어 기존 방법에 비해 불확도가 적으며 경제적이다. 본 방법은 H-ADCP가 설치된 유사량 관측소에 광범위하게 적용 가능해 유사량 모니터링의 시간적 해상도를 경제적으로 크게 줄일 수 있을 것으로 기대된다.

기계학습 기반 약물의 태아 독성 예측 연구 (Predicting the Fetotoxicity of Drugs Using Machine Learning)

  • 정명현;유선용
    • 생명과학회지
    • /
    • 제33권6호
    • /
    • pp.490-497
    • /
    • 2023
  • 임산부의 기존 질병 또는 임신 중 발생한 질병을 치료하기 위한 약물의 사용은 태아에게 잠재적인 위협이 될 수 있으므로 약물의 태아 독성 여부를 예측하는 것이 필수적이다. 하지만 약물의 태아 독성을 밝혀내는 것은 많은 시간과 비용을 필요로 하며 인간 태아에게서 독성 작용을 나타내는 근거가 불분명하다. 이에 따라 최근 태아 독성 평가를 위한 시험 설계의 현대화, 예측성 개선, 동물 사용 및 투자 비용 감소를 위한 in silico 태아 독성 평가 모델의 필요성이 대두되고 있다. 본 연구는 태아 독성 정보를 수집하고 다양한 기계학습 알고리즘을 적용하여 태아 독성 예측이 가능한 모델을 구축하였으며, 태아 독성 예측 모델의 입력 값으로 활용하기 위해 각 약물에 대한 구조적 및 생리학적 특성 벡터를 생성하였다. 이후 예측 정확도 개선을 위해 초매개변수를 조정하여 모델을 최적화 하였다. 개발한 태아 독성 예측 모델의 유효성을 검증하기 위해 학습 셋과 독립된 테스트 셋을 활용하여 정량적 성능 평가를 수행하였으며, 모든 모델의 약물 및 약물 후보 물질의 태아 독성 여부를 예측할 수 있는 것을 확인하였다(AUROC>0.85, AUPR>0.9). 나아가, 예측 모델의 특성 중요도를 분석하여 태아 독성과 관련성이 높은 약물의 특성을 제시하였다. 제안한 모델은 적은 비용과 시간으로 예측 점수를 제공함으로써 인간에 대한 태아 독성 연구를 설계하는 과정에 도움이 될 것을 기대한다.

누적 가중치 변화의 시각화를 통한 심층 신경망 분석시스템 (Deep Neural Network Analysis System by Visualizing Accumulated Weight Changes)

  • 양태린;박진호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.85-92
    • /
    • 2023
  • 최근 ChatGPT나 자율주행 자동차 등의 인공지능 분야의 급속한 발전으로 인해 인공지능에 대한 관심이 높아졌다. 그러나 아직 인공지능은 학습 과정에서 알 수 없는 요소가 많이 존재하여 모델을 개선하거나 최적화하기 위해서 필요 이상의 시간과 노력을 들여야 하는 경우가 많다. 따라서, 인공지능 모델의 학습 과정에서 가중치 변화를 명확하게 이해하고 해당 변화를 효과적으로 분석할 수 있는 도구 또는 방법론이 절실하게 요구되고 있다. 본 연구에서는 이러한 점을 해결하기 위해 누적 가중치 변화량을 시각화해주는 시스템을 제안한다. 시스템은 학습의 일정한 기간마다 가중치를 구하고 가중치의 변화를 누적시켜서 누적 가중치로 저장하여 3차원 공간상에 나타내게 된다. 이로 인해 보는 이로 하여금 한눈에 레이어의 구조와 현재의 가중치 변화량이 이해되기 쉽게 구성하였다. 이러한 연구를 통해 인공지능 모델의 학습 과정이 어떻게 진행되는지에 대한 이해와 모델의 성능 향상에 도움이 되는 방향으로 하이퍼 파라미터를 변경할 수 있는 지표를 얻게 되는 등 인공지능 학습 과정의 다양한 측면을 탐구할 수 있을 것이다. 이러한 시도를 통해 아직 미지의 영역으로 여겨지는 인공지능 학습 과정의 일부를 보다 효과적으로 탐색하고 인공지능 모델의 발전과 적용에 기여할 수 있을 것으로 기대된다.