• 제목/요약/키워드: learning distribution

검색결과 972건 처리시간 0.03초

A counting-time optimization method for artificial neural network (ANN) based gamma-ray spectroscopy

  • Moonhyung Cho;Jisung Hwang;Sangho Lee;Kilyoung Ko;Wonku Kim;Gyuseong Cho
    • Nuclear Engineering and Technology
    • /
    • 제56권7호
    • /
    • pp.2690-2697
    • /
    • 2024
  • With advancements in machine learning technologies, artificial neural networks (ANNs) are being widely used to improve the performance of gamma-ray spectroscopy based on NaI(Tl) scintillation detectors. Typically, the performance of ANNs is evaluated using test datasets composed of actual spectra. However, the generation of such test datasets encompassing a wide range of actual spectra representing various scenarios often proves inefficient and time-consuming. Thus, instead of measuring actual spectra, we generated virtual spectra with diverse spectral features by sampling from categorical distribution functions derived from the base spectra of six radioactive isotopes: 54Mn, 57Co, 60Co, 134Cs, 137Cs, and 241Am. For practical applications, we determined the optimum counting time (OCT) as the point at which the change in the Kullback-Leibler divergence (ΔKLDV) values between the synthetic spectra used for training the ANN and the virtual spectra approaches zero. The accuracies of the actual spectra were significantly improved when measured up to their respective OCTs. The outcomes demonstrated that the proposed method can effectively determine the OCTs for gamma-ray spectroscopy based on ANNs without the need to measure actual spectra.

고객 보상프로그램의 효율적 구성에 관한 연구 (A Study on Efficiently Designing Customer Rewards Programs)

  • 김상철
    • 유통과학연구
    • /
    • 제10권1호
    • /
    • pp.5-10
    • /
    • 2012
  • 본 연구는 보상프로그램의 구성에 관한 연구이다. 이를 위해 재무가치적 보상프로그램과 서비스 가치적 보상프로그램에 대한 관여수준별 선호도를 분석하였다. 또한 보상 프로그램의 평가모드(SE, JE)에 따라 선호도가 어떻게 달라지는지를 파악하였다. 실험결과 관여수준에 따라 보상프로그램에 대한 선호도는 일부 차이를 보이고 있으며 결합된 보상프로그램에 대한 선호도가 높게 나타나고 있었다. 여기서 특이한 점은 재무적 보상프로그램에 서비스 보상프로그램이 결합되는 경우에 고객들은 보상프로그램에 대해 보다 더 높은 선호도를 보이고 있어, 기존 재무보상 중심에서 벗어나 서비스 보상프로그램에 대한 관심을 제고시킬 필요가 있다. 이는 기존 기업들이 비용에 대한 부담을 갖고 있으면서도 비차별적이로 획일적인 보상프로그램을 진행하는 방식에서 새로운 보상프로그램을 구성하는 계기가 될 수 있을 것으로 판단된다.

  • PDF

KB-BERT: 금융 특화 한국어 사전학습 언어모델과 그 응용 (KB-BERT: Training and Application of Korean Pre-trained Language Model in Financial Domain)

  • 김동규;이동욱;박장원;오성우;권성준;이인용;최동원
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.191-206
    • /
    • 2022
  • 대량의 말뭉치를 비지도 방식으로 학습하여 자연어 지식을 획득할 수 있는 사전학습 언어모델(Pre-trained Language Model)은 최근 자연어 처리 모델 개발에 있어 매우 일반적인 요소이다. 하지만, 여타 기계학습 방식의 성격과 동일하게 사전학습 언어모델 또한 학습 단계에 사용된 자연어 말뭉치의 특성으로부터 영향을 받으며, 이후 사전학습 언어모델이 실제 활용되는 응용단계 태스크(Downstream task)가 적용되는 도메인에 따라 최종 모델 성능에서 큰 차이를 보인다. 이와 같은 이유로, 법률, 의료 등 다양한 분야에서 사전학습 언어모델을 최적화된 방식으로 활용하기 위해 각 도메인에 특화된 사전학습 언어모델을 학습시킬 수 있는 방법론에 관한 연구가 매우 중요한 방향으로 대두되고 있다. 본 연구에서는 금융(Finance) 도메인에서 다양한 자연어 처리 기반 서비스 개발에 활용될 수 있는 금융 특화 사전학습 언어모델의 학습 과정 및 그 응용 방식에 대해 논한다. 금융 도메인 지식을 보유한 언어모델의 사전학습을 위해 경제 뉴스, 금융 상품 설명서 등으로 구성된 금융 특화 말뭉치가 사용되었으며, 학습된 언어 모델의 금융 지식을 정량적으로 평가하기 위해 토픽 분류, 감성 분류, 질의 응답의 세 종류 자연어 처리 데이터셋에서의 모델 성능을 측정하였다. 금융 도메인 말뭉치를 기반으로 사전 학습된 KB-BERT는 KoELECTRA, KLUE-RoBERTa 등 State-of-the-art 한국어 사전학습 언어 모델과 비교하여 일반적인 언어 지식을 요구하는 범용 벤치마크 데이터셋에서 견줄 만한 성능을 보였으며, 문제 해결에 있어 금융 관련 지식을 요구하는 금융 특화 데이터셋에서는 비교대상 모델을 뛰어넘는 성능을 보였다.

MaxEnt 모형 분석을 통한 남북한 접경지역의 금강초롱꽃 자생가능지 예측 (Predicting Potential Habitat for Hanabusaya Asiatica in the North and South Korean Border Region Using MaxEnt)

  • 성찬용;신현탁;최송현;송홍선
    • 한국환경생태학회지
    • /
    • 제32권5호
    • /
    • pp.469-477
    • /
    • 2018
  • 금강초롱꽃(Hanabusaya asiatica)은 한반도 중동부에서만 제한적으로 분포하는 고유종으로, 분포범위가 좁고 개체수가 적어 서식지를 세계자연보전연맹(IUCN, International Union for Conservation of Nature) 중요 생물다양성 보호지역(key biodiversity areas: KBAs)으로 지정하여 보호할 필요가 있다. 본 연구에서는 maximum entropy(MaxEnt) 모형을 통해 남북한 접경지역 내 금강초롱꽃 자생가능지를 추정하고 이를 바탕으로 KBAs 후보지를 설정하였다. 기계학습(machine learning) 알고리즘의 하나인 MaxEnt 모형은 생물종의 출현지점만 기록한 데이터(presence-only data)로도 생물종 분포를 편향되지 않게 예측할 수 있는 생물종 분포 모형으로, 본 연구의 연구대상지처럼 현장 조사가 어려운 경우 유용한 방법이다. 본 연구에서는 현장 조사를 통해 수집한 38개 금강초롱꽃 출현 위치와 기후, 지형, 식생 등을 측정한 11개 환경변수를 이용하여 MaxEnt 모형을 학습하여 남북한 접경지역의 모든 지점에 대해 금강초롱꽃 출현확률을 추정하였다. MaxEnt 모형 분석 결과, 금강초롱꽃 출현확률이 0.5를 넘어 금강초롱꽃 분포가능지로 분류된 지역은 $778km^2$이었고, 추정된 서식가능지와 기지정된 보호지역 경계를 고려하여 설정한 최종 KBA 후보지는 $1,321km^2$이었다. 또한 11개 환경변수 중 표고와 연평균 강수량, 생장기 평균 강수량, 최한월 평균 기온이 금강초롱꽃 출현확률에 영향을 미쳐, 금강초롱꽃은 고도가 높은 서늘한 지역을 선호하는 것으로 분석되었다. 이와 같은 금강초롱꽃의 분포지 선호도 분석 결과는 KBA 후보지 설정 뿐 아니라 남북한 통일이나 기후변화와 같은 시나리오에 대비한 금강초롱꽃 보존 계획 수립의 기초자료로 활용될 수 있을 것으로 기대된다.

전라남도 섬 지역의 난온대 상록활엽수림 복원을 위한 적합지 예측 (Predicting Suitable Restoration Areas for Warm-Temperate Evergreen Broad-Leaved Forests of the Islands of Jeollanamdo)

  • 성찬용;강현미;박석곤
    • 한국환경생태학회지
    • /
    • 제35권5호
    • /
    • pp.558-568
    • /
    • 2021
  • 국내 섬 지역은 감독 부실과 관광 등으로 인해 산림 훼손이 심각한 상황이다. 한반도 서남해안 지역의 난온대 기후대원식생은 상록활엽수림이라서, 이곳을 원식생으로 복원이 바람직하다. 따라서 본 연구에서는 전남의 섬 지역 산지를 대상으로, 현존 상록활엽수림의 환경 요인을 분석하여 상록활엽수림 북원 적합지를 도출하였다. 이를 위해 딥러닝(deep learning) 알고리즘을 이용하여 Sentinel-2 위성영상에서 연구 대상지의 식생 유형을 6가지로 분류하였고, 분류된 식생유형의 위치 및 지형, 기후 속성을 측정하여 상록활엽수림의 내성 범위(tolerance range)를 분석하였다. 분석 결과, 현존 상록활엽수림은 인간의 간섭이 적은, 고도가 높고 경사가 급한 지역에 상대적으로 높은 비율로 분포하였다. 이와 같은 인위적인 간섭으로 현존 상록활엽수림은 타 식생 유형보다 오히려 연평균기온이 낮은 곳에 분포하는 경향을 보였는데, 이는 고도가 높을수록 기온은 낮아지기 때문이다. 여러 환경 요인 중 인간의 간섭에 따른 영향을 배제하고, 상록활엽수림의 복원 적합지를 파악할 수 있는 환경 요인에는 위도와 최한월 평균기온(1월)이 있었다. 상록활엽수림 내성 범위 분석 결과, 위도 34.7° 이남, 최한월평균기온 1.7℃ 이상인 지역에 주로 생육하는 것으로 나타나, 이 조건에 맞는 지역을 상록활엽수림 복원 적합지로 예측하였다. 전남 섬 지역의 산지 중 상록활엽수림 복원 적합지 면적은 614.5km2로 전체 연구 대상지의 59.0%, 연구 대상지 중 농경지 등을 제외한 산림 식생 지역의 73.4%를 차지하였다. 본 연구의 결과를 바탕으로 향후 구체적인 섬 지역 산림복원계획과 예산을 수립해야 할 것이다.

딥러닝 기반 옥수수 포장의 잡초 면적 평가 (Deep Learning Approaches for Accurate Weed Area Assessment in Maize Fields)

  • 박혁진;권동원;상완규;반호영;장성율;백재경;이윤호;임우진;서명철;조정일
    • 한국농림기상학회지
    • /
    • 제25권1호
    • /
    • pp.17-27
    • /
    • 2023
  • 포장에서 잡초의 발생은 농작물의 생산량을 크게 떨어트리는 원인 중 하나이고 SSWM을 기반으로 잡초를 변량 방제하기 위해서 잡초의 발생 위치, 밀도 그리고 이를 정량화하는 것은 필수적이다. 본 연구에서는 2020년의 국립식량과학원에서 잡초 피해를 입은 옥수수 포장의 영상데이터를 무인항공기를 활용해서 수집하였고 이를 배경과 옥수수로 분리하여 딥러닝 기반 영상 분할 모델 제작을 위한 학습데이터를 획득하였다. DeepLabV3+, U-Net, Linknet, FPN의 4가지의 영상 분할 네트워크들의 옥수수의 검출 정확도를 평가하기 위해 픽셀정확도, mIOU, 정밀도, 재현성의 지표를 활용해서 정확도를 검증하였다. 검증 결과 DeepLabV3+ 모델이 0.76으로 가장 높은 mIOU를 나타냈고, 해당 모델과 식물체의 녹색 영역과 배경을 분리하는 지수인 ExGR을 활용해서 잡초의 면적을 정량화, 시각화하였다. 이러한 연구의 결과는 무인항공기로 촬영된 영상을 활용해서 넓은 면적의 옥수수 포장에서 빠르게 잡초의 위치와 밀도를 특정하고 정량화하는 것으로 잡초의 밀도에 따른 제초제의 변량 방제를 위한 의사결정에 도움이 될 것으로 기대한다.

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

기계학습을 이용한 수출신용보증 사고예측 (The Prediction of Export Credit Guarantee Accident using Machine Learning)

  • 조재영;주지환;한인구
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 2021
  • 2020년 8월 정부는 한국판 뉴딜을 뒷받침하기 위한 공공기관의 역할 강화방안으로서 각 공공기관별 역량을 바탕으로 5대 분야에 걸쳐 총 20가지 과제를 선정하였다. 빅데이터(Big Data), 인공지능 등을 활용하여 대국민 서비스를 제고하고 공공기관이 보유한 양질의 데이터를 개방하는 등의 다양한 정책을 통해 한국판 뉴딜(New Deal)의 성과를 조기에 창출하고 이를 극대화하기 위한 다양한 노력을 기울이고 있다. 그중에서 한국무역보험공사(KSURE)는 정책금융 공공기관으로 국내 수출기업들을 지원하기 위해 여러 제도를 운영하고 있는데 아직까지는 본 기관이 가지고 있는 빅데이터를 적극적으로 활용하지 못하고 있는 실정이다. 본 연구는 한국무역보험공사의 수출신용보증 사고 발생을 사전에 예측하고자 공사가 보유한 내부 데이터에 기계학습 모형을 적용하였고 해당 모형 간에 예측성과를 비교하였다. 예측 모형으로는 로지스틱(Logit) 회귀모형, 랜덤 포레스트(Random Forest), XGBoost, LightGBM, 심층신경망을 사용하였고, 평가 기준으로는 전체 표본의 예측 정확도 이외에도 표본별 사고 확률을 구간으로 나누어 높은 확률로 예측된 표본과 낮은 확률로 예측된 경우의 정확도를 서로 비교하였다. 각 모형별 전체 표본의 예측 정확도는 70% 내외로 나타났고 개별 표본을 사고 확률 구간별로 세부 분석한 결과 양 극단의 확률구간(0~20%, 80~100%)에서 90~100%의 예측 정확도를 보여 모형의 현실적 활용 가능성을 보여주었다. 제2종 오류의 중요성 및 전체적 예측 정확도를 종합적으로 고려할 경우, XGBoost와 심층신경망이 가장 우수한 모형으로 평가되었다. 랜덤포레스트와 LightGBM은 그 다음으로 우수하며, 로지스틱 회귀모형은 가장 낮은 성과를 보였다. 본 연구는 한국무역보험공사의 빅데이터를 기계학습모형으로 분석해 업무의 효율성을 높이는 사례로서 향후 기계학습 등을 활용하여 실무 현장에서 빅데이터 분석 및 활용이 활발해지기를 기대한다.

텍스트 마이닝 기법을 적용한 뉴스 데이터에서의 사건 네트워크 구축 (Construction of Event Networks from Large News Data Using Text Mining Techniques)

  • 이민철;김혜진
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.183-203
    • /
    • 2018
  • 전통적으로 신문 매체는 국내외에서 발생하는 사건들을 살피는 데에 가장 적합한 매체이다. 최근에는 정보통신 기술의 발달로 온라인 뉴스 매체가 다양하게 등장하면서 주변에서 일어나는 사건들에 대한 보도가 크게 증가하였고, 이것은 독자들에게 많은 양의 정보를 보다 빠르고 편리하게 접할 기회를 제공함과 동시에 감당할 수 없는 많은 양의 정보소비라는 문제점도 제공하고 있다. 본 연구에서는 방대한 양의 뉴스기사로부터 데이터를 추출하여 주요 사건을 감지하고, 사건들 간의 관련성을 판단하여 사건 네트워크를 구축함으로써 독자들에게 현시적이고 요약적인 사건정보를 제공하는 기법을 제안하는 것을 목적으로 한다. 이를 위해 2016년 3월에서 2017년 3월까지의 한국 정치 및 사회 기사를 수집하였고, 전처리과정에서 NPMI와 Word2Vec 기법을 활용하여 고유명사 및 합성명사와 이형동의어 추출의 정확성을 높였다. 그리고 LDA 토픽 모델링을 실시하여 날짜별로 주제 분포를 계산하고 주제 분포의 최고점을 찾아 사건을 탐지하는 데 사용하였다. 또한 사건 네트워크를 구축하기 위해 탐지된 사건들 간의 관련성을 측정을 위하여 두 사건이 같은 뉴스 기사에 동시에 등장할수록 서로 더 연관이 있을 것이라는 가정을 바탕으로 코사인 유사도를 확장하여 관련성 점수를 계산하는데 사용하였다. 최종적으로 각 사건은 각의 정점으로, 그리고 사건 간의 관련성 점수는 정점들을 잇는 간선으로 설정하여 사건 네트워크를 구축하였다. 본 연구에서 제시한 사건 네트워크는 1년간 한국에서 발생했던 정치 및 사회 분야의 주요 사건들이 시간 순으로 정렬되었고, 이와 동시에 특정 사건이 어떤 사건과 관련이 있는지 파악하는데 도움을 주었다. 또한 일련의 사건들의 시발점이 되는 사건이 무엇이었는가도 확인이 가능하였다. 본 연구는 텍스트 전처리 과정에서 다양한 텍스트 마이닝 기법과 새로이 주목받고 있는 Word2vec 기법을 적용하여 봄으로써 기존의 한글 텍스트 분석에서 어려움을 겪고 있었던 고유명사 및 합성명사 추출과 이형동의어의 정확도를 높였다는 것에서 학문적 의의를 찾을 수 있다. 그리고, LDA 토픽 모델링을 활용하기에 방대한 양의 데이터를 쉽게 분석 가능하다는 것과 기존의 사건 탐지에서는 파악하기 어려웠던 사건 간 관련성을 주제 동시출현을 통해 파악할 수 있다는 점에서 기존의 사건 탐지 방법과 차별화된다.

전자상거래 시대 국내 택배업의 경쟁력 향상 방안에 관한 연구 (A Study on the Domestic Small Package Express Service′s Competitive Power Improvement Plan at EC Times)

  • 박영태;정종식
    • 한국유통학회:학술대회논문집
    • /
    • 한국유통학회 2002년도 춘계학술대회 발표논문집
    • /
    • pp.31-59
    • /
    • 2002
  • 최근 전자상거래가 급증하면서 택배시장이 급속히 성장하고 있다. 전자상거래를 통하여 거래가 이루어진 상품은 택배서비스를 통해 소비자에게 배송되고 있기 때문에 전자상거래를 통한 택배물량은 향후 지속적으로 증가할 것으로 예상되고 있다. 실제 전자상거래 업체들은 자체적인 택배시스템을 갖추지 않고 아웃소싱 형태로 전문 택배업체들에게 상품 운송을 전담시키고 있으며, 고객들도 욕구가 다양해져 자신이 원하는 장소까지 빠른 시간에 정확히 운송되는 택배를 선호하고 있다. 이와 함께, 택배업체들도 전화 뿐만 아니라 인터넷을 통해 주문요청을 받고 있어 택배수요를 더욱 촉진시키고 있다. 그러나 택배수요에 대한 증가에도 불구하고 상품 배달비용이 전체 구매가격에서 차지하는 비중이 상대적으로 높기 때문에 전자상거래를 통한 소액상품의 경우에 물류비 부담이 상당히 높아지고 있으며, 상품 판매 후 최종 소비자에게 전달되는 과정에서 상품의 안전성, 배송의 신속성 등의 미흡으로 대고객 서비스가 상당히 취약한 실정이다. 즉, 급증하는 전자상거래 물품 운송을 택배시스템의 하부구조가 제대로 지원하고있지 못하다는 지적이 나오고 있으며, 택배서비스에 대한 고객들의 욕구도 제대로 충족시키지 못하고있는 상황에 있다. 반면 일본의 야마토운수(주)와 같은 택배업체들은 고객의 욕구를 충족시키기 위하여 터미널이나 집배차량과 같은 하부시설과 화물추적정보시스템 부문에 과감한 투자를 하고 있고, B2B 또는 B2C 화물 접하 서비스, 인터넷을 통한 화물추적 등을 위안 새로운 택배서비스를 개발하여 고객의 욕구를 충족시키고 있을 뿐만 아니라 전자상거래의 활성화에도 기여하고 있다. 따라서 본 연구에서는 전자상거래시대 택배업의 일반적 개관을 살펴보고, 선진외국의 택배업 사례분석 및 시사점을 도출하여, 이를 바탕으로 국내 택배업의 경쟁력 향상 방안을 제시하여 보고자 한다.orms. Such a design offers an equally aesthetic experience for the interactor as they explore the meaning of the work. This design approach has been used constructively in many applications. The crucial concern is to determine how little or how much information must be presented for the interactor to achieve a suitable level of cognition. This is always a balancing act: too much difficulty will result in interactor frustration and the abandonment of the activity and too little will result in boredom leading to the same negative result In addition, it can be anticipated that the interactor will bring her or his own level of experiential cognition and/or accretion, to the experience providing reflective cognition and/or restructure the learning curve. If the design of the application is outside their present experience, interactors will begin with established knowledge in order to explore the new work. T

  • PDF