통합 검색 | Korea Science

시계열 자료의 예측을 위한 자료 기반 신경망 모델에 관한 연구: 한강대교 수위예측 적용 (A Study on the Data Driven Neural Network Model for the Prediction of Time Series Data: Application of Water Surface Elevation Forecasting in Hangang River Bridge)

유형주;이승오;최서혜;박문형
- 한국방재안전학회논문집
- /
- 제12권2호
- /
- pp.73-82
- /
- 2019
최근 이상기후로 인한 집중호우에 따른 하천변 사회기반시설의 침수피해가 증가하고 있으며, 침수 가능성 여부에 대한 신속한 예 경보가 필요한 실정이다. 일반적인 홍수 예 경보는 하천수위를 이용하고 있으며, 수치모형을 이용하여 하천수위를 예측하는 연구가 대부분이었다. 그러나 수치모형을 이용한 하천수위 예측은 결과가 정확한 반면 수치모의 시간이 오래 소요된다는 한계점이 있어 최근에는 인공신경망 등을 적용한 자료기반의 수위예측 모형이 많이 이용되고 있다. 하지만 기존의 인공신경망을 활용한 수위예측 연구는 시간적 매개변수를 고려하지 못하였다는 한계점이 존재한다. 본 연구에서는 시간적 매개변수(Time delay= 2시간)를 고려한 NARX 신경망 모형을 사용하여 한강대교의 수위를 예측하였다. 또한 NARX 모형의 적합성을 판단하기 위하여 인공신경망(ANN) 모형과, 순환신경망(RNN)모형의 결과와 비교하였다. 2009년에서 2018년까지 10년간의 수문자료를 이용하여 70%를 학습시키고 검정과 평가에 15%를 사용하여 2018년의 한강대교 3시간 후 수위를 예측한 결과 평균제곱근오차(RMSE)의 경우 ANN, RNN, NARX model이 각각 0.20 m, 0.11 m, 0.09 m, 평균절대오차(MAE)의 경우, 각각 0.12 m, 0.06 m, 0.05 m, 첨두수위 오차(Peak Error)는 각각 1.56 m, 0.55 m, 0.10 m로 나타났다. 연구 대상지역에 대한 시간적 매개변수를 고려한 예측 결과의 오차분석을 통하여 NARX 신경망 모형을 사용하는 것이 수위예측 모형 구축이 가장 적합한 것으로 나타났다. 이는 NARX 신경망 모형이 과거의 입력자료를 고려함으로써 시계열 자료의 변동 추세도 학습 할 수 있으며, 또한 모형 내 활성함수를 쌍곡선탄젠트(Hyperbolic tangent) 및 Rectified Linear Unit(ReLU) 함수를 사용하여 고수위 예측 시에도 정확한 예측 값을 도출할 수 있기 때문이다. 그러나 NARX 신경망 모형은 시퀀스 길이가 길어짐에 따라 기울기 소실문제(Vanishing gradient)가 발생하는 한계점이 있어 향후에는 이를 보완한 LSTM(Long Short Term Model)모형을 이용하여 수위예측의 정확도를 검토하고자 한다.
https://doi.org/10.21729/ksds.2019.12.2.73 인용 PDF KSCI HTML

DMIDR 장치의 재구성 알고리즘 별 성능 평가 (Performance Evaluation of Reconstruction Algorithms for DMIDR)

곽인석;이혁;문승철
- 핵의학기술
- /
- 제23권2호
- /
- pp.29-37
- /
- 2019
DMIDR (General Electric Healthcare, USA)은 GE 사(社)의 최신 장비로써 PSF (Point Spread Function reconstruction), TOF(Time of Flight)와 Q.Clear의 적용이 가능하다. 특히, Q.Clear는 보정 알고리즘으로써 복셀(voxel)단위 신호 잡음 제거로 기존 OSEM (Ordered Subset Expectation Maximization)의 한계를 넘어설 수 있다. 따라서 이러한 재구성 및 보정 알고리즘의 성능 평가를 통해 정확한 SUV를 구현하며, 병변 검출 능력에 도움이 되는 알고리즘의 조합을 확인하고자 하였다. H/B(Hot & Background) Ratio 2:1, 4:1, 8:1의 비율로 NEMA/IEC 2008 PET phantom을 제작하였다. DMIDR의 NEMA test protocol을 이용하여 영상 획득을 하였다. 재구성 조합은 (1) VPFX(VUE point FX(TOF)), (2) VPHD-S(VUE point HD+PSF), (3) VPFX-S(TOF+PSF), (4) QCHD-S-400(VUE point HD+Q.Clear(${\beta}-strength$ 400)+PSF), (5) QCFX-S-400(TOF+Q.Clear(${\beta}-strength$ 400)+PSF), (6) QCHD-S-50(VUE point HD+Q.Clear(${\beta}-strength$ 50)+PSF), (7) QCFX-S-50(TOF+Q.Clear(${\beta}-strength$ 50) + PSF)의 7 가지로 구성하였다. H/B Ratio 및 재구성 알고리즘 별로 측정된 결과를 이용하여 CR (Contrast Recovery)와 BV (Background Variability)을 구하였다. 또한, 각 조합의 count를 측정하여 SNR (Signal to Noise Ratio)과 RC(Recovery Coefficient)를 구하고 SUV (Standardized Uptake Value)를 측정하였다. 구의 크기가 가장 작은 10 mm와 13 mm에서는 VPFX-S, 17 mm 이상에서는 QCFX-S-50에서 가장 높은 CR 결과를 보였다. BV와 SNR의 비교에서는 QCFX-S-400과 QCHD-S-400에서 좋은 값을 보였다. SUV 측정 결과는 H/B ratio와 비례하여 증감하는 양상을 보였다. SUV에 대한 RC의 경우 H/B ratio와 반비례하는 양상을 보였으며, 재구성 알고리즘 중에서는 QCFX-S-50이 가장 높은 값을 보였다. 또한, Q.Clear에 ${\beta}-strength$ 400이 적용된 재구성 알고리즘들이 낮은 값 분포를 보였다. Q.Clear가 적용된 재구성 조합은 ${\beta}-strength$를 높이면 신호잡음이 억제되어 영상 품질면에서 우수한 결과를 보였고 ${\beta}-strength$를 낮추면 선예도가 증가하며, partial volume effect가 감소하여 기존의 재구성 조건에 비하여 높은 RC에 근거한 SUV 측정이 가능하였다. 이러한 진보된 알고리즘의 사용으로 보다 정확한 정량화와 미세병변 검출능력을 향상 시킬 수 있으나 상관 관계를 고려하여 목적에 맞는 최적화 과정이 필요할 것으로 사료된다.
PDF KSCI

운영 체제와 컴파일러에 따른 Geospatial Data Abstraction Library의 Hierarchical Data Format 형식 원격 탐사 자료 추출 속도 비교 (Comparison of the wall clock time for extracting remote sensing data in Hierarchical Data Format using Geospatial Data Abstraction Library by operating system and compiler)

유병현;김광수;이지혜
- 한국농림기상학회지
- /
- 제21권1호
- /
- pp.65-73
- /
- 2019
지역이나 전구 규모의 농업 생태계를 감시하기 위해 HDF 형식으로 제공되는 MODIS 원격 탐사자료가 사용되어 왔다. 대개의 경우, 다량의 영상자료들이 처리되어야 하기 때문에, 이들 자료의 처리 성능을 향상시키는 것이 유리하다. 본 연구는 HDF 파일을 처리할 수 있는 GDAL과 같은 라이브러리가 운영 체제나 배포 방식 등에 따른 처리속도의 차이를 확인하여 원격 탐사 자료 처리 시스템 구축을 지원하고자 하였다. 이를 위해, GDAL이 시스템에 설치되는 주요 조건들에 따라 MODIS 영상자료 처리 시간을 측정하고 비교하였다. 운영 체제(Ubuntu 및 openSUSE), 컴파일러(GNU 및 Intel), 설치 옵션 및 바이너리 패키지 조건을 조합하여 GDAL성능 비교가 이루어졌다. 각 조건에 따라 설치된 GDAL을 사용하여 MODIS 영상 중 대기측정 자료(MOD07)의 2차원 변수와 3차원 변수에 해당하는 총 10 종의 자료를 추출하였다. 자료처리에 소요된 구동 시간은 각 변수 값을 시스템 메모리에 저장하는 작업이 끝난 직후 측정되었다. 가장 좋은 성능을 보인 설치 조건은 Ubuntu에서 Intel Compiler를 사용하여 컴파일 된 GDAL을 사용하는 것이었다. OpenSUSE에서는 GNU와 Intel 컴파일러가 각각 2차원 자료와 3차원 자료를 처리하기 위한 작업에 효과적인 것으로 나타났다. 한편 "--with-hdf4=no" 옵션으로 컴파일 된 GDAL과 RPM package manager 버전의 GDAL의 경우, 다른 조건에 비해 상당히 낮은 성능을 보였다. 이러한 결과는 운영 체제나 컴파일러, 설치 옵션 등을 조정하여 원격 탐사자료 처리 도구의 속도를 개선할 수 있다는 것을 암시하였다. 특히, 원격 탐사 자료의 경우 다양한 형식으로 배포되므로, 이를 처리하는 라이브러리들이 최고의 성능을 발휘할 수 있는 조건을 탐색하고 이러한 결과의 공유가 후속연구에서 진행되어야 할 것으로 보인다.
https://doi.org/10.5532/KJAFM.2019.21.1.65 인용 PDF KSCI HTML

Poly-ether-ketone-ketone (PEKK) 포스트로 수복한 근관 치료 치아의 정적 파절 저항성 및 파절 형태에 관한 평가 (Evaluation of static fracture resistances and patterns of pulpless tooth restored with poly-ether-ketone-ketone (PEKK) post)

박하은;이철원;이원섭;양성은;이수영
- 대한치과보철학회지
- /
- 제57권2호
- /
- pp.127-133
- /
- 2019
목적: 본 연구의 목적은 주조 금속 포스트, 기성 섬유강화형 포스트 그리고 치과영역에서 새롭게 주목 받고 있는 재료인 polyetherketoneketone(PEKK)으로 제작한 포스트로 수복된 근관 치료 치아의 파절 강도 및 파절 양상에 대해 조사하는 것이다. 재료 및 방법: 총 21개의 하악 소구치를 포스트 재료에 따라 각각 7개씩 3개의 군으로 무작위로 분류하였다. 그룹 A는 주조 금속 포스트 코어; 그룹 B는 기성 섬유강화형 포스트 및 레진 코어; 그룹 C는 밀링된 PEKK 포스트 코어로 수복하였다. 모든 시편은 금속관으로 수복하였다. 각각의 시편들을 제작 후 만능 시험기를 사용하여 2 mm/min 속도로 치아 장축에 대해 135도의 정적 하중을 가하여 파절 강도를 측정하고, 파절 양상에 대해 조사하였다. 결과 분석은 유의수준 ${\alpha}=.05$에서 Kruskal-Wallis test 후 사후검정으로 Mann-Whitney U test를 시행하였다. 결과: PEKK 포스트 파절 강도는 주조 금속 포스트와 기성 섬유강화형 포스트에 비해 낮은 값을 보였다. 파절양상에 있어서는 육안과 현미경, 방사선 사진을 통해 살펴본 결과 금속 포스트 코어에서는 치근파절의 양상이 대부분 나타난 반면 기성 섬유 강화형포스트는 포스트의 탈락이 주로 발생하였다. PEKK 포스트 코어의 경우 치아와 포스트가 함께 파절되는 양상이 주로 나타났다. 결론: 치관부 치질이 심하게 손상된 치아 수복 시 적절한 재료의 선택이 필요하며, PEKK 포스트의 임상적 적용을 위해서는 강도 향상에 대한 연구가 더 필요할 것으로 보인다.
https://doi.org/10.4047/jkap.2019.57.2.127 인용 PDF KSCI

폐 공용화기사격장 내 납오염 사격장 군부지의 물리적 토양세척정화기술 적용성 연구 (A Study on the Application of Physical Soil Washing Technology at Lead-contaminated Shooting Range in a Closed Military Shooting Range Area)

정재윤;장윤영
- 환경영향평가
- /
- 제28권5호
- /
- pp.492-506
- /
- 2019
공용화기사격장 내 중금속 오염물은 대부분 탄두원형으로 존재하거나 입자로 존재하는 금속조각편이며 이들 미세한 금속입자들은 오랜 기간 풍화되어 표면이 산화물 또는 탄산화물로 존재할 가능성이 매우 높다. 특히 사격장 토양에서 대표적 오염물질인 납은 연성이 높아 무르고 잘 늘어나므로 더 미세입자로 존재한다. 따라서 물리적 세척 실험으로 입도분석, 입경별 중금속농도, 금속물질 성분분석, 비중, 자력, 부상선별의 적용성 평가를 실시하였다. 금속파편의 경우 FESEM분석과 무게측정결과 납은 무른 특성에 따라 얇게 조각나고 편모양의 구조로 비슷한 면적의 구형 토양보다 무게가 더 적게 나가는 것을 확인하였으며 비중선별 적용성이 높은 것을 확인할 수 있었다. 이 결과를 적용하여 하이드로사이클론을 이용한 정화효율평가 결과 1회 71%, 2회 80%, 3회 91%의 누적 정화효율을 보였다. 이에 비해 자력선별은 17%의 낮은 효율을 보였고 부상선별은 입경 0.5 mm 미만으로 선별한 대상토는(-35 mesh) 39%로 비교적 높은 효율을 보였으나 입경 2 mm 미만으로 선별한 대상토의(-10 mesh) 효율은 16%에 불과하였다. 토양세척의 대상 처리입경은 2 mm ~ 0.075 mm로 입도구분을 추가로 하여 실규모 장치에 적용하여야 하며 이는 설치비용과 공정이 추가로 구성됨에 따른 관리가 필요할 것으로 분석되었다. 결과적으로 공용화기사 격장 오염의 토양정화는 탄두 원형을 유지한 탄두는 5.56 mm 이상으로 자갈입경보다 크므로 고비중을 이용한 비중선별을 실시하고, 금속파편으로 존재하는 오염물질은 얇게 조각나고 편모양의 구조로 같은 입경의 토양보다 무게가 더 적음에 따라 토양세척의 하이드로사이클론을 이용하여 분리하여 처리할 수 있음을 확인할 수 있었다.
https://doi.org/10.14249/eia.2019.28.5.492 인용 PDF KSCI

국내 중금속 부지오염시나리오를 고려한 안정화제의 중금속 안정화 효율 규명 (Evaluation of Stabilization Capacity for Typical Amendments based on the Scenario of Heavy Metal Contaminated Sites in Korea)

양지혜;김단우;오유나;전소영;이민희
- 자원환경지질
- /
- 제54권1호
- /
- pp.21-33
- /
- 2021
국내 오염시나리오별 안정화 효율과 경제성이 뛰어난 안정화제를 선택하여 적용할 수 있도록, 국내외에서 연구된 대표적인 안정화제를 대상으로 국내 중금속 오염 현장 부지 특성별 중금속 안정화 효율이 높은 안정화제 순위를 결정하였다. 총 5종류의 오염시나리오를 가정하여 각각 해당되는 국내 오염부지 토양을 확보하였다. 국내외 활용도와 안정화 효율 연구 결과, 오염특성별 부지 시나리오에 적용 가능성 등을 고려하여 기존에 연구되었던 안정화제 13가지를 선정하였다. 선정한 오염 토양과 안정화제의 오염 가능성과 현장 적용 가능성을 평가하기 위하여 XRD/XRF 분석, 독성용출시험과 인공강우용출시험 등을 실시하였다. 부지 오염시나리오를 대표하는 5종류 오염 토양에 대하여 선정된 13종의 안정화제에 의한 비소, 수은, 납, 6가 크롬, 아연, 니켈, 구리 등 총 8종의 중금속(반금속인 비소 포함) 용출 저감 효과를 규명하는 용출 배치실험을 수행하였다. 총 5개 오염 토양에 대하여 13개 안정화제 주입 비율 3%, 5%, 7% 적용 시, 각 중금속(비소 포함)에 대한 중금속 용출 저감 효율이 안정화제를 주입하지 않은 토양 대비 20% 이상을 나타내는 안정화제 중에서 저감 효율이 높은 순위부터 5개 안정화제(Top 5)를 선택하였다. 각 안정화제에 대하여 안정화제 주입비율, 중금속 종류, 부지별 조건에 따라 수행된 배치실험 결과에 대하여 Top 5에 해당하는 총 횟수를 합산하여, 다양한 국내 부지 오염시나리오에 적용할 수 있는 안정화제의 순위를 결정하였다. 5개 오염 토양에 대하여 8개 중금속 항목별 용출 저감 효율이 20% 이상인 경우, 가장 안정화 효율이 높은 순위는 광산배수처리 슬러지(mine drainage treatment sludge), 산화철, 생석회, 소석회-석회석, 황화철, 바이오차 순으로 나타났다. 위 안정화제들에 대하여 안정화제의 효율대비 단가를 산정한 결과, 광산배수처리 슬러지, 석회석, 제강슬래그(비소의 경우), 생석회, 소석회 순으로 경제성이 높게 나타나 현장 적용성이 뛰어난 것으로 밝혀졌다.
https://doi.org/10.9719/EEG.2021.54.1.21 인용 PDF KSCI

사용자 선호도 변화에 따른 추천시스템의 다양성 적용 (Application of diversity of recommender system accordingtouserpreferencechange)

나혜연;남기환
- 지능정보연구
- /
- 제26권4호
- /
- pp.67-86
- /
- 2020
추천시스템은 시간이 흐를수록 사용자와 기업에게 점점 더 큰 영향을 주고 있다. 최근 코로나(COVID-19) 팬데믹 현상이 전 세계적으로 일어나면서 세대를 뛰어넘어 E-Commerce의 중요성이 증대되었고 추천시스템은 E-Commerce 활성화의 최중심에 있다. 추천시스템이 개발된 이래로 다수의 알고리즘이 추천시스템의 정확도를 올리는 것에 집중되어 있었고, 추천시스템의 희귀성, 다양성, 우연성 등과 같은 다른 가치들이 간과되고 있다. 본 논문에서는 사용자의 만족도는 추천시스템의 정확도에만 달려있지 않고 다양한 성능을 겸비했을 때 고객에게 만족스러운 추천서비스 경험을 제공할 것이라 생각하여 다양성을 위한 그래프 기반의 추천시스템을 개발하였다. 사용자 네트워크를 구성한 뒤 카테고리를 활용한 무게중심변화를 통해 유사도가 낮은 이질적인 사용자를 찾아 추천상품의 유사성을 낮추는 방식으로 다양성을 도모하였다. 또한, 추천의 다양성은 사용자의 다양성 선호 수준에 따라 상이할 것이라는 가정에 따라 사용자의 다양성 선호 수준을 구별하였고 다양성 모델 성능이 사용자 특성별로 다름을 확인할 수 있었다. 전체 연구 결과, 추천시스템의 정확성과 다양성이 트레이드 오프 관계에 놓여있다는 것을 확인할 수 있었지만 본 연구모델을 통해 근소한 정확도 손실 대비 높은 다양성을 얻을 수 있었다. 본 연구는 그래프 기반의 추천시스템을 통해 사용자의 만족도를 향상시키는 다양성을 실현하였다는 연구적 의의와 사용자 수준을 고려한 추천의 다양성을 적용 결과를 통해 기업의 장기적 이윤을 상승시킬 수 있는 모델 개발이라는 실무적 의의를 꼽을 수 있다.
https://doi.org/10.13088/jiis.2020.26.4.067 인용 PDF KSCI

부유챔버를 이용한 화장품의 미세먼지 부착방지 효과 평가법 (Evaluation Method of Cosmetics for the Effect of Fine Dust Adhesion Prevention Using Floating Chamber)

김원철;김한조;부용출;고재숙;백지훈
- 대한화장품학회지
- /
- 제46권4호
- /
- pp.319-327
- /
- 2020
미세먼지(Particulate matter, PM)는 피부 장벽의 기능을 저하시키고 염증성 피부 질환 및 외인성 노화를 유발하는 대기 오염원이다. 본 연구에서는 대체 미세먼지로서 iron oxide black을 이용하여 화장품에 의한 미세먼지의 피부 부착 방지효과를 평가하였다. 미세먼지 부유챔버는 피부노출부위, 미세먼지 주입구, 부유동력장치, 배출구로 구성하여 미세먼지가 챔버내에서 부유 중 피부에 자연스럽게 부착될 수 있도록 제작하였다. 대체 미세먼지의 부유농도에 따른 피부 밝기 변화를 확인하여 최적의 부유농도 조건을 확인하였다. Iron oxide black의 피부부착 전·후의 밝기차이 (미세먼지 부착 전 밝기 - 미세먼지 부착 후 밝기, Δ)는 미세먼지의 양에 비례한다. 또한, 화장품 5종에 대하여 각각 20명의 피험자를 대상으로 제품 도포군과 무도포 대조군으로 나누어 부유 대체 미세먼지에 대한 피부부착 방지효과를 확인하였다. 피부에 부착된 iron oxide black의 전·후 밝기 차이를 계산하여 대조군과 비교분석하였다(p < 0.05). 시험에 최소 150 mg 이상의 iron oxide black을 사용할 때 농도에 따른 피부 밝기 변화 양상이 뚜렷하게 나타났다. 최적의 부유농도에서 피부와 대체미세먼지의 밝기 간섭이 적고 피부 부착 패턴이 선명하게 나타났다. 5종의 화장품을 피부에 도포할 경우 iron oxide black의 부착양이 대조군에 비해 통계적으로 유의하게 낮았다. 이는 제품에 따라 iron oxide black의 부착을 방지 함을 의미한다. 본 연구는 대체 미세먼지로서 iron oxide black의 피부 부착양상을 확인하고, 화장품에 의한 부착 방지효과를 평가하는 안전하고 유용한 방법이다. 화장품의 다양한 제형이나 원료의 특성에 따라 미세먼지가 피부에 부착되는 것을 방지할수 있음을 확인하였다.
https://doi.org/10.15230/SCSK.2020.46.4.319 인용 PDF KSCI

BioFire^® Meningitis/Encephalitis Panel의 진단적 유용성 평가: 90일 미만 발열영아에서의 예비 연구 (Diagnostic Evaluation of the BioFire^® Meningitis/Encephalitis Panel: A Pilot Study Including Febrile Infants Younger than 90 Days)

김경민;박지영;박경운;손영주;최윤영;한미선;최은화
- Pediatric Infection and Vaccine
- /
- 제28권2호
- /
- pp.92-100
- /
- 2021
목적: 중추신경계 감염의 적절한 치료를 위해서 신속한 원인 병원체의 확인이 중요하다. 본 연구는 열이 있는 영아의 뇌척수액 검체에서 원인 병원체 검출을 위한 BioFire^® Meningitis/Encephalitis (ME) panel 검사 방법의 진단적 가치를 평가하고자 수행되었다. 방법: 2016년 1월부터 2019년 7월까지 발열을 주소로 서울대학교 어린이병원에 내원한 90일 미만의 영아로부터 채취한 뇌척수액으로 기존검사(세균 배양, Xpert^® enterovirus assay, herpes simplex virus-1 and -2 중합효소 연쇄반응 검사)를 시행한 후 -70℃ 초저온 냉동고에 보관된 검체를 대상으로 BioFire^® ME panel 검사를 시행하였다. 결과: 총 72개 검체(원인 병원체가 검출된 24개와 검출되지 않은 48개)가 포함되었다. BioFire^® ME panel 검사 결과, 기존검사로 원인 병원체가 검출되지 않은 48개의 검체 중 41개(85.4%)는 음성이었고 원인 병원체가 검출된 24개 검체 중 22개(91.7%)가 동일한 결과(enterovirus 19개, Streptococcus agalactiae 2개, Streptococcus pneumoniae 1개)를 보여 전체 일치율은 87.5% (63/72)였다. 병원체가 기존검사에서 검출되지 않았으나 BioFire^® ME panel에서 검출된 7개의 검체 중 6개에서 human parechovirus (HPeV)가 검출되었다. 결론: 열이 있는 90일 미만 영아에서 BioFire^® ME panel 검사법은 원인 병원체가 밝혀진 기존검사 결과와는 비교적 높은 일치도를 보이며, HPeV를 추가적으로 진단할 수 있었다. 향후, 소아청소년 진료 영역에서 BioFire^® ME panel 검사법을 적용할 근거를 마련하기 위한 임상적 유용성과 비용 효과에 대한 연구가 필요하다.
https://doi.org/10.14776/piv.2021.28.e9 인용 PDF KSCI

KB-BERT: 금융 특화 한국어 사전학습 언어모델과 그 응용 (KB-BERT: Training and Application of Korean Pre-trained Language Model in Financial Domain)

김동규;이동욱;박장원;오성우;권성준;이인용;최동원
- 지능정보연구
- /
- 제28권2호
- /
- pp.191-206
- /
- 2022
대량의 말뭉치를 비지도 방식으로 학습하여 자연어 지식을 획득할 수 있는 사전학습 언어모델(Pre-trained Language Model)은 최근 자연어 처리 모델 개발에 있어 매우 일반적인 요소이다. 하지만, 여타 기계학습 방식의 성격과 동일하게 사전학습 언어모델 또한 학습 단계에 사용된 자연어 말뭉치의 특성으로부터 영향을 받으며, 이후 사전학습 언어모델이 실제 활용되는 응용단계 태스크(Downstream task)가 적용되는 도메인에 따라 최종 모델 성능에서 큰 차이를 보인다. 이와 같은 이유로, 법률, 의료 등 다양한 분야에서 사전학습 언어모델을 최적화된 방식으로 활용하기 위해 각 도메인에 특화된 사전학습 언어모델을 학습시킬 수 있는 방법론에 관한 연구가 매우 중요한 방향으로 대두되고 있다. 본 연구에서는 금융(Finance) 도메인에서 다양한 자연어 처리 기반 서비스 개발에 활용될 수 있는 금융 특화 사전학습 언어모델의 학습 과정 및 그 응용 방식에 대해 논한다. 금융 도메인 지식을 보유한 언어모델의 사전학습을 위해 경제 뉴스, 금융 상품 설명서 등으로 구성된 금융 특화 말뭉치가 사용되었으며, 학습된 언어 모델의 금융 지식을 정량적으로 평가하기 위해 토픽 분류, 감성 분류, 질의 응답의 세 종류 자연어 처리 데이터셋에서의 모델 성능을 측정하였다. 금융 도메인 말뭉치를 기반으로 사전 학습된 KB-BERT는 KoELECTRA, KLUE-RoBERTa 등 State-of-the-art 한국어 사전학습 언어 모델과 비교하여 일반적인 언어 지식을 요구하는 범용 벤치마크 데이터셋에서 견줄 만한 성능을 보였으며, 문제 해결에 있어 금융 관련 지식을 요구하는 금융 특화 데이터셋에서는 비교대상 모델을 뛰어넘는 성능을 보였다.
https://doi.org/10.13088/jiis.2022.28.2.191 인용 PDF KSCI

검색결과 6,854건 처리시간 0.043초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)