• 제목/요약/키워드: 성능평가 지표

검색결과 625건 처리시간 0.032초

사전학습 언어 모델을 활용한 트랜스포머 기반 텍스트 요약 (Transformer-based Text Summarization Using Pre-trained Language Model)

  • 송의석;김무성;이유린;안현철;김남규
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.395-398
    • /
    • 2021
  • 최근 방대한 양의 텍스트 정보가 인터넷에 유통되면서 정보의 핵심 내용을 파악하기가 더욱 어려워졌으며, 이로 인해 자동으로 텍스트를 요약하려는 연구가 활발하게 이루어지고 있다. 텍스트 자동 요약을 위한 다양한 기법 중 특히 트랜스포머(Transformer) 기반의 모델은 추상 요약(Abstractive Summarization) 과제에서 매우 우수한 성능을 보이며, 해당 분야의 SOTA(State of the Art)를 달성하고 있다. 하지만 트랜스포머 모델은 매우 많은 수의 매개변수들(Parameters)로 구성되어 있어서, 충분한 양의 데이터가 확보되지 않으면 이들 매개변수에 대한 충분한 학습이 이루어지지 않아서 양질의 요약문을 생성하기 어렵다는 한계를 갖는다. 이러한 한계를 극복하기 위해 본 연구는 소량의 데이터가 주어진 환경에서도 양질의 요약문을 생성할 수 있는 문서 요약 방법론을 제안한다. 구체적으로 제안 방법론은 한국어 사전학습 언어 모델인 KoBERT의 임베딩 행렬을 트랜스포머 모델에 적용하는 방식으로 문서 요약을 수행하며, 제안 방법론의 우수성은 Dacon 한국어 문서 생성 요약 데이터셋에 대한 실험을 통해 ROUGE 지표를 기준으로 평가하였다.

  • PDF

PEEP-Talk: 개인화 외국어 학습을 위한 딥러닝 기반 영어 교육 플랫폼 (PEEP-Talk: Deep Learning-based English Education Platform for Personalized Foreign Language Learning)

  • 이승준;장윤나;박찬준;김민우;;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.293-299
    • /
    • 2021
  • 본 논문은 외국어 학습을 위한 딥러닝 기반 영어 교육 플랫폼인 PEEP-Talk (Personalized English Education Platform)을 제안한다. PEEP-Talk는 딥러닝 기반 페르소나 대화 시스템과 영어 문법 교정 피드백 기능이 내장된 교육용 플랫폼이다. 또한 기존 페르소나 대화시스템과 다르게 대화의 흐름이 벗어날 시 이를 자동으로 판단하여 대화 주제를 실시간으로 변경할 수 있는 CD (Context Detector) 모듈을 제안하며 이를 적용하여 실제 사람과 대화하는 듯한 느낌을 사용자에게 줄 수 있다. 본 논문은 PEEP-Talk의 각 모듈에 대한 정량적인 분석과 더불어 CD 모듈을 객관적으로 판단할 수 있는 새로운 성능 평가지표인 CDM (Context Detector Metric)을 기반으로 PEEP-Talk의 강건함을 검증하였다. 이와 더불어 PEEP-Talk를 카카오톡 채널을 이용하여 배포하였다.

  • PDF

다변량 Bernoulli 모형을 이용한 녹조 발생 예측 모형 개발 (Development of an algal bloom prediction model using multivariate Bernoulli model)

  • 정민규;김진영;조혜미;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.83-83
    • /
    • 2021
  • 수리구조물로 인한 유황변화와 함께 기후변화로 기인하는 강우변동성 및 온도 증가는 수생태 전반에 악영향을 미치는 주요 인자로 작용하고 있다. 특히, 최근 가뭄으로 인한 유황감소 및 폭염 등으로 여름철 녹조의 발생 빈도 및 강도 증가가 지속적으로 증가하고 있다. 본 연구에서는 하천에서 계측되고 있는 Cyanobacteria 개체수를 기반으로 녹조발생 여부를 전망할 수 있는 모형을 개발하고자 한다. Cyanobacteria 개체수를 기준으로 녹조발생 여부를 판단할 수 있도록 기준값(threshold)을 설정하고 binary 형태로 시계열을 구성하였다. 이를 Bernoulli 모형에 적합하여 녹조 발생 여부를 판단할 수 있도록 모형을 개발하였다. 하천을 따라 나타나는 녹조는 시공간적으로 유사한 특성을 가지며, 이러한 점을 고려하여 여러 관측지점을 동시에 모델링하는 것이 모형의 효율성과 예측성 측면에서 유리하다. 본 연구에서는 낙동강을 따라 여러 녹조관측지점을 대상으로 동시에 모델링이 가능하도록 다변량 Bernoulli 모형 기반의 녹조 예측 모형을 제시하고 과거 자료를 대상으로 모형의 적합성을 평가하였다. 다양한 지표를 기준으로 교차검증을 수행하였으며, 기존 물리적 모델에 비해 모형의 예측성능 및 효율성 측면에서 우수성을 확인할 수 있었다.

  • PDF

온라인 범죄 예방을 위한 실시간 조기 위험 감지 시스템 (Real-Time Early Risk Detection in Textual Data Streams for Enhanced Online Safety)

  • 안진명;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.525-530
    • /
    • 2023
  • 최근 소셜 네트워크 서비스(SNS) 및 모바일 서비스가 증가함에 따라 사용자들은 다양한 종류의 위험에 직면하고 있다. 특히 온라인 그루밍과 온라인 루머 같은 위험은 한 개인의 삶을 완전히 망가뜨릴 수 있을 정도로 심각한 문제로 자리 잡았다. 그러나 많은 경우 이러한 위험들을 판단하는 시점은 사건이 일어난 이후이고, 주로 법적인 증거채택을 위한 위험성 판별이 대다수이다. 따라서 본 논문은 이러한 문제를 사전에 예방하는 것에 초점을 맞추었고, 계속적으로 발생하는 대화와 같은 event를 실시간으로 감지하고, 위험을 사전에 탐지할 수 있는 Real-Time Early Risk Detection(RERD) 문제를 정의하고자 한다. 온라인 그루밍과 루머를 실시간 조기 위험 감지(RERD) 문제로 정의하고 해당 데이터셋과 평가지표를 소개한다. 또한 RERD 문제를 정확하고 신속하게 해결할 수 있는 강화학습 기반 새로운 방법론인 RT-ERD 모델을 소개한다. 해당 방법론은 RERD 문제를 이루고 있는 온라인 그루밍, 루머 도메인에 대한 실험에서 각각 기존의 모델들을 뛰어넘는 state-of-the-art의 성능을 달성하였다.

  • PDF

비지도 대조 학습에서 한국어 문장 표현을 위한 특수 토큰 컷오프 방법의 유효성 분석 (On the Effectiveness of the Special Token Cutoff Method for Korean Sentence Representation in Unsupervised Contrastive Learning)

  • 한명수;정유현;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.491-496
    • /
    • 2023
  • 사전학습 언어모델을 개선하여 고품질의 문장 표현(sentence representation)을 도출하기 위한 다양한 대조 학습 방법에 대한 연구가 진행되고 있다. 그러나, 대부분의 대조학습 방법들은 문장 쌍의 관계만을 고려하며, 문장 간의 유사 정도를 파악하는데는 한계가 있어서 근본적인 대조 학습 목표를 저해하였다. 이에 최근 삼중항 손실 (triplet loss) 함수를 도입하여 문장의 상대적 유사성을 파악하여 대조학습의 성능을 개선한 연구들이 제안되었다. 그러나 많은 연구들이 영어를 기반으로한 사전학습 언어모델을 대상으로 하였으며, 한국어 기반의 비지도 대조학습에 대한 삼중항 손실 함수의 실효성 검증 및 분석은 여전히 부족한 실정이다. 본 논문에서는 이러한 방법론이 한국어 비지도 대조학습에서도 유효한지 면밀히 검증하였으며, 다양한 평가 지표를 통해 해당 방법론의 타당성을 확인하였다. 본 논문의 결과가 향후 한국어 문장 표현 연구 발전에 기여하기를 기대한다.

  • PDF

다중 축 슬라이싱 및 3 차원 재구성을 통한 갈비뼈 세그멘테이션 (Rib Segmentation via Biaxial Slicing and 3D Reconstruction)

  • 김현성;변규린;고성현;범정현;리덕타이;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.611-614
    • /
    • 2023
  • 갈비뼈 병변 진단 과정은 방사선 전문의가 CT 스캐너를 통해 생성된 2 차원 CT 이미지들을 해석하며 진행된다. 병변의 위치를 파악하고 정확한 진단을 내리기 위해 수백장의 2차원 CT 이미지들이 세밀하게 검토되며 갈비뼈를 분류한다. 본 연구는 이런 노동 집약적 작업의 문제점을 개선시키기 위해 Biaxial Rib Segmentation(BARS)을 제안한다. BARS 는 흉부 CT 볼륨의 관상면과 수평면으로 구성된 2 차원 이미지들을 U-Net 모델에 학습한다. 모델이 산출한 세그멘테이션 마스크들의 조합은 서로 다른 평면의 공간 정보를 보완하며 3 차원 갈비뼈 볼륨을 재건한다. BARS 의 성능은 DSC, Recall, Precision 지표를 사용해 평가하며, DSC 90.29%, Recall 89.74%, Precision 90.72%를 보인다. 향후에는 이를 기반으로 순차적 갈비뼈 레이블링 연구를 진행할 계획이다.

심근관류 SPECT의 정량적 분석에서 관류정량값 정상변이의 고려: 생존심근 평가에서의 유용성 (Consideration of Normal Variation of Perfusion Measurements in the Quantitative Analysis of Myocardial Perfusion SPECT: Usefulness in Assessment of Viable Myocardium)

  • 팽진철;임일한;김기봉;이동수
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제42권4호
    • /
    • pp.285-291
    • /
    • 2008
  • 목적: 심근관류 SPECT에서 자동정량화 소프트웨어를 이용해 관류 및 기능에 대한 객관적이고 재현성 높은 정량 값을 얻을 수 있지만, 이러한 정량값들을 이용할 때는 분절별로 적지 않은 정상변이가 있음을 고려해야 한다. 이 연구에서는 관류에 대한 정량값에서 정상변이를 고려한 새로운 지표들을 유도하고, 이러한 지표들이 임상적 유용성을 가지는지 생존심근 평가를 통해 알아보았다. 대상 및 방법: 심근관류 SPECT에서 관류의 정상변이를 구하기 위해 55명(남:여=28:27)의 관상동맥질환 저확률군을 선정하였다. 이들에게서 $^{201}Tl$ 휴식기/$^{99m}Tc-MIBI$ 부하기 심근관류 SPECT를 실시하고, 20분절 모델을 이용하여 $^{201}Tl$ 휴식기 관류정량값에 대한 각 분절의 평균(m)과 표준편차(SD)를 구하였다. 생존심근 평가를 위해서는 관상 동맥질환을 진단 받고 관상동맥우회로이식술(CABG)을 시행한 환자 48명을 연구대상에 포함하였다. 이들은 수술전 $^{201}Tl$ 휴식기/$^{99m}Tc$-MIBI 부하기 게이트/$^{201}Tl$ 24시간 지연 SPECT을 실시하였고, 수술 3개월 후 추적 게이트 SPECT를 실시하여 생존심근을 판정하였다. 수술 전 $^{201}Tl$ 24시간 지연 SPECT에서 분절별 $Q_{delay}$ (관류정량값), ${\Delta}_{delay}$ ($Q_{delay}$ - m), $Z_{delay}$ (($Q_{delay}$ - m)/SD)가 정의되었고 이들의 생존심근에 대한 진단성적은 수신자특성곡선 상의 곡선하면적(AUC)을 통해 평가하였다. 결과: 관류정량값은 분절 사이에 상당한 변이를 보여, 남자의 경우 최저치 분절에서 $51.8{\pm}6.5$, 최고치 분절에서 $87.0{\pm}5.9$였고, 여성의 경우 최저치 분절 $58.7{\pm}8.1$, 최고치 분절 $87.3{\pm}6.0$으로 나타났다. 생존심근에 대한 진단성능 평가에서 $Q_{delay}$의 AUC는 0.633인데 반해 ${\Delta}_{delay}$$Z_{delay}$의 AUC는 각각 0.735와 0.716으로 나타나 $Q_{delay}$에 비해 유의하게 높은 값을 보였다(각각 p=0.001, 0.018). 가장 높은 AUC를 보인 ${\Delta}_{delay}$는, 최적분리점 -24.7에서 85%의 예민도와 53%의 특이도를 가지는 것으로 나타났다. 결론: 심근관류 SPECT의 자동 정량화 분석에서 관류정량값의 정상변이는 분절에 따라 상당한 것으로 나타났다. 이들을 고려하여 유도된 정량적 지표들은 직접적인 관류정량값에 비해 생존심근 진단에서 더 나은 진단성적을 보였다. 이 연구는 심근관류 SPECT의 정량적 분석에서 정상변이의 고려가 중요함을 시사한다.

무선통신기반 열차제어시스템에서의 운전시격 계산과 간격제어 성능개선을 위한 열차간격제어 알고리즘 (Headway Calculation and Train Control Algorithm for Performance Improvement in Radio based Train Control System)

  • 오세찬;김경희;이성훈;김자영;전종화
    • 한국산학기술학회논문지
    • /
    • 제16권10호
    • /
    • pp.6949-6958
    • /
    • 2015
  • 무선통신기반 열차제어시스템은 관할영역 내에 운행 중인 열차의 위치정보를 지상시스템에서 실시간으로 수신하고 다시 각각의 열차의 차상시스템에 새로운 이동권한을 제공함으로써 안전한 간격제어를 수행한다. 열차제어시스템의 성능은 최소 운전시격으로 평가되며 그것은 열차제어시스템의 간격제어 성능뿐만 아니라 운영특성 그리고 열차의 특성을 반영하여 계산된다. 본 논문은 무선통신기반 열차제어시스템의 운전시격 계산과 운전시격을 개선하기 위한 새로운 열차간격제어 알고리즘을 제안한다. 제안된 운전시격 계산 방법은 열차제어시스템 간격제어 성능을 반영한 안전마진 추정을 통해 각각 역간 운전시격과 역 운전시격을 정의한다. 또한 제안된 열차간격제어 개선 알고리즘은 간격제어 개선을 위해 거리와 속도를 포함하는 이동권한을 새롭게 정의하며 선행열차에서 필연적으로 발생하는 제동거리를 이용함으로써 열차의 운전시격을 향상시킬 수 있다. 제안된 운전시격 계산방법을 한국형 무선통신기반 열차제어시스템의 간격제어 성능을 대상으로 시뮬레이션을 수행하며 개선된 열차간격제어 알고리즘과 비교분석 한다. 시뮬레이션 결과에 따르면 제안된 운전시격 계산방법은 향후 무선통신기반 열차제어시스템의 성능 지표로 활용이 가능하며 제안된 간격제어 알고리즘은 기존의 무선통신기반 열차제어시스템의 역 운전시격과 역간 운전시격을 개선할 수 있음을 확인한다.

전이학습을 이용한 UNet 기반 건물 추출 딥러닝 모델의 학습률에 따른 성능 향상 분석 (Performance Improvement Analysis of Building Extraction Deep Learning Model Based on UNet Using Transfer Learning at Different Learning Rates)

  • 예철수;안영만;백태웅;김경태
    • 대한원격탐사학회지
    • /
    • 제39권5_4호
    • /
    • pp.1111-1123
    • /
    • 2023
  • 원격탐사 영상을 이용한 지표 속성의 변화를 모니터링 하기 위해서 딥러닝(deep learning) 모델을 이용한 의미론적 영상 분할 방법이 최근에 널리 사용되고 있다. 대표적인 의미론적 영상 분할 딥러닝 모델인 UNet 모델을 비롯하여 다양한 종류의 UNet 기반의 딥러닝 모델들의 성능 향상을 위해서는 학습 데이터셋의 크기가 충분해야 한다. 학습 데이터셋의 크기가 커지면 이를 처리하는 하드웨어 요구 사항도 커지고 학습에 소요되는 시간도 크게 증가되는 문제점이 발생한다. 이런 문제를 해결할 수 있는 방법인 전이학습은 대규모의 학습 데이터 셋이 없어도 모델 성능을 향상시킬 수 있는 효과적인 방법이다. 본 논문에서는 UNet 기반의 딥러닝 모델들을 대표적인 사전 학습 모델(pretrained model)인 VGG19 모델 및 ResNet50 모델과 결합한 세 종류의 전이학습 모델인 UNet-ResNet50 모델, UNet-VGG19 모델, CBAM-DRUNet-VGG19 모델을 제시하고 이를 건물 추출에 적용하여 전이학습 적용에 따른 정확도 향상을 분석하였다. 딥러닝 모델의 성능이 학습률의 영향을 많이 받는 점을 고려하여 학습률 설정에 따른 각 모델별 성능 변화도 함께 분석하였다. 건물 추출 결과의 성능 평가를 위해서 Kompsat-3A 데이터셋, WHU 데이터셋, INRIA 데이터셋을 사용하였으며 세 종류의 데이터셋에 대한 정확도 향상의 평균은 UNet 모델 대비 UNet-ResNet50 모델이 5.1%, UNet-VGG19 모델과 CBAM-DRUNet-VGG19 모델은 동일하게 7.2%의 결과를 얻었다.

식생기반 바이오필터의 미세먼지, 이산화탄소 개선효과와 실내쾌적지수 분석 (Particulate Matter and CO2 Improvement Effects by Vegetation-based Bio-filters and the Indoor Comfort Index Analysis)

  • 김태한;최부헌;최나현;장은숙
    • 한국환경농학회지
    • /
    • 제37권4호
    • /
    • pp.268-276
    • /
    • 2018
  • 본 연구는 일반인에게 안전한 실내공기질 개선수단으로 인식되는 공기정화식물의 효율적 적용을 위해 실내공조에 요구되는 총풍량 확보가 가능한 식생기반 바이오필터 시스템을 제안하고자 했다. 시스템의 정량적 성능평가는 강의실형태의 실험실 체적 $332.73m^3$ 내 16명의 재실자 조건에서 목업단위 시스템의 공조 성능, 실내공기질 및 쾌적지표 개선효과에 대한 시계열 분석으로 진행되었다. 우선, 시스템 구동을 통해 총 $1,411.22m^3/h$의 유출 총풍량을 확보하여, 4.24 ACH의 환기율을 제공할 수 있었다. 실내온도는 $1.6^{\circ}C$, 흑구온도는 $1.0^{\circ}C$ 감소가 확인되었으며, 상대습도는 24.4% 상승한 최대 82.0%까지 증가하였다. 상대습도 급증에 따른 쾌적도 감소현상은 송풍기 구동에 따라 발생되는 실내기류로 상쇄되는 것으로 판단된다. 또한, 시스템 가동에 따른 공기질 개선지표 중 $PM_{10}$은 39.5% 감소한 평균 $22.11{\mu}g/m^3$을 기록하였다. 반면, $CO_2$는 최대 1,329 ppm까지 지속적으로 농도가 상승했는데, 이는 광도조건이 광보상점을 만족하지 못해 적용 식물과 재실자에서 방출되는 $CO_2$가 처리되지 못한 것으로 해석된다. 실내쾌적지표의 경우 PMV는 평균 83.6 % 감소된 -0.082, PPD는 평균 47.0% 감소된 5.41%에 수렴하여 식생기반 바이오필터 구동에 의해 높은 쾌적범위의 실내공간조성이 가능한 것으로 판단되었다. 본 연구의 한계는 소수 참여인원과 단기간 실험으로 인하여 시스템의 성능 규명이 제한적인 부분이었으며, 보다 장기간의 실험을 통해 바이오필터에 도입된 식생의 생육상태에 따른 압력손실 변화, 미세먼지 저감에 대한 구체적인 메커니즘 규명 등의 후속연구가 진행되어야 할 것이다.