• Title/Summary/Keyword: 성능평가 모델

Search Result 3,600, Processing Time 0.125 seconds

Evaluating Korean Machine Reading Comprehension Generalization Performance using Cross and Blind Dataset Assessment (기계독해 데이터셋의 교차 평가 및 블라인드 평가를 통한 한국어 기계독해의 일반화 성능 평가)

  • Lim, Joon-Ho;Kim, Hyunki
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.213-218
    • /
    • 2019
  • 기계독해는 자연어로 표현된 질문과 단락이 주어졌을 때, 해당 단락 내에 표현된 정답을 찾는 태스크이다. 최근 기계독해 태스크도 다른 자연어처리 태스크와 유사하게 BERT, XLNet, RoBERTa와 같이 사전에 학습한 언어모델을 이용하고 질문과 단락이 입력되었을 경우 정답의 경계를 추가 학습(fine-tuning)하는 방법이 우수한 성능을 보이고 있으며, 특히 KorQuAD v1.0 데이터셋에서 학습 및 평가하였을 경우 94% F1 이상의 높은 성능을 보이고 있다. 본 논문에서는 현재 최고 수준의 기계독해 기술이 학습셋과 유사한 평가셋이 아닌 일반적인 질문과 단락 쌍에 대해서 가지는 일반화 능력을 평가하고자 한다. 이를 위하여 첫번째로 한국어에 대해서 공개된 KorQuAD v1.0 데이터셋과 NIA v2017 데이터셋, 그리고 엑소브레인 과제에서 구축한 엑소브레인 v2018 데이터셋을 이용하여 데이터셋 간의 교차 평가를 수행하였다. 교차 평가결과, 각 데이터셋의 정답의 길이, 질문과 단락 사이의 오버랩 비율과 같은 데이터셋 통계와 일반화 성능이 서로 관련이 있음을 확인하였다. 다음으로 KorBERT 사전 학습 언어모델과 학습 가능한 기계독해 데이터 셋 21만 건 전체를 이용하여 학습한 기계독해 모델에 대해 블라인드 평가셋 평가를 수행하였다. 블라인드 평가로 일반분야에서 학습한 기계독해 모델의 법률분야 평가셋에서의 일반화 성능을 평가하고, 정답 단락을 읽고 질문을 생성하지 않고 질문을 먼저 생성한 후 정답 단락을 검색한 평가셋에서의 기계독해 성능을 평가하였다. 블라인드 평가 결과, 사전 학습 언어 모델을 사용하지 않은 기계독해 모델 대비 사전 학습 언어 모델을 사용하는 모델이 큰 폭의 일반화 성능을 보였으나, 정답의 길이가 길고 질문과 단락 사이 어휘 오버랩 비율이 낮은 평가셋에서는 아직 80%이하의 성능을 보임을 확인하였다. 본 논문의 실험 결과 기계 독해 태스크는 특성 상 질문과 정답 사이의 어휘 오버랩 및 정답의 길이에 따라 난이도 및 일반화 성능 차이가 발생함을 확인하였고, 일반적인 질문과 단락을 대상으로 하는 기계독해 모델 개발을 위해서는 다양한 유형의 평가셋에서 일반화 평가가 필요함을 확인하였다.

  • PDF

Performance Model for Distributed shared Memory (분산공유 메모리를 위한 성능비교 모델)

  • 임승범;김재훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04a
    • /
    • pp.116-118
    • /
    • 2000
  • 분산 공유 메모리(Distributed Shared Memory)시스템은 사용자에게 간단한 공유메모리 개념을 제공하기 때문에 사용자는 노드 사이의 데이터 이동에 관여할 필요가 없다. DSM에서 일치서 유지를 위한 프로토콜을 선택하는 것은 통신부하를 줄이는데 중요한 역할을 한다. 본 논문은 DSM 프로토콜을 효과적으로 선택하기 위한 새로운 성능평가 모델을 제시한다. 본 연구에서 제안하는 성능평가 모델을 사용함으로써 무효화방식(invalidate protocol), 갱신 방식(update protocol) 그리고 이주방식(migratory protocol)의 성능예측이 가능하다. 본 성능평가모델은 노드들 사이의 데이터 일치성(consistency)유지를 위한 부담을 최소화하는 최적의 DSM 프로토콜을 결정하는데 사용된다.

  • PDF

Development of an Asset Management System for Public Facilities (공공시설물의 자산관리체계구축을 위한 모델 개발)

  • Kim, Chang Hak;Lee, Su Young;Jeon, Seok Hyeon
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.41 no.3
    • /
    • pp.297-304
    • /
    • 2021
  • The maintenance management system of domestic public facilities is shifting from the concept of diagnosis and repair for maintaining safety of facilities to performance evaluation method that improves and maintains the performance of facilities. However, in Korea, the performance evaluation method for the maintenance of facilities has not been established, so the performance evaluation has not been properly performed. In this study, we propose an asset management model that introduces the concept of performance evaluation to complement the simple maintenance strategy focused on safety management of current facilities. This model differentiated from the existing model by proposing a method for using WBS as a method for collecting facility maintenance information. This model proposed the most important level of service evaluation method and performance measure factors in the performance evaluation of facilities, and conducted a case analysis to assess the appropriateness of this model.

The Maintenance Performance Evaluation Dynamic Model for Apartment Buildings (공동주택의 유지관리 성능평가 동적 모델 개발)

  • Kim, Tae-Hui
    • Korean Journal of Construction Engineering and Management
    • /
    • v.6 no.5 s.27
    • /
    • pp.78-88
    • /
    • 2005
  • Given the trend of increased apartment buildings and high-rise buildings, the maintenance of apartment buildings has been set a higher value. For this reason, a total performance evaluation model of the existing buildings has recently been developed. But, it has a lack of the management work analysis. The purpose of this study, therefore, is the management work analysis for items selection of maintenance performance evaluation of apartment buildings. Candidate items of Maintenance performance evaluation was made with the existing literature and business system analysis. Easy systemicity of performance evaluation supplemented doing question to academic experts and housing managers. Finally decided maintenance performance evaluation items are to classify 14 administrative and 15 technical items.

A Study on the Services Performance Evaluation of Intelligent Network Facilities (지능망 설비에서의 서비스 성능평가에 관한 연구)

  • Jeon, Hui Jong;O, Jung Min;Kim, Chun Su;Kim, Byeong Jin
    • The Proceedings of the Korean Institute of Illuminating and Electrical Installation Engineers
    • /
    • v.9 no.2
    • /
    • pp.138-138
    • /
    • 1995
  • 본 논문에서는 지능망설비의 성능평가를 위한 평가모델 분석과 현재 운용 중인 지능망서비스 설비시스템에 적용하여 성능평가 모델 및 평가결과를 제시하였다. 평가 기법에는 시뮬레이션 및 운용해석 방법을 이용하였다. 평가 결과로서, 시뮬레이션과 운용해석 방법의 결과는 대체로 일치하였으며 지능망설비의 지연요소 보다 이용자-망 상호작용시간이 더 큰 영향을 주고 있음을 알 수 있었다. 본 논문에서 제안한 평가모델에서 지능망서비스 설비구조의 특성상 서비스처리용량을 확장할 수 있었고 서비스 성능을 고려한 정보통신설비 계획시 또는 서비스 운용관리시에 유용한 성능예측 기법으로 제공될 수 있으며 지능망서비스 설계시 서비스 성능을 고려한 통신설비 설계에 유용하게 이용되리라 기대된다.

Modeling and Simulation for Performance Evaluation of VoIP Spam Detection Mechanism (VoIP 스팸 탐지 기술의 성능 평가를 위한 모델링 및 시물레이션)

  • Kim, Ji-Yeon;Kim, Hyung-Jong;Kim, Myuhng-Joo;Jeong, Jong-Il
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.19 no.3
    • /
    • pp.95-105
    • /
    • 2009
  • Spam call is one of the main security threat in VoIP services. In this paper, we have designed simulation model for performance evaluation of VoIP spam defense mechanism. The simulation model has functions for performance evaluation such as calls generation and input/output comparison. Four representative caller models have been developed for performance evaluation and each model has its own characteristics as statistical parameters. The target mechanism of performance evaluation is SPIT(Spam over Internet Telephony) level decision algorithm, and we have derived SPIT levels of caller models. The performance evaluation model is designed using the DEVS formalism and DEVSJAVA$^{TM}$ is exploited for development and execution of simulation models.

A Gompertz Model for Software Cost Estimation (Gompertz 소프트웨어 비용 추정 모델)

  • Lee, Sang-Un
    • The KIPS Transactions:PartD
    • /
    • v.15D no.2
    • /
    • pp.207-212
    • /
    • 2008
  • This paper evaluates software cost estimation models, and presents the most suitable model. First, we transformed a relevant model into variables to make in linear. Second, we evaluated model's performance considering how much suitable the cost data of the actual development software was. In the stage of model performance evaluation criteria, we used MMRE which is the relative error concept rather than the absolute error. Existing software cost estimation model follows Weibull, Gamma, and Rayleigh function. In this paper, Gompertz function model is suggested which is a kind of growth curve. Additionally, we verify the compatability of other different growth curves. As a result of evaluation of model's performance, Gompertz function was considered to be the most suitable for the cost estimation model.

Performance evaluation of Scheduling Algorithms according to the Channel models in Multi-cell Networks (멀티 셀 네트워크에서 채널 모델에 따른 스케줄링 알고리듬 성능 평가)

  • Min, Gyeong-Baek;Hwan, Gyu-Yeon;So, Jae-U;Lee, Seung-Beom;Kim, Gyeong-Ho;Lee, Seong-Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.265-267
    • /
    • 2013
  • 본 논문에서는 멀티 셀 셀룰러 네트워크에서 채널 환경에 따른 스케줄링 알고리듬의 성능을 평가한다. 무선 통신 환경에서 대표적인 채널모델인 가우시안 채널, 레일리 페이딩 채널, SCME(Spatial Channel Model Extended) 채널 모델에 PF(Proportional Fair)와 MR(Maximum Rate) 스케줄링 기법을 적용했을 때, 시스템 성능을 평가하고 비교한다. 기지국에서 송신된 신호는 채널을 통과하며 변화하고 이는 채널 모델에 따라 달라진다. 채널 모델에 따른 스케줄링 알고리듬 성능 평가 결과 가우시안 채널모델과 레일리 페이딩 채널모델 SCME보다 좋은 성능을 보인다.

A Study on Life Cycle Management of River facilities using Performance Evaluation Model (성능평가모델을 활용한 하천시설의 생애주기 관리에 관한 연구)

  • Kim, Jin-Guk;Kim, Sooyoung;Jung, Jaewon;Yoon, Kwang Seok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.376-376
    • /
    • 2022
  • 전 세계적으로 홍수의 발생빈도가 증가함에 따라, 하천 내 홍수피해를 경감하기 위해 설치하는 하천시설에 대한 중요성이 강조되고 있다. 하천시설은 홍수조절, 이수를 위한 흐름의 제어와 유도, 자연환경의 유지 및 개선 등 중요한 역할을 하고 있으나, 구조적으로 물과의 접촉이 많아 물리적 손상이나 노후화가 매우 빠르게 진행되는 특성이 있다. 시설물의 노후화가 지속될수록 안정성을 보장하기 어려워 자연재난의 규모를 증가시킬 위험성이 있다. 하천시설의 선제적 유지관리를 위해, 본 연구에서는 시설물통합정보관리시스템(Facilty Management System; FMS)의 정밀안전진단 결과를 활용하여 시설물의 사용연수에 따른 성능지표의 변화를 기반으로 회귀식 형태의 성능평가모델을 개발하였다. 기존연구와의 비교를 통해 성능평가모델의 적합성을 확인하였으며, 개발한 성능평가모델은 하천시설의 생애주기를 통합적으로 고려함으로써 정량적인 상태를 예측할 수 있다는 장점이 있다. 본 연구에서 제안된 성능평가모델 결과는 하천시설의 생애주기 관리를 위한 기초자료로 활용 가능할 것으로 기대된다.

  • PDF

Comparative Analysis of Language Model Performance in News Domain Summarization (언어 모델의 뉴스 도메인 요약 성능 비교 분석)

  • Sangwon Ryu;Yunsu Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.131-136
    • /
    • 2023
  • 본 논문에서는 기존의 요약 태스크에서 주로 사용하는 인코더-디코더 모델과 디코더 기반의 언어 모델의 성능을 비교한다. 요약 태스크를 평가하는 주요한 평가 지표인 ROUGE 점수의 경우, 정답 요약문과 모델이 생성한 요약문 간의 겹치는 단어를 기준으로 평가한다. 따라서, 추상적인 요약문을 생성하는 언어 모델의 경우 인코더-디코더 모델에 비해 낮은 ROUGE 점수가 측정되는 경향이 있다. 또한, 최근 연구에서 정답 요약문 자체의 낮은 품질에 대한 문제가 되었고, 이는 곧 ROUGE 점수로 모델이 생성하는 요약문을 평가하는 것에 대한 신뢰도 저하로 이어진다. 따라서, 본 논문에서는 언어 모델의 요약 성능을 보다 다양한 관점에서 평가하여 언어 모델이 기존의 인코더-디코더 모델보다 좋은 요약문을 생성한다는 것을 보인다.

  • PDF