• 제목/요약/키워드: 성능평가 지표

검색결과 635건 처리시간 0.029초

영어 교육을 위한 거대 언어 모델 활용 말뭉치 확장 프레임워크 (Data Augmentation using Large Language Model for English Education)

  • 정진우;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.698-703
    • /
    • 2023
  • 최근 ChatGPT와 같은 사전학습 생성모델은 자연어 이해 (natural language understanding)에서 좋은 성능을 보이고 있다. 또한 코드 작업을 도와주고 대학수학능력시험, 중고등학교 수준의 문제를 풀거나 도와주는 다양한 분야에서 활용되고 있다. 본 논문은 사전학습 생성모델을 이용하여 영어 교육을 위해 말뭉치를 확장하는 프레임 워크를 제시한다. 이를 위해 ChatGPT를 사용해 말뭉치를 확장 한 후 의미 유사도, 상황 유사도, 문장 교육 난이도를 사용해 생성된 문장의 교육적 효과를 검증한다.

  • PDF

비디오 스트림 구조를 활용한 동적 키프레임 기반 사용자 개성 예측 (Predicting User Personality Based on Dynamic Keyframes Using Video Stream Structure)

  • 이미라;우사이먼성일;정혜동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.601-604
    • /
    • 2023
  • 기술이 발전함에 따라 복합적인 모달리티 정보를 포함하는 멀티미디어 데이터의 수집이 용이해지면서, 사람의 성격 특성을 이해하고 이를 개인화된 에이전트에 적용하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 비디오 스트림 구조를 활용하여 사용자 특성을 예측하기 위한 동적 키프레임 추출 방법을 제안한다. 비디오 데이터를 효과적으로 활용하기 위해서는 무작위로 선택한 프레임에서 특징을 추출하던 기존의 방법을 개선하여 영상 내 시간에 따른 정보와 변화량을 기반으로 중요한 프레임을 선택하는 방법이 필요하다. 본 논문에서는 제 3자가 평가한 Big-five 지표 값이 레이블링된 대표적인 데이터셋인 First Impressions V2 데이터셋을 사용하여 외면에서 발현되는 특징들을 기반으로 영상에서 등장하는 인물들의 성격 특성을 예측했다. 결론에서는 선택된 키프레임에서 멀티 모달리티 정보를 조합하여 성격 특성을 예측한 결과와 베이스라인 모델과의 성능을 비교한다.

고주파에 적합한 교차 엔트로피 손실함수에 대한 초해상도 (Super-Resolution with Cross-Entropy Loss Adapted to High Frequencies)

  • 오윤주;김태현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.709-710
    • /
    • 2024
  • Super resolution에서 High-frequency Details를 개선하는 것이 최근 문제이다. 기존에는 Super resolution을 Regression task로 접근하므로써 L2 Loss를 사용하여 이미지가 흐릿하게 되었다. 이를 해결하기위해, Classification task로 바꾸므로써 Cross Entropy Loss을 적용하여 Cross-entropy Super-resolution (CS)를 설계한다. CS를 통해 선명도와 Details이 개선되지만, 저주파의 CE Loss 학습으로인한 Black Artifacts가 발생한다. 그래서, L2 Loss는 저주파와 같이 큰 신호에 더 초점을 맞추므로, 성능 개선을 위해 저주파를 L2 Loss에서, 고주파를 CE Loss에서 학습시킨 Frequency-specific Cross-entropy Super-resolution (FCS)을 제안한다. 우리는 왜곡에 강하며 Human의 인식과 유사한 측정지표인 Learned Perceptual Image Patch Similarity (LPIPS)로 평가한다. 실험한 모든 데이터 셋에서 우리의 FCS는 Baseline보다 LPIPS가 약 1.7배 정도 개선되었다.

  • PDF

교통분야 가명정보의 효율적 처리 및 활용을 위한 통합데이터안심구역 프로토타입 (Integrated Data Safe Zone Prototype for Efficient Processing and Utilization of Pseudonymous Information in the Transportation Sector)

  • 이형근;유기동
    • 한국ITS학회 논문지
    • /
    • 제23권3호
    • /
    • pp.48-66
    • /
    • 2024
  • 데이터 3법과 데이터 산업법에 따라 가명정보 결합전문기관 및 데이터안심구역 시스템이 물리적으로 분리되어 운영 중이므로, 가명정보의 처리 및 활용을 원하는 중소기업 또는 스타트업 등의 사용자에게 복잡한 절차와 병목으로 인한 부담으로 작용한다. 또한, 개인정보의 유출 등을 우려한, 지나치게 엄격한 가명 처리 과정은 오히려 데이터의 품질을 훼손하는 역효과가 발생한다. 가명정보의 안전한 처리 및 활용을 위한 일련의 조치는 사용자의 편의와 데이터의 품질을 동시에 보장할 수 있도록 구성되어야 한다. 따라서 본 연구는 기존 가명정보 처리 및 활용의 문제점을 개선한 통합데이터안심구역의 프로토타입 시스템을 제시한다. 이를 위해 기존 BPR 가이드라인을 선택적으로 수정하여 새로운 워크플로우 재설계 가이드라인을 개발 및 적용하며, 핵심성능지표를 도출하여 개발된 프로토타입의 성능을 판단한다. 성능평가 결과 제시된 프로토타입은 기존의 시스템에 비해 시간적 측면에서는 약 6배, 비용적 측면에서는 1.28배, 품질적 측면에서는 1.3배의 향상된 성능을 보임을 확인하였다.

딥러닝을 이용한 WTCI 설태량 평가를 위한 유효성 검증 (An Effectiveness Verification for Evaluating the Amount of WTCI Tongue Coating Using Deep Learning)

  • 이우범
    • 융합신호처리학회논문지
    • /
    • 제20권4호
    • /
    • pp.226-231
    • /
    • 2019
  • 한방 설진에서 WTCI(Winkel Tongue Coating Index) 설태 평가는 환자의 설태량 측정을 위한 중요한 객관적인 지표 중의 하나이다. 그러나 이전의 WTCI 설태 평가는 혀영상으로부터 설태 부분을 추출하여 전체 혀 영역에서 추출된 설태 영역의 비율을 정량적으로 측정하는 방법이 대부분으로 혀영상의 촬영 조건이나 설태 인식 성능에 의해서 비객관적 측정의 문제점이 있었다. 따라서 본 논문에서는 빅데이터를 기반으로 하는 인공지능의 딥러닝 방법을 적용하여 설태량을 분류하여 평가하는 딥러닝 기반의 WTCI 평가 방법을 제안하고 검증한다. 설태 평가 방법에 있어서 딥러닝의 유효성 검증을 위해서는 CNN을 학습 모델로 사용하여 소태, 박태, 후태의 3가지 유형의 설태량을 분류한다. 설태 샘플 영상을 학습 및 검증 데이터로 구축하여 CNN 기반의 딥러닝 모델로 학습한 결과 96.7%의 설태량 분류 정확성을 보였다.

재사용 향상을 위한 요구사항과 컴포넌트간의 Gap 분석 (A Gap Analysis Method Between System Requirements and Components for Improving Reusability)

  • 신정환;김능회;이동현;인호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(B)
    • /
    • pp.159-162
    • /
    • 2011
  • 시스템 요구사항과 소프트웨어 재사용 컴포넌트 간의 Gap 분석을 통해 컴포넌트의 재사용 커버리지를 측정함으로써 부적절한 재사용 컴포넌트를 구분해 내거나 대안 컴포넌트 중 가장 재사용 커버리지가 높은 컴포넌트를 선택하는 방법을 제안한다. Gap 분석의 방법으로 기능적, 비기능적 지표가 고려된 FP(Function Point) 분석 방법의 사용을 통한 재사용컴포넌트의 평가 프로세스에 대해 설명한다. 재사용컴포넌트 평가 프로세스에 의해 계산된 수치화된 시스템요구사항과 재사용컴포넌트간의 커버리지 비율을 통해, 소프트웨어 재사용 방해요소인 부적절한 라이브러리의 사용, 신뢰성이 떨어지는 모듈, 성능격감 의 문제점들을 줄이거나 해결함으로써 소프트웨어 재사용의 비율을 높이고 이는 비용절감으로 이어져 보다 성공적인 소프트웨어 개발 프로젝트를 기대할 수 있다.

기관실화재 인명위험성평가에 관한 연구 (A Study on the Life Risk Assessment of Ship's Engine Room Fire)

  • 한상국;조대환;박찬수
    • 해양환경안전학회:학술대회논문집
    • /
    • 해양환경안전학회 2006년도 추계학술발표회
    • /
    • pp.283-289
    • /
    • 2006
  • 이 연구에서는 국제적으로 관심이 집중되고 있는 FSA를 선박의 화재 안전 분야에 도입하기 위한 준비과정으로 화재안전도의 가장 중요한 지표인 사망확률의 근거가 되는 피난계산을 실습선의 모의훈련에 의해 계산하여 피난시간의 계산 및 성능기준 화재의 안전설계를 검토하였다. 그 결과 승선인원과 대피 통로의 폭과는 일정한 상관관계가 있으며 최적의 폭을 산정할 수 있음을 보였다. 그러나 선박 내부의 좁은 통로와 선박의 종류에 따른 특수한 구조를 고려할 때 일괄적인 적용은 어렵다. 또한 대피시간을 모의실험에 의해 추정하고 유출계수를 구한 결과 공용실의 유출계수와 비교하여 기관실의 인명위험성이 약 4배이상 높게 나타났다.

  • PDF

SimKoR: 한국어 리뷰 데이터를 활용한 문장 유사도 데이터셋 제안 및 대조학습에서의 활용 방안 (SimKoR: A Sentence Similarity Dataset based on Korean Review Data and Its Application to Contrastive Learning for NLP )

  • 김재민;나요한;김강민;이상락;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.245-248
    • /
    • 2022
  • 최근 자연어 처리 분야에서 문맥적 의미를 반영하기 위한 대조학습 (contrastive learning) 에 대한 연구가 활발히 이뤄지고 있다. 이 때 대조학습을 위한 양질의 학습 (training) 데이터와 검증 (validation) 데이터를 이용하는 것이 중요하다. 그러나 한국어의 경우 대다수의 데이터셋이 영어로 된 데이터를 한국어로 기계 번역하여 검토 후 제공되는 데이터셋 밖에 존재하지 않는다. 이는 기계번역의 성능에 의존하는 단점을 갖고 있다. 본 논문에서는 한국어 리뷰 데이터로 임베딩의 의미 반영 정도를 측정할 수 있는 간단한 검증 데이터셋 구축 방법을 제안하고, 이를 활용한 데이터셋인 SimKoR (Similarity Korean Review dataset) 을 제안한다. 제안하는 검증 데이터셋을 이용해서 대조학습을 수행하고 효과성을 보인다.

  • PDF

정확한 댐유입량 예측을 위한 SWLSTM 개발 (Accurate dam inflow predictions using SWLSTM)

  • 김종호;쩐득충
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.292-292
    • /
    • 2021
  • 최근 데이터 과학의 획기적인 발전으로 딥러닝(Deep Learning) 알고리즘이 개발되어 다양한 분야에 널리 적용되고 있다. 본 연구에서는 인공신경망 중 하나인 LSTM(Long-Short Term Memory) 네트워크를 기반으로 정확한 댐유입량 예측을 수행하는 SWLSTM 모델을 제안하였다. SWLSM은 모델의 정확도를 개선하기 위해 세 가지 주요 아이디어를 채택하였다. (1) 통계적 속성 (PACF) 및 교차 상관 함수(CCF)를 사용하여 적절한 입력 변수와 시퀀스 길이를 결정하였다. (2) 선택된 입력 예측 변수 시계열을 웨이블릿 변환(WT)을 사용하여 하위 시계열로 분해한다. (3) k-folds cross validation 및 random search 기법을 사용하여 LSTM의 하이퍼 매개변수들을 효율적으로 최적화하고 검증한다. 제안된 SWLSTM의 효과는 한강 유역 5개 댐의 시단위/일단위/월단위 유입량을 예측하고 과거 자료와 비교함으로써 검증하였다. 모델의 정확도는 다양한 평가 메트릭(R2, NSE, MAE, PE)이 사용하였으며, SWLSTM은 모든 경우에서 LSTM 모델을 능가하였다. (평가 지표는 약 30 ~ 80 % 더 나은 성능을 보여줌). 본 연구의 결과로부터, 올바른 입력 변수와 시퀀스 길이의 선택이 모델 학습의 효율성을 높이고 노이즈를 줄이는 데 효과적임을 확인하였다. WT는 홍수 첨두와 같은 극단적인 값을 예측하는 데 도움이 된다. k-folds cross validation 및 random search 기법을 사용하면 모델의 하이퍼 매개변수를 효율적으로 설정할 수 있다. 본 연구로부터 댐 유입량을 정확하게 예측한다면 정책 입안자와 운영자가 저수지 운영, 계획 및 관리에 도움이 될 것이다.

  • PDF

통합 CNN, LSTM, 및 BERT 모델 기반의 음성 및 텍스트 다중 모달 감정 인식 연구 (Enhancing Multimodal Emotion Recognition in Speech and Text with Integrated CNN, LSTM, and BERT Models)

  • 에드워드 카야디;한스 나타니엘 하디 수실로;송미화
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.617-623
    • /
    • 2024
  • 언어와 감정 사이의 복잡한 관계의 특징을 보이며, 우리의 말을 통해 감정을 식별하는 것은 중요한 과제로 인식된다. 이 연구는 음성 및 텍스트 데이터를 모두 포함하는 다중 모드 분류 작업을 통해 음성 언어의 감정을 식별하기 위해 속성 엔지니어링을 사용하여 이러한 과제를 해결하는 것을 목표로 한다. CNN(Convolutional Neural Networks)과 LSTM(Long Short-Term Memory)이라는 두 가지 분류기를 BERT 기반 사전 훈련된 모델과 통합하여 평가하였다. 논문에서 평가는 다양한 실험 설정 전반에 걸쳐 다양한 성능 지표(정확도, F-점수, 정밀도 및 재현율)를 다룬다. 이번 연구 결과는 텍스트와 음성 데이터 모두에서 감정을 정확하게 식별하는 두 모델의 뛰어난 능력을 보인다.