• 제목/요약/키워드: 데이터 평가 모델

검색결과 2,458건 처리시간 0.033초

대화 데이터 증강에 기반한 도메인에 강건한 종단형 목적지향 대화모델 (Domain-robust End-to-end Task-oriented Dialogue Model based on Dialogue Data Augmentation)

  • 이기영;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.531-534
    • /
    • 2022
  • 신경망 기반 심층학습 기술은 대화처리 분야에서 대폭적인 성능 개선을 가져왔다. 특히 GPT-2와 같은 대규모 사전학습 언어모델을 백본 네트워크로 하고 특정 도메인 타스크 대화 데이터에 대해서 미세조정 방식으로 생성되는 종단형 대화모델의 경우, 해당 도메인 타스크에 대해서 높은 성능을 내고 있다. 하지만 이런 연구들은 대부분 하나의 도메인에 대해서만 초점을 맞출 뿐 싱글 모델로 두 개 이상의 도메인을 고려하고 있지는 않다. 특히 순차적인 미세 조정은 이전에 학습된 도메인에 대해서는 catastrophic forgetting 문제를 발생시킴으로써 해당 도메인 타스크에 대한 성능 하락이 불가피하다. 본 논문에서는 이러한 문제를 해결하기 위하여 MultiWoz 목적지향 대화 데이터에 오픈 도메인 칫챗 대화턴을 유사도에 기반하여 추가하는 데이터 증강 방식을 통해 사용자 입력 및 문맥에 따라 MultiWoz 목적지향 대화와 오픈 도메인 칫챗 대화를 함께 생성할 수 있도록 하였다. 또한 목적지향 대화와 오픈 도메인 칫챗 대화가 혼합된 대화에서의 시스템 응답 생성 성능을 평가하기 위하여 오픈 도메인 칫챗 대화턴을 수작업으로 추가한 확장된 MultiWoz 평가셋을 구축하였다.

  • PDF

펄스드 이온에너지 패턴의 신경망 시계열 모델링과 플라즈마 감시에의 응용 (Time-Series Neural Network Modeling of Pulsed Ion Energy Pattern and Applications to Plasma Monitoring)

  • 김수연;김병환
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 제39회 하계학술대회
    • /
    • pp.1855-1856
    • /
    • 2008
  • 본 연구에서는 공정 중에 민감하게 반응하는 플라즈마로부터 수집되는 이온에너지 분포(IED : Ion Energy Distribution)와 시계열 신경망 모델링을 결합한 플라즈마 감시 기술을 개발하였다. NIEA(Non-invasive ion analyzer)를 이용하여 IED를 측정하였으며, 모델링에 사용된 신경망은 자기 상관 시계열 신경망(A-NTS : Auto-Correlated Neural Time-Series)이다. 모델 개발을 위한 학습과 테스트 데이터로는 Duty ratio 100%에서 수집한 IED를 이용하였으며, 개발된 모델의 감시 성능은 60%에서 수집된 IED로 평가하였다. 학습인자 k와 m의 범위는 각각 1-3 으로 총 9종류의 (k, m) 조합에 대해서 모델 성능을 평가하였다. 신경망 은닉층 뉴런수는 2-9의 범위에서 최적화하였다. 최적화된 모델은 (2, 3)과 뉴런수 2에서 구해졌으며, 0.335의 예측 에러를 보였다. 60% IED 데이터로 평가한 결과 플라즈마 고장에의 민감도는 62% 이상이었다. 이는 IED의 A-NTS 모델이 플라즈마 고장의 감시에 효과적으로 적용될 수 있음을 의미한다.

  • PDF

A Study on Improving the Accuracy of Medical Images Classification Using Data Augmentation

  • Cheon-Ho Park;Min-Guan Kim;Seung-Zoon Lee;Jeongil Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.167-174
    • /
    • 2023
  • 본 연구는 합성곱 신경망 모델에서 이미지 데이터 증강을 통하여 대장암 진단 모델의 정확도를 개선하고자 하였다. 이미지 데이터 증강은 기초 이미지 조작 방법을 이용하여 뒤집기, 회전, 이동, 밀림, 주밍을 사용하였다. 본 연구에서는 실험설계를 위해 보유하고 있는 5000개의 이미지 데이터에 대해 훈련 데이터와 평가 데이터로 각각 4000개와 1000개로 나누었으며, 훈련 데이터 4000개에 대해 이미지 데이터 증강 기법으로 4000개와 8000개의 이미지를 추가하여 모델을 학습시켰다. 평가 결과는 훈련 데이터 4000개, 8000개, 12000개에 대한 분류 정확도가 각각 85.1%, 87.0%, 90.2%로 나왔으며 이미지 데이터 증강에 따른 개선 효과를 확인하였다.

성취기준 통합 데이터 모델을 통한 성취평가 지원 시스템 모델링 (Modeling of an Achievement Evaluation Support System Using Achievement Standards-based Integrated Data Model)

  • 정현숙;김정민
    • 한국정보기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.115-125
    • /
    • 2018
  • 2015 개정 교육과정의 핵심은 성취평가제의 적용과 확산으로서 학생들의 학업 성취 평가에서 있어서 경쟁적인 상대평가에서 벗어나 학생들이 각각의 평가기준에 따라 어느 정도의 학업 성취를 달성하였는가를 평가하는 것이다. 이를 위해서는 교수학습 설계와 수행 및 평가 프로세스를 통합 관리할 수 있는 평가기준 및 성취수준 지원 시스템이 필요하다. 본 논문에서는 교육과정의 성취기준 자료, 수업설계 자료, 학습내용 자료, 평가설계 자료, 평가결과분석 자료 및 피드백 자료들을 연계할 수 있는 통합 데이터모델을 설계하고 이에 기반한 성취평가 지원 시스템을 설계한다. 설계한 통합 데이터 모델을 기반으로 학습자 대쉬보드 웹페이지 프로토타입을 구현하고 학생평가지원포털과의 검색 기능을 비교함으로써 제안한 모델의 퀄리티를 평가하였다.

단백질 기능 예측 모델의 주요 딥러닝 모델 비교 실험 (Comparison of Deep Learning Models Using Protein Sequence Data)

  • 이정민;이현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권6호
    • /
    • pp.245-254
    • /
    • 2022
  • 단백질은 모든 생명 활동의 기본 단위이며, 이를 이해하는 것은 생명 현상을 연구하는 데 필수적이다. 인공신경망을 이용한 기계학습 방법론이 대두된 이후로 많은 연구자들이 단백질 서열만을 사용하여 단백질의 기능을 예측하고자 하였다. 많은 조합의 딥러닝 모델이 학계에 보고되었으나 그 방법은 제각각이며 정형화된 방법론이 없고, 각기 다른 데이터에 맞춰져있어 어떤 알고리즘이 더 단백질 데이터를 다루는 데 적합한지 직접 비교분석 된 적이 없다. 본 논문에서는 단백질의 기능을 예측하는 융합 분야에서 가장 많이 사용되는 대표 알고리즘인 CNN, LSTM, GRU 모델과 이를 이용한 두가지 결합 모델에 동일 데이터를 적용하여 각 알고리즘의 단일 모델 성능과 결합 모델의 성능을 정확도와 속도를 기준으로 비교 평가하였으며 최종 평가 척도를 마이크로 정밀도, 재현율, F1 점수로 나타내었다. 본 연구를 통해 단순 분류 문제에서 단일 모델로 LSTM의 성능이 준수하고, 복잡한 분류 문제에서는 단일 모델로 중첩 CNN이 더 적합하며, 결합 모델로 CNN-LSTM의 연계 모델이 상대적으로 더 우수함을 확인하였다.

시설물 상태평가를 위한 파운데이션 모델 기반 2-Step 시설물 손상 분석 (2-Step Structural Damage Analysis Based on Foundation Model for Structural Condition Assessment)

  • 박현수;김휘영;정동기
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.621-635
    • /
    • 2023
  • 시설물 상태평가는 시설물의 사용성을 평가하고, 진단 주기를 결정하는 중요한 과정이다. 현재 수행되고 있는 인력 기반 방법은 안전, 효율, 객관성에 대한 문제를 안고 있어 이를 개선하기 위해 영상을 이용한 딥러닝(deep learning) 기반의 연구가 수행되고 있다. 그러나 시설물 손상 데이터는 발견하기 어려워 다량의 시설물 손상 학습 데이터를 구축하기 어렵고, 이는 딥러닝 기반 상태평가에 한계로 작용한다. 본 연구에서는 영상 기반 시설물 상태평가의 학습 데이터 부족으로 인한 어려움을 개선하기 위해 파운데이션 모델(foundation model) 기반 2-step 시설물 손상 분석을 제시한다. 시설물 상태평가의 요소를 객체화와 정량화로 세분화하고, 정량화 단계에서 영상 분할(segmentation) 파운데이션 모델을 적용하였다. 본 연구의 방법은 기존 영상 분할 방법 대비 10% 포인트 이상 높은 mean intersection over union을 나타냈고, 특히 철근 노출의 경우에는 40% 포인트 이상의 성능 개선을 보였다. 본 연구의 방법이 학습 데이터 구축이 어려운 도메인에 성능 개선을 가져올 것이라 기대한다.

트리 기법을 사용하는 세미감독형 결함 예측 모델 (Semi-supervised Model for Fault Prediction using Tree Methods)

  • 홍의석
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권4호
    • /
    • pp.107-113
    • /
    • 2020
  • 매우 많은 소프트웨어 결함 예측에 관한 연구들이 수행되어왔지만 대부분은 라벨 데이터를 훈련 데이터로 사용하는 감독형 모델들이었다. 언라벨 데이터만을 사용하는 비감독형 모델이나 언라벨 데이터와 매우 적은 라벨 데이터 정보를 함께 사용하는 세미감독형 모델에 관한 연구는 극소수에 불과하다. 본 논문은 Self-training 기법에 트리 알고리즘들을 사용하여 새로운 세미감독형 모델들을 제작하였다. 세미감독형 기법인 Self-training 모델에 트리 기법들을 사용하는 새로운 세미감독형 모델들을 제작하였다. 모델 평가 실험 결과 새롭게 제작한 트리 모델들이 기존 모델들보다 더 나은 성능을 보였으며, 특히 CollectiveWoods는 타 모델들에 비해 압도적으로 우월한 성능을 보였다. 또한 매우 적은 라벨 데이터 보유 상황에서도 매우 안정적인 성능을 보였다.

암 유전체 데이터를 효과적으로 학습하기 위한 Node2Vec 기반의 새로운 2 차원 이미지 표현기법 (A novel Node2Vec-based 2-D image representation method for effective learning of cancer genomic data)

  • 최종환;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.383-386
    • /
    • 2019
  • 4 차산업혁명의 발달은 전 세계가 건강한 삶에 관련된 스마트시티 및 맞춤형 치료에 큰 관심을 갖게 하였고, 특히 기계학습 기술은 암을 극복하기 위한 유전체 기반의 정밀 의학 연구에 널리 활용되고 있어 암환자의 예후 예측 및 예후에 따른 맞춤형 치료 전략 수립 등을 가능케하였다. 하지만 암 예후 예측 연구에 주로 사용되는 유전자 발현량 데이터는 약 17,000 개의 유전자를 갖는 반면에 샘플의 수가 200 여개 밖에 없는 문제를 안고 있어, 예후 예측을 위한 신경망 모델의 일반화를 어렵게 한다. 이러한 문제를 해결하기 위해 본 연구에서는 고차원의 유전자 발현량 데이터를 신경망 모델이 효과적으로 학습할 수 있도록 2D 이미지로 표현하는 기법을 제안한다. 길이 17,000 인 1 차원 유전자 벡터를 64×64 크기의 2 차원 이미지로 사상하여 입력크기를 압축하였다. 2 차원 평면 상의 유전자 좌표를 구하기 위해 유전자 네트워크 데이터와 Node2Vec 이 활용되었고, 이미지 기반의 암 예후 예측을 수행하기 위해 합성곱 신경망 모델을 사용하였다. 제안하는 기법을 정확하게 평가하기 위해 이중 교차 검증 및 무작위 탐색 기법으로 모델 선택 및 평가 작업을 수행하였고, 그 결과로 베이스라인 모델인 고차원의 유전자 벡터를 입력 받는 다층 퍼셉트론 모델보다 더 높은 예측 정확도를 보여주는 것을 확인하였다.

데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정 (Optimal Identification of Data Granules-based Fuzzy Set Fuzzy Model)

  • 박건준;김완수;오성권;김현기
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.317-320
    • /
    • 2005
  • 본 논문은 비선형 시스템의 퍼지모델을 설계하기 위해 데이터 입자 기반 퍼지 집합 퍼지 모델의 최적 동정을 제안한다. 퍼지모델은 주로 경험적 방법에 의해 추출되기 때문에 보다 구체적이고 체계적인 방법에 의한 동정 및 최적화 될 필요성이 요구된다. HCM 클러스터링을 통한 데이터 입자는 입력 변수의 개별적인 퍼지 규칙을 형성하고, 퍼지 공간 분할 및 삼각형 멤버쉽 함수의 초기 정점을 정의한다. 또한, 데이터 입자의 중심을 이용하여 후반부의 구조를 결정한다. 초기 퍼지 모델을 동정하기 위해 유전자 알고리즘을 이용하여 입력 변수의 수, 선택될 입력 변수, 멤버쉽 함수의 수, 그리고 후반부 형태를 결정한다. 데이터 입자에 의한 전반부 멤버쉽 파라미터는 유전자 알고리즘을 이용하여 최적으로 동정한다 제안된 모델을 평가하기 위해 수치적인 예를 사용한다.

  • PDF

화재 탐지 인공지능 모델 성능 개선 연구 (Research on Improving Fire Detection Artificial Intelligence Model Performance)

  • 이정록;이대웅;정서현;정상
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2023년 정기학술대회 논문집
    • /
    • pp.202-203
    • /
    • 2023
  • 최근 화재 탐지 분야는 불꽃 연기의 특징과 인공지능 인식(Detection) 모델을 활용하여 탐지율을 높이려는 연구가 많이 진행되어 왔다. 기존 화재 탐지 정확도를 높이기 위한 모델 연구 이외에도 불꽃·연기의 특징을 다양한 방법으로 데이터 가공한 학습 데이터셋을 활용하는 연구들이 진행되고 있다. 본 논문에서는 화재 탐지시 불꽃/연기의 오탐지율이 높은 것을 확인하고 오탐지율을 낮추기 위해 화재 상황을 인식하여 분류하는 방법과 데이터셋을 제안한다. 제안한 모델은 동영상을 학습데이터로 활용하여 화재 상황의 특징을 추출하여 분류모델에 적용하였다. 평가는 한국정보화진흥원(NIA)에서 진행하는 화재 데이터셋을 이용하여 Yolov8, Slowfast의 모델 성능을 비교 및 분석하였다.

  • PDF