• 제목/요약/키워드: 데이터 평가 모델

검색결과 2,514건 처리시간 0.036초

당뇨병성 망막증 분류를 위한 ResNet50 모델 기반 다중 전처리 기법 (Diabetic Retinopathy Classification with ResNet50 Model Based Multi-Preprocessing)

  • 목다현;변규린;김주찬;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.621-623
    • /
    • 2023
  • 본 연구는 당뇨병성 망막증의 자동 분류를 위해 딥러닝 모델을 활용한다. CLAHE 를 사용한 전처리로 이미지의 대비를 향상시켰으며, ResNet50 모델을 기반으로 한 전이학습을 통해 모델의 성능을 향상했다. 또한, 데이터의 불균형을 고려하여 정확도 뿐만 아니라 민감도와 특이도를 평가함으로써 모델의 분류 성능을 종합적으로 평가하였다. 실험 결과, 제안한 방법은 당뇨병성 망막증 분류 작업에서 높은 정확도를 달성하였으나, 양성 클래스의 식별에서 일부 한계가 있었다. 이에 데이터의 품질 개선과 불균형 데이터 처리에 초점을 맞춘 향후 연구 방향을 제시하였다.

개인화된 의료 예측을 위한 AI 기반 불확실성 표현 및 데이터 한계 극복 연구 (A study on Overcoming Data Limitations and Representing Uncertainty in AI for Personalized Medical Predictions)

  • 김주찬;변규린;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.608-610
    • /
    • 2023
  • 의료 분야에서 AI 모델의 활용이 증가하고 있지만, 모델의 예측 불확실성을 정확하게 평가하고 표현하는 것이 중요하다. 본 연구는 이러한 문제를 해결하기 위해 AI-driven 방식을 제안하며, 특히 의료 영상 변환 모델에 대한 불확실성 표현과 데이터 한계 극복 방법론을 제안한다. 제안된 AI-driven 안저영상 변환 모델은 기존 GAN과는 다르게 구조가 이루어져 있으며, 신뢰도가 낮은 영역을 구분하고 시각화하여 표현할 수 있다. 실험 결과, 제안된 방법은 기존 모델과 비교하여 영상 변환 성능이 크게 향상되었으며, 불확실성에 대한 정확도 평가에서도 AI-driven 방식이 높은 성능을 보인다. 결론적으로, 본 연구는 AI-driven 방식을 통해 의료 AI에서의 불확실성 표현의 가능성을 확인하였으며, 이 방식이 데이터의 한계와 불확실성을 극복할 수 있을 것으로 기대된다.

역량기반 학습성과 평가 시스템 구현을 위한 데이터 모델링 및 알고리즘 설계 (Data modeling and algorithms design for implementing Competency-based Learning Outcomes Assessment System)

  • 정현숙;김정민
    • 융합정보논문지
    • /
    • 제11권11호
    • /
    • pp.335-344
    • /
    • 2021
  • 본 논문의 목적은 교과기반 학습성취평가 시스템 구현을 위한 교과 데이터 모델 및 학습 성취도 산출 알고리즘 개발이다. 현재 대학 교육의 방향인 역량기반 교육을 위해서는 교과기반 학습성취 평가가 필수적이지만 기존 연구들은 교육학적 관점으로서 컴퓨터 시스템 관점의 해결책이 매우 부족하다. 본 논문에서는 코스맵 데이터 구조 분석을 통해 계층 구조의 학습성과 모델, 학습모듈 및 학습활동 모델, 학습성과와 학습활동 연계 매트릭스 모델 및 자동화된 성취도 산출 및 성취수준 평가를 위한 성취도 계산 알고리즘을 제안한다. 이를 통해 교과기반 학습성취 평가 시스템을 개발할 수 있으며 시스템 활용을 통해 학습자의 역량 성취를 효과적으로 평가할 수 있다. 제안된 모델과 알고리즘의 평가를 위해 실제 운영중인 자바프로그래밍 교과목에 적용하였으며 이를 통해 교과기반 학습성과 성취평가 시스템 구현의 핵심요소로 활용할 수 있음을 확인하였다. 향후 연구는 학습성과 성취도 산출을 기반으로 적응형 학습 피드백과 개인화된 학습 추천 알고리즘 개발 및 시스템 구현이다.

Transformer기반의 언어모델 Bert와 GPT-2 성능 비교 연구 (Transformer-based Language model Bert And GPT-2 Performance Comparison Study)

  • 유연준;홍석민;이협건;김영운
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.381-383
    • /
    • 2022
  • 최근 자연어처리 분야에서는 Bert, GPT 등 Transformer기반의 언어모델 연구가 활발히 이뤄지고 있다. 이러한 언어모델은 대용량의 말뭉치 데이터와 많은 파라미터를 이용하여 사전학습을 진행하여 다양한 자연어처리 테스트에서 높은 성능을 보여주고 있다. 이에 본 논문에서는 Transformer기반의 언어모델인 Bert와 GPT-2의 성능평가를 진행한다. 성능평가는 '네이버 영화 리뷰' 데이터 셋을 통해 긍정 부정의 정확도와 학습시간을 측정한다. 측정결과 정확도에서는 GPT-2가 Bert보다 최소 4.16%에서 최대 5.32% 높은 정확도를 나타내었지만 학습시간에서는 Bert가 GPT-2보다 최소 104초에서 116초 빠르게 나타났다. 향후 성능 비교는 더 많은 데이터와 다양한 조건을 통해 구체적인 성능 비교가 필요하다.

GAN 데이터 기반의 머신러닝 모델을 통한 미계측 하천에서의 수생태계 건강성 등급 예측 방안 연구 (A study on the prediction of aquatic ecosystem health grade in ungauged rivers through the machine learning model based on GAN data)

  • 이서로;이지민;이관재;김종건;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.448-448
    • /
    • 2021
  • 최근 급격한 기후변화와 도시화 및 산업화로 인한 지류하천에서의 수량과 수질의 변동은 생물 다양성 감소와 수생태계 건강성 저하에 큰 영향을 미치고 있다. 효율적인 수생태 관리를 위해서는 지속적인 유량, 수질, 그리고 수생태 모니터링을 통한 데이터 축적과 더불어 면밀한 상관 분석을 통해 수생태계 건강성의 악화 원인을 규명해야 할 필요가 있다. 그러나 수많은 지류하천을 대상으로 한 지속적인 모니터링은 현실적으로 어려움이 있으며, 수생태계의 특성 상 단일 영향 인자만으로 수생태계의 건강성 변화와의 관계를 정확히 파악하는데 한계가 있다. 따라서 지류하천에서의 유량 및 수질의 시공간적인 변동성과 다양한 영향 인자를 고려하여 수생태계의 건강성을 효율적으로 예측할 수 있는 기술이 필요하다. 이에 본 연구에서는 경험적 데이터 기반의 머신러닝 모델 구축을 통해 미계측 하천에서의 수생태계 건강성 지수(BMI, TDI, FAI)의 등급(A to E)을 예측하고자 하였다. 머신러닝 모델은 학습 데이터셋의 양과 질에 따라 성능이 크게 달라질 수 있으며, 학습 데이터셋의 분포가 불균형적일 경우 과적합 또는 과소적합 문제가 발생할 수 있다. 이를 보완하고자 본 연구에서는 실제 측정망 데이터셋을 바탕으로 생성적 적대 신경망 GAN(Generative Adversarial Network) 알고리즘을 통해 머신러닝 모델 학습에 필요한 추가 데이터셋(유량, 수질, 기상, 수생태 등급)을 확보하였다. 머신러닝 모델의 성능은 5차 교차검증 과정을 통해 평가하였으며, GAN 데이터셋의 정확도는 실제 측정망 데이터셋의 정규분포와의 비교 분석을 통해 평가하였다. 최종적으로 SWAT(Soil and Water Assessment Tool) 모형을 통해 예측 된 미계측 하천에서의 데이터셋을 머신러닝 모델의 검증 자료로 사용하여 수생태계 건강성 등급 예측 정확도를 평가하였다. 본 연구에서의 GAN에 의해 강화된 머신러닝 모델은 수질 및 수생태 관리가 필요한 우심 지류하천 선정과 구조적/비구조적 최적관리기법에 따른 수생태계 건강성 개선 효과를 평가하는데 활용될 수 있을 것이다. 또한 이를 통해 예측된 미계측 하천에서의 수생태계 건강성 등급 자료는 수량-수질-수생태를 유기적으로 연계한 통합 물관리 정책을 수립하는데 기초자료로 활용될 수 있을 것이라 사료된다.

  • PDF

인적 모델 개발에 필요한 통계 데이터 고찰 (Review On the Statistical Data to Implement Human Model)

  • 조수산;장은진;임정빈
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 추계학술대회
    • /
    • pp.193-195
    • /
    • 2015
  • 해양사고 원인의 70 % 이상을 차지하는 인적오류 예방은 해양안전에 가장 중요한 이슈이다. 인적오류는 확률기반의 인적 모델을 구축하여 평가함으로써 예상되는 위기의 수준을 과학적으로 예측할 수 있다. 확률기반 인적 모델을 구축하기 위해서는 사건의 원인과 결과 사이에 연계성을 갖고 있는 통계 데이터가 필요하다. 본 연구에서는 이러한 연계 데이터 확보를 위한 것으로, 해양안전심판원의 통계 데이터 사이의 연계성 확보 방안을 주로 검토하였다. 그리고 이러한 통계 데이터를 인적 모델에 적용하는 방법과 전략도 검토하였다. 인적 모델은 회사, 선박, 해기사 관련 요소들이 총체적으로 반영될 필요가 있음을 알았고, 이러한 세 가지 요소로 구성된 통합 모델을 설계하기 위한 방안도 검토하였다. 특히, 각 요소들에 포함될 데이터 사이의 연계성 확보를 위해서 해양사고 연계 체인(Chain)을 도입하였다. 확보한 데이터는 사고의 가장 근본원인인 Hazard부터 사고의 영향을 나타내는 Impact까지의 6 단계 분석 방법을 적용하여 통계 데이터에 결합되어 있는 원인과 결과 사이의 연계성을 확보할 수 있는 방안을 수립하였다. 본 연구는 중장기적으로 추진할 과제이기 때문에 향후 본 연구 내용을 토대로 인적 모델을 개발하여 해양사고 예방에 적극 기여하고자 한다.

  • PDF

객체-관계 변환 방법론 기반 메타데이터 레지스트리 데이터베이스 설계 (A Design of Metadata Registry Database based on Object-Relational Transformation Methodology)

  • 차수영;이석훈;정동원;백두권
    • 정보과학회 논문지
    • /
    • 제42권9호
    • /
    • pp.1147-1161
    • /
    • 2015
  • ISO/IEC 11179 메타데이터 레지스트리(Metadata Registry, MDR)는 메타데이터의 등록 및 공유를 위해 개발된 국제표준이다. ISO/IEC 11179는 MDR을 객체 모델인 메타모델로 표현한다. 하지만 ISO/IEC 11179는 메타모델을 데이터베이스로 구축하기 위한 명확한 기준이 없으므로 표준 기반의 MDR 개발이 어려운 문제점이 있다. 이 논문은 MDR 구현을 위해 객체-관계 변환 방법론 기반의 MDR 데이터 모델을 설계한다. 이를 위해 연구된 객체-관계 변환 방법론의 변환 기법들을 관계성에 기준하여 분류하고, 이 변환 기법들의 사용 기준을 정의함으로 모델링 규칙을 제안한다. 이 논문은 MDR 데이터 모델에 대한 구현 결과로 관계형 데이터베이스 테이블을 구축한다. 실험 및 평가를 통하여 제안하는 모델링 규칙을 검증하고 구축된 테이블 구조의 적합성을 평가한다. 평가 결과로 제안 기법에 의해 구축된 테이블 구조는 표준 메타모델의 클래스와 관계성을 잘 보존함을 보인다.

YOLO 기반 실종자 수색 AI 응용 시스템 구현 (Implementation of YOLO based Missing Person Search Al Application System)

  • 김하연;김종훈;정세훈;심춘보
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.159-170
    • /
    • 2023
  • 실종자 수색은 많은 시간과 인력이 필요하다. 그 해결책의 일환으로 YOLO 기반 모델을 활용하여 실종자 수색 AI 시스템을 구현하였다. 객 객체 탐지 모델을 훈련하기 위해 AI-Hub에서 드론 이동체 인지 영상(도로 고정)을 수집하고 모델을 학습하였다. 또한, 훈련 데이터 세트와 상이한 환경에서의 성능을 평가하기 위해 산악 환경 데이터 세트를 추가 수집하였다. 실종자 수색 AI 시스템의 최적화를 위해 모델 크기 및 하이퍼파라미터에 따른 성능평가, 과대적합 우려에 대한 추가 성능평가를 시행하였다. 성능평가 결과 YOLOv5-L 모델이 우수한 성능을 보이는 것을 확인할 수 있었으며 데이터 증강 기법을 적용함에 따라 모델의 성능이 보다 향상되었다. 이후 웹 서비스에는 데이터 증강 기법을 적용한 YOLOv5-L 모델을 적용하여 실종자 수색의 효율성을 높였다.

웹 온톨로지 저장소의 질의 처리 성능에 대한 비교 평가 (Comparative Evaluation on Query Processing Performance of Web Ontology Storages)

  • 정동원;최명회;정영식;한성국
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.17-22
    • /
    • 2007
  • 이 논문에서는 관계형 데이터베이스 모델 기반의 OWL 웹 온톨로지 모델을 보이고 이에 대한 실험 및 비교 평가 결과에 대하여 기술한다. OWL은 W3C에 의해 2004년 12월에 권고안으로 채택된 이후에 많은 연구가 진행되고 있다. 편집 도구 개발, 저장소 개발로 OWL 기반의 추론 엔진까지 이와 관련된 다양한 연구가 진행 중이다. 특히 OWL 온톨로지의 영구적인 저장 및 관리를 위해 관계형 데이터베이스 모델을 이용한 많은 연구 결과들이 발표되고 있다. 이 논문에서는 널리 알려진 관계형 모델 기반의 저장소 보다 나은 성능을 제공하기 위해 제안한 모델에 대한 평가 결과에 대하여 기술한다. 기존 유사 연구의 경우, 비교 평가를 위한 평가 항목으로 온톨로지 로드 시간을 고려하기도 하지만 이 논문에서는 질의응답 시간에만 초점을 둔다. 이는 매우 특수한 상황을 제외한 대부분의 상황에서 질의 처리 시간이 가장 중요한 요소이며 실질적인 활용성 측면에서 핵심적으로 다루어야 하는 평가 항목이기 때문이다. 실험을 위한 데이터로서는 많은 연구에서 활용하고 있는 LUBM 데이터 셋을 이용하며 실험 대상으로는 오픈 소스이며 널리 알려진 시스템인 Jena의 저장소와 Sesame를 이용한다. 실험 및 비교 평가 결과, 제안 시스템이 비교 대상 시스템들에 비해 나은 성능을 보임을 알 수 있다.

  • PDF

부분 데이터를 이용한 신뢰도 성장 모델 선택 방법 (A Method for Selecting Software Reliability Growth Models Using Partial Data)

  • 박용준;민법기;김현수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권1호
    • /
    • pp.9-18
    • /
    • 2015
  • 소프트웨어 신뢰도 성장 모델은 고장 데이터를 사용해서 소프트웨어 출시일 또는 추가 테스트 노력을 결정하는 데 사용된다. 소프트웨어 신뢰도 성장 모델을 사용할 때 특정 소프트웨어 신뢰도 성장 모델을 모든 소프트웨어에 사용할 수 없는 문제가 있다. 또한 신뢰도를 평가하기 위해 이미 많은 수의 소프트웨어 신뢰도 성장 모델이 제안되었다. 따라서 특정 조건에 맞는 최적의 소프트웨어 신뢰도 성장 모델을 선택하는 것은 중요한 이슈가 되었다. 기존 소프트웨어 신뢰도 성장 모델 선택 방법에서는 수집된 고장 데이터 전체를 사용하고 있다. 그런데 초기에 수집된 고장 데이터는 미래 고장 예측에 영향을 주지 않을 수도 있고 경우에 따라서는 미래 고장 예측 과정에서 왜곡된 결과를 초래할 수도 있다. 이를 해결하기 위해서 이 논문에서는 부분 고장 데이터를 이용하여 적합도 평가를 수행하는 방법에 기반을 둔 소프트웨어 신뢰도 성장 모델 선택 방법을 제안한다. 이 논문에서는 고장 데이터에서 과도하게 불안정한 데이터를 제외한 부분 데이터를 사용한다. 소프트웨어 신뢰도 성장 모델 선택에 사용될 부분 데이터는 전체 고장 데이터와 고장 데이터의 일부를 제외한 부분 고장 데이터의 미래 고장 예측 능력의 비교를 통해서 찾는다. 연구의 타당성을 보이기 위하여 실제 수집된 고장 데이터를 사용해서 전체 데이터를 적용한 경우보다 부분 데이터를 사용한 경우의 미래 고장 예측 능력이 더 정확함을 보인다.