• Title/Summary/Keyword: 데이터 평가 모델

검색결과 2,514건 처리시간 0.033초

소프트웨어 프로젝트 평가모델을 통한 소프트 웨어 메트릭스 분석 (An Analysis of Software Metrics Using the SPEM(Software Project Estimation Model))

  • 이재기;신상권;남상식;박권철
    • 전자통신동향분석
    • /
    • 제17권5호통권77호
    • /
    • pp.107-118
    • /
    • 2002
  • 본 논문은 대형 프로젝트를 수행하는 데 있어서 필요한 리소스, 인력, 개발비용 및 소프트웨어 소스에 대한 데이터를 추정하여 프로젝트의 효율성을 평가하는 모델인 소프트웨어 프로젝트 평가모델을 이용하여 기 수행된 프로젝트의 경험데이터와 수행되고 있는 프로젝트의 소프트웨어 메트릭스(metrics) 데이터를 활용하여 생산성, 품질, 자원투입 효과, 개발될 소프트웨어 소스 규모 등을 추정해 보고 이를 경험적인 모델(empirical model)에 적용하여 프로젝트 별로 평가, 비교 분석해 본다. 또 향후 유사 프로젝트 관리(similar project management)에 필요한 사항들을 제안한다.

임계값 설정을 통한 근치적 위절제술 후 합병증 발생 예측 모델의 성능 평가 (Performance of a Model to Predict Complication Occurance after Radical Gastrectomy according to Thresholds)

  • 임수연;최자윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.687-689
    • /
    • 2024
  • 위암은 전 세계적인 주요 건강문제이며, 근치적 위절제술은 위암의 표준치료이다. 근치적 위절제술 후 치료목표는 합병증 발생을 낮춰 병전 상태로 빠르게 회복하는 데 있다. 따라서, 근치적 위절제술 후 합병증 발생 여부를 선별하여 예측할 수 있는 성능이 좋은 모델을 개발하는 것은 위암환자의 회복에 매우 중요하다. 랜덤포레스트 모델은 여러 개의 결정트리를 활용한 배깅 방식의 대표적인 알고리즘으로 의료 데이터를 기반으로 한 예측에 있어 뛰어난 성능을 보여 주었다. 그러나 실제 데이터는 불균형이 빈번하게 발생하여 모델의 예측 성능에 영향을 미치므로, 최적의 분류 임계값을 설정하여 다수 클래스에 대한 편향을 줄이는 것이 중요하다. 따라서, 본 연구는 최근 10년 간 일개 대학병원의 전자의무기록 데이터를 활용하여 근치적 위절제술 후 합병증 발생을 예측하는 랜덤포레스트 모델을 개발하고, 임계값 설정을 통해 불균형 데이터에 대한 모델의 성능을 평가하고자 한다.

신뢰수준평가에 기반한 고농도 오존 예측모델의 성능평가 (Performance Evaluation of High-Level Ozone Prediction Model Based on the Confidence Level Test)

  • 정재룡;안항배;송치권;배현;전병희;김성신
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.195-198
    • /
    • 2002
  • 고농도오존이 발생되는 원인과 환경적 요인의 상호관계를 모델링하기 위해 신경회로 망과 같은 지능제어 기법들이 많이 적용되어 왔다 분석과 모델링을 위해 유전자 알고리즘과 같은 최적화 방법을 적용하기도 하지만, 고농도 오존이 발생되는 메커니즘이 매우 복잡하고, 비선형적이며, 패턴파악이 어렵기 때문에 고농도 오존의 예측 모델링에는 여전히 문제점이 있다 따라서 본 논문에서는 신뢰수준과 신뢰구간을 이용하여 초농도 오존을 예측할 수 있는 모델링 방법을 서술하였다 예측값의 신뢰수준의 평가는 예측에 대한 실측값을 구하여 신뢰구간내의 데이터의 개수를 파악함으로써 신뢰성을 평가할 수 있다. 또한 이 테스트는 우리가 가지고 있지 않은 데이터에 대한 유효성을 평가하는데 적용될 수 있다 그리고 본 논문에서는 GMDH(Group Method of data handling)의 전형적인 알고리즘에 바탕을 두고 있는 DPNN(Dynamic Polynomial Neural Network)를 이용하여 예측 모델을 구성하였다. DPNN은 데이터 해석이 용이하고 비선형적인 동적 시스템 예측에 유용하게 적용될 수 있는 장점을 가지고 있다.

CNN 모델 평가를 위한 이미지 데이터 증강 도구 개발 (Development of an Image Data Augmentation Apparatus to Evaluate CNN Model)

  • 최영원;이영우;채흥석
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제29권1호
    • /
    • pp.13-21
    • /
    • 2020
  • CNN 모델이 이미지 분류와 객체 탐지 등 여러 분야에 활용됨에 따라, 자율주행자동차와 같이 안전필수시스템에 사용되는 CNN 모델의 성능은 신뢰할 수 있어야 한다. 이에 CNN 모델이 다양한 환경에서도 성능을 유지하는지 평가하기 위해 배경을 변경한 이미지를 생성하는 이미지 데이터 증강 도구를 개발한다. 이미지 데이터 증강 도구에 객체가 존재하는 이미지를 입력하면, 해당 이미지로부터 객체 이미지를 추출한 후 수집한 배경 이미지 내에 객체 이미지를 합성하여 새로운 이미지를 생성한다. CNN 모델 성능 평가 방법으로 개발한 도구를 사용하여 기존 테스트 이미지로부터 새로운 테스트 이미지를 생성하고, 생성한 새로운 테스트 이미지로 CNN 모델을 평가한다. 사례 연구로 Pascal VOC2007 테스트 데이터로부터 새로운 테스트 이미지를 생성하고, 새로운 테스트 이미지로 YOLOv3 모델을 평가하였다. 그 결과 기존 테스트 이미지의 mAP 보다 새로운 테스트 이미지의 mAP가 약 0.11 더 낮아지는 것을 확인하였다.

온도와 물성의 불확실성을 고려한 고무의 복소계수 변동성 평가 (Estimation of Variability for Complex Modulus of Rubber Considering Temperature and Material Uncertainties)

  • 이두호;황인성
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2011년도 정기 학술대회
    • /
    • pp.362-365
    • /
    • 2011
  • 본 논문에서는 통계적인 방법을 이용하여 점탄성 제진재인 합성고무의 물성에 대한 변동성을 평가하는 방법을 제안하고 측정데이터를 이용하여 합성고무에 대한 평가를 수행하였다. 고무 물성의 불확실성 인자로는 외기 온도의 변화와 실험 데이터의 오차 및 점탄성 제진모델의 오차를 고려하였다. 고무는 분수차 미분 모델로 표현되었고 온도의 영향은 비선형 이동계수모델을 도입하여 복소계수로 나타내어 동강성과 감쇠를 표현하였다. 이러한 물성모델을 바탕으로 고무에 대한 물성 실험데이터와 물성계수의 확률밀도함수 사이에 정의된 우도함수를 최대화하는 통계적 보정방법을 이용하여 물성모델의 물질계수들에 대한 변동성을 추정하였다.

  • PDF

대형 언어 모델의 한국어 Text-to-SQL 변환 능력 평가 (Evaluation of Large Language Models' Korean-Text to SQL Capability)

  • 최주영;민경구;심묘섭;정해민;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.171-176
    • /
    • 2023
  • 최근 등장한 대규모 데이터로 사전학습된 자연어 생성 모델들은 대화 능력 및 코드 생성 태스크등에서 인상적인 성능을 보여주고 있어, 본 논문에서는 대형 언어 모델 (LLM)의 한국어 질문을 SQL 쿼리 (Text-to-SQL) 변환하는 성능을 평가하고자 한다. 먼저, 영어 Text-to-SQL 벤치마크 데이터셋을 활용하여 영어 질의문을 한국어 질의문으로 번역하여 한국어 Text-to-SQL 데이터셋으로 만들었다. 대형 생성형 모델 (GPT-3 davinci, GPT-3 turbo) 의 few-shot 세팅에서 성능 평가를 진행하며, fine-tuning 없이도 대형 언어 모델들의 경쟁력있는 한국어 Text-to-SQL 변환 성능을 확인한다. 또한, 에러 분석을 수행하여 한국어 문장을 데이터베이스 쿼리문으로 변환하는 과정에서 발생하는 다양한 문제와 프롬프트 기법을 활용한 가능한 해결책을 제시한다.

  • PDF

초고해상도 지표 수문-하도 추적 모델을 통한 역학적 상세화 기술 개발: 금강 유역 사례 연구 (Dynamical Downscaling Technique through Hyper-Resoltion River Routing Modeling: A Case Study of Geum River, South Korea)

  • 감종훈;김병희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.111-111
    • /
    • 2022
  • 우리 사회가 수자원 관리 정책 결정에 사용 가능한 수문 이상 기상 정보를 제공하기 위해서는 초고해상도 지표면 수문 모델 개발이 필수적이다. 본 연구에서는 기존 저해상도 기후 모델들의 지표 수문학적인 과정들을 개선하기 위해 초고해상도 하도 추적 모델링 기술을 통해 역학적인 상세화가 시도되었다. 100-km 격자의 VIC 모델에서 재생산된 지표 배출량과 기저 배출량을 입력 데이터로 사용하여 다양한 공간 규모의 하도 추적 모델에서 사용하여 산정된 하천유량의 신뢰도를 평가하였다. 본 연구에서는 90미터 (3 arc second), 450 미터(15 arc second), 그리고 900 미터 (30 arc second) 격자 규모의 금강 유역 하천망 지도를 사용하여 과거 장기 하천 유량 데이터(1948년-2016년)를 재생산하였다. 본 연구에서는 금강 유역 내의 지점 관측 하천 유량 데이터와 재생산된 유량 데이터의 불확실성을 평가하였다. 본 연구의 주요 결과는 보다 고해상도의 하천망 지도를 하도 추적 모델에 사용 시 산정된 하천 유량 데이터의 불확실성이 감소하는 경향을 발견하였다. 끝으로, 초고해상도 지표 수문-하도 추적 모델을 통한 상세화 기술의 한계점과 개선 방안을 논의하였다. 본 연구는 기후변화로 인한 이상 기상 또는 기후의 위험성 증가에 효율적으로 선제 대응할 수 있는 핵심 수문 기후 모델링 기술을 개발에 중요한 기여할 것이다.

  • PDF

고장 데이터의 플롯을 이용한 소프트웨어 신뢰도 성장 모델의 성능평가 (Performance estimation for Software Reliability Growth Model that Use Plot of Failure Data)

  • 정혜정;양해술;박인수
    • 정보처리학회논문지D
    • /
    • 제10D권5호
    • /
    • pp.829-836
    • /
    • 2003
  • 소프트웨어 신뢰도 성장 모델은 다양하게 연구되어져 있다. 그러나 이러한 모델에서 정확한 모수를 측정하는 것은 그리 쉽지 않다. 특히 고장 데이터에 대하여 소프트웨어 신뢰도 성장 모델의 추정이 정확히 이루어져야만 모델을 설명하는 모수의 추정도 정확하게 이루어질 수 있다. 이러한 측면에서 테스팅을 통해서 얻어진 소프트웨어의 고장 데이터의 정규확률점수를 구해서 두 개의 값에 대한 플롯을 그려보고 그려진 결과를 이용해서 분포를 예측하여 예측된 분포에 적합한 소프트웨어 신뢰도 성장 모델을 적용한다면 상당히 정확한 테스팅 결과론 얻을 수 있을 것이다. 본 논문에서는 고장 테이터의 플롯을 통한 결과를 통해서 분포를 예측하고 모델을 성능평가 척도에 따라서 모의실험을 하여 그 결과를 통해서 소프트웨어 신뢰도 성장 모델의 적합성을 검정하는 연구이다. 연구결과 고장데이터의 정규점수를 이용한 플롯을 보고 소프트웨어 신뢰도 성장 모델을 예측할 수 있었고 이러한 예측을 통해서 모델 선정한다면 모델의 성능평가에서도 우수함을 확인할 수 있다.

한국어 대화 모델 학습을 위한 디노이징 응답 생성 (Denoising Response Generation for Learning Korean Conversational Model)

  • 김태형;노윤석;박성배;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

한국어 대화 모델 학습을 위한 디노이징 응답 생성 (Denoising Response Generation for Learning Korean Conversational Model)

  • 김태형;노윤석;박성배;박세영
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF