• 제목/요약/키워드: 데이터품질 평가모델

검색결과 196건 처리시간 0.03초

소프트웨어 신뢰성 품질 평가 방법론에 대한 연구 (A Study on the Method of Software Reliability Quality Testing)

  • 정혜정
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2006년도 춘계학술대회
    • /
    • pp.301-306
    • /
    • 2006
  • ISO/IEC 9126에 의하면 스프트웨어 품질 특성은 기능성, 신뢰성, 사용성, 효율성, 유지보수성, 이식성의 6가지 품질 특성으로 나누어 평가를 실시하고 있다. 각 특성은 부특성으로 나누어지고 이러한 부특성에 따른 평가 항목을 메트릭으로 정의하고 있다. 그러나 품질 특성 중 신뢰성의 경우는 ISO/IEC 9126에서 제시한 부특성인 성숙성, 오류허용성, 복구성, 준수성에 따라 품질 평가 항목이 메트릭으로 제시되어져있다. 그러나 제시되어져 있는 신뢰성 평가 항목은 소프트웨어 신뢰성 성장 모델을 이용하여 신뢰도를 평가하고 메트릭 값을 얻도록 구성되어져 있으나 수리적인 어려움과 데이터 수집에 따르는 문제점으로 인하여 적용하고 있지 못한 실정이다. 이러한 문제점을 고려하여 고장 데이터를 이용하여 소프트웨어 신뢰성을 평가할 수 있는 방안을 검토하고 현재 연구가 진행되어지고 있는 국제 표준 문건 ISO/IEC 25000 시리즈를 국내 표준으로 적용할 수 있는 방안에 대해서 연구한다.

  • PDF

결함 심각도에 기반한 소프트웨어 품질 예측 (Software Quality Prediction based on Defect Severity)

  • 홍의석
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.73-81
    • /
    • 2015
  • 소프트웨어 결함 예측 연구들의 대부분은 입력 개체의 결함 유무를 예측하는 이진 분류 모델들에 관한 것들이다. 하지만 모든 결함들이 같은 심각도를 갖지는 않으므로 예측 모델이 입력 개체의 결함경향성을 몇 개의 심각도 범주로 분류할 수 있다면 훨씬 유용하게 사용될 수 있다. 본 논문에서는 전통적인 복잡도와 크기 메트릭들을 입력으로 하는 심각도 기반 결함 예측 모델을 제안하였다. 학습 알고리즘은 많이 사용되는 네 개의 기계학습 기법들을 사용하였으며, 모델 구조는 삼진 분류 모델로 하였다. 모델 성능 평가를 위해 실험 데이터는 두 개의 NASA 공개 데이터 집합을 사용하였고, 평가 측정치는 Accuracy를 이용하였다. 평가 실험 결과는 역전파 신경망 모델이 두 데이터 집합에 대해 각각 81%와 88% 정도의 Accuracy 값으로 가장 좋은 성능을 보였다.

계층별 모델 역추론 공격 (Layer-wise Model Inversion Attack)

  • 권현호;김한준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.69-72
    • /
    • 2024
  • 모델 역추론 공격은 공격 대상 네트워크를 훈련하기 위해 사용되는 훈련 데이터셋 중 개인 데이터셋을 공개 데이터셋을 사용하여 개인 훈련 데이터셋을 복원하는 것이다. 모델 역추론 방법 중 적대적 생성 신경망을 사용하여 모델 역추론 공격을 하는 과거의 논문들은 딥러닝 모델 전체의 역추론에만 초점을 맞추기 때문에, 이를 통해 얻은 원본 이미지의 개인 데이터 정보는 제한적이다. 따라서, 본 연구는 대상 모델의 중간 출력을 사용하여 개인 데이터에 대한 더 품질 높은 정보를 얻는데 초점을 맞춘다. 본 논문에서는 적대적 생성 신경망 모델이 원본 이미지를 생성하기 위해 사용되는 계층별 역추론 공격 방법을 소개한다. MNIST 데이터셋으로 훈련된 적대적 생성 신경망 모델을 사용하여, 원본 이미지가 대상 모델의 계층을 통과하면서 얻은 중간 계층의 출력 데이터를 기반으로 원본 이미지를 재구성하고자 한다. GMI 의 공격 방식을 참고하여 공격 모델의 손실 함수를 구성한다. 손실 함수는 사전 손실 및 정체성 손실항을 포함하며, 역전파를 통해서 원본 이미지와 가장 유사하게 복원할 수 있는 표현 벡터 Z 를 찾는다. 원본 이미지와 공격 이미지 사이의 유사성을 분류 라벨의 정확도, SSIM, PSNR 값이라는 세 가지 지표를 사용하여 평가한다. 공격이 이루어지는 계층에서 복원한 이미지와 원본 이미지를 세 가지 지표를 가지고 평가한다. 실험 결과, 공격 이미지가 원본 이미지의 대상 분류 라벨을 정확하게 가지며 원본 이미지의 필체를 유사하게 복원하였음을 보여준다. 평가 지표 또한 원본 이미지와 유사하다는 것을 나타낸다.

소프트웨어 품질 예측 모델을 위한 분류 프레임워크 (Taxonomy Framework for Metric-based Software Quality Prediction Models)

  • 홍의석
    • 한국콘텐츠학회논문지
    • /
    • 제10권6호
    • /
    • pp.134-143
    • /
    • 2010
  • 본 논문에서는 위험도라는 품질 인자를 예로 들어 메트릭 기반 소프트웨어 품질 예측 모델들을 네가지 타입으로 분류하는 프레임워크를 제안한다. 모델들은 다음과 같은 두가지 기준에 의해 분류된다: 모델 입력 메트릭 형태, 과거 프로젝트 데이터의 필요 유무. 분류된 타입들은 각각의 특성을 가지며 새롭게 정의된 몇가지 기준들에 의해 타 타입들과 장단점이 비교되었다. 이러한 정성적인 평가를 거쳐 품질 예측 모델을 이용하고자하는 개발 집단은 어떤 품질 예측 모델이 자신들에게 적합한지를 판단할 수 있게 된다. 또한 각 타입에 속하는 위험도 예측 모델들을 구현해 예측 성능을 측정한 선행 연구 데이터를 분석하여 예측 성능에 못지않게 모델이 속한 타입의 특성이 모델 선정의 중요한 관건이 됨을 보였다.

공간데이터의 품질평가요소 정립에 관한 연구 (The Establishment of the Quality Estimation Elements for Spatial Data)

  • 최병길;안기덕;신상호;조광희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 GIS/RS 공동 춘계학술대회
    • /
    • pp.327-331
    • /
    • 2005
  • 본 연구의 목적은 공간데이터 구축시 아직까지 체계화되어 있지 않은 공간데이터의 품질 평가요소를 정립하는데 있다. 총 17개의 국내 공간데이터 품질관련 법규를 구축 공정, 작업방법, 장비, 정확도 등을 중심으로 분석하였다. 항공사진 촬영이 가능한 대규모 업체를 대상으로 작업순서, 사용장비, 작업순서 전후의 결과물의 정확도를 중심으로 조사하고 팀장급 직원들을 대상으로 현행 관련법규와 실무의 차이에 대하여 조사, 분석하였다. 조사, 분석한 내용을 기반으로 공간데이터의 구축공정을 항공사진을 이용한 수치지도 신규제작, 기존 수치지도 수정제작, 영상지도제작, 수치표고모델 구축 공정으로 구분하고, 각 공정별로 생성되는 공간데이터의 품질을 체크할 수 있는 요소들을 정립하였다.

  • PDF

단어 수준 한국어-영어 기계번역 품질 예측 (Word-level Korean-English Quality Estimation)

  • 어수경;박찬준;서재형;문현석;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.9-15
    • /
    • 2021
  • 기계번역 품질 예측 (Quality Estimation, QE)은 정답 문장에 대한 참조없이 소스 문장과 기계번역 결과를 통해 기계번역 결과에 대한 품질을 수준별 주석으로 나타내주는 태스크이며, 다양한 활용도가 있다는 점에서 꾸준히 연구가 수행되고 있다. 그러나 QE 모델 학습을 위한 데이터 구성 시 기계번역 결과에 대해 번역 전문가가 교정한 문장이 필요한데, 이를 제작하는 과정에서 상당한 인건비와 시간 비용이 발생하는 한계가 있다. 본 논문에서는 번역 전문가 없이 병렬 또는 단일 말뭉치와 기계번역기만을 활용하여 자동화된 방식으로 한국어-영어 합성 QE 데이터를 구축하며, 최초로 단어 수준의 한국어-영어 기계번역 결과 품질 예측 모델을 제작하였다. QE 모델 제작 시에는 Cross-lingual language model (XLM), XLM-RoBERTa (XLM-R), multilingual BART (mBART)와 같은 다언어모델들을 활용하여 비교 실험을 수행했다. 또한 기계번역 결과에 대한 품질 예측의 객관성을 검증하고자 구글, 아마존, 마이크로소프트, 시스트란의 번역기를 활용하여 모델 평가를 진행했다. 실험 결과 XLM-R을 활용하여 미세조정학습한 QE 모델이 가장 좋은 성능을 보였으며, 품질 예측의 객관성을 확보함으로써 QE의 다양한 장점들을 한국어-영어 기계번역에서도 활용할 수 있도록 했다.

  • PDF

고객의 요구사항에 기반한 데이터품질 평가속성 및 우선순위 도출 (Derivation of Data Quality Attributes and their Priorities Based on Customer Requirements)

  • 장경애;김자희;김우제
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권12호
    • /
    • pp.549-560
    • /
    • 2015
  • 데이터품질 속성으로는 ISO/IEC 기관 및 국내/외 여러 기관에서 제시한 속성이 존재하지만, 이러한 기준 및 가이드를 현실적으로 조직에 적용하기에는 시간과 비용이 상당히 소요된다. 따라서 조직환경의 제약사항이 존재하여도 적용 가능한 데이터품질 평가속성의 정의가 필요하다. 이 연구의 목적은 고객의 요구사항 기반하에 프로세스를 체계적으로 관리하고, 정량적으로 데이터를 평가하기 위한 데이터품질 평가속성과 우선순위 도출에 관한 연구이다. 본 연구에서는 데이터품질 표준(DQC-M)을 매개체로 RGT 기법을 사용하여 데이터품질 속성의 고객 인지구조(Construct)를 도출하고, 도출된 Construct 간의 상관분석을 수행하여 AHP기법으로 평가속성의 가중치 및 우선순위를 선별하였다. 그 결과 데이터품질 평가속성에서 1레벨에서는 일관된 체계, 정확한 데이터, 효율적 환경, 유연한 관리, 지속적 개선 순위가 결정되었다. 또한 2레벨의 19개 속성 중에서는 통제성(13%), 준거성(10%), 요구완전성(9.6%), 정확성(8.4%), 추적가능성(6.8%)이 상위 5순위로 결정되었다.

스마트팜 데이터 품질 향상을 위한 이상치 및 결측치 보정 방법에 관한 연구 (Research on Outlier and Missing Value Correction Methods to Improve Smart Farm Data Quality)

  • 이성재;심현
    • 한국전자통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.1027-1034
    • /
    • 2024
  • 본 연구는 AI 기반 스마트팜에서 발생하는 이상치 및 결측치 문제를 해결하여 데이터 품질을 향상시키고, 농업 예측 활동의 정확도를 높이는 것을 목표로 한다. 농진청·농정원에서 제공한 실제 데이터를 활용하여, 이상치 탐지 및 결측치 보정 기법을 적용함으로써 양질의 데이터를 수집하고 관리하고자 하였다. 성공적인 스마트팜 운영을 위해서는 IoT 기반의 AI 자동 생육 측정 모델이 필요하며, 이를 위해 안정적인 데이터 전처리를 통해 높은 데이터 품질 지수를 달성하는 것이 필수적이다. 본 연구에서는 생육 데이터의 이상치 및 결측치를 보정하는 다양한 방법을 적용하였으며, 제시된 데이터 전처리 방안을 머신러닝 기법을 통해 성능 평가 지수로 검증하였다. 연구 결과, 이상치 및 결측치 보정 방법을 적용한 결과 모델 성능이 크게 향상되었고, ROC와 AUC와 같은 평가 지표에서 높은 예측 정확도를 확인할 수 있었다.

소프트웨어 프로젝트 평가모델을 통한 소프트 웨어 메트릭스 분석 (An Analysis of Software Metrics Using the SPEM(Software Project Estimation Model))

  • 이재기;신상권;남상식;박권철
    • 전자통신동향분석
    • /
    • 제17권5호통권77호
    • /
    • pp.107-118
    • /
    • 2002
  • 본 논문은 대형 프로젝트를 수행하는 데 있어서 필요한 리소스, 인력, 개발비용 및 소프트웨어 소스에 대한 데이터를 추정하여 프로젝트의 효율성을 평가하는 모델인 소프트웨어 프로젝트 평가모델을 이용하여 기 수행된 프로젝트의 경험데이터와 수행되고 있는 프로젝트의 소프트웨어 메트릭스(metrics) 데이터를 활용하여 생산성, 품질, 자원투입 효과, 개발될 소프트웨어 소스 규모 등을 추정해 보고 이를 경험적인 모델(empirical model)에 적용하여 프로젝트 별로 평가, 비교 분석해 본다. 또 향후 유사 프로젝트 관리(similar project management)에 필요한 사항들을 제안한다.

CTQ 데이터 선정 모델에 관한 연구 (Study on the Selection Model CTQ data)

  • 김승희;김우제
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.97-112
    • /
    • 2013
  • 데이터의 품질은 효율적인 데이터 활용을 위한 가장 기본적인 전제이다. 수많은 연구와 사례를 통해 오류 데이터로 인한 손실과 그로 인한 문제점들이 대두되고 있고, 국가적으로는 데이터 품질 인증제도가 시행되고 있으나 데이터를 생성하고 관리해야 하는 조직 관점의 CTQ 데이터 선정 방법에 대한 연구는 극히 미흡한 상황이다. 본 모델은 조직에서 품질관리 대상이 되는 주요 CTQ 데이터를 선정하여 체계적으로 관리할 수 있도록 업무 및 IT측면의 CTQ 데이터의 기준을 수립하고 그에 따라 데이터를 선별하여 계량화 할 수 있게 있는 전사적 규모의 CTQ 데이터 관리 방법을 구체적으로 제시하였다. 이를 위해 SPSS를 활용하여 요인분석을 수행하고, 계량화를 위해 AHP 방법론을 사용하였다. 특히, DB 품질인증제도의 본격 시행에 따라 실무 적용에 용이하도록 CTQ-DSMM 모델을 활용한 조직 내 데이터 성숙도 관리 방안의 틀도 함께 제시하였다.