• 제목/요약/키워드: 교차프로젝트 결함 예측

검색결과 8건 처리시간 0.019초

향상된 교차 버전 결함 예측을 위한 베이지안 최적화 프레임워크 (Bayesian Optimization Framework for Improved Cross-Version Defect Prediction)

  • 최정환;류덕산
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권9호
    • /
    • pp.339-348
    • /
    • 2021
  • 최근 소프트웨어 결함 예측 연구는 교차 프로젝트 간의 결함 예측뿐만 아니라 교차 버전 프로젝트 간의 결함 예측 또한 이루어지고 있다. 종래의 교차 버전 결함 예측 연구들은 WP(Within-Project)로 가정한다. 하지만, CV(Cross-Version) 환경에서는 프로젝트 버전 간의 분포 차이의 중요성을 고려한 연구들이 없다. 본 연구에서는 다른 버전 간의 분포 차이까지 고려하는 자동화된 베이지안 최적화 프레임워크를 제안한다. 이를 통해 분포차이에 따라 전이 학습(Transfer Learning) 수행 여부를 자동으로 선택하여 준다. 해당 프레임워크는 버전 간의 분포 차이, 전이 학습과 분류기(Classifier)의 하이퍼파라미터를 최적화하는 기법이다. 실험을 통해 전이 학습 수행 여부를 분포차 기준으로 자동으로 선택하는 방법이 효과적이라는 것을 알 수 있다. 그리고 최적화를 이용하는 것이 성능 향상에 효과가 있으며 이러한 결과 소프트웨어 인스펙션 노력을 감소할 수 있다는 것을 확인할 수 있다. 이를 통해 교차 버전 프로젝트 환경에서 신규 버전 프로젝트에 대하여 효과적인 품질 보증 활동 수행을 지원할 것으로 기대된다.

교차 프로젝트 결함 예측 성능 향상을 위한 효과적인 하모니 검색 기반 비용 민감 부스팅 최적화 (Effective Harmony Search-Based Optimization of Cost-Sensitive Boosting for Improving the Performance of Cross-Project Defect Prediction)

  • 류덕산;백종문
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.77-90
    • /
    • 2018
  • 소프트웨어 결함 예측(SDP)은 결함이 있는 모듈을 식별하기 위한 연구 분야이다. 충분한 로컬 데이터가 없으면 다른 회사에서 수집한 데이터를 사용하여 분류기를 구축하는 교차 프로젝트 결함 예측(CPDP)을 활용할 수 있다. SDP에 대한 대부분의 기계 학습 알고리즘은 서로 다른 값에 따라 예측 성능에 큰 영향을 미치는 하나 이상의 매개 변수를 사용한다. 본 연구의 목적은 CPDP의 예측 성능 향상을 위해 매개 변수 선택 기법을 제안하는 것이다. Harmony Search 알고리즘을 사용하여, 예측 어려움을 야기하는 클래스 불균형을 해결하는 방법인 비용에 민감한 부스팅의 매개 변수를 조정한다. 분포 특성에 따라 매개 변수 범위와 매개 변수 간의 제한 조건 규칙이 정의되어 하모니 검색 알고리즘에 적용된다. 제안된 접근법은 15개의 대상 프로젝트를 대상으로 3개의 CPDP 모델과 내부프로젝트 결함 예측(WPDP) 모델을 비교한다. 실험 결과는 제안된 방법이 클래스 불균형의 맥락에서 다른 CPDP 방법보다 성능이 우수하다는 것을 보여준다. 이전의 연구에서는 탐지 확률이 낮거나 오보 가능성이 높았으나 우리의 기법은 높은 PD와 낮은 PF를 제공하면서 높은 전체 성능을 보였다. 또한 WPDP와 비슷한 성능을 제공하였다.

교차 프로젝트 결함 예측을 위한 유사도 측정 기법 비교 연구 (A Comparative Study on Similarity Measure Techniques for Cross-Project Defect Prediction)

  • 류덕산;백종문
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권6호
    • /
    • pp.205-220
    • /
    • 2018
  • 소프트웨어 결함 예측은 결함이 자주 발생하는 모듈에 집중함으로써 소프트웨어 품질 보증 활동에 귀중한 프로젝트 리소스를 효과적으로 할당하는 데 도움이 될 수 있다. 회사 내에서 수집 된 충분한 기록 데이터를 사용하여 정확한 결함 발생 가능성이 높은 모듈 예측에 대해 WPDP (프로젝트 내 결함 예측)를 사용할 수 있다. 회사가 과거 데이터를 유지하지 못한 경우 CPDP (Cross-Project Defect Prediction) 메커니즘을 기반으로 오류를 예측하는 분류기를 만드는 것이 도움이 될 수 있다. CPDP는 다른 조직에서 수집 한 다른 프로젝트 데이터를 사용하여 분류기를 작성하기 때문에 정확한 분류기를 만드는데 가장 큰 장애물은 소스와 대상 프로젝트 간의 서로 다른 분포이다. 이 문제의 해결을 위해 효과적인 유사도 측정 기술을 식별하는 것이 중요하므로, 본 논문에서는 다양한 유사도 측정 기술을 CPDP 모델에 적용하여 성능을 비교한다. 유사도 가중치의 유효성을 평가하고, 통계적 유의성 검정 및 효과 크기 검정을 통해 결과를 검증한다. 실험 결과, k-Nearest Neighbor (k-NN), LOcal Correlation Integral (LOCI) 및 Range 방법이 유사도 측정 기술 중 상위 3 개에 속했고, 이들을 사용하는 CPDP 예측 성능이 WPDP의 성능과 유사하였다.

FCM을 적용한 결함심각도 기반 앙상블 모델 (Defect Severity-based Ensemble Model using FCM)

  • 이나영;권기태
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권12호
    • /
    • pp.681-686
    • /
    • 2016
  • 소프트웨어 결함 예측은 프로젝트의 효율적인 관리와 성공에 있어 중요한 요소이다. 이 결함은 심각도에 따라 프로젝트에 영향을 미치는 정도가 다르다. 그러나 기존 연구는 결함 유무만 관심을 두고 심각도를 고려하지 않는다. 본 논문에서는 소프트웨어 관리 효율과 품질 향상을 위해 FCM을 적용한 결함 심각도 기반 앙상블 모델을 제안한다. 제안된 모델은 FCM으로 NASA PC4의 결함심각도를 재분류한다. 그리고 RF(Random Forest)로 심각도에 영향을 주는 입력 column을 선별하여 데이터 핵심 결함 요인을 추출한다. 또한 10-fold 교차검증으로 파라미터를 변경해 모델 성능을 평가한다. 실험 결과는 다음과 같다. 첫째, 결함심각도가 58,40,80에서 30,20,128로 재분류되었다. 둘째, 심각도에 영향을 주는 중요한 입력 column은 정확도와 노드 불순도 측면에서 BRANCH_COUNT였다. 셋째, 성능평가는 트리수가 작고 고려할 변수가 많을수록 좋은 성능을 보였다.

2D-QSAR방법을 이용한 농약류의 무지개 송어 급성 어독성 분석 및 예측 (Prediction and analysis of acute fish toxicity of pesticides to the rainbow trout using 2D-QSAR)

  • 송인식;차지영;이성광
    • 분석과학
    • /
    • 제24권6호
    • /
    • pp.544-555
    • /
    • 2011
  • 본 연구는 농약류에 대하여 구조-활성의 정량적 관계(QSAR)를 이용하여 무지개 송어(학명: Oncorhynchus mykiss)의 급성 독성을 예측-분석하는 과정을 수행하였다. 모델 구현을 위해 사용된 275종의 농약류에 대한 수중 독성(96h $LC_{50}$) 값은 DEMETRA프로젝트의 데이터를 사용하였다. 예측 모델에 사용된 2차원 분자 표현자는 PreADMET프로그램으로부터 계산을 하였고, 선형 (다중 선형 회귀 방법)모델과 비선형(서포트 벡터 머신, 인공 신경망) 학습 방법들은 실험값과 예측값의 적합도를 고려하여 최적화 되었다. 데이터 전처리 과정을 거친 뒤에, 5묶음 교차 검증과정을 포함한 모집단 기반 전진 선택법을 통해서 각 학습 방법의 최적의 표현자 집합을 결정하였다. 가장 좋은 결과는 SVM 방법 ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) 이었고, EU의 규제 기준에 따른 분류에서는 87%의 정확도를 나타내었다. MLR방법을 통해서는 무지개 송어의 급성 독성에 대하여 독성을 나타내는 농약류의 구조적 특징과 지질 층과의 상호작용을 설명할 수 있었다. 개발된 모든 모델들은 5묶음 교차 검증과 Y-scrambling test을 통해 검증되었다.

캐나다 아퀴스토어 탄성파자료를 통한 이산화탄소 지중저장 연구지역 대수층 특성화 (Aquifer Characterization Using Seismic Data on the Aquistore CCS Project, Canada)

  • 정순홍;김병엽;신영재;이호용;박명호
    • 자원환경지질
    • /
    • 제47권6호
    • /
    • pp.625-633
    • /
    • 2014
  • 캐나다 아퀴스토어 프로젝트는 인근의 화력발전소에서 포집한 이산화탄소를 심부 약 3,500 m에 존재하는 염대수층에 저장하는 포집, 수송, 주입 및 저장의 전 과정을 포함하는 세계 최초의 통합 실증 프로젝트이다. 이산화탄소의 저장소로서의 염대수층은 기존의 한정적으로 분포된 석유가스 저류층과 비교했을 때 전 세계 어디서나 분포하므로 이에 대한 실증 연구는 이산화탄소 지중저장의 저변 확대에 큰 의미가 있다. 염대수층에 이산화탄소를 주입하고 추적하기 위해서는 지하의 물성을 파악하고 특성화해야 한다. 본 연구는 캐나다 아퀴스토어 이산화탄소 지중저장 현장의 탄성파 탐사자료로부터 석유가스 자원 탐사에 이용되는 진폭 변화 분석기술을 응용하여 지중저장 대상지층의 유체 포화 특성을 도출하였다. 시추공 검층자료에서 해석된 이산화탄소 저장층 구간의 상부 및 하부는 Winnipeg층 1,815 ms과 Deadwood 층 1,857 ms로 탄성파 자료와 대비하였다. 대상 구간의 탄성파 기록으로부터 입사각에 따른 진폭 크기변화를 확인한 결과 자료의 상관성은 45 %에서 81 % 범위였다. 종축절편과 진폭구배 속성을 교차출력한 결과는 반비례 관계를 보여 전형적인 함수 퇴적층에 해당하였다. 계산된 속성들에서 대수층의 기저를 공간적으로 도시하였고 이산화탄소 지중저장 구간의 포아송비 변화를 예측하였다.

멕시코 로얄 은광산 잠재성 평가

  • 허철호;김의준
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2010년도 춘계학술발표회 논문집
    • /
    • pp.108-109
    • /
    • 2010
  • IMPACT Silver 주식회사는 Zacualpan 프로젝트의 Royal Mines(이하 로얄 광산)을 인수했다. $124.5\;km^2$에 해당하는 지역의 소유권은 두 개의 멕시코 사기업으로부터 가행중인 광산의 채굴권 구입과 운영 중인 기반시설의 임대를 조건으로 한다. 프로젝트 지역은 멕시코시티로부터 남서방향으로 100 km와 Taxco Silver 광산으로부터 북서방향으로 25 km 떨어진 지점에 위치한다. 기반시설은 비포장 도로, 충분한 전력과 물의 공급 및 숙련공들을 갖추어 우수한 평가를 받고 있다. 소유권은 멕시코인의 개인소유 하에서 무한한 매장량 혹은 자원량을 갖고 운영된 채광과 가공시설을 인수하는 것이다. 소유권 지역을 대상으로 한 IMPACT Silver사의 주 탐사목적은 이미 알려진 광화대의 확장을 위한 잠재성 평가와 다른 지역에서 신규 광상의 유망지역을 발견하는 것이다. Zacualpan 프로젝트의 로얄 광산은 남동 Guerrero terrane의 북부에 위치한다. Teloloapan subterrane은 주로 저변성 녹색편암상으로 구성된 쥬라기 후기에서 백악기 초기의 화산성 퇴적층으로 구성된다. 대부분의 유망지역은 Lower Villa de Ayala층의 중성 내지 염기성 화산성 쇄설암을 모암으로 한다. 다상의 변성작용은 지역 전반에 걸쳐 나타나고, Zacualpan 광산지역에서 수반되는 광화작용을 규제한다. Zacualpan 광산지역은 Sierra Madre del Sur로 알려진 유망 광화대에 해당한다. 이 지역은 화산성 괴상 황화광상과 천열수 맥상광상이 우세하다. 대부분의 천열수 광화작용은 3.2-3.8억 년 전 마그마의 생성이 활발한 판구조 체제 동안 발생하였다. 역사적으로 가장 주요한 지역은 Lipton Vein이다. 현재 Zacualpan 지구에서 채광량은 은 200-500 g/t 정도로 보고되고 있다. 일부 지역은 고품위 은 광화작용(은 1,000 g/t 이상)을 수반하고 있으며, 이는 탐사의 주 타겟이 되고 있다. Zacualpan에서 은 광화작용은 은이 부화된 중유황 천열수 맥상광상으로 상당히 유명하다. Fresnillo, Pachuca 및 Taxco 광산을 포함한 멕시코 소유의 대규모의 잘 알려진 광산들이 이에 해당한다. 이러한 광산들은 부산물로서 금, 아연, 연이 생산된다. 이러한 광상들은 맥상과 각력상 및 산점상 또는 망상세맥의 형태로 산출된다. 광화작용은 석영과 탄산염 맥 내에 주로 황철석과 다양한 섬아연석, 방연석, 은 혹은 금 광물들을 수반한다. 경제성을 갖는 광화작용의 수직적인 연장은 평균적으로 대략 300 m이고, 멕시코 중부에 위치한 Fresnillo의 광화작용은 100 m에서 960 m의 연장을 갖는 것으로 알려져 있다. 아주 오랫동안 Zacualpan에서 광산관계자의 관측과 IMPACT Silver에서 최근 작업의 결과를 토대로, Zacualpan 광산지역의 탐사모델은 새로운 광상의 탐사를 위한 가이드로서 개발되었다. Zacualpan 광산지역에서 가장 높은 경제성을 갖는 광화작용은 북서와 남북방향의 맥 구조를 따라 수반된다. 이러한 맥 구조들은 종종 이 지역을 가로질러 수 km까지 추적되지만, 경제성을 갖는 광화작용은 맥 구조를 따라서 구조적으로 유리한 지역에서 부광대를 형성한다. 부광대를 형성하기 위한 가장 유리한 구조적 지역은 북서와 남북방향으로 발달한 맥 구조들이 교차하는 지역이다. 지난 30년간 채광된 주요 부광대는 폭이 2-6 m 이고 수평연장은 30-150 m 그리고 수직연장은 230-300 m에 이른다. 가장 높은 생산량을 보이는 부광대는 남북방향의 이차 맥들이 Guadalupe 광산의 Lipton 맥을 가로지르는 지역에서 발달한다. 남동쪽으로 현재 Compadres 광산의 Silver Shoot No. 1으로부터 고품위 은을 생산하는 지역은 북서방향의 San Agustin 맥이 북향의 Cometa Navideno 맥에 의해 절단되는 지역에서 산출한다. 모암은 광화작용을 규제하는 또 다른 중요한 요소이다. 광산지역에서 경제성을 갖는 모든 광화작용은 중성 내지 염기성 화산암 특히 안산암과 관련 모암에 배태된다. 부광대가 셰일 혹은 편암으로 전이되는 지역에서, 맥들은 소규모의 세맥으로 나뉘어 진다. Zacualpan의 전형적인 천열수 광상에서 부광대는 상부로 가면서 은의 함량이 증가하고, 하부로 가면서 연 아연의 함량이 증가하는 수직적 대상을 보인다. 금의 함량 변화는 보다 예측이 어려우나 상당히 중요하다. Zacualpan 광산지역의 탐사모델에 사용된 토양 채취, 정밀지도제작, 트렌치 및 시추탐광은 현재 IMPACT Silver사가 이 지역을 대상으로 한 가장 효율적인 탐사방법으로 입증되었다. Zacualpan 프로젝트의 로얄 광산은 하루 500 톤을 제련하는 기반시설과 수반된 채굴권을 갖는 가행 광산들을 포함한다. 현재 IMPACT Silver사는 두 곳의 타겟 지역에서 정밀지도제작, 토양 및 암석 채취, 12공 총 1866 m의 시추탐광에 의한 사전조사로 구성된 4 단계 탐사를 수행했다. 암석 1,953개, 토양 1,631 개, 389 개의 시추코어 시료가 채집되고 분석되었다. 이러한 작업은 추가탐사를 요구하는 수많은 유망 광화대를 규명했다. Compadres 광산에서 현재 가행중인 지하갱 시료는 레벨 1에서 0.9 m의 폭을 갖는 광체에서 은 680 g/t과 금 0.3 g/t, 레벨 3에서 1.67 m의 폭을 갖는 광체에서 은 12,591 g/t과 금 12.07 g/t의 품위를 갖는 것으로 나타났다. 레벨 1에서 3까지 2-3 m의 폭과 30-40 m 연장으로 채광되었다. 시추탐광은 고품위를 갖는 몇몇의 중첩된 맥을 발견했다. Compadres 광산에서 남동방향으로 200 m지점에 위치한 Soledad 지역에서 5 개의 시추공으로부터 동일 맥 시스템이 발견되었고, 고품위 부광대의 상부로 간주되는 몇몇 중요 지점이 발견되었다. 초기 단계의 탐사는 유망 시추탐광 지역인 중간정도 내지 고품위 유망 광화대를 규명했다.

  • PDF

유체 주입에 의한 단층 재활성 해석기법 개발: 국제공동연구 DECOVALEX-2019 Task B(Benchmark Model Test) (Coupled Hydro-Mechanical Modelling of Fault Reactivation Induced by Water Injection: DECOVALEX-2019 TASK B (Benchmark Model Test))

  • 박정욱;김태현;박의섭;이창수
    • 터널과지하공간
    • /
    • 제28권6호
    • /
    • pp.670-691
    • /
    • 2018
  • 본 논문에서는 국제공동연구 DECOVALEX-2019 프로젝트의 일환으로 수행된 Task B Benchmark Model Test(BMT)의 연구 결과를 소개하였다. Task B는 'Fault slip modelling'을 연구주제로 하며, 유체의 주입으로 인해 발생하는 단층의 재활성과 수리역학적 연계거동을 예측할 수 있는 해석기법을 개발하는 데에 목적이 있다. BMT 시나리오 해석은 각 참가팀들의 수치모델이 단층의 수리역학적 연동거동을 적절히 모사할 수 있는지 교차검증함으로써 각 해석코드의 완성도를 높이기 위하여 수행되었으며, 주입압 적용 조건, 단층 물성, 수리역학적 연동해석 조건 등에 따라 7개의 해석 모델로 이루어져 있다. 본 연구에서는 TOUGH-FLAC 연동해석 기법을 이용하여, 역학적 변형으로 야기되는 단층의 수리적 물성 변화와 간극의 기하학적 변화를 동시에 반영할 수 있는 수리역학적 커플링 모듈을 개발하였다. BMT 시나리오 해석을 위하여 Task B 1단계(Step 1) 연구에서 개발된 수치모델을 일부 수정하였고, 단층의 변형에 따른 압축률과 투수계수, 단층의 해석 메쉬의 변화가 해석에 반영될 수 있도록 하였다. 단층의 투수량계수와 저류계수가 단층 내 압력 분포, 주입수량, 변위, 응력 등 수리역학적 거동에 미치는 영향을 검토하였으며, 수정된 수치모델을 기수행된 1단계 연구에 적용하여 해석결과를 업데이트하였다. 해석 결과, 본 연구에서 개발한 해석기법이 물 주입으로 인한 단층의 거동을 합리적인 수준에서 재현할 수 있는 것으로 판단할 수 있었다. 본 연구의 해석모델은 Task B에 참여하는 국외 연구팀들과의 의견 교류와 워크숍을 통해 지속적으로 개선하는 한편, 향후 연구의 현장시험에 적용하여 타당성을 검증할 예정이다.