• Title/Summary/Keyword: 교차프로젝트 결함 예측

Search Result 8, Processing Time 0.022 seconds

Bayesian Optimization Framework for Improved Cross-Version Defect Prediction (향상된 교차 버전 결함 예측을 위한 베이지안 최적화 프레임워크)

  • Choi, Jeongwhan;Ryu, Duksan
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.9
    • /
    • pp.339-348
    • /
    • 2021
  • In recent software defect prediction research, defect prediction between cross projects and cross-version projects are actively studied. Cross-version defect prediction studies assume WP(Within-Project) so far. However, in the CV(Cross-Version) environment, the previous work does not consider the distribution difference between project versions is important. In this study, we propose an automated Bayesian optimization framework that considers distribution differences between different versions. Through this, it automatically selects whether to perform transfer learning according to the difference in distribution. This framework is a technique that optimizes the distribution difference between versions, transfer learning, and hyper-parameters of the classifier. We confirmed that the method of automatically selecting whether to perform transfer learning based on the distribution difference is effective through experiments. Moreover, we can see that using our optimization framework is effective in improving performance and, as a result, can reduce software inspection effort. This is expected to support practical quality assurance activities for new version projects in a cross-version project environment.

Effective Harmony Search-Based Optimization of Cost-Sensitive Boosting for Improving the Performance of Cross-Project Defect Prediction (교차 프로젝트 결함 예측 성능 향상을 위한 효과적인 하모니 검색 기반 비용 민감 부스팅 최적화)

  • Ryu, Duksan;Baik, Jongmoon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.3
    • /
    • pp.77-90
    • /
    • 2018
  • Software Defect Prediction (SDP) is a field of study that identifies defective modules. With insufficient local data, a company can exploit Cross-Project Defect Prediction (CPDP), a way to build a classifier using dataset collected from other companies. Most machine learning algorithms for SDP have used more than one parameter that significantly affects prediction performance depending on different values. The objective of this study is to propose a parameter selection technique to enhance the performance of CPDP. Using a Harmony Search algorithm (HS), our approach tunes parameters of cost-sensitive boosting, a method to tackle class imbalance causing the difficulty of prediction. According to distributional characteristics, parameter ranges and constraint rules between parameters are defined and applied to HS. The proposed approach is compared with three CPDP methods and a Within-Project Defect Prediction (WPDP) method over fifteen target projects. The experimental results indicate that the proposed model outperforms the other CPDP methods in the context of class imbalance. Unlike the previous researches showing high probability of false alarm or low probability of detection, our approach provides acceptable high PD and low PF while providing high overall performance. It also provides similar performance compared with WPDP.

A Comparative Study on Similarity Measure Techniques for Cross-Project Defect Prediction (교차 프로젝트 결함 예측을 위한 유사도 측정 기법 비교 연구)

  • Ryu, Duksan;Baik, Jongmoon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.7 no.6
    • /
    • pp.205-220
    • /
    • 2018
  • Software defect prediction is helpful for allocating valuable project resources effectively for software quality assurance activities thanks to focusing on the identified fault-prone modules. If historical data collected within a company is sufficient, a Within-Project Defect Prediction (WPDP) can be utilized for accurate fault-prone module prediction. In case a company does not maintain historical data, it may be helpful to build a classifier towards predicting comprehensible fault prediction based on Cross-Project Defect Prediction (CPDP). Since CPDP employs different project data collected from other organization to build a classifier, the main obstacle to build an accurate classifier is that distributions between source and target projects are not similar. To address the problem, because it is crucial to identify effective similarity measure techniques to obtain high performance for CPDP, In this paper, we aim to identify them. We compare various similarity measure techniques. The effectiveness of similarity weights calculated by those similarity measure techniques are evaluated. The results are verified using the statistical significance test and the effect size test. The results show k-Nearest Neighbor (k-NN), LOcal Correlation Integral (LOCI), and Range methods are the top three performers. The experimental results show that predictive performances using the three methods are comparable to those of WPDP.

Defect Severity-based Ensemble Model using FCM (FCM을 적용한 결함심각도 기반 앙상블 모델)

  • Lee, Na-Young;Kwon, Ki-Tae
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.12
    • /
    • pp.681-686
    • /
    • 2016
  • Software defect prediction is an important factor in efficient project management and success. The severity of the defect usually determines the degree to which the project is affected. However, existing studies focus only on the presence or absence of a defect and not the severity of defect. In this study, we proposed an ensemble model using FCM based on defect severity. The severity of the defect of NASA data set's PC4 was reclassified. To select the input column that affected the severity of the defect, we extracted the important defect factor of the data set using Random Forest (RF). We evaluated the performance of the model by changing the parameters in the 10-fold cross-validation. The evaluation results were as follows. First, defect severities were reclassified from 58, 40, 80 to 30, 20, 128. Second, BRANCH_COUNT was an important input column for the degree of severity in terms of accuracy and node impurities. Third, smaller tree number led to more variables for good performance.

Prediction and analysis of acute fish toxicity of pesticides to the rainbow trout using 2D-QSAR (2D-QSAR방법을 이용한 농약류의 무지개 송어 급성 어독성 분석 및 예측)

  • Song, In-Sik;Cha, Ji-Young;Lee, Sung-Kwang
    • Analytical Science and Technology
    • /
    • v.24 no.6
    • /
    • pp.544-555
    • /
    • 2011
  • The acute toxicity in the rainbow trout (Oncorhynchus mykiss) was analyzed and predicted using quantitative structure-activity relationships (QSAR). The aquatic toxicity, 96h $LC_{50}$ (median lethal concentration) of 275 organic pesticides, was obtained from EU-funded project DEMETRA. Prediction models were derived from 558 2D molecular descriptors, calculated in PreADMET. The linear (multiple linear regression) and nonlinear (support vector machine and artificial neural network) learning methods were optimized by taking into account the statistical parameters between the experimental and predicted p$LC_{50}$. After preprocessing, population based forward selection were used to select the best subsets of descriptors in the learning methods including 5-fold cross-validation procedure. The support vector machine model was used as the best model ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) and also correctly classified 87% for the training set according to EU regulation criteria. The MLR model could describe the structural characteristics of toxic chemicals and interaction with lipid membrane of fish. All the developed models were validated by 5 fold cross-validation and Y-scrambling test.

Aquifer Characterization Using Seismic Data on the Aquistore CCS Project, Canada (캐나다 아퀴스토어 탄성파자료를 통한 이산화탄소 지중저장 연구지역 대수층 특성화)

  • Cheong, Snons;Kim, Byoung-Yeop;Shinn, Young Jae;Lee, Ho-Yong;Park, Myung-Ho
    • Economic and Environmental Geology
    • /
    • v.47 no.6
    • /
    • pp.625-633
    • /
    • 2014
  • The Aquistore project is the world's first commercial capture, transportation, utilization and storage project of post-combustion $CO_2$ from a coal-fired thermo electric power plant, and the proposed storage is a saline aquifer at a depth of about 3,500 m. Deep saline aquifer, compared to hydrocarbon reservoir, provides the great volumetric potential for storage of $CO_2$ anywhere in the world, therefore the research results from the project may be exported globally to other sites. Geological $CO_2$ storage characterization for saline aquifer instead of hydrocarbon reservoir needs to estimate the geophysical properties of subsurface geology. This study calculated the geophysical property of water-saturated formation by applying amplitude variation analysis developed from oil and gas exploration. We correlated horizon tops at the well logs to seismic traveltime of 1,815 and 1,857 ms as Winnipeg and Deadwood formations. Gradient analysis from seismic traces showed correlation coefficient of 45 - 81 % on amplitude variation with respect to incident angle. Crossplot of intercept and gradient shows the inverse proportional trend which represents typical water saturated sediments. Product attribute of intercept and gradient described the base of wet sediment. Poisson's ratio change attribute increased at the top of target area satisfying with wet sediment and decreased at the top of basement in a dry rock bed.

멕시코 로얄 은광산 잠재성 평가

  • Heo, Cheol-Ho;Kim, Ui-Jun
    • 한국지구과학회:학술대회논문집
    • /
    • 2010.04a
    • /
    • pp.108-109
    • /
    • 2010
  • IMPACT Silver 주식회사는 Zacualpan 프로젝트의 Royal Mines(이하 로얄 광산)을 인수했다. $124.5\;km^2$에 해당하는 지역의 소유권은 두 개의 멕시코 사기업으로부터 가행중인 광산의 채굴권 구입과 운영 중인 기반시설의 임대를 조건으로 한다. 프로젝트 지역은 멕시코시티로부터 남서방향으로 100 km와 Taxco Silver 광산으로부터 북서방향으로 25 km 떨어진 지점에 위치한다. 기반시설은 비포장 도로, 충분한 전력과 물의 공급 및 숙련공들을 갖추어 우수한 평가를 받고 있다. 소유권은 멕시코인의 개인소유 하에서 무한한 매장량 혹은 자원량을 갖고 운영된 채광과 가공시설을 인수하는 것이다. 소유권 지역을 대상으로 한 IMPACT Silver사의 주 탐사목적은 이미 알려진 광화대의 확장을 위한 잠재성 평가와 다른 지역에서 신규 광상의 유망지역을 발견하는 것이다. Zacualpan 프로젝트의 로얄 광산은 남동 Guerrero terrane의 북부에 위치한다. Teloloapan subterrane은 주로 저변성 녹색편암상으로 구성된 쥬라기 후기에서 백악기 초기의 화산성 퇴적층으로 구성된다. 대부분의 유망지역은 Lower Villa de Ayala층의 중성 내지 염기성 화산성 쇄설암을 모암으로 한다. 다상의 변성작용은 지역 전반에 걸쳐 나타나고, Zacualpan 광산지역에서 수반되는 광화작용을 규제한다. Zacualpan 광산지역은 Sierra Madre del Sur로 알려진 유망 광화대에 해당한다. 이 지역은 화산성 괴상 황화광상과 천열수 맥상광상이 우세하다. 대부분의 천열수 광화작용은 3.2-3.8억 년 전 마그마의 생성이 활발한 판구조 체제 동안 발생하였다. 역사적으로 가장 주요한 지역은 Lipton Vein이다. 현재 Zacualpan 지구에서 채광량은 은 200-500 g/t 정도로 보고되고 있다. 일부 지역은 고품위 은 광화작용(은 1,000 g/t 이상)을 수반하고 있으며, 이는 탐사의 주 타겟이 되고 있다. Zacualpan에서 은 광화작용은 은이 부화된 중유황 천열수 맥상광상으로 상당히 유명하다. Fresnillo, Pachuca 및 Taxco 광산을 포함한 멕시코 소유의 대규모의 잘 알려진 광산들이 이에 해당한다. 이러한 광산들은 부산물로서 금, 아연, 연이 생산된다. 이러한 광상들은 맥상과 각력상 및 산점상 또는 망상세맥의 형태로 산출된다. 광화작용은 석영과 탄산염 맥 내에 주로 황철석과 다양한 섬아연석, 방연석, 은 혹은 금 광물들을 수반한다. 경제성을 갖는 광화작용의 수직적인 연장은 평균적으로 대략 300 m이고, 멕시코 중부에 위치한 Fresnillo의 광화작용은 100 m에서 960 m의 연장을 갖는 것으로 알려져 있다. 아주 오랫동안 Zacualpan에서 광산관계자의 관측과 IMPACT Silver에서 최근 작업의 결과를 토대로, Zacualpan 광산지역의 탐사모델은 새로운 광상의 탐사를 위한 가이드로서 개발되었다. Zacualpan 광산지역에서 가장 높은 경제성을 갖는 광화작용은 북서와 남북방향의 맥 구조를 따라 수반된다. 이러한 맥 구조들은 종종 이 지역을 가로질러 수 km까지 추적되지만, 경제성을 갖는 광화작용은 맥 구조를 따라서 구조적으로 유리한 지역에서 부광대를 형성한다. 부광대를 형성하기 위한 가장 유리한 구조적 지역은 북서와 남북방향으로 발달한 맥 구조들이 교차하는 지역이다. 지난 30년간 채광된 주요 부광대는 폭이 2-6 m 이고 수평연장은 30-150 m 그리고 수직연장은 230-300 m에 이른다. 가장 높은 생산량을 보이는 부광대는 남북방향의 이차 맥들이 Guadalupe 광산의 Lipton 맥을 가로지르는 지역에서 발달한다. 남동쪽으로 현재 Compadres 광산의 Silver Shoot No. 1으로부터 고품위 은을 생산하는 지역은 북서방향의 San Agustin 맥이 북향의 Cometa Navideno 맥에 의해 절단되는 지역에서 산출한다. 모암은 광화작용을 규제하는 또 다른 중요한 요소이다. 광산지역에서 경제성을 갖는 모든 광화작용은 중성 내지 염기성 화산암 특히 안산암과 관련 모암에 배태된다. 부광대가 셰일 혹은 편암으로 전이되는 지역에서, 맥들은 소규모의 세맥으로 나뉘어 진다. Zacualpan의 전형적인 천열수 광상에서 부광대는 상부로 가면서 은의 함량이 증가하고, 하부로 가면서 연 아연의 함량이 증가하는 수직적 대상을 보인다. 금의 함량 변화는 보다 예측이 어려우나 상당히 중요하다. Zacualpan 광산지역의 탐사모델에 사용된 토양 채취, 정밀지도제작, 트렌치 및 시추탐광은 현재 IMPACT Silver사가 이 지역을 대상으로 한 가장 효율적인 탐사방법으로 입증되었다. Zacualpan 프로젝트의 로얄 광산은 하루 500 톤을 제련하는 기반시설과 수반된 채굴권을 갖는 가행 광산들을 포함한다. 현재 IMPACT Silver사는 두 곳의 타겟 지역에서 정밀지도제작, 토양 및 암석 채취, 12공 총 1866 m의 시추탐광에 의한 사전조사로 구성된 4 단계 탐사를 수행했다. 암석 1,953개, 토양 1,631 개, 389 개의 시추코어 시료가 채집되고 분석되었다. 이러한 작업은 추가탐사를 요구하는 수많은 유망 광화대를 규명했다. Compadres 광산에서 현재 가행중인 지하갱 시료는 레벨 1에서 0.9 m의 폭을 갖는 광체에서 은 680 g/t과 금 0.3 g/t, 레벨 3에서 1.67 m의 폭을 갖는 광체에서 은 12,591 g/t과 금 12.07 g/t의 품위를 갖는 것으로 나타났다. 레벨 1에서 3까지 2-3 m의 폭과 30-40 m 연장으로 채광되었다. 시추탐광은 고품위를 갖는 몇몇의 중첩된 맥을 발견했다. Compadres 광산에서 남동방향으로 200 m지점에 위치한 Soledad 지역에서 5 개의 시추공으로부터 동일 맥 시스템이 발견되었고, 고품위 부광대의 상부로 간주되는 몇몇 중요 지점이 발견되었다. 초기 단계의 탐사는 유망 시추탐광 지역인 중간정도 내지 고품위 유망 광화대를 규명했다.

  • PDF

Coupled Hydro-Mechanical Modelling of Fault Reactivation Induced by Water Injection: DECOVALEX-2019 TASK B (Benchmark Model Test) (유체 주입에 의한 단층 재활성 해석기법 개발: 국제공동연구 DECOVALEX-2019 Task B(Benchmark Model Test))

  • Park, Jung-Wook;Kim, Taehyun;Park, Eui-Seob;Lee, Changsoo
    • Tunnel and Underground Space
    • /
    • v.28 no.6
    • /
    • pp.670-691
    • /
    • 2018
  • This study presents the research results of the BMT(Benchmark Model Test) simulations of the DECOVALEX-2019 project Task B. Task B named 'Fault slip modelling' is aiming at developing a numerical method to predict fault reactivation and the coupled hydro-mechanical behavior of fault. BMT scenario simulations of Task B were conducted to improve each numerical model of participating group by demonstrating the feasibility of reproducing the fault behavior induced by water injection. The BMT simulations consist of seven different conditions depending on injection pressure, fault properties and the hydro-mechanical coupling relations. TOUGH-FLAC simulator was used to reproduce the coupled hydro-mechanical process of fault slip. A coupling module to update the changes in hydrological properties and geometric features of the numerical mesh in the present study. We made modifications to the numerical model developed in Task B Step 1 to consider the changes in compressibility, Permeability and geometric features with hydraulic aperture of fault due to mechanical deformation. The effects of the storativity and transmissivity of the fault on the hydro-mechanical behavior such as the pressure distribution, injection rate, displacement and stress of the fault were examined, and the results of the previous step 1 simulation were updated using the modified numerical model. The simulation results indicate that the developed model can provide a reasonable prediction of the hydro-mechanical behavior related to fault reactivation. The numerical model will be enhanced by continuing interaction and collaboration with other research teams of DECOVALEX-2019 Task B and validated using the field experiment data in a further study.