Software defect prediction is an important factor in efficient project management and success. The severity of the defect usually determines the degree to which the project is affected. However, existing studies focus only on the presence or absence of a defect and not the severity of defect. In this study, we proposed an ensemble model using FCM based on defect severity. The severity of the defect of NASA data set's PC4 was reclassified. To select the input column that affected the severity of the defect, we extracted the important defect factor of the data set using Random Forest (RF). We evaluated the performance of the model by changing the parameters in the 10-fold cross-validation. The evaluation results were as follows. First, defect severities were reclassified from 58, 40, 80 to 30, 20, 128. Second, BRANCH_COUNT was an important input column for the degree of severity in terms of accuracy and node impurities. Third, smaller tree number led to more variables for good performance.
Structural identification or St-Id is 'the parametric correlation of structural response characteristics predicted by a mathematical model with analogous characteristics derived from experimental measurements'. This paper describes a St-Id exercise on Humber Bridge that adopted a novel two-stage approach to first calibrate and then validate a mathematical model. This model was then used to predict effects of wind and temperature loads on global static deformation that would be practically impossible to observe. The first stage of the process was an ambient vibration survey in 2008 that used operational modal analysis to estimate a set of modes classified as vertical, torsional or lateral. In the more recent second stage a finite element model (FEM) was developed with an appropriate level of refinement to provide a corresponding set of modal properties. A series of manual adjustments to modal parameters such as cable tension and bearing stiffness resulted in a FEM that produced excellent correspondence for vertical and torsional modes, along with correspondence for the lower frequency lateral modes. In the third stage traffic, wind and temperature data along with deformation measurements from a sparse structural health monitoring system installed in 2011 were compared with equivalent predictions from the partially validated FEM. The match of static response between FEM and SHM data proved good enough for the FEM to be used to predict the un-measurable global deformed shape of the bridge due to vehicle and temperature effects but the FEM had limited capability to reproduce static effects of wind. In addition the FEM was used to show internal forces due to a heavy vehicle to to estimate the worst-case bearing movements under extreme combinations of wind, traffic and temperature loads. The paper shows that in this case, but with limitations, such a two-stage FEM calibration/validation process can be an effective tool for performance prognosis.
This study was conducted to estimate site productivity of Quercus acutissima and Quercus mongolica by four forest climatic zones. We used site environmental variables (28 geographical and pedological factors) and site index as a site productivity indicator from nation-wide 23,315 stands. Based on multiple regression analysis between site index and major environmental variables, the best-fit multivaliate models were made by each species and forest climatic zone. Most of site index prediction models by species were regressed with seven to eight factors, including altitude, relief, soil depth, and soil moisture etc. For those models, three evaluation statistics such as mean difference, standard deviation of difference, and standard error of difference were applied to the test data set for the validation of the results. According to the evaluation statistics, it was found that the models by climatic zones and species fitted well to the test data set with relatively low bias and variation. Also having above middle of site index range, total area of productive sites for the two Quercus spp. estimated by those models would be about 6% of total forest area. Northern temperate forest zone and central temperate forest zone had more productive area than southern temperate forest zone and warm temperate forest zone. As a result, it was concluded that the regressive prediction with site environmental variables by climatic zones and species had enough estimation capability of forest site productivity.
Xing, Lumin;Liu, Wenjian;Liu, Xiaoliang;Li, Xin;Wang, Han
Advances in nano research
/
v.12
no.2
/
pp.185-195
/
2022
Deep learning is another field of artificial intelligence (AI) utilized for computer aided diagnosis (CAD) and image processing in scientific research. Considering numerous mechanical repetitive tasks, reading image slices need time and improper with geographical limits, so the counting of image information is hard due to its strong subjectivity that raise the error ratio in misdiagnosis. Regarding the highest mortality rate of Lung cancer, there is a need for biopsy for determining its class for additional treatment. Deep learning has recently given strong tools in diagnose of lung cancer and making therapeutic regimen. However, identifying the pathological lung cancer's class by CT images in beginning phase because of the absence of powerful AI models and public training data set is difficult. Convolutional Neural Network (CNN) was proposed with its essential function in recognizing the pathological CT images. 472 patients subjected to staging FDG-PET/CT were selected in 2 months prior to surgery or biopsy. CNN was developed and showed the accuracy of 87%, 69%, and 69% in training, validation, and test sets, respectively, for T1-T2 and T3-T4 lung cancer classification. Subsequently, CNN (or deep learning) could improve the CT images' data set, indicating that the application of classifiers is adequate to accomplish better exactness in distinguishing pathological CT images that performs better than few deep learning models, such as ResNet-34, Alex Net, and Dense Net with or without Soft max weights.
In this study, Neural Networks models were used to forecast daily streamflow at Jindong station of the Nakdong River basin. Neural Networks models consist of CASE 1(5-5-1) and CASE 2(5-5-5-1). The criteria which separates two models is the number of hidden layers. Each model has Fletcher-Reeves Conjugate Gradient BackPropagation(FR-CGBP) and Scaled Conjugate Gradient BackPropagation(SCGBP) algorithms, which are better than original BackPropagation(BP) in convergence of global error and training tolerance. The data which are available for model training and validation were composed of wet, average, dry, wet+average, wet+dry, average+dry and wet+average+dry year respectively. During model training, the optimal connection weights and biases were determined using each data set and the daily streamflow was calculated at the same time. Except for wet+dry year, the results of training were good conditions by statistical analysis of forecast errors. And, model validation was carried out using the connection weights and biases which were calculated from model training. The results of validation were satisfactory like those of training. Daily streamflow forecasting using Neural Networks models were compared with those forecasted by Multiple Regression Analysis Mode(MRAM). Neural Networks models were displayed slightly better results than MRAM in this study. Thus, Neural Networks models have much advantage to provide a more sysmatic approach, reduce model parameters, and shorten the time spent in the model development.
This study aims to estimate daily maximum air temperature estimated using satellite-derived surface temperature and Elevation Derivative Database (EDD). The analysis is focused on the establishment of a semi-empirical estimation technique of daily maximum air temperature through the multiple regression analysis. This tests the contribution of EDD in the air temperature estimation when it is added into regression model as an independent variable. The better correlation is shown with the EDD data as compared with the correlation without this data set. In order to provide a progressive estimation technique, we propose and compare three approaches: 1) seasonal estimation non-considering landcover, 2) seasonal estimation considering landcover, and 3) estimation according to landcover type and non-considering season. The last method shows the best fit with the root-mean-square error between 0.56$^{\circ}C$ and 3.14$^{\circ}C$. A cross-validation procedure is performed for third method to valid the estimated values for two major landcover types (cropland and forest). For both landcover types, the validation results show reasonable agreement with estimation results. Therefore it is considered that the estimation technique proposed may be applicable to most parts of South Korea.
KIPS Transactions on Software and Data Engineering
/
v.6
no.2
/
pp.67-76
/
2017
In industrial site in various fields it will be generated in combination with large amounts of data have a correlation. It is able to collect a variety of data in types of industry process, but they are unable to integrate each other's association between each process. For the data of the existing industry, the set values of the molding condition table are input by the operator as an arbitrary value When a problem occurs in the work process. In this paper, design the fusion and analysis processing model of data collected for each industrial type, Prediction Case(Automobile Connect), a through for corporate earnings improvement and process manufacturing industries such as master data through standard molding condition table and the production history file comparison collected during the manufacturing process and reduced failure rate with a new molding condition table digitized by arbitrary value for worker, a new pattern analysis and reinterpreted for various malfunction factors and exceptions, increased productivity, process improvement, the cost savings. It can be designed in a variety of data analysis and model validation. In addition, to secure manufacturing process of objectivity, consistency and optimization by standard set values analyzed and verified and may be optimized to support the industry type, fits optimization(standard setting) techniques through various pattern types.
Journal of the Korea Institute of Information and Communication Engineering
/
v.23
no.5
/
pp.533-539
/
2019
This study proposes a malware classification model that can handle arbitrary length input data using the Microsoft Malware Classification Challenge dataset. We are based on imaging existing data from malware. The proposed model generates a lot of images when malware data is large, and generates a small image of small data. The generated image is learned as time series data by Dynamic RNN. The output value of the RNN is classified into malware by using only the highest weighted output by applying the Attention technique, and learning the RNN output value by Residual CNN again. Experiments on the proposed model showed a Micro-average F1 score of 92% in the validation data set. Experimental results show that the performance of a model capable of learning and classifying arbitrary length data can be verified without special feature extraction and dimension reduction.
Park, Kyung-Hyun;Jun, Sang-Ook;Cho, Maeng-Hyo;Lee, Dong-Ho
Journal of the Korean Society for Aeronautical & Space Sciences
/
v.38
no.5
/
pp.414-420
/
2010
This paper presents a validation of the accuracy of a reduced order model(ROM) and the efficiency of the design optimization using a Proper Orthogonal Decomposition(POD) to transonic wing/fuselage system. Three dimensional Euler equations are solved to extrude snapshot data of the full order aerodynamic analysis, and then a set of POD basis vectors reproducing the behavior of flow around the wing/fuselage system is calculated from these snapshots. In this study, reduced order model constructed through this procedure is applied to several validation cases, and then it is confirmed that the ROM has the capability of the prediction of flow field in the space of interest. Additionally, after the design optimization of the wing/fuselage system with the ROM is performed, results of the ROM are compared with results of the design optimization using response surface model(RSM). From these, it can be confirmed that the design optimization with the ROM is more efficient than RSM.
Park, H.S.;Lee, J.K.;Fike, J.H.;Kim, D.A.;Ko, M.S.;Ha, Jong Kyu
Asian-Australasian Journal of Animal Sciences
/
v.18
no.5
/
pp.643-648
/
2005
Near infrared reflectance spectroscopy (NIRS) has become increasingly used as a rapid, accurate method of evaluating some chemical constituents in cereal grains and forages. If samples could be analyzed without drying and grinding, then sample preparation time and costs may be reduced. This study was conducted to develop robust NIRS equations to predict fermentation quality of corn (Zea mays) silage and to select acceptable sample preparation methods for prediction of fermentation products in corn silage by NIRS. Prior to analysis, samples (n = 112) were either oven-dried and ground (OD), frozen in liquid nitrogen and ground (LN) and intact fresh (IF). Samples were scanned from 400 to 2,500 nm with an NIRS 6,500 monochromator. The samples were divided into calibration and validation sets. The spectral data were regressed on a range of dry matter (DM), pH and short chain organic acids using modified multivariate partial least squares (MPLS) analysis that used first and second order derivatives. All chemical analyses were conducted with fresh samples. From these treatments, calibration equations were developed successfully for concentrations of all constituents except butyric acid. Prediction accuracy, represented by standard error of prediction (SEP) and $R^2_{v}$ (variance accounted for in validation set), was slightly better with the LN treatment ($R^2$ 0.75-0.90) than for OD ($R^2$ 0.43-0.81) or IF ($R^2$ 0.62-0.79) treatments. Fermentation characteristics could be successfully predicted by NIRS analysis either with dry or fresh silage. Although statistical results for the OD and IF treatments were the lower than those of LN treatment, intact fresh (IF) treatment may be acceptable when processing is costly or when possible component alterations are expected.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.