• 제목/요약/키워드: Parameter selection

검색결과 726건 처리시간 0.023초

가변 Break를 이용한 코퍼스 기반 일본어 음성 합성기의 성능 향상 방법 (A Performance Improvement Method using Variable Break in Corpus Based Japanese Text-to-Speech System)

  • 나덕수;민소연;이종석;배명진
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.155-163
    • /
    • 2009
  • Text-to-speech 시스템에서 입력 텍스트로부터 운율 정보를 생성하기 위해서는 운율구 경계, 음소 지속시간, 기본주파수 포락선 설정의 3가지 기본적인 모듈이 필요하다. Break 인덱스 (BI; Break Index)는 합성기에서 운율구의 경계를 나타내고, 자연스러운 합성음을 생성하기 위해서는 BI를 정확히 예측하여야 한다. 그러나 BI는 문장의 의미나 화자의 읽기 습관(reading style)에 따라 임의적으로 결정되는 경우가 많아 정확한 예측이 매우 어렵다. 특히 일본어 합성기에서는 악센트 구 경계 (APB; Accentual Phrase Boundary)와 major phrase 경계 (MPB; Major Phrase Boundary)의 정확한 예측이 어렵다. 따라서 본 논문에서는 APB와 MPB 예측 오류를 보완할 수 있는 방법을 제안한다. BI를 고정 break (FB; Fixed Break)와 가변 break (VB; Variable Break)로 분류하여 합성단위 선택을 수행한다. 일반적으로 BI는 한번 생성되면 변하지 않는다. 따라서 BI가 잘못 생성된 경우 최적의 합성음을 생성할 수 없게 되는데, VB는 생성된 BI와 그것과 유사한 BI를 함께 이용하여 합성단위 선택을 수행함으로써 합성음의 BI가 생성된 BI와 다를 수 있는 것을 의미한다. APB와 MPB에 해당하는 BI에 대하여 VB인지 FB인지 CART(Classification and Regression Tree)를 이용하여 예측하고, VB인 경우 기본 주파수와 음소 지속시간에 대해 다중 운율 모델을 생성하여 합성단위 선택을 수행하였다. MOS 테스트 결과 원음이 4.99, 제안한 방법을 4.25, 기존의 방법은 4.01로 합성음의 자연성을 향상시킬 수 있었다.

Development and Validation of a Model Using Radiomics Features from an Apparent Diffusion Coefficient Map to Diagnose Local Tumor Recurrence in Patients Treated for Head and Neck Squamous Cell Carcinoma

  • Minjae Kim;Jeong Hyun Lee;Leehi Joo;Boryeong Jeong;Seonok Kim;Sungwon Ham;Jihye Yun;NamKug Kim;Sae Rom Chung;Young Jun Choi;Jung Hwan Baek;Ji Ye Lee;Ji-hoon Kim
    • Korean Journal of Radiology
    • /
    • 제23권11호
    • /
    • pp.1078-1088
    • /
    • 2022
  • Objective: To develop and validate a model using radiomics features from apparent diffusion coefficient (ADC) map to diagnose local tumor recurrence in head and neck squamous cell carcinoma (HNSCC). Materials and Methods: This retrospective study included 285 patients (mean age ± standard deviation, 62 ± 12 years; 220 male, 77.2%), including 215 for training (n = 161) and internal validation (n = 54) and 70 others for external validation, with newly developed contrast-enhancing lesions at the primary cancer site on the surveillance MRI following definitive treatment of HNSCC between January 2014 and October 2019. Of the 215 and 70 patients, 127 and 34, respectively, had local tumor recurrence. Radiomics models using radiomics scores were created separately for T2-weighted imaging (T2WI), contrast-enhanced T1-weighted imaging (CE-T1WI), and ADC maps using non-zero coefficients from the least absolute shrinkage and selection operator in the training set. Receiver operating characteristic (ROC) analysis was used to evaluate the diagnostic performance of each radiomics score and known clinical parameter (age, sex, and clinical stage) in the internal and external validation sets. Results: Five radiomics features from T2WI, six from CE-T1WI, and nine from ADC maps were selected and used to develop the respective radiomics models. The area under ROC curve (AUROC) of ADC radiomics score was 0.76 (95% confidence interval [CI], 0.62-0.89) and 0.77 (95% CI, 0.65-0.88) in the internal and external validation sets, respectively. These were significantly higher than the AUROC values of T2WI (0.53 [95% CI, 0.40-0.67], p = 0.006), CE-T1WI (0.53 [95% CI, 0.40-0.67], p = 0.012), and clinical parameters (0.53 [95% CI, 0.39-0.67], p = 0.021) in the external validation set. Conclusion: The radiomics model using ADC maps exhibited higher diagnostic performance than those of the radiomics models using T2WI or CE-T1WI and clinical parameters in the diagnosis of local tumor recurrence in HNSCC following definitive treatment.

Comparison of Monoexponential, Biexponential, Stretched-Exponential, and Kurtosis Models of Diffusion-Weighted Imaging in Differentiation of Renal Solid Masses

  • Jianjian Zhang;Shiteng Suo;Guiqin Liu;Shan Zhang;Zizhou Zhao;Jianrong Xu;Guangyu Wu
    • Korean Journal of Radiology
    • /
    • 제20권5호
    • /
    • pp.791-800
    • /
    • 2019
  • Objective: To compare various models of diffusion-weighted imaging including monoexponential apparent diffusion coefficient (ADC), biexponential (fast diffusion coefficient [Df], slow diffusion coefficient [Ds], and fraction of fast diffusion), stretched-exponential (distributed diffusion coefficient and anomalous exponent term [α]), and kurtosis (mean diffusivity and mean kurtosis [MK]) models in the differentiation of renal solid masses. Materials and Methods: A total of 81 patients (56 men and 25 women; mean age, 57 years; age range, 30-69 years) with 18 benign and 63 malignant lesions were imaged using 3T diffusion-weighted MRI. Diffusion model selection was investigated in each lesion using the Akaike information criteria. Mann-Whitney U test and receiver operating characteristic (ROC) analysis were used for statistical evaluations. Results: Goodness-of-fit analysis showed that the stretched-exponential model had the highest voxel percentages in benign and malignant lesions (90.7% and 51.4%, respectively). ADC, Ds, and MK showed significant differences between benign and malignant lesions (p < 0.05) and between low- and high-grade clear cell renal cell carcinoma (ccRCC) (p < 0.05). α was significantly lower in the benign group than in the malignant group (p < 0.05). All diffusion measures showed significant differences between ccRCC and non-ccRCC (p < 0.05) except Df and α (p = 0.143 and 0.112, respectively). α showed the highest diagnostic accuracy in differentiating benign and malignant lesions with an area under the ROC curve of 0.923, but none of the parameters from these advanced models revealed significantly better performance over ADC in discriminating subtypes or grades of renal cell carcinoma (RCC) (p > 0.05). Conclusion: Compared with conventional diffusion parameters, α may provide additional information for differentiating benign and malignant renal masses, while ADC remains the most valuable parameter for differentiation of RCC subtypes and for ccRCC grading.

지진취약도 곡선 생성시 선택된 지진파 수에 따른 입력변수 변화에 관한 연구 (A Study of the Relationship Between Number of Ground Motions and Parameters of Seismic Fragility Curve)

  • 박상기;박기태;김재환;정규산;서동우
    • 한국지진공학회논문집
    • /
    • 제28권5호
    • /
    • pp.285-294
    • /
    • 2024
  • Seismic fragility curves present the conditional probability of damage to target structures due to external seismic load and are widely used in various ways. When constructing such a seismic fragility curve, it is essential to consider various types and numbers of ground motions. In general, the earthquake occurrence characteristics of an area where the target structure of the seismic fragility curve exists are analyzed, and based on this, appropriate ground motions are selected to derive the seismic fragility curve. If the number of selected ground motions is large, the diversity of ground motions is considered, but a large amount of computational time is required. Conversely, if the number of ground motions is too small, the diversity of ground motions cannot be considered, which may distort the seismic fragility curve. Therefore, this study analyzed the relationship between the number of ground motions considered when deriving the seismic fragility curve and the parameters of the seismic fragility curve. Using two example structures, numerical analysis was performed by selecting a random number of ground motions from a total of two hundred, and a seismic fragility curve was derived based on the results. Analysis of the relationship of the parameter of the seismic fragility curve and the number of selected ground motions was performed. As the number of ground motions considered increases, uncertainty in ground motion selection decreases, and when deriving seismic fragility curves considering the same number of ground motions, uncertainty increases relatively as the degree of freedom of the target structure increases. However, considering a relatively large number of ground motions, uncertainty appeared insignificant regardless of increased degrees of freedom. Finally, it is possible that the increase in the number of ground motions could lower the epistemic uncertainty and thus improve the reliability of the results.

PET/CT 검사 시 CT 피폭선량 감소 방법들의 최적화 평가 (Evaluation for Optimization of CT Dose Reduction Methods in PET/CT)

  • 도용호;이홍재;김진의
    • 핵의학기술
    • /
    • 제19권2호
    • /
    • pp.55-62
    • /
    • 2015
  • PET/CT 검사 시 피폭 선량 감소를 위한 방법들이 지속적으로 개발되고 있다. 본 논문에서는 사용자에 의해 parameter 변경이 가능한 3가지 방법인 automatic exposure control(AEC), automated dose-optimized selection of X-ray tube voltage(CAREkV), sinogram affirmed iterative reconstruction(SAFIRE) 적용 시 각 방법의 적용 시와 3가지 방법의 조합에 따른 피폭선량 감소효과와 영상의 질 그리고 SUV 변화 유무를 평가하였다. Bograph mCT64 (Siemens, Germany)장비를 사용하여 anthropomorphic head, chest, pelvis phantom을 torso 모형으로 접합하여 스캔하였다. 120 kV, 40 mAs 조건으로 AEC의 적용 유무와 120 kV, 40 mAs AEC 조건으로 CAREkV의 적용 유무에 따른 피폭 선량 감소 효과를 평가 하였다. 120 kV, 25 mAs SAFIRE 조건에서 영상을 획득하여 120 kV, 40 mAs SAFIRE 미적용 시 대비 노이즈와 피폭선량 감소효과가 평가되었다. 120 kV, 40 mAs AEC 적용, 120 kV, 25 mAs 3가지 방법의 조합 조건으로 AAPM perfomance, anthropomorphic, IEC body phantom을 스캔하여 노이즈, 공간 분해능, 피폭선량 감소효과 그리고 PET SUV의 변화 유무를 평가하였다. AEC 적용 시, 미적용 대비 CTDIvol 50.52%, DLP 50.62% 감소하였다. CAREkV 적용 시 100 kV가 적용됨에 따라 mAs가 61.5% 증가하였으나 CTDI 6.2%, DLP 5.5% 감소하였다. Reference mAs를 낮게 지정할수록, strength값을 높게 지정할수록 피폭선량 감소 효과는 증가하였다. SAFIRE의 경우 40 mAs에서 25 mAs로 tube current를 37.5% 감소시켰음에도 불구하고 mean SD 2.2%, DLP 38% 감소하였다. AAPM phantom에서는 3가지 방법의 조합 시 AEC 대비 SD는 5.17% 감소하였으며 공간 분해능의 경우 유의한 차이가 없었다. Torso phantom의 경우 3가지 조합에서 AEC 대비 mean SD 6.7% 증가, DLP 36.9% 감소하였으며 IEC phantom 실험에서 PET SUV는 통계적으로 유의한 차이가 없었다(P>0.05). 본 논문에서 CT선량 감소를 위한 각 방법들 모두 피폭 선량 감소 효과를 보였으며 3가지 방법의 조합을 통하여 화질 저하와 PET SUV 변화 없이 AEC만 적용 시 대비 36.9%의 선량감소 효과가 있는 것으로 나타났다. 선량 감소 방법들의 최적화를 통하여 환자 피폭선량 저감화를 위한 지속적인 노력이 필요하며 특히 방사선 감수성이 높은 소아 환자에 적극적으로 적용되어야 할 것으로 사료된다.

  • PDF

HLW 지층처분 광역 후보부지 선정을 위한 선형구조 예비 분석 결과 (Preliminary Result of Lineament Analysis for the Potential Site Selection of HLW Geological Disposal)

  • 고경태;김유홍;이홍진
    • 자원환경지질
    • /
    • 제51권2호
    • /
    • pp.167-176
    • /
    • 2018
  • 고준위방사성폐기물 처분장 부지선정을 위해서는 암종, 지질구조, 지진, 수리지질, 지구화학, 지질공학 및 지열 등과 같은 다양한 지질학적 인자들에 대한 고려가 필요하며, 특히 선형구조는 다양한 지질인자의 특성을 반영하기 때문에 원자력 발전소, 고준위방사성폐기물 처분장 등과 같은 국가 중요시설물의 후보부지 선정에 있어 매우 중요한 기초자료로 활용될 수 있다. 본 논문에서는 선형구조분석을 통해 고준위방사성폐기물 광역 처분부지 선정을 실시한 핀란드의 선형구조 분류 방법을 국내 선형구조 자료에 적용하여 살펴보았다. 이를 위하여 기존에 한국지질자원연구원에서 보유한 선형구조도와 신규로 구조지질학, 고지진학, 지형학 전문가들로부터 획득한 새로운 선형구조 자료를 분석에 이용하였다. 새로운 선형구조 분석 자료의 신뢰성 확보를 위해 한반도 지역을 최근에 촬영한 위성영상과 국토지리정보원에서 제공하는 수치표고모델로 제작한 고해상도의 음영기복도를 이용하였다. 취득한 자료들의 전체적인 방향성 분석 결과에서는 북북동-남남서 방향이 가장 우세하게 관찰되었지만, 분석자들의 판독기준의 차이에 따라서 동북동-서남서 및 북북서-남남동 방향의 선형구조들도 높게 판독 되었다. 핀란드의 분류 방법을 적용하여, 광역후보부지 선정에 사용되는 등급 1과 등급 2에 해당되는 선형구조들의 기하학적인 발달특성을 상호 비교해 보았다. 그 결과에서는 전체적으로 등급 1의 경우에는 공통적으로 북북동-남남서 방향이 가장 우세하였으며, 서북서-동남동 방향의 선형구조도 빈도가 높게 나타났다. 등급 2의 경우에도 북북동-남남서 방향의 선형구조가 가장 우세하게 발달하고 있으며, 분석자에 따라 서북서-동남동 또는 동북동-서남서 방향의 선형구조도 빈도가 높게 나타났다. 같은 자료를 바탕으로 실시한 선형구조분석에서도 상이한 판독 결과를 보이는 것은 판독자의 주관적인 경험 및 기준이 작용하였기 때문으로 여겨진다. 따라서 신뢰도 높은 한반도 광역선형구조도를 발간하기 위해서는 상이한 자료들을 통합하는 과정에서 명확한 통합 기준의 설정이 필요하며, 지구물리탐사자료와 같은 추가적인 데이터를 통한 분석이 요구된다.

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

돼지의 번식형질과 산육형질에 대한 유전모수 추정 (Genetic Parameter Estimates for Reproductive and Productive Traits of Pig in a Herd)

  • 조충일;안진국;이준호;이득환
    • Journal of Animal Science and Technology
    • /
    • 제54권1호
    • /
    • pp.9-14
    • /
    • 2012
  • 본 연구는 국내 특정 종돈장에서 보유하고 있는 종돈에 대한 번식형질 및 산육형질들에 대한 유전변이를 추정하고자 연구를 실시하였다. 본 분석에 이용된 자료는 2000년부터 2008년까지 개량을 진행한 국내 모종돈장에 있는 돼지(Landrace, Large white, Duroc) 2,447두에서 조사된 9,886복의 번식자료(실산자수, 이유자 돈수)와 10,181두의 산육검정자료(등심단면적, 90 kg 도달일령, 등 지방두께, 정육률)을 이용하여 분석을 실시하였다. 번식형질 및 산육형질에 적합한 모형을 찾기 위해 분산분석을 실시하였으며, 그 결과 번식형질에서 품종효과, 교배웅돈효과, 산차효과, 분만시 년도-계절효과, 산육형질에서 품종효과, 분만시 년도-계절효과, 성의 효과, 모산차 등이 환경요인으로 작용하는 것으로 나타나 이들을 혼합모형방정식에 적합시켜 유전모수를 추정하였다. 그 결과, 번식 형질의 실산자수에 대한 유전력은 0.07, 모체 유전효과에 대한 유전력은 0.02로 추정되었고 이유자돈수의 유전력은 0.03, 모체 유전효과에서 0.02로 추정되었으며 이들 두 형질 간의 유전상관은 0.14, 모체 유전효과에 대한 상관은 0.06로 추정되었다. 또한 등심 면적의 경우 0.19, 90 kg 도달일령은 0.39, 등지방두께 및 정육률은 각각 0.36 및 0.43으로 번식형질에 비해 높은 유전력을 나타내는 것으로 추정되었다. 또한 등심단면적과 등지방두께 간에는 0.04로 유전적 상관관계가 없으며, 등심단면적과 정육률 간에는 0.35로 중도의 유전적 상관관계를 갖는 것으로 추정되었다. 반면에 등지방 두께와 정육률 간은 -0.42로 중도의 부의 상관관계를 나타냈으며, 등지방두께와 90 kg 도달일령 간에는 유전상관이 없는 것(0.00)으로 추정되었다. 또한 번식형질과 산육형질 간 유전상관은 등지방두께를 제외한 나머지 산육형질에서 번식형질과의 부의 상관을 보여, 번식형질 또는 산육형질을 독자적으로 개량하고자 할 때, 부의 관계가 있는 형질과의 유전적 관계를 고려한 개량목표 설정이 필요할 것으로 사료된다.

국내 암종별 고심도 암반대수층 수리지질특성 연구 (A Study on Hydrogeological Characteristics of Deep-Depth Rock Aquifer by Rock Types in Korea)

  • 이항복;박찬;천대성;최준형;박의섭
    • 터널과지하공간
    • /
    • 제34권4호
    • /
    • pp.374-392
    • /
    • 2024
  • 고준위방사성폐기물 심층처분 시, 부지선정을 성공적으로 진행하기 위해서는 단계별 접근법과 그에 따라 국내 지질환경에 적합한 지질환경특성 평가인자의 체계적인 선정 및 조사평가가 중요하다. 본 연구에서는 실제 처분시설이 위치할 것으로 예상되는 고심도의 암반대수층을 대상으로, 수리지질분야의 가장 핵심적인 평가인자로 고려되고 있는 수리전도도 특성을 평가하였다. 특히 국내에 분포하는 다양한 암종지역(화강암/화산암/편마암/이암)에서 각각 500 m 이하 750 m에 이르는 깊은 심도까지, 직접 시추공 내 수리시험을 수행하여 현지 압력-유량 자료를 획득하고, 검증된 해석방법을 통해 암종별/심도별 수리전도도 값을 도출한 일련의 수행 과정과 분석 결과들은 국내 최초의 종합적 고심도 수리특성 연구 시도라 할 수 있다. 이를 위해, 본 연구를 통해 자체적으로 개발된 정밀수리시험장비가 사용되었으며, 표준시험법을 바탕으로 한 상세조사절차가 현장시험에 적용되었다. 분석 결과, 화강암/화산암/편마암 지역에서 모두 평균 10-9 m/s 범위의 수리전도도 값이 나타났으며, 이암 지역에서는 이보다 100배(2 order)정도 낮은 수준인 평균 10-11 m/s 수리전도도 값이 도출되었다. 또한 암반절리가 다수 포함되어 있는 균열암반대수층인 화강암과 화산암 지역에서는 전체적으로 심도에 따라 투수성이 약간 감소하는 경향을 보였다. 편마암 지역은 심도보다는 지층의 암상과 그에 따른 파쇄대의 발달 여부에 따라 국부적으로 투수성 차이가 큰 경향을 나타냈다. 균열 발달이 미약한 이암 지역에서는 심도에 따른 암반 투수성의 변동이나 뚜렷한 경향성이 관찰되지 않았다. 본 연구에서 제시된 암종별/심도별 수리전도도 결과 자료들은 국내 처분부지 선정과 처분시설 설계 및 건설을 위한 기반 데이터베이스 구축에 활용될 것으로 기대된다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.