• 제목/요약/키워드: Ensemble model

검색결과 632건 처리시간 0.036초

데이터 마이닝에서 패턴 분류를 위한 다중 SVM 분류기 (Multiple SVM Classifier for Pattern Classification in Data Mining)

  • 김만선;이상용
    • 한국지능시스템학회논문지
    • /
    • 제15권3호
    • /
    • pp.289-293
    • /
    • 2005
  • 패턴 분류는 실세계의 객체를 표현한 다양한 형태의 패턴 정보를 추출하여, 이것이 어떤 부류(클래스)인가를 결정하는 것이다. 패턴 분류 기술은 데이터 마이닝, 산업 자동화나 업무자동화를 위한 컴퓨터 응용 소프트웨어 기술로서 현재 다양한 분야에서 활용되고 있다. 패턴 분류 기술의 최대 목표는 분류 성능 향상이며 이것을 위해 지난 40년간 많은 연구자들이 다양한 접근 방법들을 시도해 왔다. 주로 이용되는 단일 분류 방법들로는 패턴들의 확률적 추론에 기반한 베이즈 분류기, 결정 트리, 거리함수를 이용하는 방법, 신경망, 군집화 등이 있으나 대용량 다차원 데이터를 분석하기에는 효율적이지 못하다. 따라서 상호 보완적인 여러 분류기들을 사용해 결합을 통하여 성능 향상에 도움을 주고 있는 다중 분류기 시스템에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 다중 SVM(Support Vector Machine) 분류기에 관한 기존 연구의 문제점을 지적하고 새로운 모델을 제안한다. SVM을 다중 클래스 분류기로 확장하기 위해 일대다 정책을 기반으로 하여 각각의 SVM 출력값을 비선형 패턴을 갖는 신호로 간주하고 이를 신경망에 학습하여 최종 분류 성능 결과를 결합하는 모델인 BORSE(Bootstrap Resampling SVM by Ensemble)를 제안한다.

공간의존 파론도 게임의 재분배 모형 (A redistribution model for spatially dependent Parrondo games)

  • 이지연
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.121-130
    • /
    • 2016
  • N명의 게임자들이 둥글게 둘러앉아 공간의존 파론도 게임 B를 실시한다. 게임 B는 여러 명의 게임자들 중에서 한 명을 임의로 선택하고, 선택된 게임자는 양 옆에 있는 두 명의 게임자들의 상태에 따라 앞면이 나올 확률이 달라지는 동전을 던져서 앞면이 나오면 1원을 얻고 뒷면이 나오면 1원을 잃는다. 게임 A'은 임의로 선택된 게임자가 나머지 N - 1명의 게임자들 중에서 한 명을 임의로 선택하여 본인의 상금 1원을 전달하는 게임으로 전체 게임자들의 총 상금에는 변함이 없으므로 전체 게임자들에게는 항상 공정한 게임이다. 만약 게임 B가 지는 게임인 반면에 두 게임 A'와 B를 결합한 혼합게임 C는 이기는 게임이 되면 파론도 효과가 존재하고, 게임 B가 이기는 게임이고 혼합게임 C는 지는 게임이면 역파론도 효과가 존재한다고 한다. 먼저 마코프 체인의 상태공간의 축소를 위한 lumpability 조건이 게임 A', B 그리고 혼합게임 C에 대해 만족함을 보이고, 축소된 상태공간에서 게임 B와 C의 기대상금을 계산한다. 이를 이용하여 파론도 효과와 역파론도 효과의 존재를 확인하고, 특별히 $3{\leq}N{\leq}6$의 경우에는 파론도 효과와 역파론도 효과가 존재하는 확률 모수의 영역을 도식화 한다.

Assessment of modal parameters considering measurement and modeling errors

  • Huang, Qindan;Gardoni, Paolo;Hurlebaus, Stefan
    • Smart Structures and Systems
    • /
    • 제15권3호
    • /
    • pp.717-733
    • /
    • 2015
  • Modal parameters of a structure are commonly used quantities for system identification and damage detection. With a limited number of studies on the statistics assessment of modal parameters, this paper presents procedures to properly account for the uncertainties present in the process of extracting modal parameters. Particularly, this paper focuses on how to deal with the measurement error in an ambient vibration test and the modeling error resulting from a modal parameter extraction process. A bootstrap approach is adopted, when an ensemble of a limited number of noised time-history response recordings is available. To estimate the modeling error associated with the extraction process, a model prediction expansion approach is adopted where the modeling error is considered as an "adjustment" to the prediction obtained from the extraction process. The proposed procedures can be further incorporated into the probabilistic analysis of applications where the modal parameters are used. This study considers the effects of the measurement and modeling errors and can provide guidance in allocating resources to improve the estimation accuracy of the modal data. As an illustration, the proposed procedures are applied to extract the modal data of a damaged beam, and the extracted modal data are used to detect potential damage locations using a damage detection method. It is shown that the variability in the modal parameters can be considered to be quite low due to the measurement and modeling errors; however, this low variability has a significant impact on the damage detection results for the studied beam.

촉매 변환기의 내부 유동장 측정-CFD 해석과 비교 (Flow Field Measurement in Catalytic Converter-Comparison with Computational Fluid Dynamics Analyses)

  • 유성출;장성국
    • 대한기계학회논문집B
    • /
    • 제38권3호
    • /
    • pp.197-202
    • /
    • 2014
  • 촉매 변환기의 효율은 촉매 물질이 포함되어 있는 하니콤 브릭 입구의 유동장 분포와 밀접한 관계가 있다. 하니콤 브릭 표면의 유동장 분포가 균일하지 않으면 시스템의 전환 효율이 감소하고 균일한 유동장 분포를 갖는 촉매 변환기에 비해 크기가 커져 제작비용도 증가한다. 따라서 촉매 변환기의 내부유동 해석은 매우 중요하다. 본 연구에서는 변환기 내부 하니콤 브릭 사이부분과 2번째 하니콤 브릭 출구부분의 유동분포를 단축을 따라 37.8 l/s와 94.4 l/s 유동영역에서 측정하였다. 또한, 자동차 제작사에서 이루어진 전산해석 결과를 측정 결과와 비교하여 실험적으로 검증하였다. 하니콤 브릭 사이부분의 ${\upsilon}$-속도분포 측정은 다소 변화하는 유동패턴이 형성되는 것을 보여주지만 입구 반대쪽 벽 부근영역에서 음의 유동장이 형성되고 음의 속도는 감소하여 중심 부근에서는 정체현상을 보이고 계속 입구 쪽까지 지속되는 것을 보여준다. 대부분의 속도 값에서 전산해석 결과는 측정치에 비하여 크게 나타났다.

APCC MME 계절예측정보를 이용한 가뭄전망 (Drought Outlook using APCC MME Seasonal Prediction Information)

  • 강부식;문수진;손수진;이우진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1784-1788
    • /
    • 2010
  • APEC 기후센터(APEC Climate Center, APCC)에서 제공하는 다중모형앙상블(Multi-model Ensemble, MME) 형태의 계절예측정보를 이용하여 3개월 가뭄전망을 수행하였다. APCC MME는 기후예측모형이 가지는 불확실성을 최소화하기 위한 방법으로, 아시아 태평양 지역 내 9개 회원국 16개 기관 21개 기후모형의 계절예측정보를 활용하여, 개별 모형이 가지는 계통오차(Systematic error)를 앙상블 기법을 통하여 상쇄함으로써 최적의 예측자료를 도출한다. 또한, 기후예측 모형이 예측한 대기순환장은 관측 지점변수와 경험적 통계적 관련성을 가지므로, 이를 바탕으로 상세지역의 이상기후에 대한 정보를 도출할 수 있다. 본 연구에서는 가뭄 관리 및 전망을 위한 입력 자료로서, 기상전문 기관인 APEC 기후센터 (APEC Climate Center, APCC)에서 제공하는 전구 규모의 기온 및 강수 전망자료를 기상청 산하 59개 지점의 전망자료로 통계적 규모 축소화 기법을 통해 3개월 예보를 실시하였다. APCC 계절예측자료를 가뭄모니터링시스템의 자료입력 포맷에 따라 적절히 가공한 뒤, 가뭄 관리 및 전망을 위하여 SPI(Standard Precipitation Index) 및 PDSI(Palmer Drought Severity Index)지수의 입력자료로 사용하여 SPI 및 PDSI 지수를 산정하였다. 또한 분위사상법(Quantile Mapping)을 이용하여 총 59개 지점의 과거 월평균 관측값과 최근 2009년에 대한 모의값의 누적확률분포값을 계산하고 모의값의 확률분포를 관측값의 확률분포에 사상시켜 가뭄 전망을 위한 기상변수의 오차를 보정하고자 하였다. 이러한 계절예측정보를 이용하여 가뭄 전망에 대한 신뢰도가 높아진다면, 사전예방 및 피해완화로 가뭄상황에 대한 신속한 대처 및 피해의 경감이 이루어질 수 있을 것이다.

  • PDF

Analyzing Machine Learning Techniques for Fault Prediction Using Web Applications

  • Malhotra, Ruchika;Sharma, Anjali
    • Journal of Information Processing Systems
    • /
    • 제14권3호
    • /
    • pp.751-770
    • /
    • 2018
  • Web applications are indispensable in the software industry and continuously evolve either meeting a newer criteria and/or including new functionalities. However, despite assuring quality via testing, what hinders a straightforward development is the presence of defects. Several factors contribute to defects and are often minimized at high expense in terms of man-hours. Thus, detection of fault proneness in early phases of software development is important. Therefore, a fault prediction model for identifying fault-prone classes in a web application is highly desired. In this work, we compare 14 machine learning techniques to analyse the relationship between object oriented metrics and fault prediction in web applications. The study is carried out using various releases of Apache Click and Apache Rave datasets. En-route to the predictive analysis, the input basis set for each release is first optimized using filter based correlation feature selection (CFS) method. It is found that the LCOM3, WMC, NPM and DAM metrics are the most significant predictors. The statistical analysis of these metrics also finds good conformity with the CFS evaluation and affirms the role of these metrics in the defect prediction of web applications. The overall predictive ability of different fault prediction models is first ranked using Friedman technique and then statistically compared using Nemenyi post-hoc analysis. The results not only upholds the predictive capability of machine learning models for faulty classes using web applications, but also finds that ensemble algorithms are most appropriate for defect prediction in Apache datasets. Further, we also derive a consensus between the metrics selected by the CFS technique and the statistical analysis of the datasets.

확률론적 홍수예측을 위한 불확실성 분석 (Uncertainty Analysis for the Probabilistic Flood Forecasting)

  • 이경태;김영오;강태호
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.71-71
    • /
    • 2012
  • 현재 전 세계적으로 극한강우의 발생빈도가 점차 높아지고 있으며 홍수량 또한 강도가 커지고 있는 것이 현실이다. 하지만 과거의 홍수발생 빈도에 따라 설계된 홍수방어시설들이 점차 한계를 보이고 있으므로 이를 대비하기위한 구조적 대책뿐만 아니라 홍수피해 발생 가능지역에 사전 예경보를 시행하는 비구조적 대책마련 또한 필요하다. 기존의 홍수예측은 확정적인 하나의 유량예측값만을 제공함으로써 신속하고 편리하였지만 이에 대한 불확실성이 큰 경우 예상치 못한 큰 인적 물적 피해를 가져올 수 있다. 이처럼 확률론적 홍수예측의 필요성이 대두되어 지면서 유럽이나 미국등 선진국에서는 EFFS(European Flood Forecasting System)과 NWSRFS(National Water Service River Forecast System)같이 이미 확률론적 홍수예측에 대한 연구 및 기술개발이 활발하게 진행되어지고 있다. 하지만 홍수예측의 확률론적 접근에 있어서는 많은 불확실성들이 내포되어 있으므로 예측시스템에서 생성된 앙상블 유량예측 결과의 신뢰도 분석과 올바른 불확실성 정보의 제공이 필요하다. 본 연구는 확률론적 홍수예측 방법을 국내에 적용시켜서 기상청의 예측시스템 KLAPS(Korea Local Analysis and Prediction System), MAPLE(McGill Algorithm for Precipitation Nowcasting by Lagrangian Extrapolation), UM(Unified Model) 그리고 MOGREPS(Met Office Global Regional Ensemble Prediction System)으로부터 생성된 기상앙상블을 현재 국토해양부 홍수통제소에서 사용하고 있는 강우-유출모형인 저류함수모형(Storage Function Method)의 입력 자료로 사용한다. 확률론적 홍수예측에서 오는 불확실성을 분석하기 위해서 첫 번째로 제공되는 기상예측 시스템의 시 공간적 스케일 및 대상유역의 공간특성에 따라 어떠한 형태로 전파되어지는지를 분석하였다. 두 번째는 각각의 예측시스템들이 선행기간(Lead time)에 따라 불확실성의 특성이 어떻게 나타나게 되는지를 확인하였다. 이러한 불확실성의 특성을 정확하게 파악하게 된다면 예측에 있어서 현재 갖고 있는 문제점들로부터 개선해 나가야 할 방향을 제시해주어 향후연구에 유용하게 활용될 수 있을 것이다.

  • PDF

낙동강유역 강우의 공간자기상관 특성분석을 통한 베이지안 앙상블 강우 검증 (Spatial Autocorrelation Characteristic Analysis on Bayesian ensemble Precipitation of Nakdong River Basin)

  • 문수진;손호영;강부식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.411-411
    • /
    • 2017
  • 유역 내 발생하는 강우의 공간적인 분포는 인접성 및 거리에 따라 달라질 수 있다. 공간자기상관 분석은 공간단위(유역 또는 행정구역)의 변수(강수 등)가 주변지역과 갖는 관계를 통해 얼마나 분산되어 있는지 혹은 군집되어 있는지를 판별하는 기법으로 최근 많은 연구에서 활성화 되고 있다. 본 연구에서는 낙동강유역을 대상으로 1980~2000년까지 20개년의 기상청을 통해 수집한 강우자료와 CMIP5(Coupled Model Intercomparison Project Phase 5)에서 제공하는 기후변화 자료 중 가용할 수 있는 20개 모델의 강우를 수집하였다. 기후변화 자료는 정상성 분위사상법으로 지역오차보정을 실시하고 불확실성을 저감하고자 베이지안 모델 평균기법을 통해 새로운 시계열을 생성하였다. 생성된 시계열의 공간적인 분포를 정량적으로 평가하고자 중권역별 공간자기상관 분석을 수행하였다. 대부분의 연구에서는 GIS를 활용하여 정성적으로 강우의 분포를 나타내고 있지만 본 연구에서는 공간단위의 인접성 또는 거리에 따른 척도를 기반으로 공간자기상관을 탐색할 수 있는 Moran's I와 LISA(Local Indicators of Spatial Association)기법을 적용하였다. Moran's I는 전체 연구지역에 대한 관계를 하나의 값으로 보여주는 전역적인 기법이며, LISA는 상대적으로 넓은 지역을 국지적으로 구분하여 특정지역에 대한 Hot spot 및 Cold spot을 통해 공간자기상관 정도를 나타내는 국지적인 기법이다. 두 기법을 적용하기 위하여 인접성 기반의 공간매트릭스를 산정하고 계절별 관측값과 베이지안 앙상블 강우의 Moran's I 및 LISA 분석을 실시하였다. 관측자료와 베이지안 앙상블 강우의 분석결과가 매우 유사하게 나타남으로써 베이지안 앙상블 강우의 공간적인 분포가 관측강우를 충분히 재현하고 있다고 판단된다.

  • PDF

기후변화 적응을 위한 사용자 중심의 기후서비스체계 제안 및 사용자인터페이스 플랫폼 개발 (Suggestion of User-Centered Climate Service Framework and Development of User Interface Platform for Climate Change Adaptation)

  • 조재필;정임국;조원일;이은정;강대인;이준혁
    • 한국기후변화학회지
    • /
    • 제9권1호
    • /
    • pp.1-12
    • /
    • 2018
  • There is an emphasis on the importance of adaptation against to climate change and related natural disasters. As a result, various climate information with different time-scale can be used for science-based climate change adaptation policy. From the aspects of Global Framework for Climate Services (GFCS), various time-scaled climate information in Korea is mainly produced by Korea Meteorological Administration (KMA) However, application of weather and climate information in different application sectors has been done individually in the fields of agriculture and water resources mostly based-on weather information. Furthermore, utilization of climate information including seasonal forecast and climate change projections are insufficient. Therefore, establishment of the Cooperation Center for Application of Weather and Climate Information is necessary as an institutional platform for the UIP (User Interface Platform) focusing on multi-model ensemble (MME) based climate service, seamless climate service, and climate service based on multidisciplinary approach. In addition, APCC Integrated Modeling Solution (AIMS) was developed as a technical platform for UIP focusing on user-centered downscaling of various time-scaled climate information, application of downscaled data into impact assessment modeling in various sectors, and finally producing information can be used in decision making procedures. AIMS is expected to be helpful for the increase of adaptation capacity against climate change in developing countries and Korea through the voluntary participation of producer and user groups within in the institutional and technical platform suggested.

이내비게이션을 활용한 해양환경관측 및 빅데이터 분석방안 (Methodology on e-Navigation-Assisted Ocean Monitoring and Big Data Analysis)

  • 이관홍;박재훈;하호경;김도완;이우주;김홍태;신현정
    • 한국해양학회지:바다
    • /
    • 제23권4호
    • /
    • pp.204-217
    • /
    • 2018
  • 본 연구에서는 이내비게이션 시스템이 장착된 연안 및 국제여객선을 활용하여 효율적으로 해양환경관측을 실시하고 관측된 해양 환경 빅데이터를 분석할 수 있는 방안을 제시하였다. 먼저, 이내비게이션 시스템과 운영 개념을 소개하고, 우리나라 연안의 해양환경모니터링 현황을 개괄한 후, 기존 관측망의 단점을 보완하고 장점을 강화할 수 있도록 이내비게이션을 활용한 해양환경모니터링 관측방법과 관측요소(기상, 물성, 유속 및 수심)를 제안하였다. 또한, 이내비게이션 시스템이 장착된 여객선에서 관측한 자료를 실시간으로 분석하는 시공간 혼합효과모형, 앙상블기법 및 무요소기법과 같은 해양빅데이터 분석 기법을 제안하였다. 본 연구는 연안 선박과 소형어선에 중점을 둔 한국형 이내비게이션 추진에 도움이 될 것으로 기대한다.