• Title/Summary/Keyword: 빈도-기반 모델

Search Result 362, Processing Time 0.058 seconds

Changes projection in the Future Extreme Precipitation over South Korea using the HadGEM3-RA (HadGEM3-RA를 이용한 한반도 미래 극한강수 변화 전망)

  • Sung, Jang-Hyun;Kang, Hyun-Suk;Park, Su-Hee;Cho, Chun-Ho;Kim, Young-Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.343-343
    • /
    • 2012
  • 미래 극한사상의 초과확률을 산정하기 위하여 저해상도의 전지구 기후변화 시나리오 자료를 그대로 사용하거나 이를 역학적 또는 통계적 방법으로 상세화한 고해상도 기후변화 시나리오 자료를 활용한다. 통계적 상세화는 전지구 또는 지역기후모델의 현재기후 모의 자료와 관측 자료와의 통계적 관계를 미래 예측자료에 적용하는 방법으로, 현재와 미래 기후의 시공간적 분포가 동일하다는 가정을 포함하고 있다. 반면 역학적 상세화 방법은 기후변화 강제력을 고려하는 지역기후모델을 이용하여 기후시스템의 역학 및 물리과정, 기후시스템간 의 상호작용, 기후변화의 비정상성 등을 고려할 수 있고, 변수간의 시공간적 상관성을 지구시스템의 물리 역학적 과정으로 해석할 수 있다는 장점이 있다. 이에 국립기상연구소에서는 영국 기상청의 통합모델(UM)기반의 지역기후모델(HadGEM3)을 사용하여 50 km 및 12.5 km 격자 단위로 역학적 상세화(dynamic downscaling)를 수행하였다. 본 연구에서는 역학적 상세화로 생산된 HadGEM3-RA 자료를 이용하여 현재기후(1980-2005), 가까운 미래(2020-2049)와 21세기말(2070-2099)의 20년 빈도 강수량을 비교하였다. 연구결과, 남한에 걸쳐 현재기후에 비하여 미래에는 극한강수의 크기와 빈도가 전반적으로 증가하는 경향을 확인할 수 있었다. 20년에 한번씩 발생하였던 일 극한강수는 RCP8.5를 고려한 21세기말에는 약 4년에 한번씩 발생하리라 전망되었다.

  • PDF

A Spam Filtering Method using Frequency Distribution of Special Letter and Frequency Ratio of Keyword (특수 문자 및 단어 빈도 비율을 이용한 스팸 필터링 방법)

  • Lee, Seong-Jin;Baik, Jong-Bum;Han, Chung-Seok;Lee, Soo-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.280-283
    • /
    • 2011
  • 인터넷 환경에서 무차별적으로 유통되는 스팸 문서로 인한 사회적 문제가 커져 가고 있는 가운데 스팸문서를 차단하기 위한 활발한 연구들이 이루어지고 있다. 이 가운데 대표적인 연구는 자질어를 이용한 기계학습 기반의 스팸 차단 기술이다. 그러나 이 방법은 미리 선택된 자질어로만 구성된 분류 모델을 사용하기 때문에 Term Spamming(단어 조작에 의한 스팸 차단 행위)에 취약하며, 스팸 차단의 성능과 학습 소요 시간이 선택된 자질어의 품질과 수에 민감하게 영향을 받는다는 문제점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 스팸 문서에서 등장하는 특수 문자의 빈도와 반복되는 단어의 특징을 이용한 스팸 탐지 방법을 제안한다. 제안 방법은 각 문서에서 등장하는 특수 문자의 비율과 최다 출현 단어의 반복 패턴을 정의하고 기계학습 알고리즘을 적용하여 스팸 분류 모델을 생성한다. 제안 방법의 성능 평가를 위해 E-mail 데이터와 블로그의 Post 데이터를 사용하여 자질어 기반의 스팸 차단 방법과 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방법이 분류 정확도와 학습 소요 시간에 있어 우수한 성능을 보이는 것을 확인하였다.

Derivation of intensity-duration-frequency(IDF) curves based on AR6 SSP climate change scenario (AR6 SSP 기후변화 시나리오 기반 미래 IDF 곡선 산출)

  • Yu, Jae-Ung;Park, Moon Hyung;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.57-57
    • /
    • 2022
  • 국내의 댐·하천 설계기준은 다양한 수자원 시설물 설계 시에 활용되고 있으나, 강우사상에 대한 분석은 과거의 강우 사상에 대한 통계분석에 따라 수행되어 기후변화의 영향을 고려하지 않고 있다. 또한, 하천 설계기준에서는 홍수량 산정에 대한 방안을 명시한 바에 따르면, 홍수량 산정 표준지침에서 활용하는 빈도해석을 활용하는 방안 또는 강우-유출모형을 활용한 방안을 제시하고 있으나, 홍수량 산정 표준지침 역시 미래 강수 변화에 대한 구체적인 방안을 반영하지 않고 있는 실정이다. 전 세계적인 기후변화는 국내의 기후변동성을 증가시켜 극한강우사상의 빈도와 강도를 증대시키므로 이를 고려한 미래강우에 대한 분석이 필요한 시점이다. 일반적으로 기후 전망에 활용되는 전지구 모델(Global Climate Model; GCM)은 한반도의 복잡한 지형을 고려하기 어려우므로 지역적인 강제력을 보다 효과적으로 고려하기 위하여 지역기후모델(Regional Climate Model; RCM)을 사용하고 있다. 역학적으로 상세화 된 RCM은 비교적 고해상도의 자료를 제공하고 있으나, 강수량을 전반적으로 과소 추정하는 것으로 알려지고 있다. 본 연구에서는 지속시간 1-24시간 연최대 강우량(annual maximum rainfalls; AMRs)과 역학적 상세화 된 SSP 시나리오 일 자료를 활용하며, Copula 함수 기반의 상세화 모형을 통해 Sub-Daily 정보를 시간적으로 상세화 하였다. 최종적으로 이를 활용하여 미래 IDF 곡선을 유도하였다. 산정된 IDF 곡선 결과를 활용하여 기후변화의 영향을 고려한 설계강수량 변화량을 정량적으로 제시하고자 한다.

  • PDF

Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports (다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석)

  • Ryang, Heungmo;Yun, Unil
    • Journal of Internet Computing and Services
    • /
    • v.14 no.6
    • /
    • pp.1-8
    • /
    • 2013
  • Data mining techniques are used to find important and meaningful information from huge databases, and pattern mining is one of the significant data mining techniques. Pattern mining is a method of discovering useful patterns from the huge databases. Frequent pattern mining which is one of the pattern mining extracts patterns having higher frequencies than a minimum support threshold from databases, and the patterns are called frequent patterns. Traditional frequent pattern mining is based on a single minimum support threshold for the whole database to perform mining frequent patterns. This single support model implicitly supposes that all of the items in the database have the same nature. In real world applications, however, each item in databases can have relative characteristics, and thus an appropriate pattern mining technique which reflects the characteristics is required. In the framework of frequent pattern mining, where the natures of items are not considered, it needs to set the single minimum support threshold to a too low value for mining patterns containing rare items. It leads to too many patterns including meaningless items though. In contrast, we cannot mine any pattern if a too high threshold is used. This dilemma is called the rare item problem. To solve this problem, the initial researches proposed approximate approaches which split data into several groups according to item frequencies or group related rare items. However, these methods cannot find all of the frequent patterns including rare frequent patterns due to being based on approximate techniques. Hence, pattern mining model with multiple minimum supports is proposed in order to solve the rare item problem. In the model, each item has a corresponding minimum support threshold, called MIS (Minimum Item Support), and it is calculated based on item frequencies in databases. The multiple minimum supports model finds all of the rare frequent patterns without generating meaningless patterns and losing significant patterns by applying the MIS. Meanwhile, candidate patterns are extracted during a process of mining frequent patterns, and the only single minimum support is compared with frequencies of the candidate patterns in the single minimum support model. Therefore, the characteristics of items consist of the candidate patterns are not reflected. In addition, the rare item problem occurs in the model. In order to address this issue in the multiple minimum supports model, the minimum MIS value among all of the values of items in a candidate pattern is used as a minimum support threshold with respect to the candidate pattern for considering its characteristics. For efficiently mining frequent patterns including rare frequent patterns by adopting the above concept, tree based algorithms of the multiple minimum supports model sort items in a tree according to MIS descending order in contrast to those of the single minimum support model, where the items are ordered in frequency descending order. In this paper, we study the characteristics of the frequent pattern mining based on multiple minimum supports and conduct performance evaluation with a general frequent pattern mining algorithm in terms of runtime, memory usage, and scalability. Experimental results show that the multiple minimum supports based algorithm outperforms the single minimum support based one and demands more memory usage for MIS information. Moreover, the compared algorithms have a good scalability in the results.

A Rule Extraction Method Using Relevance Factor for FMM Neural Networks (FMM 신경망에서 연관도요소를 이용한 규칙 추출 기법)

  • Lee, Seung-Kang;Lee, Jae-Hyuk;Kim, Ho-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.377-380
    • /
    • 2012
  • 본 연구에서는 학습데이터의 빈도요소를 반영하도록 수정된 구조의 FMM 신경망을 소개하고, 이로부터 패턴 분류를 위한 지식 표현을 생성하는 방법론을 제안한다. 하이퍼박스 멤버쉽함수는 5종류의 퍼지 분할을 기반으로 설정한 구간에 대하여 소속정도를 반영하여 결정하며, 각 차원별로 특징범위의 폭과 빈도 요소로부터 가중치 값이 학습된다. 본 연구에서는 제안된 이론을 수화인식 문제를 대상으로 고찰하였다. 인식 시스템의 구성은 특징추출을 위하여 3차원으로 확장된 구조의 CNN 모델을 사용하였으며, 수화패턴 데이터의 표현은 모션 히스토리 볼륨(Motion History Volume) 구조를 기반으로 하였다. 6종류의 수화패턴 동영상으로부터 27개 특징요소를 추출하고 이를 사용한 FMM 신경망의 학습과정과 지식의 추출 과정을 실험으로 보이고 그 유용성을 고찰한다.

A Non-stationary frequency analysis for annual daily maximum rainfalls(ADMRs) using mixed Gumbel distribution of bayesian approach (Bayesian 기법의 혼합 Gumbel 분포를 활용한 연최대일강우량에 대한 비정상성 빈도해석)

  • Choi, Hong-Geun;Yoo, Min-Seok;Han, Young-Cheon;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.312-312
    • /
    • 2018
  • 우리나라의 기후 지형적 특성에 따라 연강수량의 50% 이상이 여름철에 내리며 이러한 짧은 기간에 집중적으로 내리는 강수패턴 조건하에서 수공구조물 설계시 대부분 극치빈도분석을 활용한다. 우리나라의 경우 단일 Gumbel 분포를 활용한 극치빈도분석을 많이 이용한다. 하지만, 최근 이상기후로 인하여 전세계적으로 강수패턴의 특징이 급격히 변하고 있으며, 우리나라의 강수패턴 또한 바뀌어가고 있다. 연강수량의 대부분은 태풍과 장마로 인한 강수량으로 이루어져 있고, 일반적으로 두 개의 모집단으로 이루어진 형태를 보인다. 앞선 연구에서 두 개 이상의 첨두를 가지는 형태의 연최대강수량 자료에 대해 8개의 지속시간별(1, 2, 3, 6, 9, 12, 18, 24hr)로 Bayesian 기법의 단일 Gumbel 분포형과 혼합 Gumbel분포형 기반의 극치빈도분석 결과를 비교하였고, 혼합 Gumbel 분포형이 이중첨두 부분의 거동을 효과적으로 모의하는 것을 확인하였다. 본 연구에서는 이상기후로 인한 강수량의 특징의 급격한 변화에 일정한 패턴이 있음을 가정하고 이중첨두의 연 최대일강수량 자료에 대해 혼합 Gumbel 분포형 기반 비정상성 빈도분석을 실시하였다. 정상성 빈도분석과의 비교를 위해 확률분포의 매개변수 산정시 우도함수를 Bayesian 기법을 통해 산정하여 각 분포형의 Bayesian information criterion(BIC) 값을 비교하였다. 비정상성일 경우의 BIC 값이 정상성일 경우 보다 작게 산정되었고, 강수패턴이 경향성을 가지는 것으로 판단할 수 있었다. 비정상성 혼합 Gumbel 분포형 모델은 최근 급격한 강수패턴의 변화에 대한 대응책으로서 활용성이 높을 것으로 기대된다.

  • PDF

Uncertainty assessment of point and regional frequency analysis using Bayesian method (베이지안기법을 이용한 지점 및 지역빈도해석의 불확실성 평가)

  • Lee, Jeonghoon;Lee, Okjeong;Kim, Sangdan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.406-406
    • /
    • 2021
  • 극한강우사상의 분석은 다양한 극치 분포로 구성된 극치이론을 통해 가능하다. 일반적으로 단일 지점의 극한사상의 분석을 위한 지점빈도해석 (Point Frequency Analysis, PFA)이 다양한 재현기간에 해당하는 강우량을 추정하는데 널리 사용되어왔다. 하지만 수문기후학적 극치기록은 시간적 그리고 공간적으로 제한적이다. 따라서 모의 불확실성을 줄이고 신뢰성 높은 결과를 도출하기 위해 서로 유사한 분포를 가질 수 있는 인근 지점의 활용하는 지역빈도해석 (Regional Frequency Analysis, RFA) 방법이 개발되어 적용되고 있다. 본 연구에서는 부산, 울산, 경남지역의 기상청 종관기상관측시스템(Automated Synoptic Observing System, ASOS) 울산, 부산, 통영, 진주, 거창, 합천, 밀양, 산청, 거제, 남해지점 일강수량을 자료를 기반으로 Metropolis-Hasting 알고리즘을 사용하여 일반극치분포(Generalized Extreme Value, GEV)의 매개변수를 추정하고 PFA 및 RFA의 불확실성을 평가하고자 한다. 이러한 연구는 공간적 구성 요소(예, 지리적 좌표, 고도)를 고려하지 못하며 추가변수 (예, 공변량)를 분석에 결합할 수 없는 등의 RFA의 한계를 극복하고, 명시적으로 불확실성을 추정하여 결과의 신뢰성을 확보 할 수 있는 계층적 베이지안 모델의 개발에 도움이 되리라 기대된다.

  • PDF

Assessing the future extreme dry and wet conditions in East Asia using CMIP6-BGC (CMIP6-BGC 기반 동아시아 지역 극한 건조 및 습윤 상태 평가)

  • Jaehyeong Lee;Yeonjoo Kim
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.411-411
    • /
    • 2023
  • 미래 대기 이산화탄소 농도가 증가함에 따라 강수 등 기후의 변화하고, 이는 유출량을 포함한 수문 순환 뿐 아니라 지면 식생 생장에 영향을 줄 것으로 예상된다. 이에 본 연구에서는 미래 CO2 증가에 따른 식생의 변화와 이로 인한 지표 유출량의 변화에 대해 이해하고자 한다. Intergovernmental Panel on Climate Change (IPCC) 6차 평가보고서에서 제시한 표준 온실가스 경로 중 탄소 모듈이 포함된 Coupled Model Intercomparison Project phase 6 biogeochemistry (CMIP6-BGC) 모델과 탄소 모듈이 포함안된 CMIP6 모델 결과를 활용하였다. 공통 사회경제경로 시나리오(Shared Socio-economic Pathway; SSP) 중 고탄소 시나리오인 SSP585에 따른 모델 결과물을 활용하였다. 표면 유출량 자료에 과거 기간 임계수준 방법을 (Threshold Level Method) 적용하여 동아시아 지역 극한 건조 및 습윤 상태의 빈도와 강도를 CMIP6-BGC와 CMIP6에 대해 평가하였다. CMIP6-BGC 경우, 건조 및 습윤 상태의 빈도는 각각 6.17%, 5.03% , CMIP6 경우 각각 9.29%, 6.70% 으로 예측되어, CMIP6-BGC가 CMIP6 보다 극한 상태를 과소평가하는 경향을 보였다. 또한, 잎 면적 지수(Leaf Area Index; LAI), 증산량 등의 변수를 분석하여, 기 도출된 CMIP6-BGC와 CMIP6 간의 극한 건조 및 습윤 상태 예측의 차이가 발생한 메카니즘을 이해하고자 하였다.

  • PDF

Hydrological Modeling for Estimation of Runoff in Unmeasured Mountainous Area: Application to the Var Sub-Catchment, France (미계측 산간지역의 유량추정을 위한 수문 모델링: 프랑스 Var 소유역에 적용)

  • Ji Yun Jang
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.256-256
    • /
    • 2023
  • 집중호우는 전 세계적으로 큰 기후변화 문제 중 하나다. 극심한 집중호우의 빈도수는 지구 온난화로 인해 지난 세기 중반 이후부터 점차 증가하고 있으며 그로인한 인적 및 물적인 피해 또한 증가하고 있다. 이러한 손상을 방지하기 위해서는 적절한 설계 홍수량을 계산하는 것이 중요하다. 최근에는 미계측지역의 유출량 추정 시 분포형 강우-유출 모델을 이용한다. 분포형 모델의 가장 큰 장점은 소유역의 분할 과정을 거칠 필요 없이 유역에서 무작위 점의 유출을 시뮬레이션 할 수 있다는 것이다. 본 연구에서는 2000년 11월 니스에 발생했던 강우를 기반으로 Var 유역의 소유역이자 미계측 지역인 프랑스 니스의 Ubac Vallone의 유출량 및 유출계수를 지형 데이터 등의 물리적 인자와 분포형 강우-유출모델인 MIKE SHE를 이용하여 추정하였다. 또한, 입력되는 인자의 상대적 중요성을 파악하기 위해 민감도 분석을 수행하였다. 본 연구에서는 각 인자에 대한 상대민감도 분석을 바탕으로, 유출량에 상대적으로 큰 영향을 미치는 인자를 제안하였다. 연구 결과, 50년, 100년 및 162년 빈도별 확률강우량에 따른 유출량을 추정하였으며, 162년의경우 총 유출량은 124,384.8m3, 최대 유출량 1.512m3/s, 유출계수 0.53으로 나타났다. 총 유출량과 첨두유량에 대한 상대 민감감도 분석 결과, 수리전도도가 1.5로 첨두유량과의 민감도가 높게 나타났으며, 대수층의 수평방향 수리전도도는 0.48로 총 유출량과의 민감도가 높게 나타났다

  • PDF

A Study on Asthmatic Occurrence Using Deep Learning Algorithm (딥러닝 알고리즘을 활용한 천식 환자 발생 예측에 대한 연구)

  • Sung, Tae-Eung
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.7
    • /
    • pp.674-682
    • /
    • 2020
  • Recently, the problem of air pollution has become a global concern due to industrialization and overcrowding. Air pollution can cause various adverse effects on human health, among which respiratory diseases such as asthma, which have been of interest in this study, can be directly affected. Previous studies have used clinical data to identify how air pollutant affect diseases such as asthma based on relatively small samples. This is high likely to result in inconsistent results for each collection samples, and has significant limitations in that research is difficult for anyone other than the medical profession. In this study, the main focus was on predicting the actual asthmatic occurrence, based on data on the atmospheric environment data released by the government and the frequency of asthma outbreaks. First of all, this study verified the significant effects of each air pollutant with a time lag on the outbreak of asthma through the time-lag Pearson Correlation Coefficient. Second, train data built on the basis of verification results are utilized in Deep Learning algorithms, and models optimized for predicting the asthmatic occurrence are designed. The average error rate of the model was about 11.86%, indicating superior performance compared to other machine learning-based algorithms. The proposed model can be used for efficiency in the national insurance system and health budget management, and can also provide efficiency in the deployment and supply of medical personnel in hospitals. And it can also contribute to the promotion of national health through early warning of the risk of outbreak by atmospheric environment for chronic asthma patients.