• Title/Summary/Keyword: 빈도-기반 모델

Search Result 361, Processing Time 0.031 seconds

Forecasting Model Design of Fire Occurrences with ARIMA Models (ARIMA모델에 기반한 화재발생 빈도 예측모델의 설계)

  • Ahn, Sanghun;Kang, Hoon;Cho, Jaehoon;Kim, Tae-Ok;Shin, Dongil
    • Journal of the Korean Institute of Gas
    • /
    • v.19 no.2
    • /
    • pp.20-28
    • /
    • 2015
  • A suitable monitoring method is necessary for successful policy implementation and its evaluation, required for effective prevention of abnormal fire occurrences. To do this, there were studies for applying control charts of quality management to fire occurrence monitoring. As a result, it was proved that more fire occurs in winter and its trend moves yearly-basis with some patterns. Although it has trend, if we apply the same criteria for each time, inefficient overreacting fire prevention policy will be accomplished in winter, and deficient policy will be accomplished in summer. Thus, applying different control limits adaptively for each time would enable better forecasting and monitoring of fire occurrences. In this study, we treat fire occurrences as time series model and propose a method for configuring its coefficients with ARIMA model. Based on this, we expect to carry out advanced analysis of fire occurrences and reasonable implementation of prevention activities.

Value of the SMILEs for research on water-related compound hazards under climate change impact (기후변화 및 물 관련 복합재해 연구를 위한 SMILE 활용의 가치)

  • Wooyoung, Na
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.348-348
    • /
    • 2023
  • 최근 전세계 곳곳에서는 다양한 유형의 물 관련 복합재해가 발생하고 있다. 일례로 미국 캘리포니아 지역은 2014년부터 2017년까지 극심한 가뭄에 시달리다가 대기강(atmospheric river)의 영향으로 인하여 대규모의 홍수가 잇달아 발생하였다. 유럽에서는 2021년 전례 없는 홍수 직후 500년 빈도의 가뭄이 발생하면서 심각한 인명 및 재산피해가 발생하였다. 짧은 시간 동안 양극단의수재해가 연속적으로 발생하거나, 가뭄과 폭염, 홍수와 산사태의 결합, 또는 동시에 여러 지역에서 홍수나 가뭄이 발생하는 현상 등도 복합재해에 해당한다. 즉, 복합재해는 서로 다른 특성의 독립적인 수재해가 결합되어 나타나는 재해의 한 형태로써, 발생 빈도는 적으나 유발되는 피해는 매우 크다. 더욱이 복합재해는 미래에 더욱 빈번하게, 극심하게 발생할 것으로 예상되고 있다. Single Model Initial-condition Large Ensemble (SMILE)은 복합재해의 분석에 적합한 자료로 최근 활용사례가 증가하고 있다. 기존의 기후변화 관련 연구는 여러 기후모델에서 생산한 단일 모의자료를 앙상블의 형태로 이용하여 기후요소 및 기후재해의 미래 전망이나 거동을 분석하는 과정에 기반해왔다. 이 기후모델 앙상블은 모델 간 불확실성은 고려할 수 있으나 기온 상승 시나리오의 불확실성 및 기후 시스템 내부의 변동성은 고려하지 못하는 한계가 있다. 이에 미국의 National Center for Atmospheric Research에서는 자연 자체의 변동에 의한 불확실성을 모의할 수 있는 SMILE을 개발하였다. SMILE은 단일 기후모델에서 N개의 다중 모의자료 앙상블을 출력한다. 기존의 기후모델과 유사한 과정으로 모의를 수행하되, 미세한 섭동을 부여함으로써 자연적으로 발생하는 기후시스템 내부의 변동성을 고려한다. 이러한 실험 설정은 카오스 이론에 근거한다. 여러 기후모델에 대해 SMILE 기반 모의를 수행하면 앙상블의 앙상블 개념(large ensemble)이므로 방대한 양의 기후모의 자료가 확보되어 다양한 목적의 연구에 활용할 수 있다. SMILE은 기존의 다중 기후모델 앙상블이 고려할 수 없었던 종류의 불확실성을 추가적으로 고려함으로써 인간의 활동과 자연적 변동성이 복합재해에 미치는 상대적 영향을 정량적으로 평가할 수 있게 한다. 복합재해 연구에 필수적인 표본 수 부족의 한계를 극복할 수 있기 때문에 최근 기후변화 및 수자원 관련 연구에서 적극적으로 활용되고 있다. 또한, 미래 기후를 모의하기 때문에 복합재해 발생의 특성 및 거동을 전망할 수 있고, 충분한 수의 표본은 통계분석 결과에 신뢰성을 부여할 수 있다. 이러한 SMILE의 장점은 향후 더욱 다양한 연구의 기회를 제공할 것이다.

  • PDF

An AutoEncoder Model based on Attention and Inverse Document Frequency for Classification of Creativity in Essay (에세이의 창의성 분류를 위한 어텐션과 역문서 빈도 기반의 자기부호화기 모델)

  • Se-Jin Jeong;Deok-gi Kim;Byung-Won On
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.624-629
    • /
    • 2022
  • 에세이의 창의성을 자동으로 분류하는 기존의 주요 연구는 말뭉치에서 빈번하게 등장하지 않는 단어에 초점을 맞추어 기계학습을 수행한다. 그러나 이러한 연구는 에세이의 주제와 상관없이 단순히 참신한 단어가 많아 창의적으로 분류되는 문제점이 발생한다. 본 논문에서는 어텐션(Attention)과 역문서 빈도(Inverse Document Frequency; IDF)를 이용하여 에세이 내용 전달에 있어 중요하면서 참신한 단어에 높은 가중치를 두는 문맥 벡터를 구하고, 자기부호화기(AutoEncoder) 모델을 사용하여 문맥 벡터들로부터 창의적인 에세이와 창의적이지 않은 에세이의 특징 벡터를 추출한다. 그리고 시험 단계에서 새로운 에세이의 특징 벡터와 비교하여 그 에세이가 창의적인지 아닌지 분류하는 딥러닝 모델을 제안한다. 실험 결과에 따르면 제안 방안은 기존 방안에 비해 높은 정확도를 보인다. 구체적으로 제안 방안의 평균 정확도는 92%였고 기존의 주요 방안보다 9%의 정확도 향상을 보였다.

  • PDF

Assessment of Frequency Analysis using Daily Rainfall Data of HadGEM3-RA Climate Model (HadGEM3-RA 기후모델 일강우자료를 이용한 빈도해석 성능 평가)

  • Kim, Sunghun;Kim, Hanbeen;Jung, Younghun;Heo, Jun-Haeng
    • Journal of Wetlands Research
    • /
    • v.21 no.spc
    • /
    • pp.51-60
    • /
    • 2019
  • In this study, we performed At-site Frequency Analysis(AFA) and Regional Frequency Analysis(RFA) using the observed and climate change scenario data, and the relative root mean squared error(RMMSE) was compared and analyzed for both approaches through Monte Carlo simulation. To evaluate the rainfall quantile, the daily rainfall data were extracted for 615 points in Korea from HadGEM3-RA(12.5km) climate model data, one of the RCM(Regional Climate Model) data provided by the Korea Meteorological Administration(KMA). Quantile mapping(QM) and inverse distance squared methods(IDSM) were applied for bias correction and spatial disaggregation. As a result, it is shown that the RFA estimates more accurate rainfall quantile than AFA, and it is expected that the RFA could be reasonable when estimating the rainfall quantile based on climate change scenarios.

Text Undestanding System for Summarization (텍스트 이해 모델에 기반한 정보 검색 시스템)

  • Song, In-Seok;Park, Hyuk-Ro
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.1-6
    • /
    • 1997
  • 본 논문에서는 인지적 텍스트 이해 모형을 제시하고 이에 기반한 자동 요약 시스템을 구현하였다. 문서는 정보의 단순한 집합체가 아닌 정형화된 언어 표현 양식으로서 단어의 의미적 정보와 함께 표현 양식, 문장의 구조와 문서의 구성을 통해 정보를 전달한다. 요약 목적의 텍스트 이해 및 분석 과정을 위해 경제 분야 기사 1000건에 대한 수동 요약문을 분석, 이해 모델을 정립하였고. 경제 분야 기사 1000건에 대한 테스트 결과를 토대로 문장간의 관계, 문서의 구조에서 요약 정보 추출에 사용되는 정보를 분석하였다. 본 텍스트 이해 모형은 단어 빈도수에 의존하는 통계적 모델과 비교해 볼 때, 단어 간의 관련성을 찾아내고, 문서구조정보에 기반한 주제문 추출 및 문장간의 관계를 효과적으로 사용함으로서 정보를 생성한다. 그리고 텍스트 이해 과정에서 사용되는 요약 지식과 구조 분석정보의 상관관계를 체계적으로 연결함으로서 자동정보 추출에서 야기되는 내용적 만족도 문제를 보완한다.

  • PDF

Software Development Effort Estimation Using Neural Network Model (신경망 기반의 소프트웨어 개발노력 추정모델 구축에 관한 연구)

  • Kim, Byung-Gwan;Baek, Seung
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2005.05a
    • /
    • pp.372-380
    • /
    • 2005
  • 소프트웨어 개발노력 추정에 대한 연구는 소프트웨어가 복잡해지고 범위가 크게 증가함에 따라서 그 중은 지속적으로 부각되고 있다. 관련 프로젝트를 발주하는 업체나, 이를 수주하고 개발을 진행하는 업체에게 원가를 고려하는 측면에서 매우 중요한 부분을 차지하고 있다. 이러한 개발노력 추정을 위하여 다양한 접근 방식들이 고려되어지고 있는데, 그중에서 많이 활용되어지고 있는 방식은 소프트웨어 규모에 기반을 둔 LOC(Line Of Code) 기반 COCOMO (Constructive Cost Model) 모델이나 기능점수(Function Point)를 기반으로 한 회귀분석 모델, 인공지능(Artificial Intelligence)을 활용한 신경망(Neural Network) 모델, 사례분석기법 (CBR, Case Based Reasoning) 등이 있다. 이중에서 최근에 기능점수를 활용한 개발노력 추정에 관한 연구들이 활발히 진행되고 있으나 개발노력 추정에는 소프트웨어 규모의 척도인 기능점수 뿐만 아니라, 개발환경을 구성하는 여러 가지 측면에 대한 고려가 추가되어져야 한다. 이에 본 논문은 최신의 소프트웨어 개발 사례들에 대하여 기능점수 및 추가적인 개발환경 요소들을 면밀히 분석하고, 분석한 내용에 대해서 전문가들의 설문을 통한 빈도분석 및 로지스틱 회귀분석, 데이터마이닝 기법인 신경망 분석 등을 활용하여 개발노력 추정 모델을 구축함으로써, 소프트웨어 개발의 다양한 측면의 중요성을 강조하고, 정확한 추정의 방안을 제시 하고자 노력 하였다.

  • PDF

Word Sense Similarity Clustering Based on Vector Space Model and HAL (벡터 공간 모델과 HAL에 기초한 단어 의미 유사성 군집)

  • Kim, Dong-Sung
    • Korean Journal of Cognitive Science
    • /
    • v.23 no.3
    • /
    • pp.295-322
    • /
    • 2012
  • In this paper, we cluster similar word senses applying vector space model and HAL (Hyperspace Analog to Language). HAL measures corelation among words through a certain size of context (Lund and Burgess 1996). The similarity measurement between a word pair is cosine similarity based on the vector space model, which reduces distortion of space between high frequency words and low frequency words (Salton et al. 1975, Widdows 2004). We use PCA (Principal Component Analysis) and SVD (Singular Value Decomposition) to reduce a large amount of dimensions caused by similarity matrix. For sense similarity clustering, we adopt supervised and non-supervised learning methods. For non-supervised method, we use clustering. For supervised method, we use SVM (Support Vector Machine), Naive Bayes Classifier, and Maximum Entropy Method.

  • PDF

Properties and Quantitative Analysis of Bias in Korean Language Models: A Comparison with English Language Models and Improvement Suggestions (한국어 언어모델의 속성 및 정량적 편향 분석: 영어 언어모델과의 비교 및 개선 제안)

  • Jaemin Kim;Dong-Kyu Chae
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.558-562
    • /
    • 2023
  • 최근 ChatGPT의 등장으로 텍스트 생성 모델에 대한 관심이 높아지면서, 텍스트 생성 태스크의 성능평가를 위한 지표에 대한 연구가 활발히 이뤄지고 있다. 전통적인 단어 빈도수 기반의 성능 지표는 의미적인 유사도를 고려하지 못하기 때문에, 사전학습 언어모델을 활용한 지표인 BERTScore를 주로 활용해왔다. 하지만 이러한 방법은 사전학습 언어모델이 학습한 데이터에 존재하는 편향으로 인해 공정성에 대한 문제가 우려된다. 이에 따라 한국어 사전학습 언어모델의 편향에 대한 분석 연구가 필요한데, 기존의 한국어 사전학습 언어모델의 편향 분석 연구들은 사회에서 생성되는 다양한 속성 별 편향을 고려하지 못했다는 한계가 있다. 또한 서로 다른 언어를 기반으로 하는 사전학습 언어모델들의 속성 별 편향을 비교 분석하는 연구 또한 미비하였다. 이에 따라 본 논문에서는 한국어 사전학습 언어모델의 속성 별 편향을 비교 분석하며, 영어 사전학습 언어모델이 갖고 있는 속성 별 편향과 비교 분석하였고, 비교 가능한 데이터셋을 구축하였다. 더불어 한국어 사전학습 언어모델의 종류 및 크기 별 편향 분석을 통해 적합한 모델을 선택할 수 있도록 가이드를 제시한다.

  • PDF

Analyzing the drought event in 2015 through statistical drought frequency analysis (통계학적 가뭄빈도분석 기법을 통한 2015년 가뭄사상에 대한 분석)

  • Lee, Taesam;Son, Chanyoung
    • Journal of Korea Water Resources Association
    • /
    • v.49 no.3
    • /
    • pp.177-186
    • /
    • 2016
  • Drought is a water-related natural disaster which can be simply described as spatially and temporally sequential absence of water. However, its characteristics are very difficult to define. For this reason, the preparation and mitigation from drought events have not been successful. In the current study, we illustrated a design drought estimation approach of water resources infrastructures as well as the existing theoretical one to prepare and mitigate drought disasters. Theoretical and simulation methods were tested including three time series models such as autoregressive (AR), Gamma AR, Copula AR models. The results indicated that for South Korea region, the simulation-based method to estimate drought frequency presented better performance and all the three time series models show similar performance to each other. The current drought event occurring in South Korea was investigated with dividing South Korea into four basins as Han River, Nakdong River, Geum River, and Nakdong River basins. The results showed that two middle and north basins presented significant drought events with 3 year drought duration and around 40 year return period while the other two southern regions illustrated relatively weaker drought events.

Development and Evaluation of Flood Prediction Models Using Artificial Intelligence Techniques (인공지능 기법을 활용한 홍수예측모델 개발 및 평가 - 한강수계 댐을 중심으로 -)

  • Cho, Hemie;Uranchimeg, Sumiya;Yoo, Je-Ho;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.131-131
    • /
    • 2022
  • 기후변화의 영향으로 극치강우의 변동성이 커지고 있으며 계획빈도를 초과하는 폭우로 피해가 증가하고 있다. 기존의 물리기반의 홍수예측모델은 개념적 및 구조적 제약과 함께 다양한 유역조건 및 수문기상 조건에 기인한 강우-유출 관계의 불확실성을 고려하는 데 한계가 있다. 특히 한정된 홍수 사상을 통해 구축된 관측 자료로 인해 새로운 홍수 사상 예측 능력이 저조할 수밖에 없다. 따라서 기존 물리모형 기반의 홍수예측과 함께, 딥러닝(deep learning) 모형을 고려한 홍수예측 모델 개발과 개선이 필요하다. 본 연구에서는 다양한 분야에서 활용되는 인공지능(artificial intelligence, AI) 기술을 종합적으로 검토하고, 홍수 예측 측면에서의 활용 가능성 및 신뢰성을 고려하여 AI 기법을 채택하였다. 한강수계에 존재하는 댐 중 일부를 선정하여 대상 댐의 수문·기상학적 자료를 전처리한 후, 인공지능 기반의 홍수예측모형을 구축 및 최적화하였다. 다양한 예측인자와 모델 구성으로 홍수예측력에 대한 평가를 다각적으로 수행함으로써 홍수예측모델의 신뢰성을 제고하였다. 전반적으로 우수한 결과를 도출하였고, 유역면적이 작을수록 결과가 좋았다. 이는 넓은 유역일수록 복잡한 강우-유출 과정이 내재되어 있기 때문으로 판단되며, 넓은 유역에는 본 연구에서 활용한 자료에 추가적인 자료를 도입하여 모형 개선이 이루어져야 할 것으로 판단하였다. 수문 예측 연구에 통계모형이나 기계학습모형의 적용은 많이 있었지만, 딥러닝 기법 활용은 새로운 시도라는 점에서 의미가 있다.

  • PDF