• 제목/요약/키워드: 빈도-기반 모델

검색결과 365건 처리시간 0.032초

ARIMA모델에 기반한 화재발생 빈도 예측모델의 설계 (Forecasting Model Design of Fire Occurrences with ARIMA Models)

  • 안상훈;강훈;조재훈;김태옥;신동일
    • 한국가스학회지
    • /
    • 제19권2호
    • /
    • pp.20-28
    • /
    • 2015
  • 화재를 예방하기 위해서는 그에 필요한 정책과 평가가 필요하며, 화재 발생에 대한 적절한 모니터링 기법이 있어야 한다. 이를 위해 품질관리의 기법중의 하나인 관리도를 화재 모니터링에 적용하는 연구가 진행된 바 있다. 그 결과, 통계적으로 겨울에는 많은 화재가 발생한다는 것이 증명되었고, 매년마다 어떤 주기를 띠고 변화한다는 것이 발견되었다. 그럼에도 불구하고, 여름철과 겨울철에 동일한 기준(관리한계선)을 적용할 경우 상대적으로 발생건수가 과다한 겨울에는 과도한 예방활동이 진행되고, 여름에는 잠재이상이 있는 경우에도 발생건수 감소에 따른 착시현상으로 인해 활동이 부족해질 가능성이 있다. 이때, 각 계절별로 다른 관리 한계선을 적용시킨다면 합리적인 예측과 보다 효과적인 이상 패턴의 모니터링이 가능해질 수 있다. 따라서 본 연구에서는 발생건수를 대상으로 시간에 따라 변하는 시계열 모델을 사용하여 화재발생 빈도 예측 모델계수의 체계적인 설정과정을 ARIMA 모델을 기반으로 제안하였다. 이를 바탕으로 화재발생 패턴의 개선된 분석과 이에 기반한 보다 체계적인 예방활동을 진행할 수 있을 것으로 기대한다.

기후변화 및 물 관련 복합재해 연구를 위한 SMILE 활용의 가치 (Value of the SMILEs for research on water-related compound hazards under climate change impact)

  • 나우영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.348-348
    • /
    • 2023
  • 최근 전세계 곳곳에서는 다양한 유형의 물 관련 복합재해가 발생하고 있다. 일례로 미국 캘리포니아 지역은 2014년부터 2017년까지 극심한 가뭄에 시달리다가 대기강(atmospheric river)의 영향으로 인하여 대규모의 홍수가 잇달아 발생하였다. 유럽에서는 2021년 전례 없는 홍수 직후 500년 빈도의 가뭄이 발생하면서 심각한 인명 및 재산피해가 발생하였다. 짧은 시간 동안 양극단의수재해가 연속적으로 발생하거나, 가뭄과 폭염, 홍수와 산사태의 결합, 또는 동시에 여러 지역에서 홍수나 가뭄이 발생하는 현상 등도 복합재해에 해당한다. 즉, 복합재해는 서로 다른 특성의 독립적인 수재해가 결합되어 나타나는 재해의 한 형태로써, 발생 빈도는 적으나 유발되는 피해는 매우 크다. 더욱이 복합재해는 미래에 더욱 빈번하게, 극심하게 발생할 것으로 예상되고 있다. Single Model Initial-condition Large Ensemble (SMILE)은 복합재해의 분석에 적합한 자료로 최근 활용사례가 증가하고 있다. 기존의 기후변화 관련 연구는 여러 기후모델에서 생산한 단일 모의자료를 앙상블의 형태로 이용하여 기후요소 및 기후재해의 미래 전망이나 거동을 분석하는 과정에 기반해왔다. 이 기후모델 앙상블은 모델 간 불확실성은 고려할 수 있으나 기온 상승 시나리오의 불확실성 및 기후 시스템 내부의 변동성은 고려하지 못하는 한계가 있다. 이에 미국의 National Center for Atmospheric Research에서는 자연 자체의 변동에 의한 불확실성을 모의할 수 있는 SMILE을 개발하였다. SMILE은 단일 기후모델에서 N개의 다중 모의자료 앙상블을 출력한다. 기존의 기후모델과 유사한 과정으로 모의를 수행하되, 미세한 섭동을 부여함으로써 자연적으로 발생하는 기후시스템 내부의 변동성을 고려한다. 이러한 실험 설정은 카오스 이론에 근거한다. 여러 기후모델에 대해 SMILE 기반 모의를 수행하면 앙상블의 앙상블 개념(large ensemble)이므로 방대한 양의 기후모의 자료가 확보되어 다양한 목적의 연구에 활용할 수 있다. SMILE은 기존의 다중 기후모델 앙상블이 고려할 수 없었던 종류의 불확실성을 추가적으로 고려함으로써 인간의 활동과 자연적 변동성이 복합재해에 미치는 상대적 영향을 정량적으로 평가할 수 있게 한다. 복합재해 연구에 필수적인 표본 수 부족의 한계를 극복할 수 있기 때문에 최근 기후변화 및 수자원 관련 연구에서 적극적으로 활용되고 있다. 또한, 미래 기후를 모의하기 때문에 복합재해 발생의 특성 및 거동을 전망할 수 있고, 충분한 수의 표본은 통계분석 결과에 신뢰성을 부여할 수 있다. 이러한 SMILE의 장점은 향후 더욱 다양한 연구의 기회를 제공할 것이다.

  • PDF

에세이의 창의성 분류를 위한 어텐션과 역문서 빈도 기반의 자기부호화기 모델 (An AutoEncoder Model based on Attention and Inverse Document Frequency for Classification of Creativity in Essay)

  • 정세진;김덕기;온병원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.624-629
    • /
    • 2022
  • 에세이의 창의성을 자동으로 분류하는 기존의 주요 연구는 말뭉치에서 빈번하게 등장하지 않는 단어에 초점을 맞추어 기계학습을 수행한다. 그러나 이러한 연구는 에세이의 주제와 상관없이 단순히 참신한 단어가 많아 창의적으로 분류되는 문제점이 발생한다. 본 논문에서는 어텐션(Attention)과 역문서 빈도(Inverse Document Frequency; IDF)를 이용하여 에세이 내용 전달에 있어 중요하면서 참신한 단어에 높은 가중치를 두는 문맥 벡터를 구하고, 자기부호화기(AutoEncoder) 모델을 사용하여 문맥 벡터들로부터 창의적인 에세이와 창의적이지 않은 에세이의 특징 벡터를 추출한다. 그리고 시험 단계에서 새로운 에세이의 특징 벡터와 비교하여 그 에세이가 창의적인지 아닌지 분류하는 딥러닝 모델을 제안한다. 실험 결과에 따르면 제안 방안은 기존 방안에 비해 높은 정확도를 보인다. 구체적으로 제안 방안의 평균 정확도는 92%였고 기존의 주요 방안보다 9%의 정확도 향상을 보였다.

  • PDF

HadGEM3-RA 기후모델 일강우자료를 이용한 빈도해석 성능 평가 (Assessment of Frequency Analysis using Daily Rainfall Data of HadGEM3-RA Climate Model)

  • 김성훈;김한빈;정영훈;허준행
    • 한국습지학회지
    • /
    • 제21권spc호
    • /
    • pp.51-60
    • /
    • 2019
  • 본 연구에서는 기후변화 시나리오 자료를 이용하여 지점빈도해석(At-site Frequency Analysis, AFA)과 지역빈도해석(Regional Frequency Analysis, RFA) 등을 수행하였고, Monte Carlo simulation을 통한 RRMSE(relative root mean squared error) 값을 비교·분석함으로써 각 빈도해석 방법에 따른 성능을 평가하고자 하였다. 확률강우량 산정을 위하여 기상청에서 국가표준시나리오로 제공하는 RCM(Regional Climate Model) 자료 중 하나인 HadGEM3-RA(12.5km) 기후모델 자료로부터 우리나라 615개 지점에 대한 일 강우 자료를 추출하였고, 자료의 편의보정(bias correction)과 공간상세화(spatial disaggregation)를 위하여 분위사상법(quantile mapping)과 역거리제곱법(inverse distance squared method)을 적용하였다. 분석 결과 지역빈도해석 방법이 지점빈도해석보다 정확하게 확률강우량을 산정하는 것으로 나타났으며, 이는 기후변화 시나리오 기반의 확률강우량 산정시 지역빈도해석의 결과가 보다 합리적인 전망 결과를 도출할 것으로 판단된다.

텍스트 이해 모델에 기반한 정보 검색 시스템 (Text Undestanding System for Summarization)

  • 송인석;박혁로
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.1-6
    • /
    • 1997
  • 본 논문에서는 인지적 텍스트 이해 모형을 제시하고 이에 기반한 자동 요약 시스템을 구현하였다. 문서는 정보의 단순한 집합체가 아닌 정형화된 언어 표현 양식으로서 단어의 의미적 정보와 함께 표현 양식, 문장의 구조와 문서의 구성을 통해 정보를 전달한다. 요약 목적의 텍스트 이해 및 분석 과정을 위해 경제 분야 기사 1000건에 대한 수동 요약문을 분석, 이해 모델을 정립하였고. 경제 분야 기사 1000건에 대한 테스트 결과를 토대로 문장간의 관계, 문서의 구조에서 요약 정보 추출에 사용되는 정보를 분석하였다. 본 텍스트 이해 모형은 단어 빈도수에 의존하는 통계적 모델과 비교해 볼 때, 단어 간의 관련성을 찾아내고, 문서구조정보에 기반한 주제문 추출 및 문장간의 관계를 효과적으로 사용함으로서 정보를 생성한다. 그리고 텍스트 이해 과정에서 사용되는 요약 지식과 구조 분석정보의 상관관계를 체계적으로 연결함으로서 자동정보 추출에서 야기되는 내용적 만족도 문제를 보완한다.

  • PDF

신경망 기반의 소프트웨어 개발노력 추정모델 구축에 관한 연구 (Software Development Effort Estimation Using Neural Network Model)

  • 김병관;백승익
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2005년도 춘계학술대회
    • /
    • pp.372-380
    • /
    • 2005
  • 소프트웨어 개발노력 추정에 대한 연구는 소프트웨어가 복잡해지고 범위가 크게 증가함에 따라서 그 중은 지속적으로 부각되고 있다. 관련 프로젝트를 발주하는 업체나, 이를 수주하고 개발을 진행하는 업체에게 원가를 고려하는 측면에서 매우 중요한 부분을 차지하고 있다. 이러한 개발노력 추정을 위하여 다양한 접근 방식들이 고려되어지고 있는데, 그중에서 많이 활용되어지고 있는 방식은 소프트웨어 규모에 기반을 둔 LOC(Line Of Code) 기반 COCOMO (Constructive Cost Model) 모델이나 기능점수(Function Point)를 기반으로 한 회귀분석 모델, 인공지능(Artificial Intelligence)을 활용한 신경망(Neural Network) 모델, 사례분석기법 (CBR, Case Based Reasoning) 등이 있다. 이중에서 최근에 기능점수를 활용한 개발노력 추정에 관한 연구들이 활발히 진행되고 있으나 개발노력 추정에는 소프트웨어 규모의 척도인 기능점수 뿐만 아니라, 개발환경을 구성하는 여러 가지 측면에 대한 고려가 추가되어져야 한다. 이에 본 논문은 최신의 소프트웨어 개발 사례들에 대하여 기능점수 및 추가적인 개발환경 요소들을 면밀히 분석하고, 분석한 내용에 대해서 전문가들의 설문을 통한 빈도분석 및 로지스틱 회귀분석, 데이터마이닝 기법인 신경망 분석 등을 활용하여 개발노력 추정 모델을 구축함으로써, 소프트웨어 개발의 다양한 측면의 중요성을 강조하고, 정확한 추정의 방안을 제시 하고자 노력 하였다.

  • PDF

벡터 공간 모델과 HAL에 기초한 단어 의미 유사성 군집 (Word Sense Similarity Clustering Based on Vector Space Model and HAL)

  • 김동성
    • 인지과학
    • /
    • 제23권3호
    • /
    • pp.295-322
    • /
    • 2012
  • 본 연구에서는 벡터 공간 모델과 HAL (Hyperspace Analog to Language)을 적용해서 단어 의미 유사성을 군집한다. 일정한 크기의 문맥을 통해서 단어 간의 상관성을 측정하는 HAL을 도입하고(Lund and Burgess 1996), 상관성 측정에서 고빈도와 저빈도에 다르게 측정되는 왜곡을 줄이기 위해서 벡터 공간 모델을 적용해서 단어 쌍의 코사인 유사도를 측정하였다(Salton et al. 1975, Widdows 2004). HAL과 벡터 공간 모델로 만들어지는 공간은 다차원이므로, 차원을 축소하기 위해서 PCA (Principal Component Analysis)와 SVD (Singular Value Decomposition)를 적용하였다. 유사성 군집을 위해서 비감독 방식과 감독 방식을 적용하였는데, 비감독 방식에는 클러스터링을 감독 방식에는 SVM (Support Vector Machine), 나이브 베이즈 구분자(Naive Bayes Classifier), 최대 엔트로피(Maximum Entropy) 방식을 적용하였다. 이 연구는 언어학적 측면에서 Harris (1954), Firth (1957)의 분포 가설(Distributional Hypothesis)을 활용한 의미 유사도를 측정하였으며, 심리언어학적 측면에서 의미 기억을 설명하기 위한 모델로 벡터 공간 모델과 HAL을 결합하였으며, 전산적 언어 처리 관점에서 기계학습 방식 중 감독 기반과 비감독 기반을 적용하였다.

  • PDF

한국어 언어모델의 속성 및 정량적 편향 분석: 영어 언어모델과의 비교 및 개선 제안 (Properties and Quantitative Analysis of Bias in Korean Language Models: A Comparison with English Language Models and Improvement Suggestions)

  • 김재민;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.558-562
    • /
    • 2023
  • 최근 ChatGPT의 등장으로 텍스트 생성 모델에 대한 관심이 높아지면서, 텍스트 생성 태스크의 성능평가를 위한 지표에 대한 연구가 활발히 이뤄지고 있다. 전통적인 단어 빈도수 기반의 성능 지표는 의미적인 유사도를 고려하지 못하기 때문에, 사전학습 언어모델을 활용한 지표인 BERTScore를 주로 활용해왔다. 하지만 이러한 방법은 사전학습 언어모델이 학습한 데이터에 존재하는 편향으로 인해 공정성에 대한 문제가 우려된다. 이에 따라 한국어 사전학습 언어모델의 편향에 대한 분석 연구가 필요한데, 기존의 한국어 사전학습 언어모델의 편향 분석 연구들은 사회에서 생성되는 다양한 속성 별 편향을 고려하지 못했다는 한계가 있다. 또한 서로 다른 언어를 기반으로 하는 사전학습 언어모델들의 속성 별 편향을 비교 분석하는 연구 또한 미비하였다. 이에 따라 본 논문에서는 한국어 사전학습 언어모델의 속성 별 편향을 비교 분석하며, 영어 사전학습 언어모델이 갖고 있는 속성 별 편향과 비교 분석하였고, 비교 가능한 데이터셋을 구축하였다. 더불어 한국어 사전학습 언어모델의 종류 및 크기 별 편향 분석을 통해 적합한 모델을 선택할 수 있도록 가이드를 제시한다.

  • PDF

통계학적 가뭄빈도분석 기법을 통한 2015년 가뭄사상에 대한 분석 (Analyzing the drought event in 2015 through statistical drought frequency analysis)

  • 이태삼;손찬영
    • 한국수자원학회논문집
    • /
    • 제49권3호
    • /
    • pp.177-186
    • /
    • 2016
  • 가뭄은 시공간적으로 점차적인 수분부족이 나타나는 자연재해로 비교적 간단하게 설명될 수 있다. 그러나 가뭄이 가지는 특징을 보다 명확하게 정의하기는 매우 어려우며 또한 가뭄에 대한 대비 및 정부의 대응이 미흡한 실정이다. 따라서, 본 연구에서는 가뭄재해의 대응책 마련 및 수공구조물 설계 운영기준에 활용하고자 이론적인 가뭄 재현기간 산정기법과 더불어 3가지 시계열 모델(autoregressive (AR), Gamma AR, Copula AR)을 통해 장기간의 자료를 모의하여 가뭄사상에 대한 빈도를 산정하고자 하였다. 분석결과, 시계열 모델을 활용하여 모의된 가뭄의 빈도 결과가 이론적인 기법을 통해 산정된 것보다 합리적인 결과가 도출되었으며, 모든 시계열 모델에서 유사한 결과가 도출되었다. 또한 남한지역에 발생하고 있는 현재의 가뭄사상 분석에 대해 총 4개의 대권역으로 분류하여 분석을 수행하였으며 분석결과 국내의 남부지방은 상대적으로 약한 가뭄이 발생하는 반면에 북부 및 중부지방은 현재 3년의 가뭄 지속기간을 가지는 가뭄이 발생하고 있으며 약 40년 빈도의 가뭄으로 분석되었다.

인공지능 기법을 활용한 홍수예측모델 개발 및 평가 - 한강수계 댐을 중심으로 - (Development and Evaluation of Flood Prediction Models Using Artificial Intelligence Techniques)

  • 조혜미;솜야 오랑치맥;유제호;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.131-131
    • /
    • 2022
  • 기후변화의 영향으로 극치강우의 변동성이 커지고 있으며 계획빈도를 초과하는 폭우로 피해가 증가하고 있다. 기존의 물리기반의 홍수예측모델은 개념적 및 구조적 제약과 함께 다양한 유역조건 및 수문기상 조건에 기인한 강우-유출 관계의 불확실성을 고려하는 데 한계가 있다. 특히 한정된 홍수 사상을 통해 구축된 관측 자료로 인해 새로운 홍수 사상 예측 능력이 저조할 수밖에 없다. 따라서 기존 물리모형 기반의 홍수예측과 함께, 딥러닝(deep learning) 모형을 고려한 홍수예측 모델 개발과 개선이 필요하다. 본 연구에서는 다양한 분야에서 활용되는 인공지능(artificial intelligence, AI) 기술을 종합적으로 검토하고, 홍수 예측 측면에서의 활용 가능성 및 신뢰성을 고려하여 AI 기법을 채택하였다. 한강수계에 존재하는 댐 중 일부를 선정하여 대상 댐의 수문·기상학적 자료를 전처리한 후, 인공지능 기반의 홍수예측모형을 구축 및 최적화하였다. 다양한 예측인자와 모델 구성으로 홍수예측력에 대한 평가를 다각적으로 수행함으로써 홍수예측모델의 신뢰성을 제고하였다. 전반적으로 우수한 결과를 도출하였고, 유역면적이 작을수록 결과가 좋았다. 이는 넓은 유역일수록 복잡한 강우-유출 과정이 내재되어 있기 때문으로 판단되며, 넓은 유역에는 본 연구에서 활용한 자료에 추가적인 자료를 도입하여 모형 개선이 이루어져야 할 것으로 판단하였다. 수문 예측 연구에 통계모형이나 기계학습모형의 적용은 많이 있었지만, 딥러닝 기법 활용은 새로운 시도라는 점에서 의미가 있다.

  • PDF