• 제목/요약/키워드: 빈도-기반 모델

검색결과 359건 처리시간 0.037초

Bayesian Copula 기법을 활용한 이변량 가뭄 지역빈도해석 모델 개발 (A Development of Bivariate Drought Regional Frequency Analysis Model using Bayesian Copula)

  • 김진국;소병진;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.54-54
    • /
    • 2019
  • 최근 이변량 가뭄 빈도해석시 Copula 함수 기반의 빈도해석모델을 활용한 분석이 이루어지고 있다. 그러나 기존 연구에서는 이변량 가뭄 빈도해석시 지점빈도해석에 국한되어 분석이 이루어지며, 지역을 대표하는 수문자료의 특성이 반영된 빈도분석에 대한 연구는 미진한 실정이다. 이에 본 연구에서는 Bayesian 기법과 이변량 Copula 가뭄 빈도해석 기법을 연계한 Bayesian 이변량 Copula 지역빈도해석 모델을 개발하였다. 개발된 모델에 모의자료를 적용하여 가정한 가뭄특성 및 매개변수를 추정하였으며, 유사하게 도출된 결과를 통해 모델의 적합성을 평가하였다. 최종적으로 최근 발생한 가뭄사례를 중심으로 이변량 가뭄 지역빈도해석을 수행한 결과, 기존 지점빈도해석보다 가뭄의 특성을 효과적으로 반영된 빈도해석이 이루어지는 것을 확인하였으며, 기존 Copula 모델에 Bayesian 기법을 도입하여 매개변수에서 발생하는 불확실성을 정량화 하였다. 본 연구에서 제안된 모델의 검증과정과 도출된 결과를 통해 가뭄자료의 지역적 분포특성 및 자료간의 상관성을 효과적으로 재현하는데 유리할 뿐만 아니라, 매개변수의 불확실성을 평가할 수 있는 장점을 제공할 것으로 판단된다.

  • PDF

워드 임베딩을 활용한 한국어 가짜뉴스 탐지 모델에 관한 연구 (A Study on Korean Fake news Detection Model Using Word Embedding)

  • 심재승;이재준;정이태;안현철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.199-202
    • /
    • 2020
  • 본 논문에서는 가짜뉴스 탐지 모델에 워드 임베딩 기법을 접목하여 성능을 향상시키는 방법을 제안한다. 기존의 한국어 가짜뉴스 탐지 연구는 희소 표현인 빈도-역문서 빈도(TF-IDF)를 활용한 탐지 모델들이 주를 이루었다. 하지만 이는 가짜뉴스 탐지의 관점에서 뉴스의 언어적 특성을 파악하는 데 한계가 존재하는데, 특히 문맥에서 드러나는 언어적 특성을 구조적으로 반영하지 못한다. 이에 밀집 표현 기반의 워드 임베딩 기법인 Word2vec을 활용한 텍스트 전처리를 통해 문맥 정보까지 반영한 가짜뉴스 탐지 모델을 본 연구의 제안 모델로 생성한 후 TF-IDF 기반의 가짜뉴스 탐지 모델을 비교 모델로 생성하여 두 모델 간의 비교를 통한 성능 검증을 수행하였다. 그 결과 Word2vec 기반의 제안모형이 더욱 우수하였음을 확인하였다.

  • PDF

클러스터 확률 모형에 의한 지역화와 코풀라에 의한 가뭄빈도분석 (Regionalization using cluster probability model and copula based drought frequency analysis)

  • 무하마드 아잠;최현수;김형산;황주하;맹승진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.46-46
    • /
    • 2017
  • 지역가뭄빈도분석의 분위산정에 대한 신뢰성은 수문학적으로 균일한 지역으로 구분하기 위해 사용된 장기간의 과거 자료와 분석절차에 의해 결정된다. 그러나 극심한 가뭄은 매우 드물게 발생하며 신뢰 할 수 있는 지역빈도분석을 위한 지속기간이 충분치 않는 경우가 많이 발생한다. 이 외에도 우리나라의 복잡한 지형적 및 기후적 특징은 동질한 지역으로 구분하기 위한 통계적인 처리방법이 필요하였다. 본 연구에서 적용한 지역빈도분석은 여러 지역의 다양한 변수인 수문기상 특성을 분석하여 동질한 지역을 확인하고, 주요 가뭄변수(지속 시간 및 심각도)를 통합 적용하여 각각의 동질한 지역 분위를 추정함으로써 동질한 지역을 구분하는 해결책을 제시하였다. 본 연구에서는 가우시안 혼합 모형(Gaussian Mixture Model)을 기반으로 기반 군집분석 방법을 적용하여 최적의 동질한 지역을 구분하고 그 결과를 우도비검정 및 다른 유효성 검사 지수를 이용해서 확인하였다. 가우시안 혼합 모델에서 산정했던 매개변수를 방향저감 공간으로 표현하기 위해서 가우시안 혼합 모델방향 저감(GMMDR)방법을 적용하였다. 이 변수는 가뭄빈도분석을 위해 다양한 분포와 코풀라(copula) 적합도를 이용하여 추정 비교하였다. 그 결과 우리나라를 4개의 동질한 지역으로 나누게 되었다. 가우시안과 Frank copula를 이용한 Pearson type III(PE3) 분포는 우리나라의 가뭄 기간과 심각도의 공동 분포를 추정하는데 적합한 것으로 나타났다.

  • PDF

임베디드 시스템을 위한 빈도 기반 모델 검증 기법 (Frequency Based Model Checking for Embedded System)

  • 이성훈;이동현;인호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2008
  • Model Checking 기법은 시스템을 검증하고 반례를 제시해 주는 검증 방법으로 최근에 여러 분야에서 쓰이고 있다. 하지만 임베디드 시스템과 같이 그 검증에 있어서 시간, 자원적인 제한을 가지고 있는 분야에서는 검증할 항목을 임의로 선택해서 하는 경우가 대부분이다. 따라서 이 논문에서는 검증에 있어서 우선시 해야 할 기능들을 효율적으로 선정하는 빈도 기반 모델 검증 기법을 제안하고자 한다.

DASVDD 모형을 통한 반려동물 센서 데이터 이상치 탐지 (Detection of outliers in pet sensor data through DASVDD)

  • 박정현;고준혁;김시웅;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1208-1210
    • /
    • 2023
  • 이상치는 주로 저빈도로 발생하기 때문에, 이상치 탐지 분야에서는 정상 데이터만을 이용한 비지도 기반 학습 모델을 사용하는 방법들이 제안되었다. 따라서, 본 논문에서는 반려동물 센서 데이터를 이용해 비지도 기반 모델인 DASVDD을 활용하여 이상치를 탐지한다. 하지만 데이터셋에 이상치가 존재하지 않아 반려동물이 고빈도로 보여주는 A행동군(서다, 앉다, 엎드리다, 눕다, 걷다), 저빈도로 보여주는 B행동군(킁킁대다, 먹다)으로 분리하여 학습을 진행한다. 모델의 성능은 ROC-AUC을 기준으로 79.05%의 성능을 보여주는 것을 확인하였다.

벡터와 신경망 모델에서 데이터 퓨전 기법을 이용한 정보검색의 효율성 향상 (Improving the Effectiveness of Information Retrieval Using Data Fusion Method in the Vector and Neural Network Model)

  • 최성환
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.137-142
    • /
    • 2001
  • 본 논문에서는 벡터모델과 신경망 모델을 이용하여 데이터 퓨전의 관점에서 다중증거로서 가중치, 문헌분리가, 엔트로피, 공기유사도를 적절히 결합하여 질의를 확장하는 방법을 제안한다. 실험결과 코사인 정규화 가중치 알고리즘, 문서길이 정규화 가중치 알고리즘과 결합하여 질의를 확장하는 것이 정규화시키지 않고 단순히 문헌빈도와 역문헌빈도의 조합을 이용한 가중치 알고리즘과 결합했을 때 보다 평균 정확률 향상이 더 높게 나타났다. 또한 다양한 공기기반 유사도를 이용하여 질의확장을 한 결과 벡터모델과 신경망 모델에서 코사인 공기유사도에 기반하여 질의확장한 경우가 다른 공기유사도에 비해 더 좋은 성능을 보였다.

  • PDF

기후 변수를 이용한 혼합분포 기반 비정상성 빈도 모델 (Mixture distribution based nonstationary frequency model using climate variables)

  • 최홍근;김장경;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.338-338
    • /
    • 2019
  • 설계강우량 산정시, 일반적으로 극치자료를 활용하여 정상성 가정하에 빈도해석을 수행하고 있다. 그러나 종종 정상성으로 가정했던 기존 극치강우자료가 정상성 빈도해석 모형에서 효과적으로 모델링되지 않는 비정상성 특성을 나타내고 있다. 또한, 대부분의 극치강우 분포는 해마다 다른 규모로 발생하는 홍수와 태풍 등의 강우요인으로 인해 두 개의 첨두를 갖는 혼합분포 형태를 보인다. 이에 본 연구에서는 혼합분포 기반 비정상성 빈도모델(mixture distribution based nonstationary frequency model, MDNF)을 제시하였다. 제안된 모형의 입력자료로 기후변수(e.g. SSTs and SLPs)를 사용하여 두 개의 분포형으로 구성되는 극치강우의 혼합비(mixing ratio)에 대한 영향을 분석하였으며, 극치강우 패턴이 특정 기후변수의 영향을 받는 것을 확인하였다. 최종적으로 Bayesian 기법을 MDNF 모형에 연계하여 각 첨두에 해당하는 분포형의 매개변수들에 대한 불확실성 구간을 정량적으로 제시하였다. 본 연구를 통해 강우 패턴의 변동은 설계 강우량 추정에 영향을 미치며, 특정 기후변수와 강우 패턴이 상관성을 가지는 것을 확인함으로써 합리적인 설계 강우량 산정을 위한 중요한 근거를 제공할 것으로 사료된다.

  • PDF

블로그 포스트의 자동 분류 시스템 (Automatic Classification of Blog Posts)

  • 조희선;김수아;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.160-162
    • /
    • 2013
  • 편리한 블로그 사용과 블로그에서의 정보 탐색을 위해서는 내용에 기반한 분류가 필요하다. 대부분의 블로그 사이트에서는 내용 기반 분류를 제공하고 있으나, 블로거들은 자신이 작성한 블로그에 대한 수동 분류를 입력하지 않는 경우가 많다. 본 논문에서는 분류가 제공되는 블로그 사이트에서 각 분류별 문서를 수집하고, 어휘빈도와 문서빈도, 분류별 빈도를 활용하여 문서 내 어휘의 자질 가중치를 부여하고, 다양한 학습기를 이용하여 분류 모델을 생성한 뒤 블로그의 특성에 적합한 자질 추출 알고리즘과 분류 알고리즘을 찾아낸다. 실험에서는 본 논문에서 고안한 CTF-IECDF와 나이브 베이즈 멀티노미얼로 조합한 분류 모델이 75.40%의 분류 정확률을 보였다.

  • PDF

격자기반 수문 모델을 이용한 토지이용변화에 따른 하천건천화 영향 평가 (Evaluation of Land Use Change Impact on Stream Drying Phenomena Using a Grid-Based Continuous Hydrologic Model)

  • 정충길;이용관;장선숙;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.102-102
    • /
    • 2015
  • 최근 중소규모 하천은 하천수 및 하천변 지하수 이용의 증가와 토지이용변화 등 유역 내 수문인자의 특성 변화로 인해 하천의 건천화가 점증하고 있어 하천 환경이 악화되고 있는 실정이다. 본 연구에서는 격자기반의 분포형 장기수문 모델(PGA-CC)을 이용하여 과거 수십년동안 토지이용변화에 따른 하천 건천화 영향을 평가하였다. 실제 건천화가 진행되고 있는 삽교천 상류유역($358.8km^2$)을 선정하였고 토지이용변화분석을 위해 과거 1975년 토지이용도(Past), 현재 2008년 토지이용도(Present)를 구축하였다. 각각의 토지이용 항목 중 변화율이 가장 높은 도시비율은 과거 토지이용도에서는 2.6 %였으며 현재 토지이용도에서는 11.3 %로 8.7 %가 증가하였다. 모델 검보정은 최근 7년(2005-2011)동안 최종유역출구지점에서 유출 검보정을 실시하였다. 그 결과 NSE (Nash-Sutcliffe model efficiency)은 평균 0.71로 유출량의 모의값과 실측값이 유효한 것으로 나타났다. 건천화를 평가하기 위해 시험유역에서의 5 WPs (Watching Points)를 선정하여 과거 및 현재 토지이용조건을 모의하고 유황분석을 통한 갈수 변화량 분석을 실시하였다. 건천화 빈도분석을 위해 GEV (Generalized Extreme Value) 갈수빈도분석을 실시하여 과거 토지이용 모의결과 산정된 평균 갈수량($m^3/s$) 이하로 낮아지는 유출량 일수를 계산하였다. 최종유역출구에서 과거 및 현재 토지이용도에서 모의된 평균갈수량은 각각 $3.27m^3/s$$3.11m^3/s$로 나타났다. GEV 갈수빈도분석결과 과거 토지이용조건에서의 평균갈수량은 $3.20m^3/s$(재현기간 2.33년)으로 나타났다. 도시증가에 따른 인구증가는 지하수 사용량에 증가를 가져온다. 이는, 건천화에 영향을 미치며 본 연구에서는 지하수이용량 자료(1998-2011)를 이용하여 도시면적과 지하수이용량의 선형회귀분석을 실시하여 과거 22년 지하수 사용량을 예측하였다. 그 결과 지하수사용량 증가는 토지이용변화와 복합적으로 상류유역에 하천의 변화를 가속시키는 것으로 나타냈다.

  • PDF

몬테카를로 시뮬레이션을 이용한 지역빈도해석 기법의 성능 분석: 홍수지수법과 인공신경망 모델 (The assessment of performances of regional frequency models using Monte Carlo simulation: Index flood method and artificial neural network model)

  • 이주형;서미루;박재현;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.156-156
    • /
    • 2021
  • 본 연구는 지역빈도해석을 기반으로한 인공신경망 모델과 기존에 널리 사용되는 방법인 홍수지수법의 성능을 몬테카를로 시뮬레이션을 이용하여 평가하였다. 컴퓨터 기술이 발달함에 따라 인공지능에 대한 접근성이 좋아지며 수문학을 포함한 다양한 분야에 적용되고 있다. 인공지능을 이용하여 강수량 및 유량 등 다양한 수문자료에 대한 예측이 이루어지고 있으나 빈도해석에 관한 연구는 비교적 적다. 본 연구에서 사용된 인공 지능 모델은 대상 지점의 지형학적 자료와 수문학적 자료를 이용하여 인공신경망을 통해 지점의 확률강우량(QRT-ANN) 및 확률분포형의 매개변수 (PRT-ANN)를 추정한다. 지형학적 자료로는 위도, 경도 그리고 고도가 사용되었으며 수문학적 자료로는 대상 지점의 최근 30년 일일연최대강우량을 사용하였다. 지역빈도해석의 정확도는 지역 내 통계적 특성이 비슷한 지점들이 포함되면 될수록 높아진다. 통계적 특성으로는 불일치 척도, 이질성 척도, 적합성 척도가 있으며 다양한 조건의 통계적 특성에 따른 세 개의 지역빈도해석 방법의 성능을 평가하고자 하였다. 대상 지역 내 n개의 지점이 있다고 가정하였을 때, 홍수지수법의 경우 n-1개의 지점으로 추정한 지역 성장곡선을 이용하여 나머지 1개 지점의 확률강우량을 산정할 수 있으며 인공신경망 모델들 또한 n-1개 지점들의 자료를 이용하여 모델을 구축한 뒤 나머지 지점의 확률강우량 및 확률분포형의 매개변수를 예측할 수 있다. PRT-ANN의 경우 예측된 매개변수를 이용하여 확률강우량을 산정하며 시뮬레이션 시행마다 발생시킨 자료의 지점빈도해석 결과에 대한 나머지 세 방법의 평균 제곱근 상대오차 (Relative root mean square error, RRMSE)를 계산하였다. 몬테카를로 시뮬레이션을 이용한 성능 분석을 통하여 관측값의 다양한 통계적 특성에 맞는 지역빈도해석 방법을 제시할 수 있을 것으로 판단된다.

  • PDF