• 제목/요약/키워드: GLO

검색결과 146건 처리시간 0.025초

Word2Vec, GloVe 및 RoBERTa 등의 모델을 활용한 한국어 문장 임베딩 성능 비교 연구 (A Comparative Study on the Performance of Korean Sentence Embedding)

  • 석주리;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.444-449
    • /
    • 2021
  • 자연어처리에서 임베딩이란 사람의 언어를 컴퓨터가 이해할 수 있는 벡터로 변환한 것으로 자연어처리의 필수 요소 중 하나이다. 본 논문에서는 단어 기반 임베딩인 Word2Vec, GloVe, fastText와 문장 기반 임베딩 기법인 BERT와 M-USE, RoBERTa를 사용하여 한국어 문장 임베딩을 만들어 NSMC, KorNLI, KorSTS 세 가지 태스크에 대한 성능을 확인해보았다. 그 결과 태스크에 따라서 적합한 한국어 문장 임베딩 기법이 달라지며, 태스크에 따라서는 BERT의 평균 임베딩보다 GloVe의 평균 임베딩과 같은 단어 기반의 임베딩이 좋은 성능을 보일 수 있음을 확인할 수 있었다.

  • PDF

Copula 모형을 이용한 이변량 강우빈도해석 (Bivariate Frequency Analysis of Rainfall using Copula Model)

  • 주경원;신주영;허준행
    • 한국수자원학회논문집
    • /
    • 제45권8호
    • /
    • pp.827-837
    • /
    • 2012
  • 확률강우량은 수공구조물의 설계에 있어 중요한 역할을 하며 이러한 확률강우량의 산정은 일반적으로 일변량 빈도해석을 수행하고 최적의 확률분포형을 찾아냄으로써 계산된다. 하지만 일변량 빈도해석은 수행 시 지속기간이 제한적이라는 단점이 있으며 이를 보완하기 위해 본 연구에서는 이변량 빈도해석을 수행하였다. 다변량 모형인 copula 모형 중3가지의 분포형을 이용하여 5개 지점의 연최대강우사상에 대해 이 변량 빈도해석을 수행하였으며 확률변수로 강우량과 지속기간을 사용하였다. 주변분포형은 강우량에는 Gumbel (GUM), generalized logistic (GLO) 분포형, 지속기간에는 generalized extreme value (GEV), GUM, GLO 분포형이사용됐으며 copula 모형은Frank, Joe, Gumbel-Hougaard 모형을 이용하였다. 주변분포형의 매개변수는 확률가중모멘트법을 이용하여 추정하였으며, copula 모형의 매개변수는 준모수방법인 의사최우도법을 사용하여 구하였다. 이를 통해 얻어진 확률강우량을 주변분포형과 copula 모형을바꾸어가며 비교하였다. 그 결과, 주변분포형의 종류에 따른 변화에서는 지속기간의 분포형에는 크게 영향을 받지 않는 것으로 나타났다. 강우량의 분포형에 따라서는 조금씩 차이가 났으며 강우량의 분포형이 GUM일 경우, GLO일 때에 비해 재현기간이 증가할수록 확률강우량이 증가하는 경향이 두드러졌다. Copula 모형별로 비교해보았을 때, Joe, Gumbel-Hougaard 모형은 비슷한 경향을 나타내었으며 Frank 모형은 재현기간의 증가에 따른 확률강우량의 증가가 강하게 나타냈다.

L-모멘트법을 이용한 지역홍수빈도분석을 통한 금강유역 미계측 유역의 설계홍수량 산정 (Estimating design floods for ungauged basins in the geum-river basin through regional flood frequency analysis using L-moments method)

  • 이진영;박동혁;신지예;김태웅
    • 한국수자원학회논문집
    • /
    • 제49권8호
    • /
    • pp.645-656
    • /
    • 2016
  • 본 연구에서는 금강유역에 대한 지역홍수빈도분석을 실시하고 재현기간에 따른 홍수량을 추정하는 관계식을 제안하였다. 유역 내 유량자료의 수문학적 독립성과 동질성에 대한 검증을 위하여 Lag-1 자기상관성 분석, 동질성 검정, 이상치 검정, 불일치척도 검정을 수행하였다. 검정 결과, 금강유역의 대상 관측소들은 시간에 대하여 독립적이고 동질적 모집단에 속하며 이상치는 없었다. 일반 극치 분포(GEV), 3변수 대수정규 분포(LN-III), 피어슨-III 분포(P-III), 일반 로지스틱 분포(GLO), 일반 파레토 분포(GPA) 등 5개의 3변수 확률분포함수에 대한 L-모멘트비도와 평균가중거리(AWD), 그리고 $Z^{DIST}$ 적합도 산정 결과, GLO 분포함수가 금강유역의 최적 확률분포형으로 선정되었다. GLO 분포를 바탕으로 지역홍수빈도를 추정하는 회귀모형을 제안하였고, 강경 관측소의 관측 유량을 이용하여 회귀모형의 적용성을 검증하였다.

조건부 Copula 함수 기반의 월단위 GloSea5 앙상블 예측정보 편의보정 기법과 연계한 일단위 시공간적 상세화 모델 개발 (Development of daily spatio-temporal downscaling model with conditional Copula based bias-correction of GloSea5 monthly ensemble forecasts)

  • 김용탁;김민지;권현한
    • 한국수자원학회논문집
    • /
    • 제54권12호
    • /
    • pp.1317-1328
    • /
    • 2021
  • 본 연구에서는 예측 모델의 정확성이 비교적 높은 월단위의 GloSea5 자료를 기반으로 예측강수량을 편의보정 및 시공간적으로 상세화하여 연속된 일단위 강우량을 모의하고자 하였다. 이를 위하여 GloSea5를 입력자료로 조건부 Copula와 MNHMM 모형을 적용하여 일단위 시계열 강우량 예측정보를 생산할 수 있는 모델링 체계를 제시하였다. 모의결과 동기간의 자료라도 매주 생산되는 결과가 큰 차이를 나타내는 예측강수량의 변동성이 유의하게 개선되었다. 모형 검증에서 모의된 일강수량, 연속강우확률, 연속무강우확률 및 강우일수가 관측자료와 유사한 값으로 모의되는 등 수문모형의 입력자료로써 활용성이 클 것으로 판단된다. 유역 단위에서의 모의된 강수량 계열간의 상관성 차이가 최소 -0.02에서 최대 0.10로 유역의 강우관측소간 상호종속성을 효과적으로 복원되는 등 수문모형의 입력자료로 활용 시 유역의 수문기상학적 반응을 보다 현실적으로 모의가 가능할 것으로 기대된다.

기상청 현업 기후예측시스템(GloSea5)에서의 극한예측지수를 이용한 여름철 폭염 예측 성능 평가 (An Assessment of Applicability of Heat Waves Using Extreme Forecast Index in KMA Climate Prediction System (GloSea5))

  • 허솔잎;현유경;류영;강현석;임윤진;김윤재
    • 대기
    • /
    • 제29권3호
    • /
    • pp.257-267
    • /
    • 2019
  • This study is to assess the applicability of the Extreme Forecast Index (EFI) algorithm of the ECMWF seasonal forecast system to the Global Seasonal Forecasting System version 5 (GloSea5), operational seasonal forecast system of the Korea Meteorological Administration (KMA). The EFI is based on the difference between Cumulative Distribution Function (CDF) curves of the model's climate data and the current ensemble forecast distribution, which is essential to diagnose the predictability in the extreme cases. To investigate its applicability, the experiment was conducted during the heat-wave cases (the year of 1994 and 2003) and compared GloSea5 hindcast data based EFI with anomaly data of ERA-Interim. The data also used to determine quantitative estimates of Probability Of Detection (POD), False Alarm Ratio (FAR), and spatial pattern correlation. The results showed that the area of ERA-Interim indicating above 4-degree temperature corresponded to the area of EFI 0.8 and above. POD showed high ratio (0.7 and 0.9, respectively), when ERA-Interim anomaly data were the highest (on Jul. 11, 1994 (> $5^{\circ}C$) and Aug. 8, 2003 (> $7^{\circ}C$), respectively). The spatial pattern showed a high correlation in the range of 0.5~0.9. However, the correlation decreased as the lead time increased. Furthermore, the case of Korea heat wave in 2018 was conducted using GloSea5 forecast data to validate EFI showed successful prediction for two to three weeks lead time. As a result, the EFI forecasts can be used to predict the probability that an extreme weather event of interest might occur. Overall, we expected these results to be available for extreme weather forecasting.

도시지역에 대한 환경용수의 계절전망 기법 개발 및 평가 (Development and Assessment of Environmental Water Seasonal Outlook Method for the Urban Area)

  • 소재민;김정배;배덕효
    • 한국물환경학회지
    • /
    • 제34권1호
    • /
    • pp.67-76
    • /
    • 2018
  • There are 34 mega-cities with a population of more than 10 million in the world. One of the highly populated cities in the world is Seoul in South Korea. Seoul receives $1,140million\;m^3/year$ for domestic water, $2million\;m^3/year$ for agricultural water and $6million\;m^3/year$ for industrial water from multi-purpose dams. The maintenance water used for water conservation, ecosystem protection and landscape preservation is $158million\;m^3/year$, which is supplied from natural precipitation. Recently, the use of the other water for preservation of water quality and ecosystem protection in urban areas is increasing. The objectives of this study is to develop the seasonal forecast method of environmental water in urban areas (Seoul, Daejeon, Gwangju, Busan) and to evaluate its predictability. In order to estimate the seasonal outlook information of environmental water from Land Surface Model (LSM), we used the observation weather data of Automated Synoptic Observing System (ASOS) sites, forecast and hind cast data of GloSea5. In the past 30 years (1985 ~ 2014), precipitation, natural runoff and Urban Environmental Water Index (UEI) were analyzed in the 4 urban areas. We calculated the seasonal outlook values of the UEI based on GloSea5 for 2015 year and compared it to UEI based on observed data. The seasonal outlook of UEI in urban areas presented high predictability in the spring, autumn and winter. Studies have depicted that the proposed UEI will be useful for evaluating urban environmental water and the predictability of UEI using GloSea5 forecast data is likely to be high in the order of autumn, winter, spring and summer.

PCR 기법을 이용한 Phoma glomerate 의 특이검출 (Specific and Sensitive Detection of Phoma glomerata Using PCR Techniques)

  • 윤여홍;서동연;김현주;김성환
    • 한국균학회지
    • /
    • 제41권1호
    • /
    • pp.52-55
    • /
    • 2013
  • Phoma glomerata는 식물 잎이나 열매에 병을 일으키는 식물병원균으로 알려져 있다. 국내에서는 아직 피해사례가 없기 때문에 P. glomerata는 국내의 식물검역균으로 관리되고 있다. 본 연구는 국내에 들어오는 목재나 과일에 P. glomerata를 검출할 수 있는 방법 개발코자 수행되었다. Phoma 균주들의 translation elongation factor 1 alpha 유전자 염기서열에 기초하여 P. glomerata 특이적 PCR 프라이머를 디자인 하였고 그 특이성을 검정하였다. PCR 수행 결과 P. glomerata에서만 170 bp 크기의 밴드가 증폭되었고, 다른 비교 균주에서는 밴드가 증폭되지 않았다. 검출 감도를 평가하기 위해 기존 PCR방법과 real time PCR 방법을 이용하여 실험한 결과 최소 10 pg과 1 pg까지 각각 검출할 수 있었다. 본 연구결과는 디자인된 PCR 프라이머가 P. glomerata를 특이적으로 검출하는데 유용할 것임을 보여준다.

GloSea5 모형의 6개월 장기 기후 예측성 검증 (Assessment of 6-Month Lead Prediction Skill of the GloSea5 Hindcast Experiment)

  • 정명일;손석우;최정;강현석
    • 대기
    • /
    • 제25권2호
    • /
    • pp.323-337
    • /
    • 2015
  • This study explores the 6-month lead prediction skill of several climate indices that influence on East Asian climate in the GloSea5 hindcast experiment. Such indices include Nino3.4, Indian Ocean Diploe (IOD), Arctic Oscillation (AO), various summer and winter Asian monsoon indices. The model's prediction skill of these indices is evaluated by computing the anomaly correlation coefficient (ACC) and mean squared skill score (MSSS) for ensemble mean values over the period of 1996~2009. In general, climate indices that have low seasonal variability are predicted well. For example, in terms of ACC, Nino3.4 index is predicted well at least 6 months in advance. The IOD index is also well predicted in late summer and autumn. This contrasts with the prediction skill of AO index which shows essentially no skill beyond a few months except in February and August. Both summer and winter Asian monsoon indices are also poorly predicted. An exception is the Western North Pacific Monsoon (WNPM) index that exhibits a prediction skill up to 4- to 6-month lead time. However, when MSSS is considered, most climate indices, except Nino3.4 index, show a negligible prediction skill, indicating that conditional bias is significant in the model. These results are only weakly sensitive to the number of ensemble members.

GloSea5 북반구 대기 원격상관패턴의 1~6주 주별 예측성능 검증 (Predictability of Northern Hemisphere Teleconnection Patterns in GloSea5 Hindcast Experiments up to 6 Weeks)

  • 김도경;김영하;유창현
    • 대기
    • /
    • 제29권3호
    • /
    • pp.295-309
    • /
    • 2019
  • Due to frequent occurrence of abnormal weather, the need to improve the accuracy of subseasonal prediction has increased. Here we analyze the performance of weekly predictions out to 6 weeks by GloSea5 climate model. The performance in circulation field from January 1991 to December 2010 is first analyzed at each grid point using the 500-hPa geopotential height. The anomaly correlation coefficient and mean-square skill score, calculated each week against the ECWMF ERA-Interim reanalysis data, illustrate better prediction skills regionally in the tropics and over the ocean and seasonally during winter. Secondly, we evaluate the predictability of 7 major teleconnection patterns in the Northern Hemisphere: North Atlantic Oscillation (NAO), East Atlantic (EA), East Atlantic/Western Russia (EAWR), Scandinavia (SCAND), Polar/Eurasia (PE), West Pacific (WP), Pacific-North American (PNA). Skillful predictability of the patterns turns out to be approximately 1~2 weeks. During summer, the EAWR and SCAND, which exhibit a wave pattern propagating over Eurasia, show a considerably lower skill than the other 5 patterns, while in winter, the WP and PNA, occurring in the Pacific region, maintain the skill up to 2 weeks. To account for the model's bias in reproducing the teleconnection patterns, we measure the similarity between the teleconnection patterns obtained in each lead time. In January, the model's teleconnection pattern remains similar until lead time 3, while a sharp decrease of similarity can be seen from lead time 2 in July.

기상청 기후예측시스템(GloSea6) 과거기후 예측장의 앙상블 확대와 초기시간 변화에 따른 예측 특성 분석 (Assessment of the Prediction Derived from Larger Ensemble Size and Different Initial Dates in GloSea6 Hindcast)

  • 김지영;박연희;지희숙;현유경;이조한
    • 대기
    • /
    • 제32권4호
    • /
    • pp.367-379
    • /
    • 2022
  • In this paper, the evaluation of the performance of Korea Meteorological Administratio (KMA) Global Seasonal forecasting system version 6 (GloSea6) is presented by assessing the effects of larger ensemble size and carrying out the test using different initial conditions for hindcast in sub-seasonal to seasonal scales. The number of ensemble members increases from 3 to 7. The Ratio of Predictable Components (RPC) approaches the appropriate signal magnitude with increase of ensemble size. The improvement of annual variability is shown for all basic variables mainly in mid-high latitude. Over the East Asia region, there are enhancements especially in 500 hPa geopotential height and 850 hPa wind fields. It reveals possibility to improve the performance of East Asian monsoon. Also, the reliability tends to become better as the ensemble size increases in summer than winter. To assess the effects of using different initial conditions, the area-mean values of normalized bias and correlation coefficients are compared for each basic variable for hindcast according to the four initial dates. The results have better performance when the initial date closest to the forecasting time is used in summer. On the seasonal scale, it is better to use four initial dates, where the maximum size of the ensemble increases to 672, mainly in winter. As the use of larger ensemble size, therefore, it is most efficient to use two initial dates for 60-days prediction and four initial dates for 6-months prediction, similar to the current Time-Lagged ensemble method.