• 제목/요약/키워드: MODI

검색결과 106건 처리시간 0.024초

Part-of-speech Tagging for Hindi Corpus in Poor Resource Scenario

  • Modi, Deepa;Nain, Neeta;Nehra, Maninder
    • Journal of Multimedia Information System
    • /
    • 제5권3호
    • /
    • pp.147-154
    • /
    • 2018
  • Natural language processing (NLP) is an emerging research area in which we study how machines can be used to perceive and alter the text written in natural languages. We can perform different tasks on natural languages by analyzing them through various annotational tasks like parsing, chunking, part-of-speech tagging and lexical analysis etc. These annotational tasks depend on morphological structure of a particular natural language. The focus of this work is part-of-speech tagging (POS tagging) on Hindi language. Part-of-speech tagging also known as grammatical tagging is a process of assigning different grammatical categories to each word of a given text. These grammatical categories can be noun, verb, time, date, number etc. Hindi is the most widely used and official language of India. It is also among the top five most spoken languages of the world. For English and other languages, a diverse range of POS taggers are available, but these POS taggers can not be applied on the Hindi language as Hindi is one of the most morphologically rich language. Furthermore there is a significant difference between the morphological structures of these languages. Thus in this work, a POS tagger system is presented for the Hindi language. For Hindi POS tagging a hybrid approach is presented in this paper which combines "Probability-based and Rule-based" approaches. For known word tagging a Unigram model of probability class is used, whereas for tagging unknown words various lexical and contextual features are used. Various finite state machine automata are constructed for demonstrating different rules and then regular expressions are used to implement these rules. A tagset is also prepared for this task, which contains 29 standard part-of-speech tags. The tagset also includes two unique tags, i.e., date tag and time tag. These date and time tags support all possible formats. Regular expressions are used to implement all pattern based tags like time, date, number and special symbols. The aim of the presented approach is to increase the correctness of an automatic Hindi POS tagging while bounding the requirement of a large human-made corpus. This hybrid approach uses a probability-based model to increase automatic tagging and a rule-based model to bound the requirement of an already trained corpus. This approach is based on very small labeled training set (around 9,000 words) and yields 96.54% of best precision and 95.08% of average precision. The approach also yields best accuracy of 91.39% and an average accuracy of 88.15%.

수도권 AWS 기온을 이용한 MODIS, Landsat 위성의 지표면 온도 분석 (Analysis of Land Surface Temperature from MODIS and Landsat Satellites using by AWS Temperature in Capital Area)

  • 지준범;이규태;최영진
    • 대한원격탐사학회지
    • /
    • 제30권2호
    • /
    • pp.315-329
    • /
    • 2014
  • 서울을 포함한 수도권의 지표면 온도를 분석하기 위하여 Landsat과 MODIS의 지표면 온도, AWS의 기온, 지표면 고도 및 토지이용도를 이용하였다. Landsat과 MODIS 위성의 지표면 온도와 AWS 기온의 분석은 상관계수, 평방근 오차(Root Mean Squared Error, RMSE), 선형회귀분석 등의 통계분석방법을 적용하였다. Landsat과 MODIS 지표면 온도의 상관계수는 0.32이고 RMSE는 4.61 K였다. 그리고 Landsat과 MODIS 지표면 온도와 AWS 기온의 상관성은 각각 0.83과 0.96이며 RMSE는 3.28 K, 2.25 K이었다. Landsat과 MODIS 지표면 온도는 비교적 높은 상관성을 보였으나 각각의 선형회귀의 기울기는 0.45와 1.02이었다. Landsat 5의 경우 전체 관측소에 대하여 0.5이하의 낮은 상관성을 보였고 Landsat 8의 경우는 일치되는 지점이 다른 위성에 비하여 적었으나 0.5이상의 상관성을 나타냈다. Landsat 7은 대부분 0.8이상의 높은 상관성을 보였고 대체적으로 서울중심부에서 높은 상관성이 나타났다. 위성의 지표면 온도와 지표유형에 따른 AWS 기온사이의 상관성은 0.8이상의 높은 상관성을 보였다. Landsat 위성의 지표면 온도의 상관성은 0.84이었고 RMSE는 3.1 K이상이었으며 MODIS 위성의 상관계수는 0.96이상이고 RMSE는 2.6 K이하였다. 결과적으로 두 위성의 지표온도의 차이는 관측시각 차이에 의한 것으로 위성의 해상도에 따라 복사량을 탐지하는 지표면의 면적 차이에 의하여 발생되는 것으로 사료된다.

MODIS 위성자료를 이용한 Modified Satellite-Based Priestley-Taylor (MS-PT)의 적용 및 실제 증발산 평가 (Assessment of actual evapotranspiration using modified satellite-based priestley-taylor algorithm using MODIS products)

  • 백종진;박종민;최민하
    • 한국수자원학회논문집
    • /
    • 제49권11호
    • /
    • pp.903-912
    • /
    • 2016
  • 증발산은 물수지 및 수문순환의 체계를 파악하기 위한 중요한 인자로서 이에 대한 정확한 이해 및 산정이 필요하다. 국내외에서 증발산에 대한 많은 연구들이 수행되었으나, 지점자료만을 이용하여 산정한 증발산은 시 공간적인 변동성을 파악하는데 제약이 발생한다. 이에 따라, 물리식을 기반으로 하여 인공위성에서 산정된 수문기상인자를 활용하여 증발산량의 시 공간적인 표현에 대한 연구가 발전하게 되었다. 그러나 기존에 활용되고 있는 방법들은 상대적으로 많은 입력 자료가 요구된다. 본 연구에서는 MOderate-Resolution Imaging Spectroradiometer (MODIS) 산출물을 이용하여 순복사에너지를 산정하였으며, 기존에 활용된 인공위성 기반 증발산 알고리즘에 비해 상대적으로 적은 입력 자료를 이용하는 Modified Satellite-Based Priestley-Taylor (MS-PT) 알고리즘을 적용하여 실제증발산을 산정하였다. 또한, MODIS 산출물로부터 계산된 순복사에너지와 실제증발산의 정확성을 확인하기 위하여, 청미천과 설마천의 플럭스 타워에서 관측된 자료와 비교 검증을 실시하였다. 전반적으로 MODIS 자료를 이용하여 산정된 순복사에너지와 실제증발산 값이 두 플럭스 타워에서 관측된 순복사에너지와 실제증발산이 높은 상관성을 나타내는 것을 확인할 수 있었다. 특히. 전체 모의기간 동안 인공위성 자료를 이용하여 산정된 실제증발산의 평균 결정계수는 청미천에서 0.77(0.72-0.81), 설마천에서 0.70(0.67-0.78)로 나타났다. 그러나, 청미천에 비해 설마천에서의 실제증발산 값이 과대산정되는 것을 확인 할 수 있었다. 이러한 이유는 식생에 대한 영향 및 MODIS로부터 산정된 복사에너지에서의 오차로 인해 발생한 것으로 판단된다.

위성영상을 이용한 기후변화에 따른 미래 식생정보 예측 기법 제안 (Proposal of Prediction Technique for Future Vegetation Information by Climate Change using Satellite Image)

  • 하림;신형진;김성준
    • 한국지리정보학회지
    • /
    • 제10권3호
    • /
    • pp.58-69
    • /
    • 2007
  • 지구상에서 육지 표면의 76%를 차지하고 있는 식생은 기후 변화와 관련하여 지역 부존 수자원과 환경 및 생태학적 시스템에 큰 변화를 가져올 수 있다. 본 연구에서는 위성 영상을 통해 추출된 NDVI를 통해 미래 식생정보를 예측하고자 넓은 지역에 대한 식생 피복의 파악이 용이한 NOAA 위성의 AVHRR 센서(1994년~2004년)와 Terra 위성의 MODIS 센서(2000년~2004년)로부터 얻을 수 있는 월별 정규화 식생지수(Normalized Difference Vegetation Index, NDVI)를 통하여 현 식생정보를 정량화하였다. 5년 동안의 NDVI 값은 NOAA보다 MODIS가 전체적으로 20% 정도 높게 추출되었다. 이로부터 국내 5대강 유역의 토지피복별 NDVI와 월평균 기상인자(평균기온, 최고기온, 최저기온, 강수량, 일조시간, 풍속, 습도) 사이의 상관관계를 분석하였으며, NDVI는 평균기온과 상관성이 높은 것으로 판단되었다. 상관분석 결과 얻어진 NDVI-기온 선형 회귀식을 이용하여 기후변화 시나리오의 CCCma CGCM2 모의 결과 값으로부터 토지피복에 따른 미래 NDVI를 추정 하였다. NOAA NDVI에 의해 추정 된 미래 식생정보는 현재의 NDVI 최대치와 큰 차이를 보이지 않았지만, 현재 7월에서 8월 사이 최고에 이르렀다가 9월부터 감소하는 NDVI값이 미래에는 10월까지도 높게 지속되는 경향을 보였다. MODIS NDVI에 의해 추정 된 미래 식생정보는 7월에서 8월 사이에 현재보다 약 5% 정도 증가하는 경향을 보였다.

  • PDF

SKYNET 관측 자료를 이용한 동아시아 영역에서의 MODIS 에어로솔 광학 두께 산출물 검증 (Validation of MODIS-derived Aerosol Optical Thickness Using SKYNET Measurements over East Asia)

  • 장현성;송환진;전형욱;손병주;타카무라 타미오
    • 한국지구과학회지
    • /
    • 제32권1호
    • /
    • pp.21-32
    • /
    • 2011
  • 본 연구는 동아시아 영역에 속해있는 5개 SKYNET 관측소(서울, 지바, 엣추 지마, 후쿠에 지마, 헤도 미사키)에서 6년 간 관측한 AOT 자료를 활용하여 MODIS에서 산출된 AOT를 검증하였고, 아울러 에어로솔 기후장 분석도 함께 수행하였다. 검증연구를 위해 관측소 25 km 이내의 MODIS AOT를 평균하였고, MODIS 관측시각 30분 전후 SKYNET AOT를 평균하여 시공간 일치 자료를 생산하였다. 시공간 일치 자료의 비교 결과 MODIS AOT의 정확도는 에어로솔 종류에 크게 영향을 받지 않았으나, MODIS AOT 산출과정 중 거대 입자 모형의 사용비율이 높아질수록 SKYNET AOT에 비해서 비교적 큰 값을 산출하는 경향을 보였다. 또한 AOT가 낮은 대기에서 MODIS AOT는 과대 추정하는 경향을 보였고 그 경향성은 AOT가 높아질수록 줄어들었다. MODIS-SKYNET AOT간의 회귀분석 결과 기울기는 0.86, Y절편은 0.16으로 나타났고 결정계수($R^2$)는 0.61로 나타났다. 이러한 통계적 결과로 미루어 볼 때 동아시아 영역에서 산출된 MODIS AOT는 지상 관측에 견줄 만큼 정확하다고 볼 수 있다.

MODIS와 기상자료 기반 회선신경망 알고리즘을 이용한 남한 전역 쌀 생산량 추정 (Convolutional Neural Networks for Rice Yield Estimation Using MODIS and Weather Data: A Case Study for South Korea)

  • 마종원;우엔콩효;이경도;허준
    • 한국측량학회지
    • /
    • 제34권5호
    • /
    • pp.525-534
    • /
    • 2016
  • 쌀은 오랜 기간 동안 남한 지역의 주식임과 동시에 농부들의 주 수입원이며, 농업 분야 관련 정책 수립을 위한 수학적인 쌀 생산량 추정 모델의 구축이 필요하다. 본 연구의 목적은 (1) 쌀 생산량 추정을 위한 회선신경망 모델의 구축과, (2) 최고의 성능을 보이는 회선신경망의 파라미터를 결정하는 것과, (3) 인공신경망 모델과의 비교를 통해 회선신경망의 성능을 평가하는 것이다. 각 모델의 입력데이터로는 2000~2013년도의 4~9월까지에 해당하는 기상자료와 MODIS 위성자료를 사용하였으며, 정확도 평가를 위해 교차 검증을 실시하였다. 회선신경망과 인공신경망은 쌀 생산 표본점을 대상으로 각각 36.10kg/10a, 48.61kg/10a와 시군구 지역을 대상으로 각각 31.30kg/10a, 39.31kg/10a의 RMSE를 보였다. 회선신경망 모델은 인공신경망 모델보다 우수한 성능을 보였으며, 본 연구를 통해 쌀 생산량 추정 분야에 대한 회선신경망 모델의 적용 가능성을 확인할 수 있었다.

동아시아 지역의 육상에서 다중채널 위성자료에 의한 황사/연무 탐지 (Dust/smoke detection by multi-spectral satellite data over land of East Asia)

  • 박수현;추교황;이규태;신희우;김동철;정명재
    • 대한원격탐사학회지
    • /
    • 제33권3호
    • /
    • pp.257-266
    • /
    • 2017
  • 이 연구에서는 Moderate Resolution Imaging Spectroradiometer(MODIS) Level 1.0B 자료와 다중채널 원격 탐사방법을 이용하여 황사(dust)/연무(smoke) 탐지 알고리즘을 개발하였고 결과 검증을 위하여 MODIS RGB 합성영상과 Cloud-Aerosol Lidar with Orthogonal Polarization Satellite Observations(CALIPSO)위성의 VFM(Vertical Feature Mask)자료가 사용되었다. 2007년 3월 30일과 2012년 4월 27일의 주간 사례에 대한 이 연구의 황사/연무 탐지 결과는 검증자료와 약 56.4 %, 72.0 % 일치하였으며 야간의 경우는 2012년 04월 27일 사례에 대하여 약 40.5 % 일치하였다. 그러나 이 연구 결과는 MODIS와 CALIPSO 위성의 시 공간 일치 한계 때문에 제한적 사례에 대하여 검증되었으나 추가적인 연구를 통하여 우리나라 차세대 정지궤도 기상위성의 에어로졸 탐지에 활용될 수 있을 것이다.

MODIS 구름 산출물을 이용한 영동대설 관련 구름 특성의 분석 (Analysis of Cloud Properties Related to Yeongdong Heavy Snow Using the MODIS Cloud Product)

  • 안보영;조구희;이정순;이규태;권태영
    • 대한원격탐사학회지
    • /
    • 제23권2호
    • /
    • pp.71-87
    • /
    • 2007
  • 본 연구는 NASA/GSFC에서 제공하는 MODIS 구름 산출물 자료를 활용하여 국지적 현상으로 나타난 영동지역의 14개 대설 사례를 분석하였다. MODIS에 의해 특정시간에 관측된 영동지역의 구름은 운정 온도(CTT), 광학 두께(COT), 유효 입자 반경$(r_e)$, 입자상(CP)과 같이 구름 내 속성의 특징에 따라 A, B, C 형으로 분류하였다. 각각의 구름 형태에 대한 강수량과 구름의 속성 사이의 연관성 분석에서 COT는 A와 B형에서 상당히 높은 통계적으로 유의한 관계성을 보였으며, CTT는 A형에서만 높은 상관성을 보였다. 그렇지만, C형에서는 통계적으로 유의한 관계성이 구름의 특성물에 대해 나타나지 않았다. A형 구름은 작은 크기의 물방울과 함께 주로 낮은 층운형 구름으로 구성되어 있으며, 동해에서 종관적으로 유도된 하층 한기 이류 하에서 발생할 수 있다. B형 구름은 발달하는 적운형 구름과 관련되어 있으며, 이러한 구름은 동해상에서 발달하는 저기압 중심과 밀접하게 관련되어 있다. 그렇지만, C형 구름은 다층 구름들로써 영동대설과 직접적으로 관련된 하층 구름을 상층구름이 덮고 있어 위성 관측이 어렵다. 따라서 MODIS 구름 산출물은 영동대설의 경우에 다층 구름을 제외하고 위성 자료로부터 강수량 추정과 대설 기작을 이해하는데 도움이 될 수 있다고 결론지을 수 있다.

MODIS 적외 자료를 이용한 동아시아 지역의 총가강수량 산출 (Estimation of Total Precipitable Water from MODIS Infrared Measurements over East Asia)

  • 박호순;손병주;정의석
    • 대한원격탐사학회지
    • /
    • 제24권4호
    • /
    • pp.309-324
    • /
    • 2008
  • Terra/Aqua MODIS의 적외관측 자료를 이용하여 동아시아 지역에서 물리적 방법과 split-window 방법으로 총가강수량을 산출하는 알고리즘을 개발하였다. 물리적 방법에서는 동아시아 지역에 대한 분석 예측 자료를 생산하는 RDAPS 자료를 알고리즘의 초기 추정치로 사용하였다. 이 과정에서 복사전달계산을 위해 빠르고 정확도가 높은 RTTOV-7 모델을 이용하였다. Split-window를 이용한 총가강수량 산출에서는 동아시아 지역의 라디오존데 관측자료를 훈련자료로 사용하여 밝기온도를 계산하였고, 이로부터 관측된 밝기온도로부터 총가강수량을 산출할 수 있는 회귀식을 도출하였다. 위의 두 알고리즘을 2004년 8월과 12월의 MODIS 적외 자료에 적용하여 산출한 결과를 해양에서는 DMSP SSM/I 결과와 육지에서는 라디오존데 관측 결과와 비교하여 검증하였고, 이를 바탕으로 총가강수량의 정확성에 영향을 미치는 요인과 산출과정에 중요한 물리과정을 분석하였다. 비교결과 RDAPS, MODIS, split-window 방법에 비해 물리적 방법을 이용한 총가강수량의 산출 정확성이 높은 것으로 나타났다. 그러나 물리적 방법은 초기 추정치에 따라 산출결과가 상이하게 나타나는 단점을 가지고 있는 것으로 파악되었다. 따라서 TIGR 자료와 같은 기후 평균값을 초기치로 적용함에 있어 주의가 요구된다. 이러한 원인으로 지표 부근의 수증기에 대한 정보 부족 등을 들 수 있다. 이러한 단점에도 불구하고 지표와 지형의 변화가 큰 한반도를 포함한 동아시아 지역에서는 물리적 방법에 의한 총가강수량 산출의 효율성이 큰 것으로 사료된다.

논과 고랭지 배추밭 대상 Sentinel-2A/B 정규식생지수 월 합성영상의 구름 제거 효과 분석 (Analysis of the Cloud Removal Effect of Sentinel-2A/B NDVI Monthly Composite Images for Rice Paddy and High-altitude Cabbage Fields)

  • 은정;김선화;김태호
    • 대한원격탐사학회지
    • /
    • 제37권6_1호
    • /
    • pp.1545-1557
    • /
    • 2021
  • 농작물은 그 종과 생육상태에 따라 민감한 분광특성을 나타내며, 특히 여름철에 집중적으로 관측이 필요하나 장마로 인해 광학위성의 활용이 어렵다. 이 문제를 해결하기 위해 CC-MNC(Constrained Cloud-Maximum NDVI Composite) 기법이 개발되었으며, 이 기법을 통해 구름의 영향이 최소화된 일정 주기의 대표 합성영상이 생성된다. 본 연구에서도 이 기법을 이용하여, 2019년부터 2021년까지 논과 고랭지 배추밭을 대상으로 Sentinel-2A/B NDVI 월합성영상을 제작하였다. 다른 해보다 200 mm 많은 강수량을 보이는 2020년 8월에는 16일 주기 MODIS NDVI합성영상에서도 구름의 영향이 크게 나타났다. 이 시기를 제외하고 CC-MNC 기법은 평균적으로 원영상의 45.4%의 구름 비율을 14.9%로 줄일 수 있었다. 논의 경우 Sentinel-2A/B와 MODIS NDVI 값이 큰 차이가 나지 않았으며, 5일의 주기로도 벼의 생육 주기를 잘 모니터링할 수 있었다. 고랭지 배추밭의 경우, Sentinel-2A/B에서는 고랭지 배추의 짧은 생육 주기가 잘 나타났지만, MODIS는 공간해상도의 한계를 보였다. 이와 함께 CC-MNC 기법은 수확 시기에 구름 화소가 합성에 사용되는 현상이 보이기도 하였으며, 국내지역에 맞게 VZA 임계치의 조정이 필요하다는 시사점이 도출되었다.