• Title/Summary/Keyword: k-최근린법

Search Result 7, Processing Time 0.021 seconds

Estimating Farmland Prices Using Distance Metrics and an Ensemble Technique (거리척도와 앙상블 기법을 활용한 지가 추정)

  • Lee, Chang-Ro;Park, Key-Ho
    • Journal of Cadastre & Land InformatiX
    • /
    • v.46 no.2
    • /
    • pp.43-55
    • /
    • 2016
  • This study estimated land prices using instance-based learning. A k-nearest neighbor method was utilized among various instance-based learning methods, and the 10 distance metrics including Euclidean distance were calculated in k-nearest neighbor estimation. One distance metric prediction which shows the best predictive performance would be normally chosen as final estimate out of 10 distance metric predictions. In contrast to this practice, an ensemble technique which combines multiple predictions to obtain better performance was applied in this study. We applied the gradient boosting algorithm, a sort of residual-fitting model to our data in ensemble combining. Sales price data of farm lands in Haenam-gun, Jeolla Province were used to demonstrate advantages of instance-based learning as well as an ensemble technique. The result showed that the ensemble prediction was more accurate than previous 10 distance metric predictions.

Assessment of Climate Chanage Effect on Temperature and Drought in Seoul : Based on the AR4 SRES A2 Senario (기후변화가 서울지역의 기온 및 가뭄에 미치는 영향 평가 : AR4 SRES A2 시나리오를 기반으로)

  • Kyoung, Minsoo;Lee, Yongwon;Kim, Hungsoo;Kim, Byungsik
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.29 no.2B
    • /
    • pp.181-191
    • /
    • 2009
  • This study suggests the assessment technique for climate change effect on drought in Korea based on the AR4 SRES A2 scenario reported in IPCC fourth assessment report in 2007. IPCC provides monthly outputs of 24 climate models through the DDC. One of the models is BCM2 model which was developed at BCCR in Norway and NCEP data is used for downscaling. The K-NN(K-Nearest Neighbor) and ANN(Artificial Neural Network) are selected as downscaling technique to downscale the temperature and precipitation at Seoul station in Korea. K-NN could downscale both temperature and precipitation well. ANN made a good result for temperature, but it gave a divergence result in precipitation. Finally, SPI of Seoul station is computed to evaluate the effect of climate change on drought. BCM2 predicted that temperature will increase and drought severity will increase because of the increased drought spell at Seoul station.

A Web Page Categorization Model Based on Document Structural Information (문서 구조 정보에 기반한 웹 페이지 범주화 모델)

  • Jung, Sung-Hwa;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.91-96
    • /
    • 1998
  • 본 논문에서는 주제범주 체계를 이용한 웹 검색이 가지는 장점을 이용 할 수 있도록 인터넷 웹 페이지들을 주제범주 체계에 따라 자동으로 분류하는 모델을 제시한다. 특히 웹 페이지 작성자들의 의도를 범주화에 반영할 수 있는 방법으로 HTML 태그를 이용한다. 즉 웹 페이지의 표현에 있어서 벡터 스페이스 모델에서의 색인어 빈도 가중치에 태그 가중치를 추가 하여 보다 좋은 성능을 얻도록 하였다. 그리고 주제범주를 표현하는데 사용되는 자질의 선정에는 기대상호정보, 상호정보 척도를, 문서간 유사도 비교에는 최근린법을 사용하였다. 전북대에서 정보탐정용으로 분류한 웹 페이지를 대상으로 실험하였으며, 기본 모델 대비 약 7%의 정확도 향상을 얻을 수 있었다.

  • PDF

Text Classification based on a Feature Projection Technique with Robustness from Noisy Data (오류 데이타에 강한 자질 투영법 기반의 문서 범주화 기법)

  • 고영중;서정연
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.4
    • /
    • pp.498-504
    • /
    • 2004
  • This paper presents a new text classifier based on a feature projection technique. In feature projections, training documents are represented as the projections on each feature. A classification process is based on individual feature projections. The final classification is determined by the sum from the individual classification of each feature. In our experiments, the proposed classifier showed high performance. Especially, it have fast execution speed and robustness with noisy data in comparison with k-NN and SVM, which are among the state-of-art text classifiers. Since the algorithm of the proposed classifier is very simple, its implementation and training process can be done very simply. Therefore, it can be a useful classifier in text classification tasks which need fast execution speed, robustness, and high performance.

Monitoring Spatiotemporal Changes of Tidal Flats in Go-Gunsan Islands by Environmental Factors using Satellite Images (위성영상을 활용한 환경 요인에 따른 고군산 군도 간석지의 시공간적 변화 탐지)

  • Lee, Hong-Ro;Lee, Jae-Bong
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.8 no.3
    • /
    • pp.34-43
    • /
    • 2005
  • We will catch the spatio-temporal changes that analyse the unknown topography of Go-Gunsan Islands using Landsat TM satellite images into an unsupervised ISODATA classification and a supervised nearest likelihood classification. Each sedimental topography has the different characteristics according to building the Saemangeum embarkment. We will deal with the distribution of sedimental shapes using ERDAS Imagine 8. 6. The result that classifies specifically topographic properties of our research area be considered to get use of establishing the reclaiming program and predicating the reclaimed sedimental topography. The research area can be classified into tidal flats and sea level using band 4 among 7 bands of Landsat TM. Also band 5 can be used to classify the special unknown shapes of tidal flats. We will clarify the efficiency that spatio-temporal sedimental changes can be extracted through processing satellite images. Therefore, the spatio-temporal unknown topography change monitoring using satellite images is expected to be very useful to clarify whether the tidal flat is generated or not in the Go-Gunsan Islands at the outer side of the embarkment after constructing completely the Saemangeum tidal embarkment.

  • PDF

A Study on Spatial Downscaling of Satellite-based Soil Moisture Data (토양수분 위성자료의 공간상세화에 관한 연구)

  • Shin, Dae Yun;Lee, Yang Won;Park, Mun Sung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.414-414
    • /
    • 2017
  • 토양수분은 지면환경에서 일어나는 수문 및 에너지 순환을 이해하는 데 있어 중요한 기상인자이다. 토양수분 현장관측은 땅속에 매설된 센서에 의해 상당히 정확하게 이루어지만, 관측점 수가 충분치 않아 공간적 연속성을 확보하지 못하는 어려움이 존재한다. 이에 광역적 및 연속적 관측이 가능한 마이크로파 위성센서가 토양수분 정보 획득을 위한 보조수단으로서 그 중요성이 부각되고 있다. 마이크로파 위성센서는 구름 등 기상조건의 제약을 받지 않으며, 1978년 이래 현재까지 여러 위성에 의해 25 km 및 10 km 해상도의 전지구 토양수분자료가 생산되어 왔다. 마이크로파 센서를 이용한 토양수분자료는 동일지점에 대하여 하루 2회 정도 산출되므로 적절한 시간분해능을 가지지만, 공간해상도가 최고 10 km로서 지역규모의 수문분석에 적용하기에는 충분치 않다. 이러한 토양수분자료의 공간해상도 문제 해결을 위하여 다양한 지면환경요소를 활용한 통계적 다운스케일링이 대안으로 제시되었다. 최근의 선행연구들은 대부분 방정식을 이용한 결합모형을 통해 통계적 다운스케일링을 수행하였는데, 회귀식과 같은 선형결합뿐 아니라 신경망이나 기계학습 등의 비선형결합에서도, 불가피하게 발생할 수밖에 없는 잔차(residual)로 인하여 다운스케일링 전후의 공간분포 패턴이 달라져버리는 문제를 안고 있었다. 회귀분석에 잔차의 공간내삽을 결합시킨 회귀크리깅(regression kriging)은 잔차보정을 통해 이러한 문제를 해결함으로써 다운스케일링 전후의 공간분포 일관성을 보장하는 기법이다. 이 연구에서는 회귀크리깅을 이용하여 일자별 AMSR2(Advanced Microwave Scanning Radiometer 2) 토양수분 자료를 10 km에서 1 km 해상도로 다운스케일링하고, 다운스케일링 전후의 자료패턴 일관성을 평가한다. 지면온도(LST), 지면온도상승률(RR), 식생온도건조지수(TVDI)는 일자별로 DB를 구축하였고, 식생지수(NDVI), 수분지수(NDWI), 지면알베도(SA)는 8일 간격으로 DB를 구축하였다. 이러한 8일 간격의 자료를 일자별로 변환하기 위하여 큐빅스플라인(cubic spline)을 이용하여 시계열내삽을 수행하였다. 또한 상이한 공간해상도의 자료는 최근린법을 이용하여 다운스케일링 목표해상도인 1 km에 맞도록 변환하였다. 우선 저해상도 스케일에서 추정치를 산출하기 위해서는 저해상도 픽셀별로 이에 해당하는 복수의 고해상도 픽셀을 평균화하여 대응시켜야 하며, 이를 통해 6개의 설명변수(LST, RR, TVDI, NDVI, NDWI, SA)와 AMSR2 토양수분을 반응변수로 하는 다중회귀식을 도출하였다. 이식을 고해상도 스케일의 설명변수들에 적용하면 고해상도 토양수분 추정치가 산출되는데, 이때 추정치와 원자료의 차이에 해당하는 잔차에 대한 보정이 필요하다. 저해상도 스케일로 존재하는 잔차를 크리깅 공간내삽을 통해 고해상도로 변환한 후 이를 고해상도 추정치에 부가해주는 방식으로 잔차보정이 이루어짐으로써, 다운스케일링 전후의 자료패턴 일관성이 유지되는(r>0.95) 공간상세화된 토양수분 자료를 생산할 수 있다.

  • PDF

Feature Selection to Predict Very Short-term Heavy Rainfall Based on Differential Evolution (미분진화 기반의 초단기 호우예측을 위한 특징 선택)

  • Seo, Jae-Hyun;Lee, Yong Hee;Kim, Yong-Hyuk
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.6
    • /
    • pp.706-714
    • /
    • 2012
  • The Korea Meteorological Administration provided the recent four-years records of weather dataset for our very short-term heavy rainfall prediction. We divided the dataset into three parts: train, validation and test set. Through feature selection, we select only important features among 72 features to avoid significant increase of solution space that arises when growing exponentially with the dimensionality. We used a differential evolution algorithm and two classifiers as the fitness function of evolutionary computation to select more accurate feature subset. One of the classifiers is Support Vector Machine (SVM) that shows high performance, and the other is k-Nearest Neighbor (k-NN) that is fast in general. The test results of SVM were more prominent than those of k-NN in our experiments. Also we processed the weather data using undersampling and normalization techniques. The test results of our differential evolution algorithm performed about five times better than those using all features and about 1.36 times better than those using a genetic algorithm, which is the best known. Running times when using a genetic algorithm were about twenty times longer than those when using a differential evolution algorithm.