• 제목/요약/키워드: Nearest Neighbor Estimates

검색결과 10건 처리시간 0.036초

거리 가중치와 층화를 이용한 최근린기반 임목축적 추정치의 정확도 비교 (Comparison of Forest Growing Stock Estimates by Distance-Weighting and Stratification in k-Nearest Neighbor Technique)

  • 임종수;유병오;신만용
    • 한국산림과학회지
    • /
    • 제101권3호
    • /
    • pp.374-380
    • /
    • 2012
  • 본 연구는 최근린 기법에서 거리가중치와 훈련자료의 층화에 의한 추정치의 정확도를 비교하여 효율적인 방법을 모색하기 위하여 수행하였다. 거리가중치의 경우, 유사성이 높은 훈련자료에 가중치를 부여하는 방법으로 일반적으로 적용되는 5가지의 계수(0, 0.5, 1, 1.5, 그리고 2)를 비교한 결과, 평균 편차에서 최대 ${\pm}0.6m^3/ha$로 정확도는 유사한 것으로 나타났다. 훈련자료의 층화에서는 임상구분을 적용하였을 때 추정치의 정확도가 가장 높은 것으로 나타났으며, 임상구분과 참조수평거리(반경=100 km)를 통합하여 적용하였을 경우에는 임상구분에 의한 추정치와 유사한 정확도를 나타내었다. 연구대상지의 2010년 기준 평균임목축적과 비교한 결과 최근린 기반 추정치가 약 $5m^3/ha$ 정도 과소 추정되었지만, 조사시점을 고려하였을 때 상당한 정확도를 나타낸 것으로 평가된다.

위성영상을 활용한 지상부 산림바이오매스 탄소량 추정 - k-Nearest Neighbor 및 Regression Tree Analysis 방법의 비교 분석 - (Estimation of Aboveground Forest Biomass Carbon Stock by Satellite Remote Sensing - A Comparison between k-Nearest Neighbor and Regression Tree Analysis -)

  • 정재훈;우엔 콩 효;허준;김경민;임정호
    • 대한원격탐사학회지
    • /
    • 제30권5호
    • /
    • pp.651-664
    • /
    • 2014
  • 최근 주기적이고 정확한 산림바이오매스 탄소저장량 추정에 대한 필요성이 한국에서도 점차 증가하고 있다. 본 연구에서는 k-Nearest Neighbor (kNN) 및 Regression Tree Analysis (RTA) 알고리즘을 대상으로 공주 및 세종시를 대상으로 한 탄소량 변화 탐지를 통해 그 효용성을 비교 분석 하고자 하였다. 현장 자료로는 제 3차 및 제 5, 6차 국가산림자원조사 자료를 이용하였으며, 위성영상자료는 1992년, 2010년에 취득된 Landsat TM과 2009년에 취득된 Aster 영상을 이용하였다. 또한, 추정정확도를 향상시키기 위해 각 영상으로부터 다양한 식생지수를 생성하였다. 두 방법론의 비교를 위해 RMSE 및 평균편의(mean bias)를 포함한 각종 탄소통계량을 계산하였으며, 대상지역에 대한 탄소분포지도를 생성하고 비교를 수행하였다. 그 결과, kNN 알고리즘은 영상에 상관없이 보다 안정적인 추정결과를 나타낸 반면, 스무딩 효과로 인해 탄소의 공간분포가 뚜렷하지 않은 단점이 발견되었다. RTA의 경우 평균편의 결과 및 탄소의 공간분포가 명확히 나타나는 장점이 있으나, 위성영상에 따라 탄소추정량에서 큰 차이를 나타내었다. 최종적으로 2009년 및 2010년 탄소지도에서 1992년 탄소지도를 차분한 탄소차분지도를 생성을 통해 공주시 및 세종시 지역의 산림 탄소저장량이 급격히 증가했음을 확인하였다.

다수 분류기를 이용한 메타레벨 데이터마이닝 (Metalevel Data Mining through Multiple Classifier Fusion)

  • 김형관;신성우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.551-553
    • /
    • 1999
  • This paper explores the utility of a new classifier fusion approach to discrimination. Multiple classifier fusion, a popular approach in the field of pattern recognition, uses estimates of each individual classifier's local accuracy on training data sets. In this paper we investigate the effectiveness of fusion methods compared to individual algorithms, including the artificial neural network and k-nearest neighbor techniques. Moreover, we propose an efficient meta-classifier architecture based on an approximation of the posterior Bayes probabilities for learning the oracle.

  • PDF

Nonparametric Estimation of the Bivariate Survival Function under Koziol-Green Model I

  • Ahn, Choon-Mo;Park, Sang-Gue
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권4호
    • /
    • pp.975-982
    • /
    • 2003
  • In this paper we considered the problem of estimating the bivariate survival distribution of the random vector (X, Y) when Y may be subject to random censoring but X is always uncensored. Adapting conditional Koziol-Green model, simplified estimator for bivariate survival function is proposed. We perform simulation to compare the proposed estimator with popular estimators and discussed the performance of it.

  • PDF

위성영상자료 및 국가 산림자원조사 자료를 이용한 산림 바이오매스 추정 (Estimation of Forest Biomass based upon Satellite Data and National Forest Inventory Data)

  • 임종수;한원성;황주호;정상영;조현국;신만용
    • 대한원격탐사학회지
    • /
    • 제25권4호
    • /
    • pp.311-320
    • /
    • 2009
  • 본 연구는 전라북도 무주군을 대상으로 제5차 국가산림자원조사 자료와 위성영상(Landsat TM-5)자료를 이용하여 산림 바이오매스를 추정하고 이를 토대로 바이오매스 주제도를 작성하고자 하였다. 먼저 국가산림자원조사의 야외 표본점 자료를 이용하여 조사표본점의 단위면적 당 축적을 산출하고, 바이오매스 변환계수를 적용하여 산림 바이오매스를 추정하였다. 본 연구에서는 위성영상 자료를 이용한 산림 바이오매스 추정을 위해 회귀모형을 이용하는 방법과 최근린 기법(k-Nearest Neighbor)을 이용하는 두 가지 방법을 사용하였는데, 이 두 가지 방법에 의해 추정된 산림 바이오매스를 국가산림자원조사 자료에 의한 추정치와 비교하여 최적의 방법을 선정하였다. 추정된 바이오매스 통계량의 비교를 위해 교차대조법을 이용하여 RMSE(Root Mean Square Error)와 평균편의(Mean Bias)를 산출하였는데, 그 결과 두 방법 모두 유사한 추정오차(RMSE: 63.75$\sim$67.26ton/ha)와 편차($\pm$1 ton/ha)를 보여 정확성 면에서는 큰 차이가 없는 것으로 나타났다. 하지만 최근린 기법을 이용하여 산림 바이오매스를 추정하는 것이 효율성 측면에서 보다 유리할 것으로 평가되었다. 최근린 기법에 의해 추정된 무주군의 산림 바이오매스는 약 839만 톤으로 나타났으며 단위면적당 평균은 149톤/ha인 것으로 분석되었다.

A New Similarity Measure based on Separation of Common Ratings for Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.149-156
    • /
    • 2021
  • 추천 시스템의 여러 구현 기법들 중 협력 필터링은 과거 평가 이력을 토대로 유사성이 높은 인접 이웃들을 선정하여, 그들이 선호했던 상품들을 추천하는데, 많은 상업 사이트에서 성공적으로 활용되고 있다. 유사도의 정확한 측정은 시스템의 성능을 좌우하는 매우 중요한 요소이다. 기존에 다양한 방식의 유사도 척도들이 개발되었는데, 대개 전통적인 유사도 척도와 기개발된 여러 계수들과의 통합 방식이었다. 본 연구에서는 새로운 방식의 유사도 척도를 제안한다. 두 사용자 간의 공통 평가 영역을 평가치 크기에 따라 분할하여 각 부분 영역별로 유사도를 측정하고 이들을 가중 통합함으로써, 유사한 영역이 구체적으로 파악되어 최종 유사도값에 반영된다. 두 종류의 개방형 데이터셋을 활용한 성능을 측정하였고, 그 결과 특히 밀집 데이터셋에서 제안 방법의 예측 정확도, 순위 정확도, 평균 정밀도 성능이 기존보다 우수하였다. 제안 척도는 다양한 상업 시스템에서 사용자들의 선호에 보다 적합한 상품을 추천하는데 유용하게 활용될 것으로 기대한다.

비모수적 기법에 의한 확률론적 저수지 유입량 예측 (Probabilistic Reservoir Inflow Forecast Using Nonparametric Methods)

  • 이한구;김선기;조영현;정구열
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.184-188
    • /
    • 2008
  • 추계학적 시계열 분석은 크게 수문자료의 장기간 합성과 실시간 예측으로 구분해 볼 수 있다. 장기간 합성은 주로 수문자료의 추계적 특성을 반영한 수자원 시스템의 운영율 개발에 이용되어 왔다. 반면에 실시간 예측은 수자원 시스템의 순응적(adaptive) 관리에 적용되고 있다. 두 개념의 차이로 전자는 시계열 자료를 합성하여 발생 가능한 모든 수문조합을 얻고자 하는 것이라면 후자는 전 시간의 수문량을 조건으로 하는 다음 시간의 값을 순응적으로 예측하는 것이라 할 수 있다. 수문자료의 합성과 예측에는 크게 결정론적, 확률론적 방법의 두 가지 대별될 수 있다. 결정론적 모델링 방법에는 인공신경망이나 Fuzzy 기법 등을 이용할 수 있으며, 확률론적 방법에는 ARMAX 등의 모수적 기법과 k-NN(k-nearest neighbor bootstrap resampling), KDE(kernel density estimates), 추계학적 인공신경망 등의 비모수적 기법으로 분류할 수 있다. 본 연구에서는 대표적 비모수적 기법인 k-NN를 이용하여 충주댐을 대상으로 월 및 일 유입량 자료의 예측 정도를 살펴보았다. 전 시간 관측치를 조건으로 하는 다음 시간의 조건부 확률분포를 구하여 평균값을 계산한 후 관측치와 비교함으로써 모형의 정도를 살펴보았다. 그리고 실시간 저수지 운영에 이 기법의 활용성과 장단점도 살펴보았다. 모형개발 절차로 모형의 보정을 거쳐 검증을 실시하였다. 결론적으로 월 및 일 유입량 예측에 k-NN 기법이 실무적으로 적용될 수 있었으며, 장점으로는 k-NN 기법이 다른 기법보다 모델링 절차가 비교적 쉬워 저수지 운영 최적화 등 타 시스템과의 연계에 수월함이 인식되었다.

  • PDF

CO-CLUSTER HOMOTOPY QUEUING MODEL IN NONLINEAR ALGEBRAIC TOPOLOGICAL STRUCTURE FOR IMPROVING POISON DISTRIBUTION NETWORK COMMUNICATION

  • V. RAJESWARI;T. NITHIYA
    • Journal of applied mathematics & informatics
    • /
    • 제41권4호
    • /
    • pp.861-868
    • /
    • 2023
  • Nonlinear network creates complex homotopy structural communication in wireless network medium because of complex distribution approach. Due to this multicast topological connection structure, the queuing probability was non regular principles to create routing structures. To resolve this problem, we propose a Co-cluster homotopy queuing model (Co-CHQT) for Nonlinear Algebraic Topological Structure (NLTS-) for improving poison distribution network communication. Initially this collects the routing propagation based on Nonlinear Distance Theory (NLDT) to estimate the nearest neighbor network nodes undernon linear at x(a,b)→ax2+bx2 = c. Then Quillen Network Decomposition Theorem (QNDT) was applied to sustain the non-regular routing propagation to create cluster path. Each cluster be form with co variance structure based on Two unicast 2(n+1)-Z2(n+1)-Z network. Based on the poison distribution theory X(a,b) ≠ µ(C), at number of distribution routing strategies weights are estimated based on node response rate. Deriving shorte;'l/st path from behavioral of the node response, Hilbert -Krylov subspace clustering estimates the Cluster Head (CH) to the routing head. This solves the approximation routing strategy from the nonlinear communication depending on Max- equivalence theory (Max-T). This proposed system improves communication to construction topological cluster based on optimized level to produce better performance in distance theory, throughput latency in non-variation delay tolerant.

사례기반추론을 이용한 초기단계 공사비 예측 방법: 속성 가중치 산정을 중심으로 (Schematic Cost Estimation Method using Case-Based Reasoning: Focusing on Determining Attribute Weight)

  • 박문서;성기훈;이현수;지세현;김수영
    • 한국건설관리학회논문집
    • /
    • 제11권4호
    • /
    • pp.22-31
    • /
    • 2010
  • 프로젝트 초기단계에서 산정된 공사비는 발주자의 중요한 의사결정에 영향을 미치므로 그 중요성이 강조되고 있지만, 정보의 부족으로 인하여 주로 견적전문가의 경험과 지식에 의존하여 진행된다. 이것은 현재 문제와 가장 유사한 과거 사례를 선택하여 사용하는 사례기반추론으로 발전되었다. 사례기반추론 모델의 예측 성능은 속성 가중치의 산정 결과에 많은 영향을 받으므로, 정확한 속성 가중치의 산정이 요구된다. 기존의 연구는 수학적 방법 또는 전문가의 주관적 판단을 이용하는 방법을 사용한다. 본 연구는 기존 연구의 문제점을 보완하기 위해 유전자 알고리즘을 이용한 사례기반추론 공사비 예측 모델을 제안한다. 공사비 예측 모델은 최근이웃 조회 방법의 과정에 의해 추출한 사례의 공사비 정보를 이용하여 예측 대상의 공사비를 산정한다. 검증 결과 AACE에서 정의한 견적시기별 예측 정확도와 표준화 회귀계수 동일가중치를 사용한 방법보다 높은 오차율을 나타내었다. 따라서 본 연구는 유전자 알고리즘을 도입하여 예측 성능을 향상시키고, 사례기반추론 방법을 사용하여 사용자가 이해하기 용이한 해결책 도출과정을 제시하였다는데 그 의미가 있다.

임상도와 Landsat TM 위성영상을 이용한 산림탄소저장량 추정 방법 비교 연구 (Comparison of Forest Carbon Stocks Estimation Methods Using Forest Type Map and Landsat TM Satellite Imagery)

  • 김경민;이정빈;정재훈
    • 대한원격탐사학회지
    • /
    • 제31권5호
    • /
    • pp.449-459
    • /
    • 2015
  • 기존의 국가산림자원조사(National Forest Inventory, NFI)에 의한 산림탄소저장량 추정 방법은 국가 규모의 평균 탄소저장량 추정에는 충분하지만 표본점 개수가 부족한 시 군 단위의 세밀한 추정은 어렵다. 본 연구에서는 시 군별 산림탄소저장량 추정을 위해 공간 자료를 보조 자료로 이용하고 2가지 업스케일링 방법을 적용하여 격자별 산림탄소저장량 정보를 가진 산림탄소지도를 제작하였다. 대상지역은 충청남도로 2가지 방법 모두 제 5차 NFI(2006~2009) 자료를 활용하였다. 방법 1은 임상도를 보조 자료로 선택하고 NFI 기반 산림탄소저장량 회귀모델을 이용하였다. 방법 2는 위성영상을 보조 자료로 선택하고 k-NN을 이용하여 산림탄소저장량을 추정하였다. 불확실성을 고려하기 위해 200회 몬테카를로 시뮬레이션을 수행하여 최종 AGB 탄소지도를 산출하였다. 방법 1에서는 충청남도의 총 산림탄소저장량이 22,948,151 tonC으로 기존의 현지조사표본 기반 추정치(21,136,911 tonC)에 비해 과대추정을, 방법 2에서는 19,750,315 tonC로 과소추정되는 경향을 나타내었다. 독립검증 지점(n=186)의 탄소저장량에 대한 대응표본 T-검정 결과, 방법 2의 평균 추정치와 NFI 표본 기반 평균 추정치는 통계적으로 유의한 차이가 있는 반면(p<0.01), 방법 1의 평균 추정치는 NFI 표본 기반 평균 추정치와 통계적으로 유의한 차이가 없는 것으로 평가되었다(p>0.01). 특히, 방법 2의 경우 k-NN의 스무딩 효과 및 몬테카를로 시뮬레이션을 통해 위성영상과 표본점의 mis-registration 오차가 추정오차에 큰 영향을 미칠 수 있음이 발견되었다. 임상도를 활용한 방법 1이 임분 구조가 복잡한 우리나라 산림의 탄소량 추정에 효과적일 수 있지만, 미조사 지점의 주기적인 갱신 및 대면적 추정에 유리한 위성영상의 활용은 여전히 필수적이다, 따라서 시공간적인 확장과 함께 보다 신뢰할 수 있는 산림탄소저장량 추정을 위해 다양한 위성영상 자료 및 활용 기법에 관한 연구가 필요할 것으로 사료된다.