• 제목/요약/키워드: Nearest neighborhood method

검색결과 33건 처리시간 0.023초

데이터 분포에 기반한 유사 군집 선택법 (Neighborhood Selection with Intrinsic Partitions)

  • 김계현;최승진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.428-432
    • /
    • 2007
  • We present a novel method for determining k nearest neighbors, which accurately recognizes the underlying clusters in a data set. To this end, we introduce the "tiling neighborhood" which is constructed by tiling a number of small local circles rather than a single circle, as existing neighborhood schemes do. Then we formulate the problem of determining the tiling neighborhood as a minimax optimization, leading to an efficient message passing algorithm. For several real data sets, our method outperformed the k-nearest neighbor method. The results suggest that our method can be an alternative to existing for general classification tasks, especially for data sets which have many missing values.

  • PDF

공간이웃정보를 고려한 공간회귀분석 (A study on the spatial neighborhood in spatial regression analysis)

  • 김수정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.505-513
    • /
    • 2017
  • 최근, 더욱 상세하고 정확한 추정 결과를 위해 소지역추정(small area estimation; SAE)의 연구가 많이 진행되고 있다. 그 중 공간회귀모형 (spatial regression model)을 이용한 방법이 주를 이루고 있는데 이를 사용하기 위해서는 공간이웃 (spatial neighbor)의 정의가 필요하다. 본 연구에서는 공간이웃을 정의하는 방법으로 도로네 삼각망 (Delaunay triangulation; DT)을 소개하고 k-최근접 (k-nearest neighbor; KNN)과 비교하여 분석한다. 두 가지 공간이웃을 정의하는 방법중에서 어떤 방법으로 이웃을 정의하는 것이 효율적인지 알아보기 위해 시뮬레이션을 실시하였고, 지가 (land price)데이터를 이용하여 실 데이터를 분석하였다.

차분진화 알고리즘을 이용한 Nearest Prototype Classifier 설계 (Design of Nearest Prototype Classifier by using Differential Evolutionary Algorithm)

  • 노석범;안태천
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.487-492
    • /
    • 2011
  • 본 논문에서는 가장 단순한 구조를 가진 Nearest Prototype Classifier의 성능 개선을 위해 차분 진화 알고리즘을 적용하여 prototype의 위치를 결정하는 방법을 제안하였다. 차분 진화 알고리즘을 이용하여 prototype의 위치 벡터가 결정이 되며, 차분 진화 알고리즘에 의해 결정된 prototype의 class label을 결정하기 위한 class label 결정 알고리즘도 제안하였다. 제안된 알고리즘의 성능 평가를 위해 기존의 패턴 분류기와 비교 결과를 보인다.

KNN 알고리즘을 활용한 고속도로 통행시간 예측 (Expressway Travel Time Prediction Using K-Nearest Neighborhood)

  • 신강원;심상우;최기주;김수희
    • 대한토목학회논문집
    • /
    • 제34권6호
    • /
    • pp.1873-1879
    • /
    • 2014
  • 실시간 자료를 반영한 통행시간 예측 기법은 다양하지만 관련 연구 검토 결과 과거이력데이터가 충분하다면 타 모형에 비해 K 최대근접이웃(K-Nearest Neighbors)의 정확도가 우수하므로 본 연구에서는 이에 대한 적용 방법 도출 및 가능성 평가를 목적으로 한다. 본 연구에서는 KNN의 입력 자료로 TCS 교통량 및 DSRC 구간통행시간의 실시간 및 과거 이력자료, 경로통행시간 이력자료를 활용하였다. 통행시간 예측치는 TCS 교통량 및 DSRC 구간통행시간의 실시간 자료와 유사한 경로통행시간을 탐색한 후 이를 가중평균하여 산출하였다. 예측 기법을 적용한 결과 DSRC 구간통행시간의 가중치가 증가할수록 정확도는 증가하였으며, 이는 실시간 교통상황 변화를 DSRC 구간통행시간이 잘 반영하기 때문이다. 그러나 TCS 교통량을 기반으로 한 경우 역시 정확도의 차이가 크지 않으며, 변화 추이도 유사하게 나타났다. 이러한 결과를 볼 때 향후 대용량의 과거이력자료가 축적될 경우 예측오차는 더욱 감소될 것으로 기대된다.

패널조사 웨이브 무응답의 대체방법 비교 (Comparisons of Imputation Methods for Wave Nonresponse in Panel Surveys)

  • 김규성;박인호
    • 한국조사연구학회지:조사연구
    • /
    • 제11권1호
    • /
    • pp.1-18
    • /
    • 2010
  • 본 논문에서는 패널조사에서 발생하는 웨이브 무응답을 대체하는 방법을 고찰하였다. 패널조사에서는 이전 조사 데이터를 무응답 대체에 활용할 수 있기 때문에 이러한 성질을 이용하면 횡단면 무응답 대체보다 더 효과적인 웨이브 무응답 대체법을 찾을 수 있다. 먼저 웨이브 무응답 대체를 사용하는 해외의 주요 패널조사를 살펴보고, 웨이브 무응답 대체방법 중 종단면 회귀대체법, 이월대체법, 최근방 회귀대체법, 그리고 행렬대체법을 고찰하였다. 그리고 웨이브 무응답 대체법의 성능을 비교하기 위하여 한국복지패널 데이터를 대상으로 모의실험을 실시하였다. 성능을 비교하기 위하여 평균대체, 회귀대체, 비대체, 최근방 대체, 핫덱 대체를 고려하였고 성능평가 지표로는 예측 정확성 지표와 추정 정확성 지표를 이용하였다. 모의실험 결과 비대체, 행렬대체는 두 지표 모두 우수했고, 회귀대체, 종단면 회귀대체, 이월대체는 예측 정확성은 우수한 반면 추정 정확성은 다소 떨어졌으며, 반대로 최근방 회귀대체, 최근방 대체, 핫덱 대체는 예측 정확성은 떨어지나 추정 정확성은 높은 것으로 나타났다. 마지막으로 평균 대체는 두 지표 모두 좋지 않았다.

  • PDF

A Comparative Study of Microarray Data with Survival Times Based on Several Missing Mechanism

  • Kim Jee-Yun;Hwang Jin-Soo;Kim Seong-Sun
    • Communications for Statistical Applications and Methods
    • /
    • 제13권1호
    • /
    • pp.101-111
    • /
    • 2006
  • One of the most widely used method of handling missingness in microarray data is the kNN(k Nearest Neighborhood) method. Recently Li and Gui (2004) suggested, so called PCR(Partial Cox Regression) method which deals with censored survival times and microarray data efficiently via kNN imputation method. In this article, we try to show that the way to treat missingness eventually affects the further statistical analysis.

고객 맞춤 서비스를 위한 HPPS(Hybrid Preference Prediction System) 설계 (A Design of HPPS(Hybrid Preference Prediction System) for Customer-Tailored Service)

  • 정은희;이병관
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1467-1477
    • /
    • 2011
  • 본 논문에서는 고객 맞춤 서비스의 선호도를 정확하게 예측하기 위하여 사용자 프로파일 분석, 사용자간 유사도 분석을 이용한 HPPS(Hybrid Preference Prediction System) 설계를 제안한다. 기존의 NBCFA(Neighborhood Based Collaborative Filtering Algorithm)과 달리, 본 논문은 첫째, 선호도 예측식에서 이웃의 상품 평가가 없을 경우 상품에 대한 평균값을 이용하도록 하였고, 둘째, 선호도 예측식에서 사용자의 특성을 분석한 가중치를 반영하도록 하였고, 끝으로, 인접 이웃을 선정할 때 유사도, 상품 평가 여부, 평가 횟수를 반영하여 HPPS에 선호도의 정확도를 향상시켰다. 따라서 첫째와 둘째의 선호도 예측식을 이용하면 HPPS의 정확도는 기존의 NBCFA에 비해 97.24% 향상되었고, 인접이웃 선정방식에서도 HPPS 시스템의 정확도가 75% 향상되었다.

모바일 P2P 네트워크에서 피어의 이동성을 고려한 연속적인 k-최근접 질의 처리 (Continuous K-Nearest Neighbor Query Processing Considering Peer Mobilities in Mobile P2P Networks)

  • 복경수;이현정;박용훈;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.47-58
    • /
    • 2012
  • 본 논문에서는 MP2P(Mobile Peer-to-Peer) 네트워크 환경에서 이동하는 피어들을 대상으로 실시간으로 질의 결과를 갱신하는 연속적인 k-최근접 질의 처리 기법을 제안한다. 제안하는 기법은 질의 피어와 근접한 k개의 피어를 효율적으로 모니터링하기 위하여 모니터링 영역(monitoring region)을 생성하여 배포한다. 모니터링 영역은 주변 피어들의 이동 벡터를 이용하여 특정 시간 범위 내에서 최소 k개의 질의 결과를 보장하기 위해 만들어진 영역이다. 제안하는 기법은 주변 피어들의 벡터를 이용하여 Monitoring Region을 계산하기 때문에 유지 시간을 증가시켜 모니터링 영역의 무효화에 따른 질의 재수행 비용을 감소시킨다. 제안하는 기법의 우수성을 입증하기 위해 기존 기법과 성능 평가를 수행한 결과 제안하는 기법이 기존 기법보다 우수한 성능을 보였다.

K 최대근접이웃 방법을 이용한 통행시간 예측에 대한 연구 (A Study of Travel Time Prediction using K-Nearest Neighborhood Method)

  • 임성한;이향미;박성룡;허태영
    • 응용통계연구
    • /
    • 제26권5호
    • /
    • pp.835-845
    • /
    • 2013
  • 통행시간은 교통정보 중에서 가장 대표적이고 이용자 선호도가 높은 정보이다. 본 연구에서는 일반국도를 대상으로 실시간 시스템에 적용 가능한 통행시간 예측 방법을 개발하고자 하였다. 통행시간 예측방법으로 비모수적 접근 방법인 K 최대근접이웃 방법을 적용하였다. K 최대근접이웃 방법은 데이터에 대한 특별한 가정이 필요 없고, 모수 추정 과정이 필요 없어 실시간 교통관리시스템에 적합하다. K 최대근접이웃 방법의 우수성을 평가하기 위해 교통 분야에서 많이 적용되고 있는 이력자료 평균방법과 칼만 필터방법을 선정하여 평균절대백분율오차와 변동계수를 통해 평가하였다. 평가 결과 K 최대근접이웃 방법이 이력자료 평균방법과 칼만 필터방법에 비해 우수한 것으로 분석되었다. 통행시간 정보 제공 시 본 연구에서 개발된 방법을 통해 도출된 통행시간과 구간검지기로부터 관측된 통행시간을 탄력적으로 적용함으로써 통행시간 정보의 신뢰도를 향상시킬 수 있을 것으로 기대된다.

곡가공 프로세스를 고려한 곡판 분류 알고리즘 (An Algorithm of Curved Hull Plates Classification for the Curved Hull Plates Forming Process)

  • 노재규;신종계
    • 대한조선학회논문집
    • /
    • 제46권6호
    • /
    • pp.675-687
    • /
    • 2009
  • In general, the forming process of the curved hull plates consists of sub tasks, such as roll bending, line heating, and triangle heating. In order to complement the automated curved hull forming system, it is necessary to develop an algorithm to classify the curved hull plates of a ship into standard shapes with respect to the techniques of forming task, such as the roll bending, the line heating, and the triangle heating. In this paper, the curved hull plates are classified by four standard shapes and the combination of them, or saddle, convex, flat, cylindrical shape, and the combination of them, that are related to the forming tasks necessary to form the shapes. In preprocessing, the Gaussian curvature and the mean curvature at the mid-point of a mesh of modeling surface by Coon's patch are calculated. Then the nearest neighbor method to classify the input plate type is applied. Tests to verify the developed algorithm with sample plates of a real ship data have been performed.